Qui-quadrado de Pearson e Coeficiente de Contingência

Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.

Vamos utilizar os mesmos dados hipotéticos que relacionam sexo e tipo de curso superior escolhido:

analise_bivariada_qual4

Veja que a distribuição de sexo é de aproximadamente 58% masculino e 42% feminino. Como temos 665 indivíduos que irão cursar exatas, o esperado é que 384 (58%*665) indivíduos fossem do sexo masculino e os outros 281 (42%*665) fossem do sexo feminino. Sendo assim, temos um desvio do valor esperado.

Olhe intuitivamente! Se não tivéssemos nenhum desvio, as variáveis sexo e faculdade não teriam nenhuma dependência (leia novamente o trecho que fala sobre associação entre variáveis). É de se esperar então que quanto maior o desvio, maior a dependência entre as duas variáveis qualitativas consideradas. Ou seja, implica uma relação entre as duas, implica que a partir do sexo você já tem uma ideia do curso que a pessoa optou.

Então, sendo repetitivo novamente, verificamos o valor esperado e o quanto as distribuições desviam desse valor:

analise_bivariada_qual6

Valor Esperado

analise_bivariada_qual7

Desvio = Valor Observado – Valor Esperado

O qui-quadrado de pearson consiste em obter o quadrado de cada célula acima dividido pelo respectivo valor esperado e fazer a somatória:

analise_bivariada_qual8

No nosso caso, teremos como resultado: 11,5+11,4+15,7+15,5 = 54,2.

Uma crítica comum é que esse teste não fornece claramente a força da dependência entre duas variáveis, e sim, a existência dessa dependência.

Por isso, temos o coeficiente de contingência de Pearson, dado por:

analise_bivariada_qual9

Com isso, chegamos então ao valor de 0,19, o que indica uma baixa associação (isso se eu não errei nenhuma conta ao longo desse material).

Atenção: Em alguns casos, principalmente na literatura estrangeira, é possível encontrar o coeficiente com outra letra – já encontrei como T.

Nota: É interessante também a leitura a respeito do coeficiente Phi, embora você já consiga se virar bem com o coeficiente de Pearson e as análises das distribuições.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s