Análise Bidimensional para Variáveis Qualitativas

Assim como podemos analisar bidimensionalmente variáveis quantitativas, podemos analisar variáveis qualitativas. Neste caso, ao invés de querer saber a relação entre duas quantidades, queremos saber a relação de duas categorias / características. Por exemplo, você pode estar interessado em saber a relação entre o grau de instrução do indivíduo e o sexo, cuja distribuição é apresentada na tabela abaixo:

analise_bivariada_qual1

Uma forma de se analisar, é observando como estão distribuídos esses indivíduos de forma geral. Por exemplo, qual a porcentagem da população que é analfabeto e do sexo masculino?

Ou seja, analisamos qual % de cada par de grau de instrução e sexo com relação ao total:

analise_bivariada_qual2

Ou então, podemos verificar dentro de cada subgrupo de sexo qual a distribuição do grau de instrução:

analise_bivariada_qual3

Isso é facilmente construído no Excel com uma tabela dinâmica, onde você pode também obter a distribuição por subgrupo de grau de instrução. E observar, por exemplo, que dentre os analfabetos, 47% são do sexo masculino (3.453.934/7.297.008) e 53% são do sexo feminino (3.843.074/7.297.008).

Essas distribuições são utilizadas principalmente para entender a associação entre as variáveis. Veja que independente do sexo, 5,1% da população é analfabeta, 7,1% possui o ensino fundamental completo e assim por diante. Ao observarmos isoladamente sexo masculino ou sexo feminino, vemos que essas mesmas distribuições praticamente se mantém. Assim, nossa conclusão a partir desses dados, é que o sexo não tem relação com o grau de instrução.

Vamos supor que a gente queira ver a relação entre o sexo e a escolha entre faculdade de exatas ou humanas a partir dos dados (hipotéticos) dos alunos de um determinado colégio:

analise_bivariada_qual4

Calculando as distribuições por sexo:

analise_bivariada_qual5

Veja agora que a distribuição de alunos por curso, ao desconsiderarmos o sexo dos alunos, é de 49,8% para exatas e 50,2% para humanas. Entretanto, quando consideramos o sexo dos alunos, essa distribuição muda, indicando que há uma associação (~ dependência) entre sexo e escolha do curso.

Nota: As tabelas utilizadas como exemplo também são chamadas de Tabelas de Contingência.

Anúncios

2 comentários

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s