Correlação: Não implica causalidade, mas tem seu valor

Como já foi criticado anteriormente aqui, correlação não implica causalidade e faz as pessoas inferirem resultados equivocados dos seus dados. Nós, como bons estudiosos de estatística, podemos então desprezar todos os outros meros mortais que usam correlação nas suas análises no dia a dia e agirmos da forma mais soberba possível, porque, vamos lá, a gente pode… certo?

Claro que não. Primeiro, ninguém gosta de uma pessoa tão arrogante. Segundo, porque estaríamos equivocados.

Pela própria definição de correlação, quando analisamos a correlação entre duas variáveis estamos verificando como as duas se relacionam, mesmo que não dizendo se uma causa a outra. Diversos pares de variáveis possuem uma relação conhecida. Através do coeficiente de Pearson, por exemplo, somos capazes de medir a força com que essa relação se dá.

Além disso, a correlação pode ser um primeiro passo para criar incentivos a uma determinada investigação / experimento.

Por fim, ninguém inicia um modelo simplesmente batendo um monte de variáveis em um liquidificador e esperando p-valor (no plural é p-valores?) bons. É preciso que essas variáveis façam algum sentido. O mesmo vale para dizer se a correlação é espúria. Pesquise as variáveis que fazem sentido.

Relembrando:

Coeficiente de Pearson: Medida de correlação entre duas variáveis que varia de -1 a 1. Muito próximo a 1? Então as duas variáveis se movem na mesma direção com a mesma força. Ou seja, uma aumentou, a outra aumentou também. Preciso mesmo dizer o que quer dizer quando esse coeficiente é próximo de -1?
Bônus

A grande diferença entre calcular o coeficiente de correlação de Pearson e realizar uma regressão linear está justamente na causalidade. Conforme comentado, a correlação mede a relação entre as duas variáveis, aí está a chave para as dúvidas de muitos alunos. A correlação entre A e B é a mesma que a de B e A. Não tem essa de uma variável implicar algo em outra. Diferente da regressão, que no caso, regredimos a variável A na variável B. Uma causa algo na outra.

Anúncios

3 comentários

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s