Correlação e Causalidade: Dois Exemplos Práticos

Como alguém que se interessa bastante por economia e estatística, estou sempre tentando entender alguns dados e o que eles significam. Como sempre, os dados podem ter várias interpretações, principalmente se forem somente alguns levantamentos mais simples com algumas correlações e não um estudo mais rebuscado. Neste post, quero mostrar duas maneiras com que as correlações podem nos enganar na hora de interpretar causalidades.

Primeiro, vou mostrar os dados que eu conhecia e qual a interpretação que eu tinha a respeito deles:

  • Dado: Pessoas mais altas possuem salários mais altos;
    Interpretação: Por algum tipo de preconceito, assim como vemos com raça, os responsáveis pela seleção preferem preencher as melhores vagas com pessoas mais altas. Provavelmente, por algum motivo qualquer – algo que poderia ser explicado melhor por psicólogos – pessoas mais altas impõe maior respeito ou passam uma imagem melhor.
  • Dado: Países com maior incidência de malária, são mais pobres.
    Interpretação: Em países mais pobres, as pessoas têm piores condições de vida. Isto significaria menos recursos de todos os tipos, incluindo saneamento e tratamentos médicos. Logo, a pobreza seria a causa da maior incidência de malária. Resolver a solução da malária, não resolveria o problema dos baixos ganhos dos indivíduos destes países.

Porém, minhas duas interpretações estavam erradas. Por este motivo sempre falo que devemos ser cuidadosos ao lidar com dados dessa forma mais “bruta”. Para entender causalidade, é preciso ir além do básico. Vamos entender o que ocorreu e qual o problema estatístico em questão.

PROBLEMA 1: DEIXAR UMA VARIÁVEL RELEVANTE DE FORA

No artigo entitulado “Stature and Status: Height, Ability, and Labor Market Outcomes”, as economistas Anne Case e Christina Paxson buscaram entender a relação entre salário e altura. Em um estudo um tanto quanto polêmico, as pesquisadoras testaram uma nova hipótese: adultos mais altos ganham mais porque possuem uma maior capacidade cognitiva.

Apesar de incomodar os mais baixinhos, e eu me incluo neste grupo, o resultado faz sentido e já é reforçado por alguns autores que fazem menção aos problemas nutricionais que gerariam tanto o problema da altura, quanto o cognitivo. No livro “A Economia dos Pobres: Repensar de modo radical a luta contra a pobreza global”, os economistas Abhijit V. Banerjee e Esther Duflo explicam a relação entre alimentação e altura, indicando que os mais pobres acabam tendo um prejuízo cognitivo, por conta da alimentação, e que se reflete na altura.

Leia mais sobre os problemas causados ao deixar uma variável relevante de fora da análise em Viés de Variável Omitida: Um exemplo prático,  Viés de Variável Omitida: Prova Matemática e Sobre o viés de variável omitida e estudos observacionais

PROBLEMA 2: A DIREÇÃO DA CAUSALIDADE

Na segunda questão, o engano na interpretação estava em entender, principalmente, o sentido da relação. Sabendo que há uma correlação entre pobreza e incidência de malária, parece fácil interpretar que a pobreza seja a causa do número de pessoas vítimas da doença. O que até pode ser verdade, em partes. Porém, se essa premissa fosse 100% precisa, resolver o problema da malária não faria um país mais rico. Mas isso não é o que acontece.

No artigo “Malaria Eradication in the Americas: A Retrospective Analysis of Childhood Exposure”, Hoyt Bleakley analisa a erradicação da doença em diversos países do continente americano: EUA, México, Colômbia e Brasil. O avanço na erradicação, contando com avanços tecnológicos da época, nos permite responder questões deixadas no parágrafo anterior. A conclusão do estudo foi que a exposição à malária na infância afeta a produtividade na vida adulta, o que leva à rendimentos mais baixos. Nas áreas que eram mais afetadas pela doença antes da erradicação, foi observado foi um aumento no rendimento dos nascidos após o combate à doença em relação à geração anterior. Os ganhos na vida adulta, de uma criança não exposta à doença em comparação à exposta foram estimados em até 50% a mais por ano.

As técnicas utilizadas no estudo já foram discutidas no blog por algumas vezes, e, além da leitura do artigo, recomendo a leitura dos posts Causalidade ReversaAvaliando intervenções: Variáveis Instrumentais e Para que serve e como funciona a variável instrumental?.

CONCLUSÃO

É bem difícil não tirarmos quaisquer conclusões quando nos deparamos com algumas estatísticas. Porém, é importante nos atentarmos que nossas intuições podem – e vão, em diversos momentos – nos enganar. A diferença de um bom estatístico / economista para um ruim (ou um leigo no assunto) é que o bom estatístico / economista deve estar aberto às hipóteses e saber que aqueles números podem significar algo completamente diferente do que ele imaginava. E, é claro, tem que saber que correlação não implica causalidade!

Espero que tenha aproveitado o post.

Bons estudos!

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s