correlacao

Correlação Parcial e Semiparcial: Definição e Código SAS

Além da correlação linear comumente utilizada na estatística, duas outras correlações podem ser interessantes para sua análise: parcial e semiparcial. Ambas dizem respeito à associação entre as variáveis, no entanto, agora trabalhamos com a ideia de manter outras variáveis controle constantes. (mais…)

Anúncios

Causalidade Reversa

Um dos maiores cuidados que devemos ter ao elaborarmos um experimento, um RCT (randomized controlled trial), é a causalidade reversa.

Causalidade reversa se refere à inversão da direção causa-efeito em um experimento. Isto é, ocorre quando há confusão entre o que é a causa e o que é o efeito. Os modelos estatísticos servem para dizer que X causa Y, porém, quando há causalidade reversa, o autor corre o risco de concluir que Y causa X.

Leia mais…

Correlação igual a zero implica independência?

Já analisamos diversas vezes a correlação de Pearson, como nos posts Correlação vs. Casualidade, Correlação vs. Causalidade – Parte 2 e Correlação: Não implica causalidade, mas tem seu valor. Na maioria das vezes analisamos como podemos nos enganar ao observarmos uma alta correlação. Não vimos porém, como algumas vezes nos enganamos ao analisarmos baixas correlações. Mais especificamente, tente responder a uma pergunta antes de prosseguir com o post: é possível as variáveis terem alguma relação se a correlação entre elas é igual a zero?

Leia mais…

Análise Bidimensonal para Variáveis Quantitativas

Análise bidimensional (ou bivariada) é a análise de duas variáveis em conjunto. Quando utilizamos medidas resumo como média, mediana e variância (como no post Estatística Descritiva), estamos analisando a variável de forma isolada. Porém, em muitos casos, é interessante entender como as variáveis interagem entre si.

Leia mais…

Avaliando intervenções: Variáveis Instrumentais

Já adiantando, esse post é para discutir alguns métodos econométricos. A discussão sobre o tema dos artigos utilizados não é relevante no contexto do post. Sugiro ainda a leitura do artigo Using Terror Alert Levels to Estimate the Effect of Police on Crime e do livro Freakonomics: O Lado Oculto e Inesperado de Tudo que nos Afeta (além dos que serão mencionados).

A polícia é bastante defendida e atacada pelas pessoas. De um lado os que acreditam na sua efetividade em combater o crime, do outro os mais céticos que acreditam que a polícia não é eficiente e é, muitas vezes, até pior para uma comunidade. Eu não estou aqui para discutir o que é certo e o que é errado, e sim mostrar como a estatística e a econometria são úteis na decisão de políticas que melhorem o bem estar geral e a não sermos enganados por qualquer correlação apresentada por aí.

Encontrar essa causalidade entre polícia e criminalidade não é fácil. Samuel Cameron, 1988, analisou 22 papers, desses, 18 indicavam uma relação positiva entre aumento policial e aumento de criminalidade ou então nenhuma relação. Nenhum conseguiu concluir que o aumento no número de policiais diminuía a criminalidade. Esses estudos, porém, não trataram o problema de endogeneidade. Endogeneidade ocorre quando seu erro e uma variável regressora estão correlacionados. Quando ela ocorre você não tem ideia de quem causa o que. E isso ocorre no nosso caso. Pense em um prefeito cuja cidade tem uma taxa de criminalidade alta. É bem provável que ele contrate mais policiais. Ou seja, muitos policiais em uma área de alta criminalidade, ou o contrário. Isso acaba enviesando nosso modelo.

E o que os estudos mais recentes nos dizem?

No artigo Panic on the Streets of London: Police, Crime, and the July 2005 Terror Attacks, Mirko Draca, Stephen Machin, and Robert Witt, utilizando diversas técnicas econométricas buscam explicar a causalidade entre policiamento e criminalidade.

Utilizando principalmente Difference in Differences eVariáveis Instrumentais, o paper analisa esse efeito utilizando o aumento do policiamento que ocorreu na Inglaterra após um ataque terrorista. É um material bem completo e uma análise cuidadosa, que considera efeitos de tendência (e se o bairro já estiver passando por uma redução de crimes?), teste de Placebo (análogo ao placebo quando falamos de remédios, mas para nossos grupos tratados) , dentre outras coisas.

Variáveis Instrumentais

Essa variáveis são utilizadas no estudo para lidar com o problema de endogeneidade que fazem com que nossos parâmetros de OLS sejam inconsistentes.

Para encontrar uma variável instrumental, precisamos de uma variável que impacta a variável resposta y através da variável explicativa x. Um exemplo famoso, citado no livro Mostly Harmless Econometrics, Angrist e Pischke, é de um estudo que buscava encontrar a relação entre anos de escolaridade e salário, que possuía a variável habilidade dentro do erro do modelo. A variável instrumental utilizada foi trimestre de nascimento, que impactava o salário, porém, através da variável escolaridade.

Para o estudo citado no início desse post, a variável encontrada foi o ataque terrorista. Note que essa variável de nada adiantaria para explicar a redução de criminalidade, porém, ao afetar o efetivo policial, ela acaba impactando a criminalidade. Essa é a intuição que eu acredito ser necessária para você entender o que é uma variável instrumental.

O resultado do estudo?

We find strong evidence that more police lead to reductions in what we refer to as susceptible crimes (i.e., those that are more likely to be prevented by police visibility, including street crimes like robberies and thefts)

Ou seja, eles conseguiram evidenciar, que o aumento no policiamento causa redução em crimes que eles chamam de “crimes suscetíveis”, que são os crimes que seriam mais visíveis aos policiais, como roubos, furtos e violência. Isso tudo mesmo com aquela correlação que observamos entre polícia e criminalidade.

Apenas para concluir, o modelo apresentado pelos autores demonstra que outros crimes, como os sexuais, não apresentaram diferenças significativas.

Leia também: Do Police Reduce Crime? Estimates Using the Allocation of Police Forces After a Terrorist Attack

Correlação vs. Causalidade – Parte 2

Vamos supor que a gente tenha o gráfico abaixo com a média do número de filhos de mulheres que recebem bolsa família e a média das que não recebem bolsa família. O que você consegue concluir a partir dos gráficos?

Spoiler alert: Apenas que a média do número de filhos das que recebem é mais alta!

Quer dizer que o bolsa família incentiva as mulheres a terem filhos?

Vamos pensar! Quem recebe bolsa família é porque tem menor renda, geralmente menos acesso a informações. É de se esperar que independente da bolsa, essas mulheres tenham mais filhos. Então, apesar desse gráfico animar alguns radicais mal informados, ele não quer dizer que o bolsa família incentive as mulheres a terem mais filhos. Pior ainda para esses sensacionalistas mal informados, pode ser que ocorra o contrário e na verdade essa bolsa desincentive, mas isso eles só vão conseguir saber se pesquisarem mais.

Got it?

Ps.: Dados ilustrativos ein galera! Nada de utilizá-los!

Correlação vs. Casualidade

É muito comum em uma discussão sobre política, economia, etc., alguém vir com um argumento do tipo “ah mas em país x, y e z o porte de armas é legal e lá a criminalidade é baixa”.

Eu me lembro de uma aula do mestrado alguns alunos argumentarem que o ensino básico gratuito era fundamental para um país crescer, dado que Coréia do Sul, Estados Unidos e muitos outros países desenvolvidos funcionavam desta maneira. É comum também muitos economistas defenderam políticas de proteção à indústria, fazendo uso do argumento de que os países cresceram quando tiveram maior participação das indústrias no PIB. Não vou discutir o certo e o errado aqui, nem tenho ferramentas para isso, mas posso com certeza afirmar que esse tipo de afirmação não pode ser feita dessa forma tão displicente. Tudo bem, eu também já fiz várias vezes… é meio que automático, não?

Já que deu certo ali, ali e ali, então vai dar certo aqui!

Parece muito óbvio. Mas não é!

Quando fazemos essas afirmações, estamos utilizando a correlação para explicar uma causalidade. O que isso quer dizer? Quer dizer que se nos países onde as armas são legalizadas, a violência é baixa, então, a legalização do porte de armas causa a queda na violência. Quer dizer também, que se os países desenvolvidos tem ensino básico gratuito, então o ensino básico gratuito causa desenvolvimento. É o que quer dizer, é o que as pessoas afirmam, mas…

gnas1

Sim, o Gandalf tem razão, é bullshit!

Vamos tratar só o primeiro caso, do porte de armas. Não vou discutir se o porte de armas é bom ou ruim, nem tenho dados para isso. Porém, vamos discutir a afirmação de que muitos jornalistas sensacionalistas fazem, de que em alguns países desenvolvidos e com baixa criminalidade possuem porte de armas legalizado, então se legalizarmos por aqui, vamos conseguir baixar o número de crimes. Primeiro, quem garante que o porte de armas é o principal responsável pela baixa criminalidade? E se o ensino tiver impacto maior? E se uma renda maior per capita for responsável? E se forem as diferentes leis?

Para o caso dos países onde o ensino básico é gratuito e eles são desenvolvidos, quem garante que o ensino gratuito que gerou desenvolvimento e não o contrário, o fato de serem desenvolvidos ou terem crescido em determinado período, permitiu maior gasto em ensino? Quem garante que se tivessem adotado um ensino privado não teriam crescido mais?

Esses tipos de perguntas que os estudiosos de econometria tentam responder.

Além disso, e se for pura coincidência? Nos dois exemplos não ocorreu de um implicar o outro, simplesmente aconteceu ué! E acontece em diversos casos.

Por exemplo, você sabia que o gasto dos EUA em ciências e tecnologia cresceu no mesmo ritmo que o número de suicídios?  E que o número de pessoas que morreram afogadas em piscina variou de forma muito parecida com o número de filmes que o Nicolas Cage apareceu. Se você não é um supersticioso, você pode facilmente ver que coincidências acontecem. Isso se chama correlação espúria. Uma mera coincidência.

spurial1
spur2 Fonte: http://www.tylervigen.com/spurious-correlations

Portanto, tome cuidado com seus argumentos e com o que jogam para cima de você. Correlação não implica causalidade!