Diferenças em Diferenças (Diff-in-Diff)

Já fiz um post sobre como fazer uma regressão de diferenças em diferenças em Regressão Diff-In-Diff com Efeitos Fixos no R, porém não falei muito da técnica. Agora, vou passar uma introdução bem tranquila para você entender a intuição por trás dela.

Diferenças em diferenças é uma técnica estatística bastante utilizada em econometria para se analisar, principalmente, o efeito de alguma política que altere o comportamento de um público em determinado momento, em comparação com outro que não fez parte dessa política.

Por exemplo, suponha que em 2015 o prefeito da cidade de São Paulo distribua tablets por todas as escolas, na intenção de que isso aumente a performance dos alunos. Já em 2017, queremos saber se a performance dos alunos melhorou com o uso do tablet. Poderíamos comparar a média dos alunos em 2015 com a média de 2017 para avaliar essa melhora:

diff_in_diff1

Veja que no gráfico com eixo y contendo a média das notas no ENEM e o eixo x contendo o ano da prova, podemos notar que os alunos de São Paulo tiveram uma evolução após a política de uso de tablet. Seria essa evolução causada pelos tablets?

Bem… é possível. Porém, vamos supor que nesse mesmo período, a situação econômica do país tenha mudado, as crianças e adolescentes agora estão em melhores condições, se alimentam melhor. Ou seja, temos uma evolução causada pelo próprio tempo, pelo período transcorrido. A nossa diferença de 20 pontos, que vamos chamar aqui de D1 tem duas componentes então, o programa e o que chamaremos de tendência:

D1 = Programa + Tendência

Não é possível estimar ainda quanto da diferença vem da tendência e quanto vem da política. No entanto, se tivermos uma outra cidade, que também vai sofrer o efeito do tempo, da melhoria geral no país, podemos fazer a comparação. Então, vamos observar a mudança na cidade de Osasco:

diff_in_diff2

Essa mudança na cidade de Osasco muito provavelmente contempla o efeito da tendência, ou seja, esses 17 pontos na média representam a alteração que ocorre por conta da melhoria das condições no país.

Então, para capturar o efeito do programa de tablets, o nosso Diff-In-Diff, bastaria subtrair esse valor que representa a tendência:

DD = D1 – D2

DD = 20 – 17

DD = 3

diff_in_diff3

Outra forma de se calcular o efeito seria tomar a diferença entre as cidades antes do programa e em seguida a diferença após o programa. A diferença entre esses dois valores, representa o efeito da política:

diff_in_diff4

As duas formas chegam no mesmo valor. E essa é a intuição por trás do diff-in-diff!

 

Anúncios

3 comentários

  1. É possível usar essa técnica de diferenças usando regressão logística? Preciso saber se a probabilidade de um evento ocorrer (0 ou 1) aumentou ou diminuiu após o surgimento de uma lei em 2005.

    Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s