Econometria

Listas de Econometria (2): Demonstrações Envolvendo Somatória

Dando continuidade às resoluções de exercícios de Econometria I, seguem mais alguns que são comuns de se ver nas primeiras listas da disciplina. Dessa vez, são demonstrações que envolvem lidar com a somatória. São exercícios simples, pouco trabalhosos, mas que são muito úteis para entender o resto da matéria. Inclusive, um deles servirá de base para a demonstração que está em Listas de Econometria (1): Derivando os Parâmetros de uma Regressão Linear Simples. Eu espero de verdade que isso ajude quem está apanhando da matéria. Qualquer problema no entendimento, até se achar que algo não está legível, não hesite em me contatar. Bora passar nessa matéria! (mais…)

Listas de Econometria (1): Derivando os Parâmetros de uma Regressão Linear Simples

O que será apresentado neste post é um exercício padrão de quem faz Econometria I na faculdade. Todo professor de econometria em algum momento mostrou aos alunos como derivar a fórmula do intercepto e a inclinação da reta (os betas) de uma Regressão Linear Simples. E é isso que veremos hoje! (mais…)

Resumão dos Tweets

Muito do que posto no Twitter acaba não vindo parar aqui. Às vezes são coisas tão breves que nem conseguiria elaborar um post. Outras vezes, são threads que até caberiam aqui, mas que são mais fáceis de se postar por lá. E tem coisa também que são só reflexões aleatórias ou piadinhas. De qualquer forma, aqui vão alguns dos tweets recentes, para quem não acompanha a conta saber mais ou menos qual é a pegada por lá. No fim deste post, há uma thread que essa sim acho essencial para todos que estudam ciência de dados. (mais…)

Algoritmo de Classificação: KNN (K Nearest Neighbors)

O algoritmo KNN, abreviação de K Nearest Neighbors, é um algoritmo bastante utilizado por cientistas de dados, principalmente pela sua facilidade de implementação (além de ser um lazy learner*). É um algoritmo supervisionado de machine learning, utilizado para problemas de classificação e regressão. Hoje, o foco é na parte de classificação. A ideia é simples, separar os indivíduos em grupos (ou classes) de acordo com a semelhança existente. Vamos entender o que isso quer dizer… (mais…)

Everest Regression

Alguém postou recentemente um comentário sobre Everest Regression no Twitter – não me recordo, mas creio que tenha sido o @lmonasterio. Acabei me recordando desse termo maravilhoso que ouvi somente umas duas vezes, mas que acho bem divertido e interessante. Sendo assim, vamos entender o que ele significa! (mais…)

Experimentos Controlados: Intenção-de-Tratar

Os experimentos aleatórios controlados, famosos RCTs (Randomized Controlled Trials), trazem consigo alguns problemas no que diz respeito aos indivíduos que fazem parte do estudo. Pense, por exemplo, num indivíduo que faz parte de um estudo com um novo remédio que deve ser tomado para baixar seu colesterol. É impossível para o cientista que está realizando o estudo saber se o paciente vai tomar ou não o remédio. É impossível também ele fazer com que o indivíduo não desapareça do nada. Para lidar com estes problemas, é comum adotamos a abordagem Intenção-de-Tratar (nome traduzido diretamente de Intention to Treat). Apenas para facilitar a escrita, chamaremos a abordagem de sua abreviação no inglês, ITT. (mais…)

Qual amostra mais confiável, uma de 90% da população ou uma de 5%?

Lembra daquelas pesquisas eleitorais de Twitter ou qualquer outra plataforma falando: entre aqui e marque em quem você vai votar, vamos fazer uma amostra de X milhões de pessoas, mais confiável que as pesquisas atuais? Eu lembro bem, pois é sofrível para alguém que adora estatística ouvir isso. Se você está minimamente próximo da estatística na sua vida profissional ou acadêmica e ainda acredita que é uma amostra de 1 milhão de pessoas é mais confiável do que uma de 5 mil, se você é desses que não desconfia de pesquisas feitas na internet onde participa quem se dispõe a clicar e preencher as respostas, então aconselho a leitura de uma discussão de hoje que aconteceu no Twitter. (mais…)

Correlação / Causalidade + RDD: Educação Impacta na Criminalidade?

Este post já está ficando cada vez mais batido aqui no blog, mas toda vez que eu encontro um bom exemplo, me sinto na obrigação de trazê-lo. Desta vez, a análise é sobre correlação e criminalidade. Afinal de contas, parece que alunos repetentes estão mais propensos ao crime. Ou seja, a repetência teria algum efeito sobre a criminalidade. Será? (mais…)

Correlação e Causalidade: Dois Exemplos Práticos

Como alguém que se interessa bastante por economia e estatística, estou sempre tentando entender alguns dados e o que eles significam. Como sempre, os dados podem ter várias interpretações, principalmente se forem somente alguns levantamentos mais simples com algumas correlações e não um estudo mais rebuscado. Neste post, quero mostrar duas maneiras com que as correlações podem nos enganar na hora de interpretar causalidades. (mais…)

Para que serve e como funciona a variável instrumental?

Variáveis instrumentais, em inglês Instrumental Variables (IVs), são excelentes para analisar causa e efeito de diversos eventos. Descobri esta técnica quando estudei Microeconometria, uma disciplina optativa no meu mestrado. Notei que muitas pessoas, mesmo dentro da estatística e econometria não tem tanta familiaridade com ela e achei mais espantoso ainda ela ter sido optativa. Sendo assim, resolvi escrever este breve texto introduzindo o conteúdo e a forma como esta técnica funciona. (mais…)