Correlação / Causalidade + RDD: Educação Impacta na Criminalidade?

Este post já está ficando cada vez mais batido aqui no blog, mas toda vez que eu encontro um bom exemplo, me sinto na obrigação de trazê-lo. Desta vez, a análise é sobre correlação e criminalidade. Afinal de contas, parece que alunos repetentes estão mais propensos ao crime. Ou seja, a repetência teria algum efeito sobre a criminalidade. Será? (mais…)

Anúncios

Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação

Resolvi compartilhar um exercício que tive que fazer, no qual o objetivo era analisar um gráfico e localizar suas falhas. Isto tudo com base num trabalho de Alberto Cairo, chamado Graphics Lies, Misleading Visuals (recomendadíssimo!). Recebi 15/15 pontos de três avaliadores, mas fica aí aberto para quem tiver críticas ou sugestões. Recomendo também que façam este tipo de exercício, ainda que não tenham um avaliador. Só o fato de parar para pensar no tema já traz uma boa evolução. (mais…)

Variáveis Aleatórias Contínuas

Dando continuidade aos posts sobre variáveis aleatórias (se você ainda não leu os demais, vá em Variáveis: Definição e Classificação e Variáveis Aleatórias Discretas), vamos falar agora das variáveis aleatórias contínuas. Vamos entender a definição destas variáveis, entender suas funções e como calcular o valor médio e a variância. (mais…)

Variáveis Aleatórias Discretas

No passado, foi introduzido o conceito de variáveis no post Variáveis: Definição e Classificação. Agora, vamos introduzir o conceito de variável aleatória e derivados, como função de probabilidade, função de distribuição, além da forma de se calcular a média e a variância para estas variáveis. (mais…)

Tabela Dinâmica no Python

Todo mundo já se complicou tentando fazer uma tabela dinâmica (pivot table) fora do Excel. No Python, você não precisa criar uma função ou fazer algum tipo de manipulação com a tabela para chegar numa visão semelhante ao que fazemos nas tabelas dinâmicas do Excel. Vamos entender então como utilizar a função pivot_table – se você estiver iniciando e não sabe ainda o que é uma tabela dinâmica, recomendo que vá ao Youtube, faça uma pesquisa rápida e volte em seguida. (mais…)

Tutorial: Strings em Python

Trabalhar com variáveis texto não é a coisa mais difícil do mundo, mas nem sempre é trivial. Como contar a quantidade de caracteres (i.e. o comprimento) de uma variável? Como converter uma variável minúscula para maiúscula? Como pegar um trecho (~substring) de uma variável texto? Como concatenar dois campos e criar uma nova coluna com base neles? Tudo isso é essencial para a sobrevivência de um cientista de dados. Neste post, vamos conhecer alguns comandos essenciais para quando se trabalha com variáveis strings no Python. (mais…)

Tutorial: Tratando sua Tabela no Python (com Pandas)

Este Tutorial deveria se chamar “Selecionando e Filtrando Elementos em um Dataframe no Python”, entretanto, para não confundir ninguém, exclui o termo “Dataframe”. De maneira formal, Dataframe é um objeto formado por séries bidimensionais. De forma esdrúxula, é o que normalmente lemos como uma tabela. Neste post, trabalhando com a biblioteca Pandas, vou mostrar como localizar elementos, fazer filtros, excluir colunas, ordenar os dados, dentre outras tarefas que realizamos em Dataframes. (mais…)

Inserindo Título/Notas no seu Jupyter Notebook

Já dei uma breve introdução ao Jupyter Notebook no post Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook. Se antes eu achava que o Rodeo seria meu preferido para programar em Python, agora não vejo chance nenhuma de trocar o Jupyter Notebook. Uma das coisas mais interessantes dessa aplicação, e que será o tema deste curto post, é que você consegue acompanhar facilmente todo o histórico de seu código e, mais ainda, transformar numa espécie de apresentação ou caderno mesmo. (mais…)

Funções Lambda em Python

Já expliquei como construir uma função em Python no post Construindo Funções em Python. No entanto, Python tem uma função que eu desconhecia até pouco tempo e que tem seu valor, principalmente pela praticidade. Esta nova função, que eu vou explicar neste post, é a chamada função lambda(mais…)

Correlação e Causalidade: Dois Exemplos Práticos

Como alguém que se interessa bastante por economia e estatística, estou sempre tentando entender alguns dados e o que eles significam. Como sempre, os dados podem ter várias interpretações, principalmente se forem somente alguns levantamentos mais simples com algumas correlações e não um estudo mais rebuscado. Neste post, quero mostrar duas maneiras com que as correlações podem nos enganar na hora de interpretar causalidades. (mais…)