Autor: Yukio

Experimentos Controlados: Intenção-de-Tratar

Os experimentos aleatórios controlados, famosos RCTs (Randomized Controlled Trials), trazem consigo alguns problemas no que diz respeito aos indivíduos que fazem parte do estudo. Pense, por exemplo, num indivíduo que faz parte de um estudo com um novo remédio que deve ser tomado para baixar seu colesterol. É impossível para o cientista que está realizando o estudo saber se o paciente vai tomar ou não o remédio. É impossível também ele fazer com que o indivíduo não desapareça do nada. Para lidar com estes problemas, é comum adotamos a abordagem Intenção-de-Tratar (nome traduzido diretamente de Intention to Treat). Apenas para facilitar a escrita, chamaremos a abordagem de sua abreviação no inglês, ITT. (mais…)

Anúncios

Qual amostra mais confiável, uma de 90% da população ou uma de 5%?

Lembra daquelas pesquisas eleitorais de Twitter ou qualquer outra plataforma falando: entre aqui e marque em quem você vai votar, vamos fazer uma amostra de X milhões de pessoas, mais confiável que as pesquisas atuais? Eu lembro bem, pois é sofrível para alguém que adora estatística ouvir isso. Se você está minimamente próximo da estatística na sua vida profissional ou acadêmica e ainda acredita que é uma amostra de 1 milhão de pessoas é mais confiável do que uma de 5 mil, se você é desses que não desconfia de pesquisas feitas na internet onde participa quem se dispõe a clicar e preencher as respostas, então aconselho a leitura de uma discussão de hoje que aconteceu no Twitter. (mais…)

Comunidades Terapêuticas: A Chave para Vencer as Drogas?

Estava com este texto escrito desde abril, como não encontrei onde publicá-lo – na verdade, até achei que tivesse, mas o site para o qual eu mandei ainda não publicou – vai ser aqui mesmo. Sem revisões de terceiros mesmo, então peço desculpas se tiver algum erro de concordância, gramática ou algo assim (acho que não tem!).

A guerra às drogas já consumiu trilhões de dólares considerando somente os Estados Unidos [1]. Apesar deste gasto imenso, este mercado nunca esteve tão acessível, o que deixa claro que as medidas de repressão que boa parte dos países adotaram no passado fracassaram. Por este motivo, boa parte do mundo desenvolvido tem migrado para uma política de redução de danos, descriminalização e legalização, ao invés de repressão. O Brasil, no entanto, ao assinar a nova Política Nacional sobre Drogas (PNAD) [2], caminha mais uma vez na direção contrária do que recomendam os especialistas da área. (mais…)

Introdução ao Text Mining com Python

Ainda não fiz nenhum post sobre text mining neste blog, o que é um pecado. Analisar textos, agora que muita informação está no Twitter, Facebook, comentários, discussões online, dentre tantas outras coisas, é essencial. Por isso, hoje vou fazer um breve post, no melhor estilo github, deixando somente o código e os comentários. Penso que é tudo bem auto-explicativo aqui, mas fiquem à vontade de me questionar nos comentários ou em qualquer outro lugar, caso tenham dúvidas com relação a algum trecho. (mais…)

Join – Merge no Python (Usando Pandas)

Assim como aprendemos no SQL, ou qualquer linguagem para manipulação de bases de dados, como unir bases de dados de diferentes maneiras, o Pandas nos permite fazer estas tratativas no Python. Abaixo, vamos aprender como fazer as uniões de tabelas e algumas táticas que podem facilitar sua vida. (mais…)

Só existem 4 grandes clubes no Brasil!

Há um tempo, um jornalista levantou o ponto de que só existem 4 grandes clubes no Brasil. Comentei isto numa thread no meu Twitter, mas antes havia iniciado este post aqui porque eu queria argumentar um pouco mais. O post ficou como rascunho por várias semanas até que hoje eu acidentalmente o vi. Achei válido finalizá-lo, só por diversão, mesmo não tendo nada a ver com o EstatSite. A fonte se resume ao Wikipedia, mas vou colocar alguns links ao fim do post. (mais…)

Correlação / Causalidade + RDD: Educação Impacta na Criminalidade?

Este post já está ficando cada vez mais batido aqui no blog, mas toda vez que eu encontro um bom exemplo, me sinto na obrigação de trazê-lo. Desta vez, a análise é sobre correlação e criminalidade. Afinal de contas, parece que alunos repetentes estão mais propensos ao crime. Ou seja, a repetência teria algum efeito sobre a criminalidade. Será? (mais…)

Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação

Resolvi compartilhar um exercício que tive que fazer, no qual o objetivo era analisar um gráfico e localizar suas falhas. Isto tudo com base num trabalho de Alberto Cairo, chamado Graphics Lies, Misleading Visuals (recomendadíssimo!). Recebi 15/15 pontos de três avaliadores, mas fica aí aberto para quem tiver críticas ou sugestões. Recomendo também que façam este tipo de exercício, ainda que não tenham um avaliador. Só o fato de parar para pensar no tema já traz uma boa evolução. (mais…)

Variáveis Aleatórias Contínuas

Dando continuidade aos posts sobre variáveis aleatórias (se você ainda não leu os demais, vá em Variáveis: Definição e Classificação e Variáveis Aleatórias Discretas), vamos falar agora das variáveis aleatórias contínuas. Vamos entender a definição destas variáveis, entender suas funções e como calcular o valor médio e a variância. (mais…)

Variáveis Aleatórias Discretas

No passado, foi introduzido o conceito de variáveis no post Variáveis: Definição e Classificação. Agora, vamos introduzir o conceito de variável aleatória e derivados, como função de probabilidade, função de distribuição, além da forma de se calcular a média e a variância para estas variáveis. (mais…)