Diversos

Estatística Tradicional e Machine Learning, qual a melhor?

Junto ao crescimento exponencial de informações e tipos de dados, surgem atualmente, de maneira acelerada, novas tecnologias e metodologias capazes de suportar, processar e analisar todo esse volume de informações. Com isso, alguns temas e discussões acabam vindo à tona no mundo do cientista de dados e dois dos que causam mais polêmica são justamente o que é melhor usar e como usar determinadas técnicas de análise de dados.  (mais…)

Anúncios

Artigo Científico sobre Experimentos Aleatórios Controlados

No meu texto de segunda feira escrito para o Portal Deviante, chamado Qual o tamanho da influência de seus amigos?, mencionei um ótimo artigo para quem quer estudar RCT (Randomized Controlled Trials). O artigo se chama How Does Peer Pressure Affect Educational Investments e é altamente recomendável para quem está estudando a matéria. Leia o meu texto e as indicações ao final dele!

Abraços!

Diagrama de Ramo-e-Folhas

Uma alternativa ao histograma é o diagrama ramo-e-folhas. No diagrama é possível observar a distribuição de um conjunto de valores. A grande diferença é que nele os valores originais são apresentados. A ideia aqui é dividir a informação em partes denominadas ramo e folha, sendo a primeira o valor inteiro e a segunda o decimal (até dois dígitos). Para o valor 5,35, o ramo é 5 e 35 as folhas.

Leia mais…

Artigo utilizando modelos em painel e text mining

Escrevi um texto para o portal deviante falando sobre um dos artigos mais legais de economia que li no ano passado. Além do considerável impacto social do tema, me chamou a atenção ver a autora utilizar text mining – além de outras técnicas estatísticas, como modelos em painel. Fica aí o link do meu texto para quem se interessar: Igualdade de Gênero no Mundo Acadêmico. Nele faço referência ao artigo e também a um bom livro chamado “The Why Axis: Hidden Motives and the Undiscovered Economics”, que é de economia, mas uma boa leitura para qualquer um envolvido em análise de dados.

Leia também:
Diferenças em Diferenças (Diff-in-Diff)
Regressão Diff-In-Diff com Efeitos Fixos no R

Introdução ao SQL

INTRODUÇÃO

SQL (Structured Query Language) é a linguagem padrão utilizada para armazenar, manipular e recuperar informações de bancos de dados. Colocando de forma simples, é através do SQL que é possível criar e atualizar nossos dados através de um modelo relacional. Os maiores usuários da linguagem são os DBAs (Database Administrators), responsáveis por toda a gestão dos dados, desde criar tabelas até dar acesso às demais áreas (para os mais curiosos há um podcast brasileiro com foco nos DBAs chamado DatabaseCast).

Leia mais…

Podcasts

Você pega trânsito no trabalho? Já cansou dos programas de rádio? Quer fazer algo mais produtivo com esse tempo? Que tal tentar um podcast?

Fiz uma pequena lista de programas falando sobre estatística:

Podcasts que falam sobre Estatística

PS.: Depois de ouvir os programas sobre estatística, dê uma chance a essa mídia. Recomendo o Scicast e o Dragões de Garagem para quem gosta de ciência!