Autor: Yukio

Ainda sobre eleições

Anúncios

Média por Grupo no R

Imagine que você tenha uma base contendo informações de diversos grupos ou categorias diferentes. Pode ser que você tenha a informação de idade para cada indivíduo e queira saber a média por sexo, por região ou até por separação de grupo tratamento e controle. No R, o pacote plyr facilita bastante esta análise. Não tenho certeza se já postei isso antes, mas como utilizei o código agora a pouco durante um curso de Data Science, acho válido compartilhar. (mais…)

Tutorial: PROC MEANS no SAS

Como falei no post anterior sobre frequências (ver TUTORIAL: PROC FREQ NO SAS), é difícil entender bases grandes somente olhando para o analítico. Normalmente, vamos tentar obter algumas medidas que resumam o conteúdo em questão. Uma das formas de obter estas medidas, quando falamos de variáveis numéricas, é utilizando o proc means. Com o proc means você consegue encontrar a média, mediana, percentil, quartil  e várias outras estatísticas no SAS. Veja abaixo como utilizar este procedimento para entender seus dados. (mais…)

TUTORIAL: PROC FREQ NO SAS

Sempre que você for trabalhar com bases grandes, você provavelmente não vai conseguir dizer o que está dentro daquela base e/ou entender se seus dados fazem sentido, somente olhando para o analítico da base. Uma das formas de se analisar o conteúdo de uma base, é verificando as frequências com que aparecem algumas informações. Verificar a frequência é importante não só para validação das informações, como também para se obter insumos para tomada de decisão. No SAS, a principal forma de se obter as frequências é através do proc freq. Vamos verificar quais as diferentes formas de se usar este comando. (mais…)

As pesquisas eleitorais são compradas?

Muita gente critica as pesquisas eleitorais. Se aproveitando dessa brecha, ou simplesmente por desconhecerem estatística, algumas pessoas estão criando pesquisas alternativas. Sites e mais sites agora pedem que você marque em quem vai votar, pensando que essa é a forma ideal de prever o resultado das urnas. Não é. E as pesquisas também não são fraudadas. Alguns dos motivos, que envolvem tanto teoria econômica, quanto técnicas estatísticas: (mais…)

Regressão Logística: Conceitos Essenciais e Modelo

Regressão Logística, também chamada de Logit, é uma técnica de modelagem utilizada para lidar com variáveis binárias (0 ou 1). Para responder a questões como “qual o salário de um indivíduo, dado seus anos de estudos”, “qual o valor de uma casa, dadas suas características”, a regressão linear é suficiente. Entretanto, se quisermos responder a questões como “o indivíduo vai pagar uma dívida?”, “o consumidor vai comprar determinado produto?”, i.e., perguntas de sim (=1) ou não (=0), aí faz sentido usar outro modelo, dentre as diversas possibilidades temos a regressão logística. (mais…)

Estatística Essencial em Forma de Anedota

Escrevi uma série de textos no Portal Deviante sobre experimentos, amostragem e outras formas de se fazer análises, além de explicar alguns conceitos estatísticos, todos em forma de historinhas, com exemplos bem claros. Cuidados que se deve ter e erros comuns. Todos bem leves e escritos de uma forma bem informal. (mais…)