Estatística Básica

Amostra: Definição e Exemplo Prático

População é o conjunto de todos os indivíduos, coisas ou eventos do problema em questão. Em um estudo médico sobre obesidade, a população são todos os indivíduos obesos. Em uma análise sobre acidentes de trânsito, a população é composta por todos os acidentes de trânsito.

Uma amostra é um subconjunto da população que é extraída de forma a garantir que a representatividade de uma população. Como em muitos casos é impossível analisar a população como um todo, a amostra é uma forma de estudar o problema em questão utilizando um subgrupo da população. Se um médico quisesse testar a efetividade de um remédio para obesidade, sendo impossível testar o remédio em todas as pessoas obesas do mundo, ele provavelmente iria escolher um grupo de pessoas de diferentes idades, gêneros e raças para fazer parte do estudo. A partir do resultado obtido com a amostra, ele inferiria o resultado para a população de obesos.

post_amostra

Erros na extração de uma amostra invalidam um estudo. Duas anedotas são contadas no meu texto  Amostra que perde guerra!, disponível no Portal Deviante. Outra explicação sobre viés na amostragem, você pode encontrar nos posts Viés de Seleção: Seus resultados podem estar te enganando e Um exemplo prático de Viés de Seleção.

A técnica de amostragem mais comum é a amostragem aleatória simples. O método consiste em extrair um subconjunto de indivíduos de uma população de forma que todos os indivíduos tenham a mesma probabilidade de ser escolhidos e cada amostra possível tenha a mesma probabilidade de ser escolhida que qualquer outra amostra.

Para aprender a extrair amostras aleatórias no R e no SAS, visite os posts Gerar uma amostra aleatória simples no R e Gerar amostras aleatórias simples no SAS.

No Python, como ainda não há posts aqui no EstatSite, recomendo visitar: Random Sampling Numpy.

No futuro pretendo apresentar outras técnicas de amostragem e ainda o conceito de amostra não probabilística. Apesar de serem menos utilizadas que a técnica aqui apresentada, podem ser úteis ao leitor.

E se você gostou desse post, deixe sua curtida e divulgue para seus amigos. Isso ajuda bastante o site. Bons estudos!

Anúncios

Variáveis: Definição e Classificação

Em estatística, quando falamos de variável estamos falando sobre um atributo, uma característica de uma pessoa ou coisa. A altura de uma pessoa, o número de filhos e o estado civil são exemplo de variáveis.
As variáveis podem ser divididas em qualitativas ou quantitativas:
  • Variáveis Quantitativas: são variáveis numéricas, mensuráveis em uma escala quantitativa. A altura de uma pessoa e a quantidade de filhos que ela tem são variáveis quantitativas. Essas variáveis podem ainda ser divididas em variáveis discretas ou contínuas.
    • Discretas: são variáveis quantitativas cujos valores possíveis formam um conjunto finito ou enumerável de números (referenciar Bussab). Resulta de procedimento de contagem. Exemplos: número de filhos, quantidade de latas de cerveja, número de ovos que uma galinha bota ao longo da vida, etc.
    • Contínuas: são características mensuráveis. Em um determinado intervalo, podem adotar quaisquer valores (números reais). Na construção de tabelas de frequência, para estas variáveis, é necessário construir intervalos que agrupem os dados. Exemplos: altura, peso, renda salarial, etc.
  • Variáveis Qualitativas: são variáveis que não possuem valor quantitativo, não são expressas numericamente. A cor dos olhos e o sexo de um indivíduo são exemplos de variáveis qualitativas. Podemos ainda dividir estas variáveis em nominais e ordinais.
    • Nominais: variáveis que não possuem ordenação. Exemplos: sexo, cor dos olhos, nacionalidade, cidade de nascimento, etc.
    • Ordinais: variáveis que possuem ordenação. Exemplos: escolaridade, classe social, etc.
O quadro abaixo – um pouco mau desenhado, confesso – resume a classificação de variáveis:

pst_variaveis

Agora que você já entende o conceito de variáveis, é importante estudar como apresentar a frequência delas. Alguns posts bacanas sobre esse segundo passo são: Visualizando seus dados: HistogramaAnálise Bidimensonal para Variáveis Quantitativas e Análise Bidimensional para Variáveis Qualitativas.

Abraços e bons estudos!