vies de selecao

Amostra: Definição e Exemplo Prático

População é o conjunto de todos os indivíduos, coisas ou eventos do problema em questão. Em um estudo médico sobre obesidade, a população são todos os indivíduos obesos. Em uma análise sobre acidentes de trânsito, a população é composta por todos os acidentes de trânsito.

Uma amostra é um subconjunto da população que é extraída de forma a garantir que a representatividade de uma população. Como em muitos casos é impossível analisar a população como um todo, a amostra é uma forma de estudar o problema em questão utilizando um subgrupo da população. Se um médico quisesse testar a efetividade de um remédio para obesidade, sendo impossível testar o remédio em todas as pessoas obesas do mundo, ele provavelmente iria escolher um grupo de pessoas de diferentes idades, gêneros e raças para fazer parte do estudo. A partir do resultado obtido com a amostra, ele inferiria o resultado para a população de obesos.

post_amostra

Erros na extração de uma amostra invalidam um estudo. Duas anedotas são contadas no meu texto  Amostra que perde guerra!, disponível no Portal Deviante. Outra explicação sobre viés na amostragem, você pode encontrar nos posts Viés de Seleção: Seus resultados podem estar te enganando e Um exemplo prático de Viés de Seleção.

A técnica de amostragem mais comum é a amostragem aleatória simples. O método consiste em extrair um subconjunto de indivíduos de uma população de forma que todos os indivíduos tenham a mesma probabilidade de ser escolhidos e cada amostra possível tenha a mesma probabilidade de ser escolhida que qualquer outra amostra.

Para aprender a extrair amostras aleatórias no R e no SAS, visite os posts Gerar uma amostra aleatória simples no R e Gerar amostras aleatórias simples no SAS.

No Python, como ainda não há posts aqui no EstatSite, recomendo visitar: Random Sampling Numpy.

No futuro pretendo apresentar outras técnicas de amostragem e ainda o conceito de amostra não probabilística. Apesar de serem menos utilizadas que a técnica aqui apresentada, podem ser úteis ao leitor.

E se você gostou desse post, deixe sua curtida e divulgue para seus amigos. Isso ajuda bastante o site. Bons estudos!

Anúncios

Um exemplo prático de Viés de Seleção

Errar na hora de selecionar a amostra de um estudo pode causar vários problemas no experimento. Escrevi recentemente um texto no Portal Deviante sobre o assunto. Para ler clique no link: Amostra que perde guerra!

Leia também: Viés de Seleção: Seus resultados podem estar te enganando

Viés de Seleção: Seus resultados podem estar te enganando

Imagine que você queira saber se pessoas que vão ao médico vivem melhor do que pessoas que não vão, ou vão pouco, ao médico. Aí você monta um experimento, pega 100 pessoas que vão ao médico semanalmente e outras 100 que quase não vão. Ao final de um período você analisa os dois grupos e olhe só, quem menos foi ao médico está mais saudável. É suficiente para você concluir que ir ao médico faz mal à saúde?

Você pode levantar diversas hipóteses aí. Talvez ir ao médico seja ruim porque você pega doenças de outros pacientes, ou então os médicos não tratam direito os pacientes, ou quem vai ao médico toma muitos remédios e os efeitos colaterais são ruins.

É bem possíve que você tenha sido mais uma vítima do viés de seleção.

O viés de seleção ocorre quando o grupo estudado não foi escolhido de forma aleatória. Mesmo que não intencional, afinal, nesse caso você não escolheu os seus pacientes, mas nem por isso a escolha foi aleatória.

Pense no exemplo mencionado. Pessoas que vão ao médico constantemente, na maioria das vezes, vão porque possuem uma saúde mais debilitada que pessoas que não vão tanto ao médico. Sendo assim, é muito provável que elas possuam uma saúde pior mesmo indo ao médico.

Outro exemplo poderia ser algumas pesquisas antigamente que eram feitas por telefone. Imagine que uma empresa ligue para diversas pessoas para fazer uma determinada pesquisa. Mesmo que ela ligue para pessoas de diversas cidades, essa amostra possivelmente está viesada, já que muitas pessoas não possuíam telefone em casa no Brasil.

Sempre que ler um estudo, ou fizer seu próprio estudo, pense bem em como sua amostra foi selecionada, isso vai fazer toda a diferença!

Para os que possuem inglês de nível avançado ou fluente, recomendo a leitura do livro Mostly Harmless Econometrics de Joshua Angrist, os capítulos 1 e 2 dão uma boa ideia desse tipo de problema.