Autor: Yukio

20 pacotes de Machine Learning mais baixados do R

Se liga nesse gráfico que o KDnuggets postou hoje, com os 20 pacotes de Machine Learning mais baixados do R: (mais…)

Anúncios

As pesquisas eleitorais são compradas?

  • Muita gente critica as pesquisas eleitorais. Se aproveitando dessa brecha, ou simplesmente por desconhecerem estatística, algumas pessoas estão criando pesquisas alternativas. Sites e mais sites agora pedem que você marque em quem vai votar, pensando que essa é a forma ideal de prever o resultado das urnas. Não é. E as pesquisas também não são fraudadas. Alguns dos motivos, que envolvem tanto teoria econômica, quanto técnicas estatísticas: (mais…)
  • Regressão Logística: Conceitos Essenciais e Modelo

    Regressão Logística, também chamada de Logit, é uma técnica de modelagem utilizada para lidar com variáveis binárias (0 ou 1). Para responder a questões como “qual o salário de um indivíduo, dado seus anos de estudos”, “qual o valor de uma casa, dadas suas características”, a regressão linear é suficiente. Entretanto, se quisermos responder a questões como “o indivíduo vai pagar uma dívida?”, “o consumidor vai comprar determinado produto?”, i.e., perguntas de sim (=1) ou não (=0), aí faz sentido usar outro modelo, dentre as diversas possibilidades temos a regressão logística. (mais…)

    Estatística Essencial em Forma de Anedota

    Escrevi uma série de textos no Portal Deviante sobre experimentos, amostragem e outras formas de se fazer análises, além de explicar alguns conceitos estatísticos, todos em forma de historinhas, com exemplos bem claros. Cuidados que se deve ter e erros comuns. Todos bem leves e escritos de uma forma bem informal. (mais…)

    Regressão Logística no R

    Regressão logística é uma técnica estatística muito poderosa, utilizada para modelagem de saídas binárias (sim ou não). Quando se quer medir a relação de uma variável dependente binária com uma ou mais variáveis independentes, é comum utilizar esta técnica. Pense, por exemplo, numa empresa que empresta dinheiro para um cliente. Com base nas informações deste cliente (idade, profissão, etc.), é interessante a empresa tentar prever se o cliente vai pagar a dívida ou não. Uma forma de tentar prever isso é utilizando a regressão logística.  (mais…)

    Análise de Componentes Principais (PCA) no R

    Estava fazendo um curso de machine learning, quando reparei que as minhas notas com o código R para rodar PCA, estavam até que bem didáticas. Ainda não falei do conteúdo aqui no site, mas acho que compartilhar esse código já deve ajudar algumas pessoas. (mais…)