Como obter a moda no R

Moda é uma medida de tendência central. A definição é simples: é o valor que aparece com maior frequência nos seus dados. Exemplo: a moda do conjunto {1,1,2,2,3,3,3,4} é 3.

Nunca havia reparado, mas no R não há uma função para moda. A função mode() retorna o formato da variável (e.g.: numérico). Fuçando um pouco, encontrei um ótimo tuutorial de estatística em R no Analytics Vidhya que incluía essa função. Para obter a moda, a alternativa é obter a frequência de cada valor e a partir daí utilizar a função max. Veja o exemplo com o dataset cars (já disponível no R por default):

# obtem a tabela com frequencia das variaveis
freq = table(cars$speed);
# obtem o nome da variavel
names(table(cars$speed))[table(cars$speed) == max(table(cars$speed))]

Lembrando que a função names() serve para obter o nome de uma coluna no R com base na posição (ou deixando em branco se quiser saber todas).

# retorna os nomes das colunas
names(cars)
# retorna o nome da coluna 2
names(cars)[2]
Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s