Criando variáveis dummy no R

Uma curtinha só para começar bem a semana…

Utilizando a base de dados german_credit_2 abaixo temos um exemplo de como criar uma variável binária com valor 1 para os clientes que possuem um montante de crédito acima de $ 1.000 e 0 para os que possuem menos que $ 1.000 (inclui uma forma de ler os dados em csv e uma forma de ler em excel):


## Le a base de dados csv
dados = read.csv("../database/german_credit_2.csv");

## le a base de dados excel - Primeiro instala pacote xlsx
install.packages("xlsx");
library("xlsx");
dados = read.xlsx("../database/german_credit_2.xlsx", sheetIndex=1);

## cria variavel para quem tem montante maior que mil
dados$valor1000 = as.numeric(dados$CreditAmount >= 1000);

Anúncios

3 comentários

    1. Enoch, muito obrigado pelo comentário. O que aconteceu foi o seguinte: 1) No último post expliquei que o arquivo estava em excel porque o wordpress não aceita csv. Vou revisar o texto e incluir uma menção a função read.excel. 2) O ponto no Credit Amount existia no último arquivo do site. Como eu baixei e fui reescrevendo o código e depois só copiei e colei, ele acabou ficando com esse ponto. De qualquer forma, não deveria ter no post, já que eu disponibilizei o arquivo sem esse ponto (eu acho). Vou consertar o post ainda hoje.

      Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s