r

Loop no R

Quando falamos de loop em computação, estamos nos referindo a uma sequência de comandos que são especificados uma vez no código, mas executados repetidas vezes sucessivamente. (mais…)

Anúncios

Criando tabelas no R

Muitas vezes, para praticar alguma técnica, é mais eficiente criar uma amostra qualquer para fazer pequenos testes. Sendo uma amostra pequena, você consegue verificar se a técnica funciona, ou simular vários cenários possíveis para garantir que ela atenderá a todos. No R, é bem simples criar uma amostra. Abaixo, criamos um data frame com 3 variáveis, sendo uma a chave de identificação (id), a outra uma variável com caracteres (var_char) e a outra uma variável numérica (var_num):

exemplo_1 = data.frame(id = c(1, 2, 3, 4),
var_char = c("A", "B", "C", "D"),
var_num = c(10, 20, 30, 40))

exemplo_1

Captura de Tela 2018-06-17 às 08.40.12

É possível, de forma mais ágil ainda, criar sequências de números, letras maiúsculas, letras minúsculas e até mesmo de meses:

exemplo_2 = data.frame(id = c(1:10),
var_car = letters[1:10],
VAR_CHAR = LETTERS[1:10],
mes = month.abb[1:10])
exemplo_2

Captura de Tela 2018-06-17 às 08.44.54

Para criar amostras aleatórias, basta adaptar o código que vimos em Gerar uma amostra aleatória simples no R:

# variavel aleat sera amostra de numeros de 0 a 100
exemplo_3 = data.frame(id = c(1:10),
                      aleat = sample(1:100, 10, replace=T))
exemplo_3

Captura de Tela 2018-06-17 às 08.47.53

Simples, não?

Sempre que for utilizar alguma técnica mais complexa, teste em tabelas menores, que possibilitem que você visualize exatamente o que está sendo feito. Simule os cenários que você pode encontrar e veja se o que você fez atende a todos.

Bons estudos!

Se este post te ajudou de alguma forma, curte o link ou deixe um comentário. E se tiver outros amigos que trabalham com esse material, não deixe de compartilhar com eles o site. Obrigado.

Unindo tabelas no R (Join/Merge)

Quem trabalha muito com bases de dados com certeza já usou algum comando com o nome merge ou os famosos joins. Esse eu acho que é de longe o tipo de comando que eu mais uso quando trabalho com base de dados. Como você nunca tem todas as informações possíveis em uma tabela, você sempre vai precisar enriquecer suas bases com informações de outros locais.  (mais…)

Séries Temporais: Gráficos para Sazonalidade

Além da decomposição apresentada no post Séries Temporais: Introdução e Decomposição dos Componentes em R, há outras formas de visualizar a sazonalidade da série. A séries utilizada aqui é a a10 do pacote fpp, e que contém as informações de venda de antibióticos na Austrália no período de 1991 a 2008.

Leia mais…

Gerar uma amostra aleatória simples no R

Para gerar uma amostra aleatória simples no R a partir de um conjunto de dados que você possui, o modo mais fácil é com a função sample() já apresentada aqui no post Como gerar números aleatórios no R?. A única diferença é que será necessário colocar como primeiro argumento o vetor em questão:

Leia mais…

Histograma no R

Fazer um histograma no R é bem simples, basta utilizar o comando hist() com a variável que você quer investigar a distribuição. No entanto, um gráfico detalhado pode necessitar de mais detalhes, seja uma mudança na cor ou a apresentação das medidas de tendência central. Este post apresentará os detalhes que são possíveis de acrescentar no seu histograma utilizando o R.

Leia mais…

Tutorial: Manipulação e Análise de Dados em R

Esse é um pequeno tutorial para quem não tem muita familiriadade com o R. O foco é entender o que o R é capaz de fazer, mas não deixar de fora as explicações estatísticas (ainda que sejam breves). Se você nunca abriu o R, recomendo que passe primeiro por Primeiros passos no R (Studio) e em seguida volte aqui.

Leia mais…