Autor: Yukio

Criando Sequências no Python

Uma coisa geralmente é útil em diversos momentos é criar uma sequência de números. Seja esta sequência somente um índice ou uma sequência com alguma lógica, como uma progressão aritmética ou geométrica, é raro você passar por uma linguagem sem utilizá-las. No Python, isto não é diferente. Por isso, vamos ver alguns exemplos de como construir sequências. (mais…)

Anúncios

Histograma no R Agrupando 1 e 0?

Recentemente, recebi um e-mail pedindo uma ajuda para montar um histograma no R. O problema que a pessoa enfrentava era o seguinte: ao usar a função hist(), o R estava agrupando as quantidades que estavam na barra 1 e 0. Ou seja, se a pessoa tivesse 5 ocorrências do valor 0 e outras 3 com valor 1, o gráfico apresentaria só uma barra, registrando 8 ocorrências. Veja o exemplo abaixo: (mais…)

Python: Tipos de Variáveis e Listas

Como todas as linguagens, Python tem seus tipos de variáveis. A maioria já é conhecida das pessoas (string, numérica, etc.), mas há algumas novidades em termos de listas. Neste post, veremos como identificar o tipo da variável, algumas manipulações simples que podem ser feitas com cada tipo e os diferentes tipos de listas. (mais…)

Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook

Conforme falei em Primeiros passos em Python, além do Rodeo, outro ambiente muito utilizado para Python é o navegador Anaconda, que possui o Jupyter Notebook. Como a plataforma pode ser nova para alguns, vou explicar um pouco como fazer uso dela para programar em Python. É uma brevíssima introdução, bem prática, para que você passe logo pela parte chata e comece a programar. No futuro, pretendo fazer um post mais completo. (mais…)

Tutorial: Lidando com Missing no SAS

Já falei sobre missing em alguns posts aqui (ver post Verificar se alguma das colunas é missing no SAS e Formas de deletar linhas com Missing no SAS), mesmo assim, notei que faltaram algumas coisas. Este post é para dar conta do que não foi abordado no assunto. Ou seja, pode considerar o TUTORIAL como sendo a soma destes 3 posts. (mais…)

Merge (Join) no R

No post Como combinar tabelas no SAS utilizando left join e full join ensinei como unir tabelas no SAS, utilizando o PROC SQL. Agora, como podemos fazer essa união no R? Como utilizar os clássicos inner join, left join, right join, etc., no R? É bem simples, você vai ver que consegue fazer tudo isso com menos linhas que no SQL. (mais…)

Localizando Outliers Através do Intervalo Interquartil (+ Boxplot + Código SAS)

Recentemente, estava trabalhando com uma base de mais ou menos 500 mil linhas, onde a maior parte dos dados de uma determinada variável estava no intervalo de 0 a 1.000. Esta mesma variável, no entanto, possuía algumas linhas em que o valor dela era 5.000, 10.000 e até 15.000. Ou seja, haviam alguns outliers. Isto era um problema, principalmente, quando eu construía um gráfico de distribuição. Para lidar com isso, eu exclui os outliers com base no conceito do intervalo interquartil. (mais…)

Geolocalização: Plotando os pontos em um mapa no R

Trabalhando com uma base de dados de vendas do e-commerce brasileiro, me deparei com uma lista dos locais onde as compras foram feitas e outra com os locais de onde eram os compradores. Pensei comigo que uma forma bacana de demonstrar onde as compras eram feitas, seria marcando os locais das lojas ou dos compradores, no próprio mapa. (mais…)

Sumifs e Countifs no R

A maioria das pessoas que usa Excel já utilizou as funções sumif() e countif(), em português soma.se() e cont.se(). Estas funções tem como retorno a soma de determinada coluna condicionada a alguma regra qualquer. Imagine, por exemplo, que você é dono de uma loja e queira saber qual foi o gasto total em compras dos clientes acima de 50 anos na sua loja. Mais do que a soma, você pode querer a média ou a contagem do número de clientes. Para entender como se obter isso no R, dê uma olhada na tabela abaixo, composta por uma chave de identificação do cliente (id_cliente), o valor gasto em compras (vlr_compra), a idade e a UF: (mais…)