Leitura de arquivos CSV no Python

Embora já tenha falado sobre isso em Primeiros passos em Python, acabei repetindo o tema. Acontece, não vale a pena deletar agora que já está escrito…

CSV talvez o formato mais popular utilizado para guardar dados. Por esse motivo é importante saber como carregar arquivos nesse formato em qualquer software estatístico que você esteja utilizando. Sendo assim, apresento aqui a maneira de carregar um arquivo .csv no Python. Para replicar os códigos abaixo, você deve antes baixar o arquivo german_credit_data.csv – esse dataset já foi utilizado em outros posts, então recomendo que você o tenha na sua máquina. O arquivo contém 1.000 linhas com informações de crédito dos clientes de um banco alemão.

Apesar de existir o módulo CSV no Python, eu ainda acho a documentação meio confusa e prefiro utilizar funções do Panda. Abaixo, já com comentários, como carregar o arquivo .csv e visualizar as primeiras e últimas linhas da tabela em questão:

# carrega biblioteca
import pandas as pd

# carrega dados
german_credit = pd.read_csv("D:/Estudos/Datasets/german_credit.csv")

# visualiza 10 primeiras linhas
german_credit.head(10)

# visualiza 10 ultimas linhas
german_credit.tail(10)
Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s