Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)

Recentemente fui analisar várias colunas de um dataframe no Python, mas as funções que estava utilizando eram todas numéricas. Ou seja, as colunas que não eram numéricas estavam atrapalhando meu código. Para resolver este problema, descobri que era possível selecionar somente as colunas numéricas no Python com uma função bem simples:


numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
df_numeric = df.select_dtypes(include=numerics)

Veja o que foi feito, primeiro declaramos quais os tipos de variáveis que queremos no nosso dataframe, na sequência, utilizamos a função select_dtypes() para filtrar somente os tipos de variáveis que correspondem ao tipo que declaramos. Com isso, temos uma nova tabela somente com os tipos de variáveis que queremos.

Se você quiser listar todas as variáveis que foram selecionadas, você pode utilizar o comando abaixo:


list(df_numeric.columns.values)

O comando é bem intuitivo, você está listando todas as variáveis (i.e., todas as colunas) do seu dataframe.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s