10 métodos em Pandas que podem ajudar a substituir o Excel por Python

Como você pode usar esses métodos pandas para fazer a transição do Microsoft Excel para o Python, economizando tempo e sanidade

1. Importar um arquivo Excel

Esse método lê seu arquivo Excel em um DataFrame Pandas . Você vai querer reutilizar este dataframe, então vamos salvá-lo para a variável .

df = pd.read_excel(some_file_path)

2. Visualizar o novo DataFrame

Pode parecer um pouco estranho no início que você não esteja visualizando cada linha de dados como em um arquivo Excel. Veja como visualizar os cinco primeiros registros — você pode especificar esse valor dentro dos parênteses, seu padrão é de apenas cinco.

df.head()

3. Contagem de linhas

Geralmente é útil saber com quantas linhas você está trabalhando, então para conseguir isso você pode chamar o método.

df.count()

4. Estatísticas descritivas básicas

Com apenas uma linha de código você é capaz de obter o mínimo, máximo e média de todas as colunas dentro de seu DataFrame.

df.describe()

5. Substituir valores nulos

Este é bastante autoexplicativo, para substituir todos os valores NaN por um zero.

df.fillna(0)

Podemos ir um pouco além com o preenchimento para frente, ou para trás preenchendo com o valor anterior ou posterior da linha.

df.fillna(method='ffill', axis = 0)df.fillna(method='bfill', axis = 0)

Ou preenchendo para frente, ou para trás o valor da coluna.

df.fillna(method='ffill', axis = 1)df.fillna(method='bfill', axis = 1

6. Filtro

Filtrando uma coluna específica com base em um determinado valor ou string. Uma vez que você está mais familiarizado, aqui está uma documentação sobre como filtrar com base em múltiplas condições.

df[df['column_name'] == 0]df[df['column_name'] == "hello"]

7. Dropar duplicatas

Para quando você não quiser nenhuma linha repetida dentro de seus dados.

df.drop_duplicates()

8. Join

Juntar nosso DataFrame principal com outro dataframe, unindo-os pelo mesmo valor de coluna. O método tem o parâmetro padrão, no entanto, quando você estiver mais confiante há outros tipos de joins você pode descobrir mais sobre na documentação pandas.

df.join(lookup_dataframe, on='column_name')

9. Pivot/Agrupamento

Outra grande parte do trabalho em Excel é o uso de Tabelas Dinâmicas. Usando pandas, é muito simples de recriar.

df.groupby(['column1', 'column2']).sum()
df.groupby(['column1', 'column2']).count()

Ou, se você quiser agregar cada coluna com um método diferente, você pode fazer isso também.

df.groupby(['column1', 'column2']).sum()
df.groupby(['column1', 'column2']).count()

10. Exportar para Excel

A probabilidade é que você precisará compartilhar seu trabalho novamente no Excel. Isso é o que seus colegas esperam receber, ou o que você vai se sentir confortável usando para visualizações de dados.

df.to_excel(file_path, index=False)

Aqui eu especifiei para não incluir índices dentro do arquivo Excel de saída, no entanto você sempre pode alterar isso para ser, se desejar.

Obrigado.

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store