5 operações de coluna em Pandas mais úteis

Como usar cinco das principais operações de coluna mais pesquisadas para Pandas

1. Como ordenar valores por coluna

A classificação com DataFrame Pandas por uma ou mais colunas pode ser feita de forma ascendente ou descendente.

O primeiro argumento passado em by é a coluna ‘column_name’ do nosso DataFrame que gostaríamos ordenar.

Se você precisarmos classificar por várias colunas, devemos passar os valores para uma lista de colunas e uma outra lista de ordenação correspondente às colunas.

Este exempelo ordenou as colunas do DataFrame de forma distinta, um a em ordem ascendente e a outra em descendente.

2. Como renomear colunas em Pandas

Há uma série de maneiras que você pode renomear colunas usando Pandas, vamos renomear tanto uma, como várias colunas.

Para renomear várias colunas:

Outra maneira de renomear cabeçalhos de coluna usando o módulo Python Pandas é definir o atributo:columns

3. Como Excluir colunas de DataFrames

Podemos excluir uma ou mais colunas de um dataframe Pandas ao mesmo tempo. Primeiro, vamos começar com a exclusão de uma coluna:

Especificando axis garante que estamos dropando uma coluna no sentido correto de “coluna” e não em linha. Para dropar várias colunas, atualizar a passagem com uma lista de nomes de colunas.

4. Agrupar colunas

Agrupar dados com Pandas é uma maneira de resumir seus dados. Isso pode ser usado como base para plotar gráficos ou apenas para fornecer insights.

O método pode ser usado em qualquer número de colunas e usado para agregar cada uma de diferentes maneiras. O código abaixo agrupará duas colunas e agregará a estas operações de soma e média, respectivamente.

5. Como aplicar uma função a uma coluna usando pandas

Uma maneira de aplicar uma função a todas as linhas em uma coluna de dataframe pandas é usando o método .apply()

Acima, uma coluna específica foi selecionada para a função (genérica neste caso) foi aplicada. As funções aplicadas podem ser embutidas, por exemplo, a função raiz quadrada numpy ou uma função definida pelo usuário.

Usando a função lambda, para cada linha na coluna, cada valor será quadrado e, em seguida, terá cinco adicionados aos valores dessa coluna.

Resumindo

  1. Classificar por colunas df.sort_values()
  2. Colunas de renomear df.rename()
  3. Excluir colunas df.drop()
  4. Grupo e agregado por colunas df.groupby().agg()
  5. Aplique uma função a todas as linhas em uma coluna df.apply()

Obrigado.

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store