6 padrões de exibição com Pandas Options Display

Às vezes podemos querer que ele exiba em algum formato que não seja o padrão. Neste artigo, sugiro 6 ajustes melhorar a eficiência de codificação.

Como cientista de dados, analista de dados ou engenheiro de dados, o Pandas deve ser uma das bibliotecas mais usadas em Python. Ele pode imprimir o Data Frame em um formato bem HTML estilizado para nós, que é uma de suas principais características se você estiver usando o Jupyter Notebook/Lab ou o Google Colab como eu.

Como os Pandas usam HTML + CSS pré-definidos, não precisamos nos preocupar com o formato nós mesmos. No entanto, às vezes podemos querer que ele exiba em algum formato que não seja o padrão. Você provavelmente sabe que podemos começar por definir:

1. Definir o número máximo de linhas

pd.options.display.max_rows

Quando tivermos um DataFrame com mais linhas, o Pandas irátruncar as linhas no meio para garantir que não seremos incomodados com uma mesa extremamente longa. O número padrão é 60.

Como mostrado, se tivermos um quadro de dados com mais de 60 linhas, 50 linhas no meio serão truncadas.

pd.DataFrame(np.random.randn(61, 5))

Se definirmos a opção maior do que o número de linhas do nosso quadro de dados, todas as linhas serão exibidas. Por exemplo, vamos defini-lo para 100 linhas.

pd.options.display.max_rows = 100

2. Definir o número máximo de colunas

pd.options.display.max_columns

Claro, a lógica de truncado também se aplica à direção horizontal. O número padrão do número máximo de colunas é 20.

Se não alterá-lo e tiver um quadro de dados com mais de 20 colunas, não poderemos ver as colunas no meio novamente.

pd.DataFrame(np.random.randn(5, 21))

Se quisermos ver todas as colunas, basta toranr o número máximo de colunas ainda maior.

pd.options.display.max_columns = 50

3. Definir largura máxima da célula

pd.options.display.max_colwidth

Não só o número de linhas e colunas, mas a largura de cada célula também tem restrições em sua largura.

Por padrão, pandas exibem apenas conteúdo em uma célula com uma largura máxima de 50. Ou seja, uma célula com mais de 50 caracteres será truncada.

pd.DataFrame({
'col': [''.join(list("Towards Data Science.") * 3)]
})

No código acima, eu só repeti a string “Para Ciência de Dados”. 3 vezes que tem 63 caracteres no total. Então, a cauda é truncada.

Se definirmos a largura máxima da coluna para 80, todo o texto será exibido.

4. Definir o número máximo de colunas mostradas em

pd.options.display.max_info_columns

Acredito que a maioria de nós usará para verificar rapidamente o perfil do DataFrame.

No entanto, às vezes não mostra todas as colunas nos resultados. Isso ocorre porque o método tem uma restrição padrão no número máximo de colunas a serem perfildas, que é de 100 colunas.

Vamos criar um DataFrame de dados aleatório com mais de 100 colunas e usar o método para obter seu perfil.

df = pd.DataFrame(np.random.randn(5, 101))
df.info(

Neste caso, a opção de colunas de informações máximizar o número de colunas pode ajudar.

pd.options.display.max_info_columns = 150
df.info()

5. Definir precisão de exibição

pd.options.display.precision

Você pode ou não notar que o Pandas realmente tem uma restrição incorporada sobre o número de decimais a serem exibidos em um quadro de dados. Vamos usar o quadro de dados gerado na demonstração anterior como exemplo.

Preste atenção na primeira célula, que tem um número flutuante -0,939665. Isso porque pandas só exibirão 6 dígitos após o ponto decimal. Se tirarmos o número do quadro de dados da seguinte forma, podemos então ver que ele tem muito mais decimais -0,9396645167554308.

df.iloc[0, 0]

Não se preocupe. Isso não afetará os números reais que serão usados em seu algoritmo mais tarde, porque é apenas para exibição. No entanto, se quisermos ver os números com mais precisão? Vamos definir a opção para 15.

pd.options.display.precision = 15

Agora, ele pode exibir o número inteiro.

6. Definir formato decimal

pd.options.display.float_format

Às vezes, podemos querer mostrar nosso trabalho para outra pessoa, ou podemos querer ver o quadro de dados mais bonito por nós mesmos.

Por exemplo, vamos considerar que os números no quadro de dados que usamos nos exemplos acima devem ser percentuais, e só nos preocupamos 2 dígitos após o ponto decimal. Em seguida, podemos usar esta opção para definir o formato de exibição da seguinte forma.

pd.options.display.float_format = '{:.2f}%'.format

Como mostrado, o formato é flexível o suficiente para você torná-lo o que se adequar às suas necessidades, como exibir moeda.

Concluindo

Neste artigo, apresentei 6 pandas exibindo opções que seria melhor memorizar. Há mais de 30 deles, mas estes são o que eu encontrei os mais usados.

Obrigado.

Composing a repository of books (i bought), authors (i follow) & blogs (direct ones) for my own understanding.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store