Drop() Pandas: o que é e como usar esse método na prática?

Análises estatísticas requerem o tratamento de inúmeros dados, seja para buscar uma informação, inserir uma nova ou deletá-la. Desse modo, o Python é bastante útil, pois oferece uma infinidade de pacotes e métodos específicos para essa atividade, como é o caso do drop() Pandas.

Assim, se você já precisou ou tem interesse em conhecer mais sobre como remover dados de tabelas de forma rápida e eficiente, gostará de saber mais sobre esse método, específico para essa funcionalidade. 

Por isso, fique com a gente, e aprenda sobre drop() Pandas como os seguintes tópicos:

Boa leitura!

O que é e para que serve o método drop() Pandas?

Para entender do que se trata o método drop() Pandas, precisamos compreender o que é o Pandas. 

O Pandas é um pacote do Python, projetado para trabalhar com análise de dados. Desse modo, ele é adequado para lidar com dados tabulares, séries, matrizes, entre outros conjuntos estatísticos.

Assim, o método drop() serve para eliminar linhas e colunas de tabelas, baseadas em um rótulo e eixo correspondentes, ou em um índice ou nome de coluna. Quando utilizado com multi-indexes, rótulos em diferentes níveis podem ser removidos.

Qual a sintaxe desse método?

A sintaxe do método drop() Pandas utiliza a palavra dataframe, que seria o conjunto de dados utilizado no momento, seguido do método drop(). O método recebe parâmetros, para que possa localizar qual linha ou coluna deverá ser removida. Dessa forma, podem ser inseridos:

  • labels (rótulos); 
  • axis (eixos); 
  • index (linha); 
  • columns (coluna); 
  • level (nível); 
  • inplace (atual); 
  • errors (erros). 

Vale ressaltar que nem todos os parâmetros precisam ser utilizados. Alguns deles possuem função de substituição, como é o caso de index e columns, que fazem o papel de labels. Veja, a seguir, a sintaxe completa:

dataframe.drop(labels, axis, columns, level, inplace., errors)

Para entendermos melhor o funcionamento, vamos a um exemplo. 

Para remover uma coluna específica, utilizamos o seguinte comando: 

dataframe.drop(“column name”, axis='columns').

O item “column name” seria o nome da coluna e “columns” indica o eixo de remoção, no caso uma coluna. Já para remover uma linha, o código ficaria: 

dataframe.drop(1, axis='index') 

“1” seria o índice da linha e “index” seria o eixo de remoção, no caso uma linha.

Quais os parâmetros do método drop() Pandas?

Agora, vamos falar com mais detalhes sobre a finalidade de cada um dos parâmetros disponíveis no método drop() Pandas. Confira a tabela:

ParâmetroValorDescrição
labelsNome da linha ou coluna a ser removida
axis0 ou “index”, 1 ou “columns”Eixo de remoção

index e columns

de labels, axis = 1 para columns = labels ou index = labels
Alternativa para o parâmetro labels. Usado para especificar o nome da linha ou coluna
level1 ou nome do nívelUsado para checar o nível da hierarquia de valores


inplace


True ou False
A remoção é feita no DataFrame atual quando True ou retorna uma cópia de onde a remoção foi feita quando False 
errors“ignore” ou “raise”Usado para ignorar ou não os erros do processo

Valor de retorno do método drop() Pandas!

Ao utilizarmos o método drop() Pandas, vamos obter como resultado um DataFrame. O DataFrame é o conjunto de dados resultante da aplicação do drop() e seus parâmetros. Outro retorno possível seria um None, obtido quando o parâmetro inplace estiver configurado como True

Para exemplificar, temos a seguinte matriz de valores, em que 0, 1 e 2 são indexes e “A”, “B”, “C” e “D” são colunas:

ABCD
00133
14567
2891011

Ao aplicarmos o método para remover as colunas “B” e “C”, utilizando o comando 

dataframe.drop(columns=['B', 'C'])

Receberemos o DataFrame:

AD
003
147
2811

5 exemplos de uso do método drop() Pandas!

Abordaremos agora cinco exemplos sobre como utilizar o método drop() Pandas, para lidar com a análise de dados. Para isso, usaremos o DataFrame abaixo:

ABCD
00133
14567
2891011

Deletar uma coluna pelo nome e eixo

dataframe.drop(labels="A", axis=1)

Nesse exemplo, devemos passar o rótulo ao qual desejamos remover e se ele é uma linha ou coluna, passando seu eixo. Dessa forma, 1 significa coluna e 0 significa linha. Veja que a coluna “A”, da tabela, foi removida.

BCD
0133
1567
291011

Deletar uma coluna apenas pelo nome

dataframe.drop(columns="A")

Aqui será apagada da tabela a coluna indicada no parâmetro “columns”. Desse modo, “A” é removida.

BCD
0133
1567
291011

Deletar uma linha a partir do index

dataframe.drop(0)

Nesse método, é removida a linha de index 0, ou seja, a primeira linha da tabela.

ABCD
14567
2891011

Deletar uma linha e coluna pelo index e nome da coluna

dataframe.drop(index=0, columns=”A” )

Nesse caso, será apagado da tabela a linha indicada no parâmetro “index” e a coluna indicada no  parâmetro “columns”. Assim, a coluna “A” e a linha 0 são removidas.

BCD
1567
291011

Deletar linhas por nível

dataframe.drop(index="length", level=1) 

Nesse método, o “index” será o comprimento de cada dado. Dessa forma, se cada coluna possui duas linhas, então o método irá apagar a 2° linha de cada uma delas.

Usaremos o DataFrame abaixo para exemplificar:

AB
0
Y
01
145
0
Z
89
11011

Aplicado o método, obteremos:

AB
0Y01
0Z89

Nesse artigo você pode aprender mais sobre o método drop() Pandas, utilizado para lidar com dados tabulares, séries, matrizes e outros conjuntos estatísticos. Você também pode entender o que é o Panda, um pacote do Python específico para análise de dados. 

Além disso, aprendemos mais sobre os parâmetros utilizados no método. Como os labels, que são os rótulos das linhas e das colunas e o axis, que indica o eixo de deleção na tabela.

Desse modo, você já pode ter uma noção melhor sobre como usar o drop() para trabalhar removendo linhas e colunas, a partir de parâmetros, com o Python. 

Leia agora sobre Data Analytics em nosso blog!