Análises estatísticas requerem o tratamento de inúmeros dados, seja para buscar uma informação, inserir uma nova ou deletá-la. Desse modo, o Python é bastante útil, pois oferece uma infinidade de pacotes e métodos específicos para essa atividade, como é o caso do drop() Pandas.
Assim, se você já precisou ou tem interesse em conhecer mais sobre como remover dados de tabelas de forma rápida e eficiente, gostará de saber mais sobre esse método, específico para essa funcionalidade.
Por isso, fique com a gente, e aprenda sobre drop() Pandas como os seguintes tópicos:
- O que é e para que serve o método drop() Pandas?
- Qual a sintaxe desse método?
- Quais os parâmetros do método drop() Pandas?
- Valor de retorno do método drop() Pandas?
- 5 exemplos de uso do método drop() Pandas!
Boa leitura!
O que é e para que serve o método drop() Pandas?
Para entender do que se trata o método drop() Pandas, precisamos compreender o que é o Pandas.
O Pandas é um pacote do Python, projetado para trabalhar com análise de dados. Desse modo, ele é adequado para lidar com dados tabulares, séries, matrizes, entre outros conjuntos estatísticos.
Assim, o método drop() serve para eliminar linhas e colunas de tabelas, baseadas em um rótulo e eixo correspondentes, ou em um índice ou nome de coluna. Quando utilizado com multi-indexes, rótulos em diferentes níveis podem ser removidos.
Qual a sintaxe desse método?
A sintaxe do método drop() Pandas utiliza a palavra dataframe, que seria o conjunto de dados utilizado no momento, seguido do método drop(). O método recebe parâmetros, para que possa localizar qual linha ou coluna deverá ser removida. Dessa forma, podem ser inseridos:
- labels (rótulos);
- axis (eixos);
- index (linha);
- columns (coluna);
- level (nível);
- inplace (atual);
- errors (erros).
Vale ressaltar que nem todos os parâmetros precisam ser utilizados. Alguns deles possuem função de substituição, como é o caso de index e columns, que fazem o papel de labels. Veja, a seguir, a sintaxe completa:
dataframe.drop(labels, axis, columns, level, inplace., errors)
Para entendermos melhor o funcionamento, vamos a um exemplo.
Para remover uma coluna específica, utilizamos o seguinte comando:
dataframe.drop(“column name”, axis='columns').
O item “column name” seria o nome da coluna e “columns” indica o eixo de remoção, no caso uma coluna. Já para remover uma linha, o código ficaria:
dataframe.drop(1, axis='index')
“1” seria o índice da linha e “index” seria o eixo de remoção, no caso uma linha.
Quais os parâmetros do método drop() Pandas?
Agora, vamos falar com mais detalhes sobre a finalidade de cada um dos parâmetros disponíveis no método drop() Pandas. Confira a tabela:
Parâmetro | Valor | Descrição |
labels | – | Nome da linha ou coluna a ser removida |
axis | 0 ou “index”, 1 ou “columns” | Eixo de remoção |
index e columns | de labels, axis = 1 para columns = labels ou index = labels | Alternativa para o parâmetro labels. Usado para especificar o nome da linha ou coluna |
level | 1 ou nome do nível | Usado para checar o nível da hierarquia de valores |
inplace | True ou False | A remoção é feita no DataFrame atual quando True ou retorna uma cópia de onde a remoção foi feita quando False |
errors | “ignore” ou “raise” | Usado para ignorar ou não os erros do processo |
Valor de retorno do método drop() Pandas!
Ao utilizarmos o método drop() Pandas, vamos obter como resultado um DataFrame. O DataFrame é o conjunto de dados resultante da aplicação do drop() e seus parâmetros. Outro retorno possível seria um None, obtido quando o parâmetro inplace estiver configurado como True.
Para exemplificar, temos a seguinte matriz de valores, em que 0, 1 e 2 são indexes e “A”, “B”, “C” e “D” são colunas:
A | B | C | D | |
0 | 0 | 1 | 3 | 3 |
1 | 4 | 5 | 6 | 7 |
2 | 8 | 9 | 10 | 11 |
Ao aplicarmos o método para remover as colunas “B” e “C”, utilizando o comando
dataframe.drop(columns=['B', 'C'])
Receberemos o DataFrame:
A | D | |
0 | 0 | 3 |
1 | 4 | 7 |
2 | 8 | 11 |
5 exemplos de uso do método drop() Pandas!
Abordaremos agora cinco exemplos sobre como utilizar o método drop() Pandas, para lidar com a análise de dados. Para isso, usaremos o DataFrame abaixo:
A | B | C | D | |
0 | 0 | 1 | 3 | 3 |
1 | 4 | 5 | 6 | 7 |
2 | 8 | 9 | 10 | 11 |
Deletar uma coluna pelo nome e eixo
dataframe.drop(labels="A", axis=1)
Nesse exemplo, devemos passar o rótulo ao qual desejamos remover e se ele é uma linha ou coluna, passando seu eixo. Dessa forma, 1 significa coluna e 0 significa linha. Veja que a coluna “A”, da tabela, foi removida.
B | C | D | |
0 | 1 | 3 | 3 |
1 | 5 | 6 | 7 |
2 | 9 | 10 | 11 |
Deletar uma coluna apenas pelo nome
dataframe.drop(columns="A")
Aqui será apagada da tabela a coluna indicada no parâmetro “columns”. Desse modo, “A” é removida.
B | C | D | |
0 | 1 | 3 | 3 |
1 | 5 | 6 | 7 |
2 | 9 | 10 | 11 |
Deletar uma linha a partir do index
dataframe.drop(0)
Nesse método, é removida a linha de index 0, ou seja, a primeira linha da tabela.
A | B | C | D | |
1 | 4 | 5 | 6 | 7 |
2 | 8 | 9 | 10 | 11 |
Deletar uma linha e coluna pelo index e nome da coluna
dataframe.drop(index=0, columns=”A” )
Nesse caso, será apagado da tabela a linha indicada no parâmetro “index” e a coluna indicada no parâmetro “columns”. Assim, a coluna “A” e a linha 0 são removidas.
B | C | D | |
1 | 5 | 6 | 7 |
2 | 9 | 10 | 11 |
Deletar linhas por nível
dataframe.drop(index="length", level=1)
Nesse método, o “index” será o comprimento de cada dado. Dessa forma, se cada coluna possui duas linhas, então o método irá apagar a 2° linha de cada uma delas.
Usaremos o DataFrame abaixo para exemplificar:
A | B | ||
0 | Y | 0 | 1 |
1 | 4 | 5 | |
0 | Z | 8 | 9 |
1 | 10 | 11 |
Aplicado o método, obteremos:
A | B | ||
0 | Y | 0 | 1 |
0 | Z | 8 | 9 |
Nesse artigo você pode aprender mais sobre o método drop() Pandas, utilizado para lidar com dados tabulares, séries, matrizes e outros conjuntos estatísticos. Você também pode entender o que é o Panda, um pacote do Python específico para análise de dados.
Além disso, aprendemos mais sobre os parâmetros utilizados no método. Como os labels, que são os rótulos das linhas e das colunas e o axis, que indica o eixo de deleção na tabela.
Desse modo, você já pode ter uma noção melhor sobre como usar o drop() para trabalhar removendo linhas e colunas, a partir de parâmetros, com o Python.