Desvio padrão: o que é, fórmula, como calcular?

Desvio padrão, um parâmetro comumente utilizado quando se trata de manipulação de estatísticas no dia a dia de alguém que trabalha com dados. Provavelmente, se você for da área, esse é um termo típico para você.

Entender sobre parâmetros estatísticos pode ser uma tarefa desafiadora se você não tiver uma boa instrução e um material completo que lhe auxilie a entendê-los de maneira descomplicada. Quando se trata de desvio padrão, muitas pessoas ficam confusas acerca do tema. 

Mas não estamos aqui com o intuito de dificultar o entendimento, muito pelo contrário, nesse texto você encontrará um verdadeiro guia, completo e prático, acerca do que é desvio padrão e outras medidas estatísticas.

Nesse post você verá sobre: 

O que é desvio padrão e para que serve?

Quando nos referimos ao desvio padrão em um conjunto de dados, estamos nos referindo a um parâmetro estatístico cujo objetivo é medir o grau de variabilidade em um conjunto de dados. Ou seja, é um coeficiente de variação desses dados. 

Comumente utilizamos o desvio padrão para entender uma população. Porém, também utilizamos dados de amostras para calcular estimativas da população a partir do desvio de uma amostra. 

Qual a relação entre variância e desvio padrão?

Em probabilidade e estatística, a variância é definida como uma variável aleatória capaz de medir a dispersão dos dados, mostrando o quão distante estão os valores da média. 

A sua relação é definida de forma que a variância é o quadrado do desvio padrão, estabelecendo-se uma relação quadrática entre as equações. Logo, para obtê-lo, é só tirar a raiz quadrada da variância. Enquanto para obter a variância, elevamos o desvio padrão ao quadrado.

Conheça a fórmula do desvio padrão e da variância!

Fórmula da variância

Fórmula da variância

∑: representa o somatório

x: representa um valor do conjunto de dados

μ: representa a média do conjunto de dados

N: representa o número de dados totais

Fórmula do desvio padrão

Para calcular o desvio-padrão (DP), utilizamos a seguinte fórmula:

Fórmula do desvio padrão

Para podermos compreender melhor como funciona essa fórmula, precisamos primeiro definir quem é cada variável

∑: representa o somatório

x: representa um valor do conjunto de dados

μ: representa a média do conjunto de dados

N: representa o número de dados totais

Não se preocupe, talvez esse início pareça um pouco confuso e difícil, mas você logo verá que com a prática tudo começará a fazer sentido.

Como calcular desvio padrão? O passo a passo com exemplo!

Agora que nós já sabemos a fórmula para calcular o desvio-padrão, mostraremos um exemplo de como o desvio-padrão pode ser calculado manualmente. No trabalho com dados, um estatístico utiliza softwares como R, Python e o Excel (que são comumente utilizados no processo de análise de dados), no entanto, é importante compreender como esse cálculo é feito para que você entenda como ele realmente funciona antes de aplicá-lo em um software. 

Como foi apresentado no tópico anterior, para calcular o desvio-padrão utilizamos a seguinte fórmula: 

Fórmula do desvio padrão

Vamos resolver um exemplo de como o desvio-padrão pode ser calculado passo a passo de modo a desmembrar a fórmula para que se torne compreensível o processo do cálculo. 

Exemplo: Em uma sala de aula, 5 estudantes tiram notas 8, 5, 9, 6 e 7 em português. Calcule o desvio padrão.

Passo 1: Calculando a média

Antes de calculá-lo, vamos calcular a média, pois, para encontrar o desvio padrão, precisamos primeiro calcular a variância que precisa da média.

Então,

Calculando a média dos dados para a variância

Passo 2: Calculando a distância 

Calculando a distância

Nesse passo, é calculado a distância entre cada dado e a sua média.

Por exemplo, o primeiro dado é 8, e a média é 7, então a distância entre esses dados é 1. O quadrado é 1.

Passo 3: Calculando o somatório das distâncias

Somatório das distâncias

Aqui nós somamos os 5 valores encontrados no passo 2. 

(8 -7)2+ (5 -7)2+(9 -7)2+(6 -7)2+(7 -7)2= 1 + 4 + 4 + 1 + 0 = 10

Passo 4: dividindo por N

Nesse passo, dividimos o valor que foi encontrado no passo 3 pelo número de dados, que representa a variável N. 

Dividindo o resultado por N

Observação: nesse passo podemos observar que o que foi calculado na verdade é a variância. e agora aplicaremos a raiz quadrada sobre ela encontrando, assim, o desvio padrão. 

Passo 5: Encontrando o desvio padrão

Encontrando o desvio padrão

Viu como desmembrar a fórmula faz a sua compreensão ficar melhor? 

Como calcular desvio padrão no excel?

Como dissemos no tópico acima, no dia a dia, a maioria dos cálculos que fazemos são feitos por softwares, e para isso uma ferramenta bastante utilizada é o Microsoft Excel. Utilizaremos o exemplo anterior. 

Passo 1: Organizando os dados

Para organizar os dados e efetuar os cálculos, precisamos tê-los na mesma coluna, como mostra a imagem abaixo:

Adicionando os dados

Passo 2: Utilizando DESVPAD.P

Para utilizar qualquer fórmula no Excel, é importante lembrar-se de colocar o sinal de “=”. A próxima etapa será digitar a função DESVPAD.P, selecionando os dados que você deseja utilizar para calcular o desvio padrão, como mostra a imagem abaixo: 

Inserindo a fórmula do desvio padrão no Excel

Para obter o resultado é só apertar a tecla Enter que você visualizará o desvio-padrão dos seus dados. 

Como interpretar o resultado do desvio padrão?

O desvio padrão pode ser entendido como uma medida usada para medir a dispersão entre os dados em relação à média. Dessa forma, quando calculado juntamente com a média de diversos grupos, temos informações para avaliar e entender o comportamento.

Quando usar o desvio padrão da amostra e o desvio padrão da população?

O desvio padrão da amostra é utilizado quando temos grandes conjuntos de dados e precisamos de um valor confiável e significativo para estimar o desvio padrão da população 

O que é o erro padrão e para que é usado?

Esses conceitos são muito importantes dentro da estatística e auxiliam na forma que os dados são interpretados.

O erro padrão é definido como uma medida de variação de uma média amostral em relação com a média populacional. Logo, é uma estatística que auxilia na verificação da confiabilidade da média calculada. 

Para calcular o erro padrão, é necessário dividir o desvio padrão pela raiz quadrada do tamanho da amostra. 

Quais as diferenças entre desvio padrão e erro padrão?

Infelizmente, é frequente a confusão entre os termos de erro padrão e desvio padrão. Mas, aqui, cuidaremos para que você não saia com nenhuma dúvida em relação aos conceitos, pois, apesar de tratarem sobre a média, são diferentes.

O desvio padrão, como já foi discutido anteriormente, está relacionado a um índice de dispersão da amostra populacional em relação a média, já o erro padrão trata-se de uma medida estatística que auxilia na avaliação da confiabilidade da média calculada. 

Agora você pode fazer a diferenciação entre desvio padrão e erro padrão. 

Exercício resolvido de desvio padrão!

Agora que já entendemos o que é o desvio padrão e vimos como podemos calculá-lo, resolveremos alguns exercícios de fixação.

1. Em uma equipe de vôlei, os atletas possuem os seguintes pesos: 80kg, 68kg, 90kg, 77kg e 85kg. Qual o peso médio da equipe? Calcule também o desvio padrão. 

Mais uma vez vamos desmembrar a fórmula e encontrá-lo passo a passo. 

Fórmula do desvio padrão

passo 1: calculando a média

Então,

Calculando a média dos dados para a variância

Já encontramos a resposta para a primeira pergunta da questão, o peso médio da equipe é de 80kg. 

Passo 2: Calculando a distância 

Calculando a distância

Nesse passo, é calculado a distância entre cada dado e a sua média.

Por exemplo, o primeiro dado é 80, e a média é 80, então a distância entre esses dados é 0. O quadrado é 0.

Passo 3: Calculando o somatório das distâncias

Somatório das distâncias

Aqui nós somamos os 5 valores encontrados no passo 2. 

(80 -80)2+ (68 -80)2+(90 -80)2+(77 -80)2+(85 -80)2= 0+24+100+9+25=158

Passo 4: dividindo por N

Nesse passo, dividimos o valor que foi encontrado no passo 3 pelo número de dados, que representa a variável N. 

Dividindo o resultado por N

Passo 5: Encontrando o desvio padrão

Encontrando o desvio padrão

O desvio padrão é uma medida estatística muito importante quando se trata de entender sobre dados e efetuar as suas manipulações, uma vez que nos traz informações importantes e relevantes acerca dos dados.

O mais indicado é que você tente resolver problemas e pratique a resolução manual de questões sobre desvio padrão para que se torne ainda mais familiar no seu dia a dia. 

Inclusive, você pode utilizar o excel para calcular tudo isso e aqui nós podemos ajudar com uma trilha completa sobre Excel. 

E ah, não esqueça de conferir no nosso blog nosso texto sobre Linguagem R: o que é, para que usar e por que aprender? Tenho certeza que essa ferramenta estatística também vai te auxiliar com desvio padrão e outros parâmetros estatísticos.