Desvio padrão, um parâmetro comumente utilizado quando se trata de manipulação de estatísticas no dia a dia de alguém que trabalha com dados. Provavelmente, se você for da área, esse é um termo típico para você.
Entender sobre parâmetros estatísticos pode ser uma tarefa desafiadora se você não tiver uma boa instrução e um material completo que lhe auxilie a entendê-los de maneira descomplicada. Quando se trata de desvio padrão, muitas pessoas ficam confusas acerca do tema.
Mas não estamos aqui com o intuito de dificultar o entendimento, muito pelo contrário, nesse texto você encontrará um verdadeiro guia, completo e prático, acerca do que é desvio padrão e outras medidas estatísticas.
Nesse post você verá sobre:
- O que é desvio padrão e para que serve?
- Qual a relação entre variância e desvio padrão?
- Conheça a fórmula do desvio padrão e da variância!
- Como calcular desvio padrão? O passo a passo com exemplo!
- Como calcular desvio padrão no excel?
- Como interpretar o resultado do desvio padrão?
- Quando usar o desvio padrão da amostra e o desvio padrão da população?
- O que é o erro padrão e para que é usado?
- Quais as diferenças entre desvio padrão e erro padrão?
- Exercício resolvido de desvio padrão!
O que é desvio padrão e para que serve?
Quando nos referimos ao desvio padrão em um conjunto de dados, estamos nos referindo a um parâmetro estatístico cujo objetivo é medir o grau de variabilidade em um conjunto de dados. Ou seja, é um coeficiente de variação desses dados.
Comumente utilizamos o desvio padrão para entender uma população. Porém, também utilizamos dados de amostras para calcular estimativas da população a partir do desvio de uma amostra.
Qual a relação entre variância e desvio padrão?
Em probabilidade e estatística, a variância é definida como uma variável aleatória capaz de medir a dispersão dos dados, mostrando o quão distante estão os valores da média.
A sua relação é definida de forma que a variância é o quadrado do desvio padrão, estabelecendo-se uma relação quadrática entre as equações. Logo, para obtê-lo, é só tirar a raiz quadrada da variância. Enquanto para obter a variância, elevamos o desvio padrão ao quadrado.
Conheça a fórmula do desvio padrão e da variância!
Fórmula da variância
∑: representa o somatório
x: representa um valor do conjunto de dados
μ: representa a média do conjunto de dados
N: representa o número de dados totais
Fórmula do desvio padrão
Para calcular o desvio-padrão (DP), utilizamos a seguinte fórmula:
Para podermos compreender melhor como funciona essa fórmula, precisamos primeiro definir quem é cada variável
∑: representa o somatório
x: representa um valor do conjunto de dados
μ: representa a média do conjunto de dados
N: representa o número de dados totais
Não se preocupe, talvez esse início pareça um pouco confuso e difícil, mas você logo verá que com a prática tudo começará a fazer sentido.
Como calcular desvio padrão? O passo a passo com exemplo!
Agora que nós já sabemos a fórmula para calcular o desvio-padrão, mostraremos um exemplo de como o desvio-padrão pode ser calculado manualmente. No trabalho com dados, um estatístico utiliza softwares como R, Python e o Excel (que são comumente utilizados no processo de análise de dados), no entanto, é importante compreender como esse cálculo é feito para que você entenda como ele realmente funciona antes de aplicá-lo em um software.
Como foi apresentado no tópico anterior, para calcular o desvio-padrão utilizamos a seguinte fórmula:
Vamos resolver um exemplo de como o desvio-padrão pode ser calculado passo a passo de modo a desmembrar a fórmula para que se torne compreensível o processo do cálculo.
Exemplo: Em uma sala de aula, 5 estudantes tiram notas 8, 5, 9, 6 e 7 em português. Calcule o desvio padrão.
Passo 1: Calculando a média
Antes de calculá-lo, vamos calcular a média, pois, para encontrar o desvio padrão, precisamos primeiro calcular a variância que precisa da média.
Então,
Passo 2: Calculando a distância
Nesse passo, é calculado a distância entre cada dado e a sua média.
Por exemplo, o primeiro dado é 8, e a média é 7, então a distância entre esses dados é 1. O quadrado é 1.
Passo 3: Calculando o somatório das distâncias
Aqui nós somamos os 5 valores encontrados no passo 2.
(8 -7)2+ (5 -7)2+(9 -7)2+(6 -7)2+(7 -7)2= 1 + 4 + 4 + 1 + 0 = 10
Passo 4: dividindo por N
Nesse passo, dividimos o valor que foi encontrado no passo 3 pelo número de dados, que representa a variável N.
Observação: nesse passo podemos observar que o que foi calculado na verdade é a variância. e agora aplicaremos a raiz quadrada sobre ela encontrando, assim, o desvio padrão.
Passo 5: Encontrando o desvio padrão
Viu como desmembrar a fórmula faz a sua compreensão ficar melhor?
Como calcular desvio padrão no excel?
Como dissemos no tópico acima, no dia a dia, a maioria dos cálculos que fazemos são feitos por softwares, e para isso uma ferramenta bastante utilizada é o Microsoft Excel. Utilizaremos o exemplo anterior.
Passo 1: Organizando os dados
Para organizar os dados e efetuar os cálculos, precisamos tê-los na mesma coluna, como mostra a imagem abaixo:
Passo 2: Utilizando DESVPAD.P
Para utilizar qualquer fórmula no Excel, é importante lembrar-se de colocar o sinal de “=”. A próxima etapa será digitar a função DESVPAD.P, selecionando os dados que você deseja utilizar para calcular o desvio padrão, como mostra a imagem abaixo:
Para obter o resultado é só apertar a tecla Enter que você visualizará o desvio-padrão dos seus dados.
Como interpretar o resultado do desvio padrão?
O desvio padrão pode ser entendido como uma medida usada para medir a dispersão entre os dados em relação à média. Dessa forma, quando calculado juntamente com a média de diversos grupos, temos informações para avaliar e entender o comportamento.
Quando usar o desvio padrão da amostra e o desvio padrão da população?
O desvio padrão da amostra é utilizado quando temos grandes conjuntos de dados e precisamos de um valor confiável e significativo para estimar o desvio padrão da população
O que é o erro padrão e para que é usado?
Esses conceitos são muito importantes dentro da estatística e auxiliam na forma que os dados são interpretados.
O erro padrão é definido como uma medida de variação de uma média amostral em relação com a média populacional. Logo, é uma estatística que auxilia na verificação da confiabilidade da média calculada.
Para calcular o erro padrão, é necessário dividir o desvio padrão pela raiz quadrada do tamanho da amostra.
Quais as diferenças entre desvio padrão e erro padrão?
Infelizmente, é frequente a confusão entre os termos de erro padrão e desvio padrão. Mas, aqui, cuidaremos para que você não saia com nenhuma dúvida em relação aos conceitos, pois, apesar de tratarem sobre a média, são diferentes.
O desvio padrão, como já foi discutido anteriormente, está relacionado a um índice de dispersão da amostra populacional em relação a média, já o erro padrão trata-se de uma medida estatística que auxilia na avaliação da confiabilidade da média calculada.
Agora você pode fazer a diferenciação entre desvio padrão e erro padrão.
Exercício resolvido de desvio padrão!
Agora que já entendemos o que é o desvio padrão e vimos como podemos calculá-lo, resolveremos alguns exercícios de fixação.
1. Em uma equipe de vôlei, os atletas possuem os seguintes pesos: 80kg, 68kg, 90kg, 77kg e 85kg. Qual o peso médio da equipe? Calcule também o desvio padrão.
Mais uma vez vamos desmembrar a fórmula e encontrá-lo passo a passo.
passo 1: calculando a média
Então,
Já encontramos a resposta para a primeira pergunta da questão, o peso médio da equipe é de 80kg.
Passo 2: Calculando a distância
Nesse passo, é calculado a distância entre cada dado e a sua média.
Por exemplo, o primeiro dado é 80, e a média é 80, então a distância entre esses dados é 0. O quadrado é 0.
Passo 3: Calculando o somatório das distâncias
Aqui nós somamos os 5 valores encontrados no passo 2.
(80 -80)2+ (68 -80)2+(90 -80)2+(77 -80)2+(85 -80)2= 0+24+100+9+25=158
Passo 4: dividindo por N
Nesse passo, dividimos o valor que foi encontrado no passo 3 pelo número de dados, que representa a variável N.
Passo 5: Encontrando o desvio padrão
O desvio padrão é uma medida estatística muito importante quando se trata de entender sobre dados e efetuar as suas manipulações, uma vez que nos traz informações importantes e relevantes acerca dos dados.
O mais indicado é que você tente resolver problemas e pratique a resolução manual de questões sobre desvio padrão para que se torne ainda mais familiar no seu dia a dia.
Inclusive, você pode utilizar o excel para calcular tudo isso e aqui nós podemos ajudar com uma trilha completa sobre Excel.
E ah, não esqueça de conferir no nosso blog nosso texto sobre Linguagem R: o que é, para que usar e por que aprender? Tenho certeza que essa ferramenta estatística também vai te auxiliar com desvio padrão e outros parâmetros estatísticos.