Variância: o que é, para que serve e como calcular?

Na estatística, existem diversas formas de analisar um determinado dado, seja ele simples ou mais complexo, para escolhermos exatamente o que utilizarmos com o intuito de chegar em um resultado certo. Para isso, é necessário realizar uma análise do que realmente é pertinente para que possamos aplicar a fórmula correta. Uma dessas formas de análise é a variância. 

Supondo um cenário na qual solicitam para você realizar uma análise do banco de dados de um posto de saúde e você precisa verificar se os dados estão mais dispersos ou não, como você faria? Quer saber mais como poderíamos resolver isso e que fórmula deveria ser utilizada? Então fique com a gente e aproveite a leitura.

O que é variância?

A variância é um conceito bastante utilizado na estatística que tem como objetivo apresentar o quão longe — ou dispersos — os valores estão em relação ao valor médio . De início, pode parecer confusa essa definição ou qual o objetivo dela. Portanto, vamos analisar um exemplo:

Supondo um cenário no qual houve um lançamento de dados, eu obtive os seguintes números: 2, 4, 5 e 6. Primeiramente, antes de sabermos qual é a variância, é importante realizarmos a soma de todos os números apresentados e depois dividir pela quantidade de termos. O resultado ficaria assim:

x = 2 + 4 + 5 + 6 / 4

x = 17/4

x = 4,25

Após entendermos que a média desse cálculo é 4,25, já podemos começar a verificar a variância de cada número. 

Ao olhar o primeiro número, que seria o 4, podemos concluir que ele apresenta uma baixa variância pois está bem próximo de nossa média. Agora, o número 9, por exemplo, já está um pouco mais longe de nossa média, então ele apresenta uma alta variância.

Qual a relação entre variância e desvio padrão?

Você já se perguntou qual a diferença entre o desvio padrão e a variância? Pois bem, essa é uma dúvida bastante comum entre as pessoas pois ambos termos podem soar bastante parecidos. No entanto, eles têm objetivos bastante diferentes, afinal, um depende do outro para ser calculado.

A variância é bastante utilizada para verificar o quanto um número se afasta da média determinada em uma amostra. Sendo assim, antes de calcular a variância, é importante saber a média para obter um resultado preciso. 

Já o desvio padrão, como o próprio nome já diz, é calculado partindo do resultado da variância. Ele é importante para sabermos o quanto os dados apresentados dentro de uma amostra varia.

Supondo um gráfico no qual serão inseridos todos os números obtidos nos cálculos do desvio padrão e sabendo que o gráfico é uma curva, é importante notar que quanto mais perto do centro ele se encontra, melhor é. Sendo assim, essa proximidade pode ser chamada de uma distribuição normal.

Conheça a fórmula da variância e desvio padrão!

Quando olhamos as fórmulas relacionadas a variância, é bastante comum imaginar que é algo bastante complexo de calcular. Porém, isso não é exatamente verdade. Vamos apresentar a fórmula de dois tipos de variância e a fórmula para realizar o cálculo do desvio padrão.

Fórmula da variância

Antes de mostrarmos a fórmula para calcular a variância, é importante sabermos que existem dois tipos: a variância amostral e a variância populacional.

Variância Amostral:

Fórmula da variância amostral

Essa fórmula representa a variância amostral. Para entendermos melhor, vamos verificar qual é a função de cada item encontrado na fórmula.

S² → Quer dizer a variância, ou seja, o resultado que precisamos encontrar.

xi → Significa o valor que está sendo analisado.

x → Significa a média aritmética da amostra.

n → Significa o número de dados da amostra.

Variância Populacional:

Bem parecida com a fórmula da variância amostral, essa é a fórmula da variância populacional. Cada item da fórmula é similar aos itens da fórmula anterior, já apresentada. 

Fórmula da variância populacional

Fórmula do desvio padrão

O desvio padrão é designado através da raiz quadrada da variância,.Sendo assim, podemos utilizar a fórmula mostrada acima para dar sequência em nosso cálculo.

Desvio padrão

Como calcular a variância?

Para realizar o cálculo de variância, existem alguns métodos a serem seguidos..

Calculando a variância amostral

Agora que já sabemos como é a fórmula para realizar o cálculo da variância de um conjunto, vamos então entender o passo a passo a ser seguido para realizar o cálculo.

Para darmos início, vamos imaginar um cenário no qual desejamos saber quantas músicas uma população de 200 pessoas escuta por dia. Desse modo, se formos perguntar um a um e anotar, isso levaria muito tempo e poderia levar ao comprometimento do resultado. Logo, dentro dessa população, podemos pegar a nossa amostra com os seguintes valores obtidos pelas respostas de algumas pessoas.

Pessoa 1: 6 músicas

Pessoa 2: 4 músicas

Pessoa 3: 5 músicas

Pessoa 4: 1 músicas

Pessoa 5: 7 músicas

Pessoa 6: 1 músicas

Primeiro passo:

Devemos calcular a média aritmética para podermos dar início ao cálculo. Então, vamos realizar a soma de todas as músicas que são ouvidas e logo depois vamos dividir pela quantidade de pessoas para quem foi feita a pergunta.

x  = 6 + 4 +5 + 1 +7 + 1 / 6

x  = 24/6

x  = 4

Segundo passo:

Agora que já temos o resultado de nossa média aritmética, vamos utilizar a fórmula da variância amostral para realizar o cálculo. Para isso, para cada quantidade de músicas por pessoa, vamos fazer menos 4, que é o resultado da nossa média, e elevar ao quadrado. Observe o passo a passo na prática para melhor compreensão:

S² = (6 – 4)² + (4 – 4)² + (5 – 4)² + (1 – 4)² + (7 – 4)² + (1 – 4)² / 6 -1

S² = 4 + 0 + 1 + 9 + 9 + 9 / 5

s² = 32/5

s² = 6,4

A variância amostral é de 6,4.

Calculando a variância populacional

Como observamos no tópico anterior, a fórmula para realizar o cálculo da variância populacional não é muito diferente do cálculo da variância amostral. Sendo assim, vamos utilizar um outro exercício agora e tentar resolver com base para o cálculo da variância populacional.

Supondo um cenário no qual desejamos calcular a variância populacional de uma equipe de trabalho que contém 5 pessoas desenvolvedoras, o desejado é saber quantos anos de experiência cada uma delas possui na área de tecnologia para que possamos calcular a variância populacional.

Pessoa Desenvolvedora 1: 10 anos

Pessoa Desenvolvedora 2: 4 anos

Pessoa Desenvolvedora 3: 5 anos

Pessoa Desenvolvedora 4: 15 anos

Pessoa Desenvolvedora 5: 1 anos

Primeiro passo:

Assim como no passo a passo anterior, devemos realizar o cálculo da média aritmética dos dados que estão disponíveis acima.

s² = 10 + 4 + 5 + 15 + 1 / 5

s² = 35 / 5

s² = 7

Segundo passo:

Agora que já temos a média aritmética calculada, vamos calcular a variância populacional utilizando a fórmula mostrada no tópico anterior.

s² = (10 – 7)² + (4 – 7)² + (5 – 7)² + (15 – 7)² + (1 – 7)² /5

s² = 9 + 9 + 4 + 64 + 36 / 5

s² = 122/5

s² = 24,4

A variância populacional é de 24,4.

Como calcular variância no Excel?

Além de realizar o cálculo da variância através de fórmulas em estatística, o Excel também apresenta essa fórmula para que possamos utilizá-la, não exigindo nenhuma lógica por trás. De início pode parecer confusa, mas fique com a gente e olhe na prática!

Supondo um cenário em que, em uma escola, uma professora está separando a nota de três salas diferentes. É necessário que, após essa separação, ela calcule a variância populacional e a variância amostral de cada sala.

Variância Populacional: Utilize a fórmula abaixo para realizar o cálculo.

=VARP(dados)

Inserindo a fórmula da variância populacional no excel

Variância Amostral: Utilize a fórmula abaixo para realizar o cálculo.

=VARA(dados)

Inserindo a fórmula da variância amostral no excel

4 exercícios resolvidos de variância!

Agora que já entendemos qual a importância da variância, para que serve e como utilizar, vamos fazer alguns exercícios para melhor fixarmos.

Exercício 1:

Supondo os seguintes dados dos alunos de natação de uma academia, levando em consideração que a academia possui cinco equipes diferentes: 8, 6, 5, 5, 6. Calcule a variância populacional da quantidade de alunos de cada equipe.

Cálculo para sabermos a média:

x = 8 + 6 + 5 + 5 + 6 / 5

x = 30 / 5

x = 6

Cálculo da variância:

S² = (8-6)² + (6-6)² + (5-6)² + (5-6)² + (6-6)² / 5

S² = (2)² + (0)² + (-1)² + (-1)² + (0)² / 5

S² = 4 + 0 + 1 + 1 +0 / 5

S² = 6/5

S² = 1,2

Exercício 2:

Uma determinada avenida na cidade de São Paulo tem apenas 4 moradias, variando entre prédio e casa. Um engenheiro deseja calcular a variância populacional delas de acordo com a altura de cada uma. Observe a figura abaixo para resolver o exercício.

Exercício 2

Cálculo da média:

x = 500 + 900 + 200 +850 / 4

x = 2450 / 4

x = 612,5

Cálculo da variância populacional:

S² = (500 – 612,5)² + (900- 612,5)² + (200 – 612,5)² + (850 – 612,5)² / 4

S² = 12.656,25 + 82.656,25 + 170.156,25 + 56.406,25 / 4

S² = 321.875,00 / 4

S² = 80.468,75

Exercício 3:

Maria, uma mulher que sempre anota seus gastos. Uma vez, ao ir ao supermercado, ela notou uma discrepância nos valores. Ela optou por analisar quais foram os produtos que mais tiveram alta no preço e puxar a planilha do começo do ano para fazer essa comparação. Os produtos com os preços alterados foram:

Exercício 3 tabela

Após analisar a tabela, calcule a variância dos preços dos alimentos.

Macarrão

Cálculo da média:

x = 2,50 + 3,10 + 4,50 +7,00/4

x = 17,10/4

x = 4,28

Cálculo da variância:

S² = (2,50 – 4,28)²+ (3,10 – 4,28)²+ (4,50 – 4,28)²+ (7,00 – 4,28)²/ 4

S² = 3,1684 + 1,3924 + 0,0484 + 7,3984 / 4

S² = 12,0076/4

S² = 3,0019

Feijão

Cálculo da média:

x = 5,00 + 6,50 + 8,00 + 11,20/4

x = 30,70 / 4

x = 7,68

Cálculo da variância:

S² = (5,00 – 7,68)² + (6,50 – 7,68)² + (8,00 – 7,68)² + (11,20 – 7,68)² / 4

S² = 7,1824 + 1,3924 + 0,1024 + 12,3904/4

S² = 21,0676/4

S² = 5,2669

Exercício 4:

Calcule a variância amostral e a variância populacional dos 6 números sorteados em um bolão.

Números: 45, 20, 33, 78, 21, 10.

Cálculo da média

x = 45 + 20 + 33 + 78 + 21 + 10 / 6

x = 207 / 6

x = 34,5

Variância amostral

S² = (45-34,5)² + (20-34,5)² + (33-34,5)² + (78-34,5)² + (21-34,5)² + (10-34,5)² / 6 – 1

S² = 110,25+210,25+2,25+1.892,25+182,25+600,25 / 5

S² = 2997,50 / 5

S² = 599,50

Variância populacional

S² = (45-34,5)² + (20-34,5)² + (33-34,5)² + (78-34,5)² + (21-34,5)² + (10-34,5)² / 6

S² = 110,25+210,25+2,25+1.892,25+182,25+600,25 / 6

S² = 2997,50 / 6

S² = 499,58

Gostou de entender um pouco mais sobre variância e como calcular? Ela auxilia as pessoas que desejam analisar a dispersão entre dados, seja de um conjunto, de um ambiente, entre outros. Além da sua fórmula ser bastante utilizada na estatística em si, como vimos nos tópicos acima, o recurso da fórmula no Excel pode ser algo que agilizará o tempo para obter o resultado.

Se interessou em saber mais sobre fórmulas? Você pode ler também sobre Soma no Excel: como fazer e quais as principais fórmulas?