Regressão Linear Simples: O que é e como fazer?

No seu cotidiano, você já deve ter pensado se algumas situações estão relacionadas a outras, como, por exemplo, se a falta de sono afeta a ansiedade, se uma população fumante afeta na taxa de natalidade, etc. Essas relações entre esses fatos podem ser analisadas por meio de uma regressão linear simples. 

As regressões lineares simples estão no conjunto de estudos da estatística e ela trabalha bastante com cálculos e análises gráficas. Contudo, muitas pessoas podem não ter facilidade de trabalhar com números e podem apresentar dificuldades em fazer análises sobre variáveis distintas, se estão relacionadas. 

Com o aprendizado das regressões lineares simples, você não só saberá analisar a relação entre variáveis, como também realizará análises que envolvem vários acontecimentos. Preparado(a) para verificar o que é essa regressão linear simples e como utilizar ela no nosso cotidiano? Vamos nessa!

Nesse artigo, abordaremos os seguintes tópicos: 

O que é a Regressão Linear Simples?

A regressão linear simples é uma espécie de modelo na estatística cujo objetivo é indicar qual será o comportamento de uma variável dependente (Y) como uma função que contenha uma ou mais variáveis independentes (X).

Nesse caso, utilizaremos apenas uma variável independente e uma dependente. Se tivermos mais que uma variável independente (X), utilizaremos a regressão linear múltipla.

Ou seja, a regressão linear simples é uma forma de verificar uma possível relação linear entre duas variáveis, como, por exemplo:

  • Verificar se a temperatura atual influencia no crescimento de uma massa de pão, ou em sua fermentação;
  • Verificar o coeficiente de inteligência de uma pessoa baseada na idade dela;

Entendi! Mas, para o que serve essa regressão linear? Esse assunto será abordado na seção seguinte.

Para que serve a Regressão Linear Simples?

Existem alguns casos que podemos utilizar a regressão linear simples. São eles: 

  • Para verificar se uma variável tem alguma relação com outra;
  • Quando há a possibilidade de fazermos uma previsão de uma variável pelo valor de outra variável;
  • Podemos utilizar a regressão linear simples para criação de modelos base antes da criação de modelos de regressão linear múltipla. 

Vejamos agora como funciona sua fórmula.

Entenda a fórmula da Regressão Linear Simples

A fórmula de uma regressão linear simples é a seguinte:

Fórmula da regressão linear simples

Você deve ter notado que ela parece com uma equação do primeiro grau, com duas incógnitas, não é? Isso mesmo, ela basicamente é uma equação da reta. 

As variáveis da equação podem ser interpretadas como: 

  • y: o y seria os valores previstos, que queremos fazer uma previsão sobre ele(s);
  • x: seria a variável independente;
  • α: o valor alfa indica o valor de “y”, quando “x” for igual a zero;
  • β: seria a variável que determina o quão inclinada a reta será, pois, ela determinará se a relação entre as variáveis é grande ou pequena. 

Caso não tenha ficado evidente algum ponto, não se preocupe, pois serão exibidos alguns exercícios práticos relacionados a regressão linear simples. 

Quais as diferenças entre Regressão Linear Simples e Regressão Linear Múltipla?

A diferença seria que, enquanto na regressão linear simples é utilizada apenas uma variável independente e uma dependente, na regressão linear múltipla utilizamos duas ou mais variáveis independentes para analisarmos um caso. 

Exemplo de Regressão Linear Simples na prática! Saiba como fazer!

Considere uma loja que vende pisos por metros. A quantidade de pisos vendidos e o valor das vendas mensais são apresentados na tabela a seguir. Sejam y os valores arrecadados com a venda de pisos no mês e x a quantidade de metros vendidos, ajuste um modelo de regressão linear simples para os dados apresentados.

Mêsx: Venda de pisos (a cada 100 m)y: Vendas mensais
(a cada R$ 1000,00)
111
221
332
442
554

A função linear, escrevemos y = α + βx. Isolando o alfa, temos: α = y – βx. 

Passo 1: Para facilitarmos nossos cálculos, devemos construir uma tabela que contenha a coluna x², a coluna y² e, a multiplicação de ambas: 

Mêsx: Venda de pisos (a cada 100 m)y: Vendas mensais
(a cada R$ 1000,00)
x * y
111111
221412
332946
4421648
554251620
Somatório:1510552637

Passo 2: Para calcularmos o valor de β, devemos fazer o seguinte: 

em que Sxy seria o desvio padrão de y e o Sxx seria o valor do desvio padrão de x. 

Nesse caso, as fórmulas de desvio padrão seriam essas: 

Fórmula do desvio padrão de X
Fórmula do desvio padrão de Y

Não se preocupe, pois utilizando a tabela anterior do exercício, os dados serão preenchidos. Vamos verificar os dados, fornecidos: 

  • O somatório de todos os itens da coluna x, da tabela, é igual a 15 (5+4+3+2+1), concorda? Então, Σxi = 15. 
  • O somatório de todos os itens da coluna y, da tabela, é igual a 15 (4+2+2+1+1), então, Σyi = 10. 
  • O somatório de todos os itens da coluna Σx2 , da tabela, é igual a 55 (1+4+9+16+25), então, Σx2 = 55. 
  • O somatório de todos os itens da coluna Σx *  Σy , da tabela, é igual a 37 (1+2+6+8+20), então, Σx *  Σy = 37

Com base nos dados acima, já conseguimos utilizar as fórmulas:

Resolução das fórmulas de desvio padrão

Feito isso, agora iremos retornar na fórmula do β:

Fórmula para encontrar a variável de inclinação da reta
Resolução da fórmula de inclinação da regressão linear simples

Retornando na fórmula: α = y – βx, utilizaremos y=2 e x=3, para encontrar o valor faltante de alfa:

α = 2 – 0.7 * 3 

α = 0,1.

Ou seja, a fórmula será igual a: 

A fórmula finalizada

Como fazer Regressão Linear Simples no Excel?

Para fazermos a regressão linear simples no Excel, devemos fazer o seguinte: 

  1. Coletar os dados e organizar eles em uma tabela, no Excel. Nesse caso, foi utilizado uma quantidade de gols que um time fez em 10 jogos, sendo x os jogos e y a quantidade de gols: 
Tabela no Excel com gols de um determinado time
  1. Selecionar os dados e, clicar em Inserir
Botão "Inserir" no Excel
  1. Selecionar o gráfico de dispersão conforme foto a seguir:
Selecionando o gráfico de dispersão

E, ele será exibido:

Gráfico de dispersão
  1. Selecionar os pontos do gráfico, clicando neles, depois clicar com o botão direito do mouse e clicar em Adicionar linha de tendência: 
Adicionando linha de tendência
Linha de tendência regressão linear simples
  1. Feito isso, à sua direita, haverá opções para você exibir a equação do gráfico e mostrar o valor de R², que seria um indicador que varia entre 0 e 1, que determina o quão válida aquela análise é. Quanto maior o valor dele, mais explicativa a análise e a amostra é melhor ajustada: 
Exibindo valor de R quadrado

Selecionando às duas opções acima, os valores aparecerão no gráfico:

Fórmula da regressão linear no Excel

Como descobrir se uma Regressão Linear está correta?

Fizemos a regressão, perfeito! Mas, será que ela faz sentido? Pois, não basta só simplesmente fazer a regressão. Algumas perguntas precisam ser feitas depois da análise feita: 

  • A equação está adequada para a correlação que existe entre as duas variáveis?
  • O modelo terá alguma utilidade para podermos formular hipóteses?

Diante disso, temos que analisar três pontos, para responder às perguntas acima, que seriam:

  • P-valor da regressão: ele define se há alguma correlação entre as variáveis utilizadas. Esse valor pode ser maior ou menor que 0.5. Se for maior, a correlação não é significativa. Caso contrário, é significativa.
  • Análise de resíduos: verifica se a equação está adequada. Essa etapa verificamos, no gráfico, se os valores de Y previsto e real estão muito divergentes ou não;
  • Coeficiente de determinação (R²): define o quão representativo é a variável x para explicar como é o comportamento de y. Ele varia entre 0 e 1 e, quanto maior o valor dele, mais explicativa a análise.

3 exercícios de Regressão Linear Simples!

1) Analise a tabela abaixo e monte a equação da reta.

Exercício 1 Regressão Linear Simples tabela

Resolução:

Construindo a tabela completa, ela ficará da seguinte forma:

x: Quantidadey: Custosx * y
101001001000
111121211232
121191441428
131301691690
141391961946
151422252130
Somatório: 7574294955


Feito, isso, a quantidade de elementos será igual a 6 e, conforme mostrado no exemplo prático, inserimos os valores nas fórmulas, conforme o processo a seguir: 

Resolução Exercício 1

2) Com base no exercício anterior, calcule o custo para 16 unidades. 

Resolução:
x = quantidade 

y = custo

Para isso, basta pegarmos a equação da reta:
y = 15,79 + 8,63 * (16)
y = R$ 153,87

Fazendo o cálculo acima, o custo será de 153,87 reais.

3) Construa um gráfico de dispersão no Excel, com base nos dados a seguir:

Tabela Exercício 3 Regressão Linear Simples

Resolução:

Resolução exercício 3

Muito bacana esse assunto sobre regressão linear, não é? Aprendendo ela, você terá uma excelente maneira de analisar diversas situações do cotidiano para ver se há alguma relação entre os fatos que ocorrem, se eles estão interligados, utilizando números para provar o raciocínio.

Ela utiliza apenas duas variáveis, uma dependente e outra independente e, o que a diferencia de uma regressão múltipla, seria que a múltipla possui mais variáveis para serem analisadas no estudo que estamos fazendo. Ela também pode ser realizada no Excel, por meio de gráficos. 

Para continuar seus estudos na área de estatística, confira o artigo de como funciona a linguagem R, uma das principais utilizadas para análise de dados.