Regressão Múltipla com R



CONCEITO

A regressão múltipla é uma extensão da regressão linear na relação entre mais de duas variáveis.
Na relação linear simples, temos uma variável preditora e uma resposta, mas, na regressão múltipla,
temos mais de uma variável preditora e uma variável de resposta.

A equação matemática geral para regressão múltipla é :
y = a + b1x1 + b2x2 +...bnxn
A seguir, é apresentada a descrição dos parâmetros usados:

  • y é a variável de resposta
  • a, b1, b2 ... bn são os coeficientes
  • x1, x2, ... xn são as variáveis preditoras

Criamos o modelo de regressão usando a função lm() em R.
O modelo determina o valor dos coeficientes usando os dados de entrada. Em seguida, podemos  Prever o valor da variável de resposta para um determinado conjunto de variáveis preditoras usando esses coeficientes.

FUNÇÃO LM()

Essa função cria o modelo de relacionamento entre o preditor e a variável de resposta.

A sintaxe básica da função lm() na regressão múltipla é:
lm(y ~ x1+x2+x3...,data)
A seguir, é apresentada a descrição dos parâmetros usados:

  • formula é um símbolo que apresenta a relação entre a variável de resposta e as variáveis preditoras.
  • data é o vetor no qual a fórmula será aplicada

NA PRÁTICA


Dados de Entrada

Vamos utlizar o conjunto de dados "mtcars" disponível no ambiente R.

Ele fornece uma comparação entre diferentes modelos de carros em termos de quilometragem por galão (mpg),  cilindrada ("disp"), potência ("hp"), peso do carro ("wt") e mais alguns parâmetros.

O objetivo do modelo é estabelecer a relação entre "mpg" como uma variável de resposta com "disp", "hp" e "wt"  como variáveis preditoras.
Criamos um subconjunto dessas variáveis a partir do conjunto de dados mtcars para essa finalidade.


Quando executamos o código acima, ele produz o seguinte resultado


Criando um modelo de relacionamento e obtendo os coeficientes

Criando um modelo de relacionamento


Exibindo o modelo


Obtendo o Intercepto e os coeficientes como elementos vetoriais e exibindo os resultados


Quando executamos o código acima, ele produz o seguinte resultado


Criando a equação para o modelo de regressão

Com base nos valores de interceptação e coeficiente acima, criamos a equação matemática.

  • y = a+Xdisp.x1+Xhp.x2+Xwt.x3
 ou

  •  y = 37.15+(-0.000937)*x1+(-0.0311)*x2+(-3.8008)*x3

Aplicando equação para prever novos valores

Podemos usar a equação de regressão criada acima para prever a milhagem quando um novo conjunto de valores para deslocamento, potência e peso é fornecido.

 Para um carro com disp = 221, hp = 102 e peso = 2,91, a milhagem prevista é


  • y = 37.15+(-0.000937)*221+(-0.0311)*102+(-3.8008)*2.91 = 22.7104



Espero que tenham gostado e que este artigo possa ser útil em vossos estudos
Não esqueçam de contribuir com vossa opinião!

Grande Abraço e bons estudos!!

O Script completo em R pode ser encontrado no meu Git:
https://github.com/NelsonZyon/Data-Science/blob/master/Regressao_Multipla_R.R

Comentários

Postagens mais visitadas deste blog

Tutorial de Machine Learning com Python - Iniciantes - Parte 1

Tutorial de Machine Learning com Python - Iniciantes - Parte 2