Regressão Linear com R


Regressão Linear com R

A análise de regressão é uma ferramenta estatística muito usada para estabelecer um modelo de relacionamento entre duas variáveis. 
Uma dessas variáveis é chamada variável preditora, cujo valor é coletado por meio de experimentos. 
A outra variável é chamada variável de resposta cujo valor é derivado da variável preditora.

Na regressão linear, essas duas variáveis são relacionadas por meio de uma equação, onde o expoente (poder) de ambas as variáveis é 1. 
Matematicamente, uma relação linear representa uma linha reta quando plotada como gráfico. 
Uma relação não linear em que o expoente de qualquer variável não é igual a 1 cria uma curva.

A equação matemática geral para uma regressão linear é:

y = ax + b

A seguir, é apresentada a descrição dos parâmetros usados :
  • y é a variável de resposta
  • x é a variável preditora
a e b são constantes que são chamadas de coeficiente

Etapas para estabelecer uma regressão

Um exemplo simples de regressão é prever o peso de uma pessoa quando sua altura é conhecida. 
Para fazer isso, precisamos ter a relação entre altura e peso de uma pessoa.

As etapas para criar o relacionamento são :
  • Realize o experimento de reunir uma amostra dos valores observados de altura e peso correspondente.
  • Crie um modelo de relacionamento usando as funções lm () em R.
  • Encontre os coeficientes do modelo criado e crie a equação matemática usando estes
  • Obtenha um resumo do modelo de relacionamento para saber o erro médio na previsão. Também chamado de resíduos.
  • Para prever o peso de novas pessoas, use a função predict () em R.

Dados de Entrada:

Valores para a Altura:

51, 174, 138, 186, 128, 136, 179, 163, 152, 131

Valores para o Peso

63, 81, 56, 91, 47, 57, 76, 72, 62, 48

Função lm()

Essa função cria o modelo de relacionamento entre o preditor e a variável de resposta.

Sintaxe
A sintaxe básica da função lm () na regressão linear é :

lm(formula,data)

A seguir, é apresentada a descrição dos parâmetros usados:
  • formula é um símbolo que apresenta a relação entre x e y.
  • data é o vetor no qual a fórmula será aplicada.
Crie um modelo de relacionamento e obtenha os coeficientes


Aplicar a função lm()


Print do resultado:


 Quando executamos o código acima, ele produz o seguinte resultado:


Agora vamos obter o resumo dos relacionamentos


Aplicando a função lm() e print do resultado


Quando executamos o código acima, ele produz o seguinte resultado :


 Função predict ()

Sintaxe

A sintaxe básica para predict () na regressão linear é -

predict(object, newdata)

A seguir, é apresentada a descrição dos parâmetros usados:
  • object é a fórmula que já foi criada usando a função lm ()
  • newdata é o vetor que contém o novo valor para a variável preditora

Calculando a previsão do peso das pessoas

Vetor preditor:


Vetor de resposta:


Aplicar a função lm()


Em seguida vamos encontrar o peso de uma pessoa com altura 170.


Quando executamos o código acima, ele produz o seguinte resultado:


Por fim, vamos observar a regressão graficamente:

Crie a variável preditora e resposta e aplique a função lm()


Em seguida atribuímos um nome para o gráfico que poder ser salvo no seu computador.


Como fase final plotamos o gráfico que será salvo



Após a plotagem o gráfica fica desta forma:



Salvar o arquivo:



Desejamos que este tutorial seja útil para todos os nossos leitores.

O script completo pode ser acessado no meu Git:


Não esqueça de deixar seu comentário no post, sua contribuição é muito importante!

Abraços e bons estudos!!

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Tutorial de Machine Learning com Python - Iniciantes - Parte 1

Regressão Múltipla com R

Tutorial de Machine Learning com Python - Iniciantes - Parte 2