Regressão Linear com R
Regressão Linear com R
A análise de regressão é uma ferramenta estatística muito usada para estabelecer um modelo de relacionamento entre duas variáveis.
Uma dessas variáveis é chamada variável preditora, cujo valor é coletado por meio de experimentos.
A outra variável é chamada variável de resposta cujo valor é derivado da variável preditora.
Na regressão linear, essas duas variáveis são relacionadas por meio de uma equação, onde o expoente (poder) de ambas as variáveis é 1.
Matematicamente, uma relação linear representa uma linha reta quando plotada como gráfico.
Uma relação não linear em que o expoente de qualquer variável não é igual a 1 cria uma curva.
A equação matemática geral para uma regressão linear é:
y = ax + b
A seguir, é apresentada a descrição dos parâmetros usados :
- y é a variável de resposta
- x é a variável preditora
a e b são constantes que são chamadas de coeficiente
Etapas para estabelecer uma regressão
Um exemplo simples de regressão é prever o peso de uma pessoa quando sua altura é conhecida.
Para fazer isso, precisamos ter a relação entre altura e peso de uma pessoa.
As etapas para criar o relacionamento são :
- Realize o experimento de reunir uma amostra dos valores observados de altura e peso correspondente.
- Crie um modelo de relacionamento usando as funções lm () em R.
- Encontre os coeficientes do modelo criado e crie a equação matemática usando estes
- Obtenha um resumo do modelo de relacionamento para saber o erro médio na previsão. Também chamado de resíduos.
- Para prever o peso de novas pessoas, use a função predict () em R.
Dados de Entrada:
Valores para a Altura:
51, 174, 138, 186, 128, 136, 179, 163, 152, 131
Valores para o Peso
63, 81, 56, 91, 47, 57, 76, 72, 62, 48
Função lm()
Essa função cria o modelo de relacionamento entre o preditor e a variável de resposta.
Sintaxe
A sintaxe básica da função lm () na regressão linear é :
lm(formula,data)
A seguir, é apresentada a descrição dos parâmetros usados:
- formula é um símbolo que apresenta a relação entre x e y.
- data é o vetor no qual a fórmula será aplicada.
Crie um modelo de relacionamento e obtenha os coeficientes
Aplicar a função lm()
Print do resultado:
Quando executamos o código acima, ele produz o seguinte resultado:
Agora vamos obter o resumo dos relacionamentos
Aplicando a função lm() e print do resultado
Quando executamos o código acima, ele produz o seguinte resultado :
Função predict ()
Sintaxe
A sintaxe básica para predict () na regressão linear é -
predict(object, newdata)
A seguir, é apresentada a descrição dos parâmetros usados:
- O object é a fórmula que já foi criada usando a função lm ()
- newdata é o vetor que contém o novo valor para a variável preditora
Calculando a previsão do peso das pessoas
Vetor preditor:
Vetor de resposta:
Aplicar a função lm()
Em seguida vamos encontrar o peso de uma pessoa com altura 170.
Quando executamos o código acima, ele produz o seguinte resultado:
Por fim, vamos observar a regressão graficamente:
Crie a variável preditora e resposta e aplique a função lm()
Em seguida atribuímos um nome para o gráfico que poder ser salvo no seu computador.
Como fase final plotamos o gráfico que será salvo
Salvar o arquivo:
Desejamos que este tutorial seja útil para todos os nossos leitores.
O script completo pode ser acessado no meu Git:
Não esqueça de deixar seu comentário no post, sua contribuição é muito importante!
Abraços e bons estudos!!
Show de Bola! Excelente artigo! Parabéns!
ResponderExcluir