La régression linéaire simple permet de modéliser une relation linéaire entre deux variables quantitatives dans le but d’expliquer un phénomène ou de le prédire.
#On commence par représenter les données :
plot(Sepal.Length~Petal.Length, data=iris)
#On constate que la relation entre la largeur des sépales et celle des pétales semble être linéaire
#On estime les paramètres :
Reg.simp <- lm(Sepal.Length~Petal.Length, data=iris)
#Call:
#lm(formula = Sepal.Length ~ Petal.Length, data = iris)
#Residuals:
# Min 1Q Median 3Q Max
#-1.24675 -0.29657 -0.01515 0.27676 1.00269
#Coefficients:
# Estimate Std. Error t value Pr(>|t|)
#(Intercept) 4.30660 0.07839 54.94 <2e-16 ***
#Petal.Length 0.40892 0.01889 21.65 <2e-16 ***
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#Residual standard error: 0.4071 on 148 degrees of freedom
#Multiple R-squared: 0.76, Adjusted R-squared: 0.7583
#F-statistic: 468.6 on 1 and 148 DF, p-value: < 2.2e-16
On obtient une matrice “Coefficients” qui contient pour chaque paramètre son estimation, son écart-type estimé et la p-value. Si la p-value est inférieure à 0.05 cela signifie que la relation entre les deux variables est significative.