Calculer les résidus d’un modèle avec resid
en R
Dans l’analyse de données, il est souvent nécessaire d’évaluer la qualité d’un modèle statistique. Une des manières de le faire est d’examiner les résidus, qui sont les différences entre les valeurs observées et les valeurs prédites par le modèle. Dans cet article, nous allons voir comment calculer les résidus d’un modèle de régression linéaire en utilisant la fonction resid
en R.
Qu’est-ce qu’un résidu ?
Un résidu est défini comme suit :
[ text{Résidu} = text{Valeur observée} – text{Valeur prédite} ]
Les résidus nous aident à comprendre si notre modèle s’ajuste bien aux données. Un modèle idéal aurait des résidus qui sont aléatoires et ne montrent pas de tendance.
Exemple de calcul des résidus
Pour illustrer cela, nous allons créer un modèle de régression linéaire simple avec un jeu de données fictif. Supposons que nous avons des données sur la taille et le poids d’un groupe de personnes.
Étape 1 : Créer les données
Commençons par créer un jeu de données :
# Créer un jeu de données fictif
set.seed(123) # Pour la reproductibilité
taille <- rnorm(100, mean = 170, sd = 10) # Taille en cm
poids <- 0.5 * taille + rnorm(100, mean = 0, sd = 5) + 50 # Poids en kg
# Combiner les données dans un data frame
donnees <- data.frame(taille, poids)
Étape 2 : Ajuster un modèle de régression linéaire
Nous allons maintenant ajuster un modèle de régression linéaire pour prédire le poids en fonction de la taille :
# Ajuster le modèle de régression linéaire
modele <- lm(poids ~ taille, data = donnees)
Étape 3 : Calculer les résidus
Après avoir ajusté le modèle, nous pouvons calculer les résidus en utilisant la fonction resid
:
# Calculer les résidus
residus <- resid(modele)
# Afficher les premiers résidus
head(residus)
Étape 4 : Interpréter les résidus
Les résidus que nous avons calculés nous montrent la différence entre les poids observés et les poids prédits par notre modèle. Nous pouvons également visualiser ces résidus pour vérifier s’ils sont aléatoires :
# Tracer les résidus
plot(donnees$taille, residus,
main = "Résidus du modèle de régression",
xlab = "Taille (cm)",
ylab = "Résidus",
pch = 19)
abline(h = 0, col = "red") # Ligne horizontale à y = 0
Conclusion
Dans cet article, nous avons vu comment calculer les résidus d’un modèle de régression linéaire en R en utilisant la fonction resid
. Les résidus sont un outil précieux pour évaluer la qualité de notre modèle. En les analysant, nous pouvons identifier des problèmes potentiels et améliorer notre ajustement. N’hésitez pas à explorer davantage les résidus pour mieux comprendre vos modèles statistiques !