• Menu
    • Nos Formations
    • Nos Prestations
    • Les Astuces
Skip to content
Astuces et scripts R
Astuces et scripts R
Primary Navigation Menu
Menu
  • Abcd’R
  • Tous les scripts
    • Voir les articles
    • Proposer un Article
  • Formation au logiciel R
  • Contact

Les dates de formations à R, éligibles au CPF sont en lignes !

Voir nos formations

Validation croisée d’un modèle avec caret

Par vincent
Le janvier 22, 2025
Dans validation
Tagged caret, validation
Avec 0 Comments

Validation croisée d’un modèle avec caret en R

La validation croisée est une technique essentielle en apprentissage automatique qui permet d’évaluer la performance d’un modèle sur des données non vues. Elle aide à éviter le surapprentissage (overfitting) en s’assurant que le modèle généralise bien. Dans cet article, nous allons explorer comment effectuer une validation croisée à l’aide du package caret en R.

Installation et chargement du package

Avant de commencer, assurez-vous d’avoir installé le package caret. Vous pouvez l’installer en utilisant la commande suivante :

install.packages("caret")

Ensuite, chargez le package :

library(caret)

Exemple de validation croisée

Pour illustrer la validation croisée, nous allons utiliser le jeu de données iris, qui est un classique en apprentissage automatique. Ce jeu de données contient des mesures de fleurs d’iris et leur espèce.

Étape 1 : Préparation des données

Nous allons d’abord préparer nos données. Le jeu de données iris est déjà prêt à l’emploi, mais nous allons le diviser en variables explicatives (features) et en variable cible (target).

data(iris)
set.seed(123)  # Pour la reproductibilité

# Définir les variables explicatives et la variable cible
features <- iris[, 1:4]
target <- iris[, 5]

Étape 2 : Définir le contrôle de la validation croisée

Nous allons maintenant définir le contrôle de la validation croisée. Ici, nous allons utiliser une validation croisée à 10 plis (10-fold cross-validation).

control <- trainControl(method = "cv", number = 10)

Étape 3 : Entraîner le modèle

Nous allons entraîner un modèle de classification. Pour cet exemple, nous allons utiliser un arbre de décision avec la méthode rpart.

# Entraîner le modèle
model <- train(features, target, method = "rpart", trControl = control)

# Afficher les résultats
print(model)

Étape 4 : Évaluation des performances

Après l’entraînement, caret fournit des statistiques sur les performances du modèle, y compris l’accuracy (précision) et d’autres mesures. Vous pouvez également visualiser les résultats de la validation croisée.

# Résumé des performances
results <- model$results
print(results)

Conclusion

La validation croisée est un outil puissant pour évaluer la performance des modèles d’apprentissage automatique. En utilisant le package caret, nous avons pu facilement configurer et exécuter une validation croisée sur le jeu de données iris. Cela nous a permis d’obtenir une estimation fiable de la performance de notre modèle.

N’hésitez pas à explorer d’autres méthodes et paramètres dans caret pour améliorer vos modèles et adapter la validation croisée à vos besoins spécifiques.

2025-01-22
Article précédent: Utiliser tidyr::pivot_wider pour transformer des données
Article suivant: Vectoriser des opérations pour améliorer la performance

Formation et consultance

Trouvez votre formation R sur-mesure chez ThinkR

-- Contactez-nous --

Catégories

Commentaires récents

  • Sébastien dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Achraf Mazouz dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Lou Sayd dans Coment alculer simplement la SEM dans R ? (Erreur Standard)
  • Nicolas dans Comment remplacer une chaîne de caractères ? string_replace_all(df, "pattern","replacement")
  • Vincent dans Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Archives

Plan

  • Abcd’R
  • Tous les scripts
    • Proposer un Article
  • Ressources documentaires
    • Le logiciel R
    • Liste des interfaces graphiques
  • Formation au logiciel R
  • Contact
  • Politique de confidentialité

Flux ThinkR – Certification & Formation langage R

  • Déboguer une fonction avec debugonce() ou browser()
  • Dessinez pour gagner : L’impact des maquettes sur vos apps Shiny
  • Gérer et manipuler des dates en 2024 : une année pas comme les autres !
  • Retour vers le turfu : R, le web, et webR
  • Créer un package R et le versionner avec VSCode ? Mission possible !

Méta

  • Connexion
  • Flux des publications
  • Flux des commentaires
  • Site de WordPress-FR

ABCD'R (par ThinkR ) © 2025 - Confidentialité