• Menu
    • Nos Formations
    • Nos Prestations
    • Les Astuces
Skip to content
Astuces et scripts R
Astuces et scripts R
Primary Navigation Menu
Menu
  • Abcd’R
  • Tous les scripts
    • Voir les articles
    • Proposer un Article
  • Formation au logiciel R
  • Contact

Les dates de formations à R, éligibles au CPF sont en lignes !

Voir nos formations

Créer une matrice de confusion avec table

Par vincent
Le octobre 31, 2024
Dans statistiques
Tagged confusion, matrice
Avec 0 Commentaire

Créer une matrice de confusion avec table en R

Une matrice de confusion est un outil essentiel en apprentissage automatique pour évaluer la performance d’un modèle de classification. Elle permet de visualiser les performances d’un modèle en comparant les prédictions faites par le modèle avec les vraies étiquettes des données. Dans cet article, nous allons voir comment créer une matrice de confusion en utilisant la fonction table en R.

Exemple concret

Imaginons que nous avons un modèle de classification qui prédit si un email est un spam ou non. Nous allons simuler des prédictions et des vraies étiquettes pour illustrer la création d’une matrice de confusion.

Étape 1 : Créer des données simulées

Commençons par créer un vecteur de vraies étiquettes et un vecteur de prédictions :

# Vraies étiquettes (1 = spam, 0 = non spam)
vraies_etiquettes <- c(1, 0, 1, 1, 0, 0, 1, 0, 1, 0)

# Prédictions du modèle
predictions <- c(1, 0, 0, 1, 0, 1, 1, 0, 1, 0)

Étape 2 : Créer la matrice de confusion

Nous allons maintenant utiliser la fonction table pour créer la matrice de confusion :

# Créer la matrice de confusion
matrice_confusion <- table(vraies_etiquettes, predictions)

# Afficher la matrice de confusion
print(matrice_confusion)

Étape 3 : Interpréter la matrice de confusion

La matrice de confusion affichée ressemblera à ceci :

               predictions
vraies_etiquettes  0  1
                 0  4  1
                 1  1  4

Dans cette matrice :

  • La première ligne représente les vrais négatifs (4) et les faux positifs (1).
  • La deuxième ligne représente les faux négatifs (1) et les vrais positifs (4).

Étape 4 : Calculer les métriques de performance

À partir de la matrice de confusion, nous pouvons calculer plusieurs métriques de performance, telles que la précision, le rappel et le score F1.

# Calculer les métriques
vrais_positifs <- matrice_confusion[2, 2]
vrais_negatifs <- matrice_confusion[1, 1]
faux_positifs <- matrice_confusion[1, 2]
faux_negatifs <- matrice_confusion[2, 1]

precision <- vrais_positifs / (vrais_positifs + faux_positifs)
rappel <- vrais_positifs / (vrais_positifs + faux_negatifs)
f1_score <- 2 * (precision * rappel) / (precision + rappel)

# Afficher les résultats
cat("Précision :", precision, "n")
cat("Rappel :", rappel, "n")
cat("Score F1 :", f1_score, "n")

Conclusion

Créer une matrice de confusion en R est un processus simple grâce à la fonction table. Elle permet d’évaluer la performance d’un modèle de classification de manière claire et concise. En utilisant cet outil, vous pouvez facilement calculer des métriques de performance essentielles pour améliorer vos modèles. N’hésitez pas à appliquer cette méthode à vos propres données pour mieux comprendre les performances de vos modèles de classification.

2024-10-31
Article précédent: Créer et écrire des fichiers Excel avec writexl
Article suivant: Customiser les couleurs des graphiques dans ggplot2

Formation et consultance

Trouvez votre formation R sur-mesure chez ThinkR

-- Contactez-nous --

Catégories

Commentaires récents

  • Sébastien dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Achraf Mazouz dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Lou Sayd dans Coment alculer simplement la SEM dans R ? (Erreur Standard)
  • Nicolas dans Comment remplacer une chaîne de caractères ? string_replace_all(df, "pattern","replacement")
  • Vincent dans Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Archives

Plan

  • Abcd’R
  • Tous les scripts
    • Proposer un Article
  • Ressources documentaires
    • Le logiciel R
    • Liste des interfaces graphiques
  • Formation au logiciel R
  • Contact
  • Politique de confidentialité

Flux ThinkR – Certification & Formation langage R

  • Déboguer une fonction avec debugonce() ou browser()
  • Dessinez pour gagner : L’impact des maquettes sur vos apps Shiny
  • Gérer et manipuler des dates en 2024 : une année pas comme les autres !
  • Retour vers le turfu : R, le web, et webR
  • Créer un package R et le versionner avec VSCode ? Mission possible !

Méta

  • Connexion
  • Flux des publications
  • Flux des commentaires
  • Site de WordPress-FR

ABCD'R (par ThinkR ) © 2025 - Confidentialité