• Menu
    • Nos Formations
    • Nos Prestations
    • Les Astuces
Skip to content
Astuces et scripts R
Astuces et scripts R
Primary Navigation Menu
Menu
  • Abcd’R
  • Tous les scripts
    • Voir les articles
    • Proposer un Article
  • Formation au logiciel R
  • Contact

Les dates de formations à R, éligibles au CPF sont en lignes !

Voir nos formations

Grouper des données avec dplyr::group_by et summarise

Par vincent
Le novembre 13, 2024
Dans groupement
Tagged group_by, summarise
Avec 0 Commentaire

Grouper des données avec dplyr::group_by et summarise

Dans l’analyse de données, il est souvent nécessaire de regrouper des données par certaines catégories et de calculer des statistiques résumées pour chaque groupe. Le package dplyr de R offre des fonctions puissantes pour effectuer ces opérations de manière efficace et intuitive. Dans cet article, nous allons explorer comment utiliser dplyr::group_by et dplyr::summarise pour grouper des données et obtenir des résumés.

Installation et chargement de dplyr

Si vous n’avez pas encore installé le package dplyr, vous pouvez le faire avec la commande suivante :

install.packages("dplyr")

Ensuite, chargez le package :

library(dplyr)

Exemple concret

Imaginons que nous avons un jeu de données sur les ventes de produits dans un magasin. Ce jeu de données contient les colonnes suivantes : produit, quantite, et prix. Nous souhaitons calculer le total des ventes pour chaque produit.

Voici un exemple de jeu de données :

# Création d'un jeu de données exemple
ventes <- data.frame(
  produit = c("A", "B", "A", "C", "B", "A"),
  quantite = c(10, 5, 8, 2, 3, 7),
  prix = c(100, 200, 100, 300, 200, 100)
)

Utilisation de group_by et summarise

Pour calculer le total des ventes pour chaque produit, nous allons d’abord grouper les données par produit avec group_by, puis utiliser summarise pour calculer la somme des quantités et des ventes (quantité * prix).

Voici comment faire cela :

# Calculer le total des ventes par produit
resultat <- ventes %>%
  group_by(produit) %>%
  summarise(
    total_quantite = sum(quantite),
    total_ventes = sum(quantite * prix)
  )

# Afficher le résultat
print(resultat)

Explication du code

  1. group_by(produit) : Cette fonction regroupe les données par la colonne produit. Chaque groupe correspond à un produit unique.
  2. summarise(…) : Cette fonction permet de créer un résumé pour chaque groupe. Dans notre cas, nous calculons :

    • total_quantite : la somme des quantités vendues pour chaque produit.
    • total_ventes : la somme des ventes totales, calculée comme quantite * prix.
  3. print(resultat) : Enfin, nous affichons le résultat.

Résultat attendu

Le résultat affiché devrait ressembler à ceci :

# A tibble: 3 × 3
  produit total_quantite total_ventes
  <chr>            <int>        <dbl>
1 A                   25        2500
2 B                    8        1600
3 C                    2         600

Conclusion

Dans cet article, nous avons vu comment utiliser dplyr::group_by et dplyr::summarise pour grouper des données et calculer des statistiques résumées. Ces fonctions sont très utiles pour analyser des jeux de données et extraire des informations significatives. N’hésitez pas à explorer d’autres fonctions de dplyr pour enrichir vos analyses de données !

2024-11-13
Article précédent: Fusionner des data frames avec merge
Article suivant: Générer des nombres aléatoires avec runif et rnorm

Formation et consultance

Trouvez votre formation R sur-mesure chez ThinkR

-- Contactez-nous --

Catégories

Commentaires récents

  • Sébastien dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Achraf Mazouz dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Lou Sayd dans Coment alculer simplement la SEM dans R ? (Erreur Standard)
  • Nicolas dans Comment remplacer une chaîne de caractères ? string_replace_all(df, "pattern","replacement")
  • Vincent dans Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Archives

Plan

  • Abcd’R
  • Tous les scripts
    • Proposer un Article
  • Ressources documentaires
    • Le logiciel R
    • Liste des interfaces graphiques
  • Formation au logiciel R
  • Contact
  • Politique de confidentialité

Flux ThinkR – Certification & Formation langage R

  • Déboguer une fonction avec debugonce() ou browser()
  • Dessinez pour gagner : L’impact des maquettes sur vos apps Shiny
  • Gérer et manipuler des dates en 2024 : une année pas comme les autres !
  • Retour vers le turfu : R, le web, et webR
  • Créer un package R et le versionner avec VSCode ? Mission possible !

Méta

  • Connexion
  • Flux des publications
  • Flux des commentaires
  • Site de WordPress-FR

ABCD'R (par ThinkR ) © 2025 - Confidentialité