• Menu
    • Nos Formations
    • Nos Prestations
    • Les Astuces
Skip to content
Astuces et scripts R
Astuces et scripts R
Primary Navigation Menu
Menu
  • Abcd’R
  • Tous les scripts
    • Voir les articles
    • Proposer un Article
  • Formation au logiciel R
  • Contact

Les dates de formations à R, éligibles au CPF sont en lignes !

Voir nos formations

Utiliser dplyr pour filtrer les données

Par vincent
Le décembre 30, 2024
Dans filtrage
Tagged dplyr, filtrer
Avec 0 Commentaire

Utiliser dplyr pour filtrer les données en R

Le package dplyr est l’un des outils les plus puissants et populaires pour la manipulation de données en R. L’une de ses principales fonctionnalités est la capacité à filtrer des données, ce qui permet de sélectionner des sous-ensembles de données en fonction de conditions spécifiques. Dans cet article, nous allons explorer comment utiliser dplyr pour filtrer des données de manière simple et efficace.

Installation et chargement de dplyr

Avant de commencer, assurez-vous que le package dplyr est installé et chargé dans votre environnement R. Vous pouvez l’installer avec la commande suivante :

install.packages("dplyr")

Ensuite, chargez le package :

library(dplyr)

Exemple concret : Filtrer un jeu de données

Pour illustrer l’utilisation de dplyr, prenons un exemple avec le jeu de données intégré mtcars, qui contient des informations sur différentes voitures. Supposons que nous souhaitons filtrer les voitures qui ont une consommation de carburant (mesurée en miles par gallon, mpg) supérieure à 20.

Étape 1 : Visualiser les données

D’abord, jetons un œil aux premières lignes du jeu de données mtcars :

head(mtcars)

Étape 2 : Filtrer les données

Nous allons utiliser la fonction filter() de dplyr pour sélectionner les voitures avec un mpg supérieur à 20. Voici comment faire :

voitures_economiques <- mtcars %>%
  filter(mpg > 20)

Dans cet exemple :

  • mtcars est notre jeu de données d’origine.
  • %>% est l’opérateur pipe qui permet de passer le résultat de la commande précédente à la suivante.
  • filter(mpg > 20) sélectionne uniquement les lignes où la colonne mpg est supérieure à 20.

Étape 3 : Afficher les résultats

Pour voir les voitures qui répondent à notre critère, nous pouvons afficher le nouveau jeu de données :

print(voitures_economiques)

Conclusion

Filtrer des données avec dplyr est une tâche simple et intuitive. Grâce à la fonction filter(), vous pouvez facilement extraire des sous-ensembles de données basés sur des conditions spécifiques. Dans cet article, nous avons vu comment filtrer les voitures du jeu de données mtcars pour ne garder que celles ayant une consommation de carburant supérieure à 20 mpg.

N’hésitez pas à explorer d’autres fonctions de dplyr pour enrichir votre analyse de données en R !

2024-12-30
Article précédent: Utiliser des modèles mixtes avec lme4
Article suivant: Utiliser faceting pour diviser un graphique avec ggplot2

Formation et consultance

Trouvez votre formation R sur-mesure chez ThinkR

-- Contactez-nous --

Catégories

Commentaires récents

  • Sébastien dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Achraf Mazouz dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Lou Sayd dans Coment alculer simplement la SEM dans R ? (Erreur Standard)
  • Nicolas dans Comment remplacer une chaîne de caractères ? string_replace_all(df, "pattern","replacement")
  • Vincent dans Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Archives

Plan

  • Abcd’R
  • Tous les scripts
    • Proposer un Article
  • Ressources documentaires
    • Le logiciel R
    • Liste des interfaces graphiques
  • Formation au logiciel R
  • Contact
  • Politique de confidentialité

Flux ThinkR – Certification & Formation langage R

  • Déboguer une fonction avec debugonce() ou browser()
  • Dessinez pour gagner : L’impact des maquettes sur vos apps Shiny
  • Gérer et manipuler des dates en 2024 : une année pas comme les autres !
  • Retour vers le turfu : R, le web, et webR
  • Créer un package R et le versionner avec VSCode ? Mission possible !

Méta

  • Connexion
  • Flux des publications
  • Flux des commentaires
  • Site de WordPress-FR

ABCD'R (par ThinkR ) © 2025 - Confidentialité