• Menu
    • Nos Formations
    • Nos Prestations
    • Les Astuces
Skip to content
Astuces et scripts R
Astuces et scripts R
Primary Navigation Menu
Menu
  • Abcd’R
  • Tous les scripts
    • Voir les articles
    • Proposer un Article
  • Formation au logiciel R
  • Contact

Les dates de formations à R, éligibles au CPF sont en lignes !

Voir nos formations

Sélectionner des colonnes avec select de dplyr

Par vincent
Le décembre 18, 2024
Dans colonnes
Tagged colonnes, select
Avec 0 Commentaire

Sélectionner des colonnes avec select de dplyr

Le package dplyr est l’un des outils les plus puissants et populaires pour la manipulation de données en R. L’une de ses fonctions les plus utilisées est select(), qui permet de choisir des colonnes spécifiques d’un tableau de données (data frame). Cet article vous expliquera comment utiliser select() avec des exemples concrets.

Installation et chargement de dplyr

Avant de commencer, assurez-vous que le package dplyr est installé et chargé dans votre session R. Vous pouvez le faire avec les commandes suivantes :

install.packages("dplyr")  # Installer dplyr si ce n'est pas déjà fait
library(dplyr)             # Charger le package

Utilisation de select()

La fonction select() vous permet de choisir une ou plusieurs colonnes d’un data frame. Voici la syntaxe de base :

select(data, column1, column2, ...)
  • data : le data frame à partir duquel vous souhaitez sélectionner des colonnes.
  • column1, column2, ... : les noms des colonnes que vous souhaitez conserver.

Exemple concret

Imaginons que nous avons un data frame nommé df contenant des informations sur des étudiants :

# Création d'un exemple de data frame
df <- data.frame(
  nom = c("Alice", "Bob", "Charlie"),
  age = c(20, 21, 22),
  note = c(15, 12, 18),
  ville = c("Paris", "Lyon", "Marseille")
)

# Affichage du data frame
print(df)

Ce qui donne :

      nom age note      ville
1   Alice  20  15      Paris
2     Bob  21  12       Lyon
3 Charlie  22  18 Marseille

Sélectionner des colonnes

Supposons que nous ne souhaitons garder que les colonnes nom et note. Nous pouvons utiliser select() comme suit :

# Sélectionner les colonnes 'nom' et 'note'
df_selection <- select(df, nom, note)

# Affichage du nouveau data frame
print(df_selection)

Le résultat sera :

      nom note
1   Alice  15
2     Bob  12
3 Charlie  18

Sélectionner avec des fonctions

select() permet également d’utiliser des fonctions pour sélectionner des colonnes. Par exemple, vous pouvez utiliser starts_with(), ends_with(), ou contains() pour sélectionner des colonnes selon des critères spécifiques.

Voici un exemple utilisant starts_with() pour sélectionner les colonnes qui commencent par la lettre n :

# Sélectionner les colonnes qui commencent par 'n'
df_selection_starts_with_n <- select(df, starts_with("n"))

# Affichage du nouveau data frame
print(df_selection_starts_with_n)

Le résultat sera :

      nom note
1   Alice  15
2     Bob  12
3 Charlie  18

Conclusion

La fonction select() de dplyr est un outil puissant pour manipuler vos données en R. Elle vous permet de choisir facilement les colonnes qui vous intéressent, que ce soit en spécifiant les noms des colonnes ou en utilisant des fonctions pour des sélections plus dynamiques. N’hésitez pas à explorer davantage les fonctionnalités de dplyr pour améliorer votre analyse de données !

2024-12-18
Article précédent: Sélection de variables avec stepAIC
Article suivant: Tester l’efficacité d’un code avec system.time

Formation et consultance

Trouvez votre formation R sur-mesure chez ThinkR

-- Contactez-nous --

Catégories

Commentaires récents

  • Sébastien dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Achraf Mazouz dans Comment effectuer des calculs de somme et de moyenne sur les colonnes ou les lignes d’une matrice ? colSums, rowSums, colMeans, rowMeans
  • Lou Sayd dans Coment alculer simplement la SEM dans R ? (Erreur Standard)
  • Nicolas dans Comment remplacer une chaîne de caractères ? string_replace_all(df, "pattern","replacement")
  • Vincent dans Comment comparer deux moyennes avec R grâce au test de Student ? t.test

Archives

Plan

  • Abcd’R
  • Tous les scripts
    • Proposer un Article
  • Ressources documentaires
    • Le logiciel R
    • Liste des interfaces graphiques
  • Formation au logiciel R
  • Contact
  • Politique de confidentialité

Flux ThinkR – Certification & Formation langage R

  • Déboguer une fonction avec debugonce() ou browser()
  • Dessinez pour gagner : L’impact des maquettes sur vos apps Shiny
  • Gérer et manipuler des dates en 2024 : une année pas comme les autres !
  • Retour vers le turfu : R, le web, et webR
  • Créer un package R et le versionner avec VSCode ? Mission possible !

Méta

  • Connexion
  • Flux des publications
  • Flux des commentaires
  • Site de WordPress-FR

ABCD'R (par ThinkR ) © 2025 - Confidentialité