R Niveau 1 - Utilisateur - Analyse de données
Certification du répertoire spécifique de France Compétences RS6193
Toutes nos formations sont proposées en distanciel. Lisez ici notre vision de la formation à distance.
Cette certification est centrée sur les concepts du {tidyverse}, une approche efficace et particulièrement accessible aux débutants de la programmation en R couvrant la plupart des besoins en data science.
Le titulaire de la certification sera capable, dans une démarche de data science, d’intégrer et de traiter des données, et de produire un rapport en utilisant de manière appropriée le langage de programmation R Le titulaire de la certification sera capable de mettre en place un processus de traitement des données sous R qui soit reproductible avec différents type de jeux de données
Objectifs pédagogiques
- Connaître et comprendre l’environnement R
- Importer et exporter des données
- Concevoir des opérations de manipulation de données (filtrer, trier, agréger, transformer…) comme un flux de traitement organisé
- Dessiner le graphique approprié à la représentation souhaitée
- Manipuler les dates
- Manipuler les chaines de caractères
- Maîtriser le paramétrage de rapports mis en forme d’analyse de données
Accessibilité
Vous êtes en situation de handicap et souhaitez suivre une formation avec nous, ce courriel vous est dédié : [email protected]. Cette formation n’est pas (encore) accessible aux personnes aveugles et malvoyantes. Pour toute autre situation, n’hésitez pas à nous contacter pour évaluer comment vous assurer une expérience apprenante optimum (les adaptations spécifiques peuvent entraîner des frais supplémentaires).
Profil des apprenants
- Utilisateurs d’Excel pour l’analyse de données
- Utilisateurs de logiciels de statistiques propriétaires
- Utilisateur de R nécessitant une remise à niveau
Prérequis
– Affinité pour la programmation
– Affinité pour les données
– Aisance informatique
Programme
- Présentation de R, premiers pas dans la console
- Démystifier la console, une «super-calculatrice» qui exécute du code
- Prendre ses marques dans RStudio, créer son premier projet
- Comprendre ce qu’est un vecteur
- Se familiariser avec les packages et le moyen de les utiliser
- Utiliser Quarto/Rmarkdown pour la prise de notes
- Visualiser des données
- Construire, modifier et exporter des graphiques avec le package {ggplot2}
- Importer des données
- Importer des fichiers plats de type .csv et .xls avec les packages {readr} et {readxl}
- Vérifier la qualité de l’import
- Typer les données (déterminer si chaque colonne est une date, une valeur numérique, un texte…)
- Manipuler et nettoyer des données
- Se familiariser avec les packages {dplyr} et {tidyr}
- Concevoir les opérations de manipulation de données comme un flux de traitement organisé :
- introduction de l’opérateur %>%
- Manipuler, transformer et résumer des données avec {dplyr}
- Remodeler les données sous un format adéquat avec {tidyr}
- Produire des rapports d’analyse
- Appréhender le concept de recherche reproductible
- Compiler des rapports commentés imbriqués de code R avec Quarto/Rmarkdown
- Savoir exporter en docx, en html et en pdf
- Mise en forme de tableau avec {DT}
- Décrire des données
- Calculer des paramètres descriptifs pertinents pour décrire des données (effectifs, moyennes, médianes, écart-types…)
- Utilisation du package {skimr}
- Autonomisation
- Approfondir les connaissances sur les packages
- Exporter des données
- Savoir comment trouver de l’aide face à un problème rencontré sur R
- Paramétrer finement les rapports d’analyse réalisés avec Quarto/Rmarkdown
- Réaliser des jointures de données
- Réaliser une jointure simple
- Réaliser une jointure complexe
- Gérer des dates
- Formater, manipuler et opérer des calculs sur des dates avec le package {lubridate}
- Comprendre, appréhender et utiliser les formats dates dans R
- Gérer les chaînes de caractères
- Manipuler les chaînes de caractères avec le package {stringr}
- Gérer la présence de données manquantes dans les données
Moyens pédagogiques et techniques
- Formation 100% en distanciel synchrone (par demi-journées)
- Documents supports de formation projetés
- Mise à disposition en ligne de documents supports à la suite de la formation
- Plateforme d’apprentissage intégrée en ligne
- Exposés théoriques
- Travaux dirigés
- Quiz en salle
- Mise à disposition d’une base de ressources documentaires
Dispositif de suivi de l'exécution de l'évaluation des résultats de la formation
- Émargement en ligne
- Évaluations formatives régulières sous forme de QCM
- Évaluations sommatives régulières sous forme de travaux dirigés
- Formulaires d’évaluation de la formation, à chaud et à froid
- Examen certifiant en fin de cursus – En autonomie en temps limité de 2 heures
- Alternance régulière entre théorie et pratique
À propos de cette certification
Libellé : Analyse statistique de données avec le langage R
Code de la fiche : RS6193
Certificateur : ThinkR
Date d’enregistrement : 14-12-2022
Titres RNCP complémentaires de cette certification