Si vous souhaitez unifier plusieurs colonnes en une seule, faites appel à la fonction unite(), issue du package tidyr. Cette fonction prends en premier argument le nom de l’objet contenant le tableau, la colonne cible, les colonnes à lier, puis un éventuel séparateur. Notez que le séparateur de base est « _ ». data(« msleep ») library(tidyr) unite(msleep, genusvore, genus, vore, sep = « -« )Read More →

Votre colonne contient deux variables (ou plus), et vous avez besoin de la séparer ? Pour transformer xx_yy en deux colonnes qui contiendront xx et yy, faites appel à la fonction separate() du package tidyr ! separate prend quatre arguments principaux : le tableau, le nom de la colonne à séparer, les noms des colonnes cibles, et le séparateur. library(tidyr) data(« presidential ») separate(presidential, start, c(« y », »m », « d »), sep = « -« )Read More →

Issu du package magrittr et disponible dans le tidyverse, le pipe vous permet de passer de : library(tidyverse) data(« population ») head(summarise(group_by(filter(population, year > 1999),country),moyenne = mean(population))) à population %>% filter(year > 1999) %>% group_by(country) %>% summarise(moyenne = mean(population)) %>% head() Plus clair, n’est-ce pas ! Alors, comment ça marche ? C’est très simple : l’élément à gauche de %>% se retrouve en premier argument de la fonction à droite. Autrement dit, f(x,y) s’écrit x %>% f(y). Comment faire si l’élément de gauche n’est pas le premier argument de celui de droite ? Vous pouvez y faire référence en le remplaçant par un point : list(c(1,2,3), c(4,5,6),Read More →

Package de dataviz du tidyverse, ggplot2 est l’incontournable R pour la visualisation de données. La force de ce module ? ggplot2 repose sur une « grammaire graphique ». Pour plus d’infos sur cette philosophie, rendez-vous sur les liens en bas de page. Construisons pas à pas un ggplot. 1. Installation install.packages(« ggplot2 »)#Ou pour la version en développement :devtools::install_github(« tidyverse/ggplot2 ») 2. Ouverture library(« ggplot2″) 3. Couche 1 : « data & aesthetics » Avec cette première ligne, il s’agit tout simplement d’indiquer l’objet contenant le jeu de données, et les variables qui vont être visualisées en x, en y, ou avec les couleurs, les tailles… ggplot(data = iris, aes(Sepal.Length, Sepal.Width, color = SpeciesRead More →

Avec ce package du tidyverse, vous pouvez filtrer votre jeu de données pour ne retenir que les valeurs qui vous intéressent, grâce à la fonction filter(). Cette fonction prend en paramètres votre objet contenant un tableau de données, puis une ou plusieurs variable(s) avec leurs filtres. Vous pouvez utiliser tous les opérateurs classiques (==, !=, >, <, etc.) data(women)women %>% filter(height == 59)women %>% filter(height > 59 & weight < 139) Vous pouvez également « piper » vos filtres. Utile pour une meilleure lisibilité, si vous voulez combiner beaucoup de conditions (mais vous aurez plus de ligne  : women %>% filter(height > 59) %>% filter(weight < 139)Read More →

  Formation au logiciel R Afin de progresser et de maîtriser au mieux le logiciel R nous vous proposons des formations sur mesure à R . Il peut s’agir de formations orientées statistique, programmation avancée avec R, big-data avec R, cartographie avec R, développement de packages, développement d’interface web avec {shiny}. Débutant ou confirmé, contactez-nous afin d’élaborer avec nous un programme de formation au logiciel R qui correspond à vos besoins et à votre niveau. Il s’agit de formation sur mesure, en distanciel ou dans vos locaux, possiblement partout en France. Nous utilisons vos problématiques et vos jeux de données afin d’élaborer une session de formationRead More →

Pour importer un fichier SAS sas7bdat, la premiere solution est d’utiliser la fonction read.sas7bdat du package sas7bdat library(sas7bdat)donnee<-read.sas7bdat(« fichier.sas7bdat ») Cependant parfois  vous allez tomber sur cette erreur : Error in read.sas7bdat(« ficher.sas7bdat ») : file contains compressed data En effet le package sas7bdat n’est pas capable d’importer les fichiers compressés.Voici une solution qui fonctionne : library(devtools)install_github(« biostatmatt/sas7bdat.parso »)library(sas7bdat.parso) s7b2csv(« fichier.sas7bdat », « fichier.csv ») donnee<-read.csv(« fichier.csv »)  Read More →

La fonction seconds_to_period(), du package lubridate, permet de convertir un nombre de secondes en une période, et la fonction period_to_seconds() permet de convertir une période en un nombre de secondes. seconds_to_period(60) [1] « 1M 0S » seconds_to_period(150) [1] « 2M 30S » seconds_to_period(3600) [1] « 1H 0M 0S » seconds_to_period(4989000) [1] « 57d 17H 50M 0S »     period_to_seconds(seconds_to_period(60)) [1] 60 period_to_seconds(seconds_to_period(150)) [1] 150 period_to_seconds(seconds_to_period(3600)) [1] 3600 period_to_seconds(seconds_to_period(4989000)) [1] 4989000  Read More →