You searched for - Page 19 à 30 - Astuces et scripts R

08 juillet

Le juillet 8, 2015

Dans base indispensable, fonctions utiles

Comment installer un package sur R ? : install.packages, library

La fonction install.packages() permet de télécharger des packages et de les installer sur l’ordinateur (On ne fait cela qu’une fois). La fonction library() permet ensuite de charger le package et de rendre les fonctionnalités de celui-ci disponibles (Il faut faire cela à chaque fois que l’on ouvre R). install.packages(« lubridate ») #On télécharge le packages « lubridate » et on l’installe library(lubridate) #On charge ce package et on rend les fonctionnalités de celui-ci disponibles Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans manipulation de données

Avec 0 Commentaire

Comment extraire des éléments d’une chaîne de caractères ? : substr

La fonction substr() permet d’extraire une sous-chaine à partir d’une chaine de caractères. Dans cette fonction le premier argument est la chaine de caractères, le deuxième correspond au début de sous-chaine et le troisième à la fin de la sous-chaine que nous voulons extraire. chaine <- « Bonjour tout le monde » ss_chaine <- substr(chaine,9,12) #La sous-chaine débute au 9ème caractère et se finie au 12ème #Ainsi on extrait le mot « tout »Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans manipulation de données, Transformation de données

Avec 0 Commentaire

Comment passer d'un format Wide à un format Long pour un data.frame ? : reshape

La fonction reshape() permet de modifier le format des données en fonction de la variable qu’on associe au paramètre « direction ». df <- data.frame(id = rep(1:4, rep(2,4)), visit = I(rep(c(« Before », »After »), 4)), x = rnorm(4), y = runif(4)) df # df est un data.frame de dimension 8 X 4 avec des répétitions # On simplifie le tableau en enlevant les répétitions df2=reshape(df, timevar = « visit », idvar = « id », direction = « wide ») # Le paramètre « direction » associé à la valeur « long » permet de récupérer le format original des données. reshape(df2, timevar = « visit », idvar = « id », direction = « long ») Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans fonctions utiles, manipulation de données, Transformation de données

Avec 0 Commentaire

Comment appliquer une fonction à une ou plusieurs colonnes d’un data.frame et ajouter ces nouvelles données à ce data.frame ? : ddply()

La fonction ddply(), faisant partie du package plyr, permet d’appliquer une fonction à une ou plusieurs colonnes d’un data.frame en fonction des modalités d’une ou deux variables, et d’ajouter ces données à ce data.frame. library(plyr) # On charge le package plyr #On construit un data.frame : dfx <- data.frame( group <- c(rep(‘A’, 8), rep(‘B’, 15), rep(‘C’, 6)), sex <- sample(c(« M », « F »), size = 29, replace = TRUE), age <- runif(n = 29, min = 18, max = 54)) ddply(dfx, .(group, sex), mutate, mean = round(mean(age), 2), sd = round(sd(age), 2)) # On obtient laRead More →

08 juillet

Par helene

Le juillet 8, 2015

Dans fonctions utiles, manipulation de données

Avec 0 Commentaire

Comment appliquer une fonction par groupe à un data.frame et retourner un data.frame ? : ddply

La fonction ddply(), faisant partie du package plyr, permet d’appliquer une fonction à des subdivisions d’un data.frame library(plyr) # On charge le package plyr # On construit un data.frame dfx <- data.frame( group <- c(rep(‘A’, 8), rep(‘B’, 15), rep(‘C’, 6)), sex <- sample(c(« M », « F »), size = 29, replace = TRUE), age <- runif(n = 29, min = 18, max = 54)) ddply(dfx, .(group), summarize, mean = round(mean(age), 2), sd = round(sd(age), 2)) # On obtient la moyenne et l’écart type associé à l’âge en fonction du groupe ddply(dfx, .(group, sex), summarize, Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans fonctions utiles, manipulation de données, Transformation de données

Avec 1 Commentaire

Comment supprimer une colonne ou un ligne d’un data.frame ?

iris iris_bis <- iris[,-2] # On supprime la 2eme colonne iris_ter <- iris[-20,] # On supprime la 20eme ligne Pour le faire dans le cadre du {tidyverse}, reportez-vous à cette page : https://thinkr.fr/abcdr/comment-supprimer-une-colonne-ou-une-ligne-dans-un-dataframe-avec-le-tidyverse-et-dplyr/Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans fonctions utiles

Avec 0 Commentaire

Comment faire des comptages dans un data.frame ? apply, lapply, sapply, which

Les fonctions de la famille apply() et la fonction which() peuvent permettre de compter les éléments identiques, négatifs, positifs ou encore supérieurs ou inférieurs à une certaine valeur dans un data.frame. iris# iris, un tableau de données m <- matrix(data=cbind(rnorm(30, 0), rnorm(30, 2), rnorm(30, 5)), nrow=30, ncol=3) # m, une matrice de données Calculer le nombre d’éléments identiques : ### Dans un tableau :lapply (iris, function(x) length(unique(x))) # retourne une liste sapply (iris, function(x) length(unique(x))) # retourne un vecteur numérique ### Dans une matrice : apply (m, 2,function(x) length(unique(x))) #retourne des entiers Calculer le nombre d’éléments supérieurs ou inférieur à une certaine valeur : ###Read More →

08 juillet

Par helene

Le juillet 8, 2015

Dans fonctions utiles, manipulation de données

Avec 0 Commentaire

Comment ajouter un niveau à un facteur ?

Il est parfois utile d’ajouter un niveau, absent à l’intérieur du facteur mais qui est susceptible de devoir être ajouter par la suite. x <- factor(c(« A », »A », »B », »A », »C », »A », »B », »A », »B », »B », »C », »A », »C »)) levels(x) <- c(levels(x), »D ») # On ajoute le niveau “D” au facteur x On obtient : x [1] A A B A C A B A B B C A C Levels: A B C DRead More →

07 juillet

Par helene

Le juillet 7, 2015

Dans fonctions utiles, manipulation de données

Avec 0 Commentaire

Comment gérer les données manquantes lors d’une opération grâce au paramètre na.rm ?

Les données manquantes empêchent R de réaliser des opérations comme la moyenne ou la somme appliquée à un vecteur par exemple. Pour que le logiciel puisse les réaliser il est nécessaire d’ajouter le paramètre na.rm afin que les données manquantes soient prises en compte en tant que telles. x<-c(1,NA,4.3,8,NA,9.5,3.1) # x est un vecteur contenant des données manquantes sum(x) # Renvoie « NA », la fonction sum() ne prend pas en compte les données manquantes sum(x, na.rm=TRUE) # Renvoie la somme. Le paramètre « na.rm »Read More →

07 juillet

Par helene

Le juillet 7, 2015

Dans fonctions utiles, Transformation de données

Avec 0 Commentaire

Comment modifier un vecteur contenant des caractères ? chartr(), tolower(), toupper()

x<-(« Comment Remplacer Plusieurs Caractères ? ») chartr(« ers », »olm »,x) # On remplace dans le vecteur x les « e » par des « o » # les « r » par des « l » # et les « s » par des « m » tolower(x) # On met tous les caractères enRead More →

Les dates de formations à R, éligibles au CPF sont en lignes !

Search results for: (Page 19)

Comment installer un package sur R ? : install.packages, library

Comment extraire des éléments d’une chaîne de caractères ? : substr

Comment passer d'un format Wide à un format Long pour un data.frame ? : reshape

Comment appliquer une fonction à une ou plusieurs colonnes d’un data.frame et ajouter ces nouvelles données à ce data.frame ? : ddply()

Comment appliquer une fonction par groupe à un data.frame et retourner un data.frame ? : ddply

Comment supprimer une colonne ou un ligne d’un data.frame ?

Comment faire des comptages dans un data.frame ? apply, lapply, sapply, which

Comment ajouter un niveau à un facteur ?

Comment gérer les données manquantes lors d’une opération grâce au paramètre na.rm ?

Comment modifier un vecteur contenant des caractères ? chartr(), tolower(), toupper()