La fonction ddply(), faisant partie du package plyr, permet d’appliquer une fonction à une ou plusieurs colonnes d’un data.frame en fonction des modalités d’une ou deux variables, et d’ajouter ces données à ce data.frame.
library(plyr) # On charge le package plyr
#On construit un data.frame :
dfx <- data.frame(
group <- c(rep('A', 8), rep('B', 15), rep('C', 6)),
sex <- sample(c("M", "F"), size = 29, replace = TRUE),
age <- runif(n = 29, min = 18, max = 54))
ddply(dfx, .(group, sex), mutate,
mean = round(mean(age), 2),
sd = round(sd(age), 2))
# On obtient la moyenne et l'écart type de l’âge en fonction du groupe et du sexe
# et on ajoute une colonne “mean” et “sd” au data.frame dfx.