You searched for package - Page 3 à 11

30 janvier

Le janvier 30, 2019

2019-01-30-comment-calculer-le-nombre-de-donnees-manquantes-par-lignes

Plusieurs façon de faire, à vous de choisir celle qui vous plait le plus 🙂 Fabriquons un petit jeu de données auquel nous souhaitons ajouter une colonne contenant le nombre ne NA sur chacune des lignes. library(tidyverse) dataset <- tribble(~a,~b,~c, 1,NA,NA, NA,NA,NA, 1,2,3, NA,3,NA ) A l'ancienne dataset$nb <- apply(dataset, MARGIN = 1, function(x){sum(is.na(x))}) avec du pmap et du mutate dataset %>% mutate(nb = pmap(.,function(a,b,c){sum(is.na(a),is.na(b),is.na(c))}), nb= unlist(nb)) Mais c’est dommage de devoir spécifier a, b et c. donc simplifions : dataset %>% mutate(nb = pmap_dbl(., function(…){sum(is.na(c(…)))})) Cela reste à mon goût un peu trop verbeux Avec rowSums dataset %>% mutate(nb = rowSums(is.na(.))) ça c’est propreRead More →

14 septembre

Par vincent

Le septembre 14, 2018

Dans Uncategorized

Avec 0 Commentaire

2018-09-14-comment-supprimer-les-na-valeurs-manquantes-dans-r-avec-dplyr

Vous savez comment filtrer un jeu de données avec dplyr ? : filter(), on peut donc utiliser une règle pour filtrer sur les valeurs manquantes (les fameux NA) en utilisant la fonction is.na. library(dplyr) df <- tibble(x1 = c(1, 2, NA, 4), x2 = c(« a », NA, « b », « c »), y = c(NA, TRUE, FALSE, TRUE)) df %>% filter(!is.na(x1)) Mais si vous voulez supprimer les lignes qui contiennent des NA dans plusieurs colonnes, voire toutes les colonnes, il vaut mieux utiliser drop_na du package {tidyr}. Vous pourrez même utiliser les "helpers" comme pour la fonction select de {dplyr} pour choisir les colonnes avec des règles. library(tidyr) dfRead More →

14 septembre

Par Sébastien

Le septembre 14, 2018

Dans base indispensable, manipulation de données, tidyverse, Transformation de données

Avec 0 Commentaire

Comment supprimer les NA (valeurs manquantes) dans R avec dplyr ?

Vous savez comment filtrer un jeu de données avec dplyr ? : filter(), on peut donc utiliser une règle pour filtrer sur les valeurs manquantes (les fameux NA) en utilisant la fonction is.na. library(dplyr) df <- tibble(x1 = c(1, 2, NA, 4), x2 = c(« a », NA, « b », « c »), y = c(NA, TRUE, FALSE, TRUE)) df %>% filter(!is.na(x1)) Mais si vous voulez supprimer les lignes qui contiennent des NA dans plusieurs colonnes, voire toutes les colonnes, il vaut mieux utiliser drop_na du package {tidyr}. Vous pourrez même utiliser les « helpers » comme pour la fonction select de {dplyr} pour choisir les colonnes avec des règles. library(tidyr) dfRead More →

23 mai

Par vincent

Le mai 23, 2018

Dans Uncategorized

Avec 0 Commentaire

2018-05-23-comment-faire-une-anova-avec-effet-aleatoire-pour-une-analyse-de-precision-et-de-repetabilite-avec-r-comme-dans-sas

Une anova avec modèle mixte comme VARCOMP dans SAS Créons d’abord un jeu de données. On souhaite déterminer la précision et la répétabilité d’une analyse. Pour cela, la mesure est effectuée par 2 techniciens différents, sur des concentrations de produits différents sur 3 jours différents et avec 2 réplicats. library(dplyr) set.seed(42) data <- tibble( concentration = rep(c(10, 30, 50, 80), 3*2), technicien = rep(c(« A », « B »), each = 3*2*2), jour = rep(rep(1:3, each = 2*2), 2), replicat = rep(1:2, times = 2*3*2)) %>% mutate(mesure = ifelse( technicien == « A », 0.2 * concentration + rnorm(12, sd = 3), 0.2 * concentration + rnorm(12, sd = 2))) dataRead More →

23 mai

Par Sébastien

Le mai 23, 2018

Dans SAS, expérimentation, modélisation

Avec 0 Commentaire

Comment faire une anova avec effet aléatoire pour une analyse de précision et de répétabilité avec R comme dans SAS ?

12 décembre

Par Sébastien

Le décembre 12, 2017

Le logiciel R

R est un logiciel libre, gratuit et multiplateforme (windows, linux et mac) distribué par GNU Public Licence trés utilisé pour l’analyse statistique. La version de base dispose d’un grand nombre d’outils analytiques et graphiques permettant de manipuler, de traiter et de représenter des données de nature très différentes. Son développement met à contribution des utilisateurs qui peuvent créer de nouveaux paquets (« packages ») rendant les possibilités d’utilisation immenses dans des domaines d’études très différents (écologie, analyse sensorielle, psychologie, économie…) et faisant intervenir des techniques très diverses (analyse multivariée, modélisation linéaire et non linéaire, statistique spatiale, classification, tests statistiques…). Le partage grandissant de nouveaux paquetsRead More →

04 décembre

Par vincent

Le décembre 4, 2017

Dans Uncategorized

Avec 0 Commentaire

2017-12-04-comment-lire-le-contenu-dun-shapefile-avec-r

Un shapefile est un fichier d’information géographique avec un format vectoriel. Il permet de représenter des points (e.g. villes), des lignes (e.g. routes) et des polygones (e.g. départements) avec un système d’information géographique. Le format shapefile est composé de plusieurs fichiers séparés (4 minimum): data.shp : informations de géométrie (coordonnées) data.prj : information de système de projection data.dbf : table des attributs data.shx : indice de position des géométries Dans R, deux packages majeurs sont utilisés pour manipuler les données géographiques de type vectoriel: {sp} : Le package de référence. Il utilise notamment la librairie {rgdal} pour lire les données géographiques, un package utilisant laRead More →

04 décembre

Par Sébastien

Le décembre 4, 2017

Dans sig - cartographie, Transformation de données

Avec 0 Commentaire

Comment lire le contenu d'un shapefile avec R ?

25 juillet

Par colin

Le juillet 25, 2017

Dans manipulation de données, tidyverse

Avec 0 Commentaire

Comment détecter si une valeur se situe entre deux autres valeurs ? between()

Est-ce que la valeur associée à votre variable est comprise entre deux autres valeurs ? Vous le saurez en faisant appel à between, du package {dplyr} ! {dplyr} est un package du tidyverse que l’on a jamais fini de découvrir. Regorgeant de fonctions facilitant la manipulation de données, ce package répond à quasiment toutes les questions que vous pourriez vous poser sur vos données… Et par exemple : comment savoir si une valeur est entre deux autres valeurs. Pour le savoir, direction between, qui prendra trois paramètres : votre valeur, la valeur de la borne de droite, et la valeur de la borne de gauche.Read More →

25 juillet

Par vincent

Le juillet 25, 2017

Dans Uncategorized

Avec 0 Commentaire

Les dates de formations à R, éligibles au CPF sont en lignes !

Search results for: package (Page 3)

2019-01-30-comment-calculer-le-nombre-de-donnees-manquantes-par-lignes

2018-09-14-comment-supprimer-les-na-valeurs-manquantes-dans-r-avec-dplyr

Comment supprimer les NA (valeurs manquantes) dans R avec dplyr ?

2018-05-23-comment-faire-une-anova-avec-effet-aleatoire-pour-une-analyse-de-precision-et-de-repetabilite-avec-r-comme-dans-sas

Comment faire une anova avec effet aléatoire pour une analyse de précision et de répétabilité avec R comme dans SAS ?

Le logiciel R

2017-12-04-comment-lire-le-contenu-dun-shapefile-avec-r

Comment lire le contenu d'un shapefile avec R ?

Comment détecter si une valeur se situe entre deux autres valeurs ? between()

2017-07-25-comment-detecter-si-une-valeur-se-situe-entre-deux-autres-valeurs-between