La fonction prop.test() permet de savoir si deux proportions mesurées sont identiques ou non.   Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire dans chaque échantillon, que chaque effectif soit supérieur ou égal à 5 et que tous les échantillons soient indépendants.   Exemple : On se demande si la proportion de fumeuses est différente de celle des fumeurs mat<-matrix(c(15,10,15,20),2) dimnames(mat) <- list(c(« homme », »femme ») ,c(« oui », »non »))   > mat       oui non homme  15  15 femme  10  20   #On obtient une matrice avec 4 effectifs suppérieurs à 5   prop.test(mat)   #        2-sample test for equality of proportions with continuityRead More →

La fonction binom.test() réalise un test de conformité d’une proportion mesurée dans un échantillon et permet de savoir si cette proportion est différente d’une valeur cible. Pour cela on compare Pobs à Pthéo, dans un échantillon de n individus.   Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire et que la condition suivante soit respecter : n Pobs  ≥ 5  et n (1-Pobs ) ≥ 5   On utilise la fonction binom.test(x, n, p) où :                                x : nombre de succès                                n : nombre d’essais                                p : probabilité théorique   Exemple :                # 92Read More →

La fonction recast(), du package reshape2, permet d’obtenir une table de contingence en une seule étape à partir d’un data.frame. La fonction renvoie un data.frame.   library(reshape2) # On charge le package reshape2   airquality#En 2 étapes :  aqm <- melt(airquality, id=c(« Month », « Day »), na.rm=TRUE) #On passe d’un format “Wide” à un format “Long” dcast(aqm, Month ~ variable, mean, margins = TRUE) #On obtient une table de contingence contenant la moyenne de chaque variable en fonction du mois  #En 1 seule étape :  recast(airquality, Month~ variable, id.var = 5:6, mean, na.rm=TRUE, margins=TRUE) #La fonction recast() permet d’obtenir une table de contingence en 1 seule étape  Read More →

La fonction outer() permet d’appliquer une fonction à chaque couple de deux vecteurs. La fonction outer() retourne une matrice de la forme M(i, j) = f (xi , yj) où x et y sont des vecteurs et f une fonction de deux variables → f (x, y) #On crée deux vecteurs : A <- sample(5) A B <- c(2,6) outer(A,B, FUN= »+ ») #On ajoute chaque élément de A et de B 2 à 2    On obtient : outer(A,B,FUN= »+ »)      [,1] [,2] [1,]    5    9 [2,]    7   11 [3,]    6   10 [4,]    3    7 [5,]    4    8     Mois <-c(« Janv », »Fev », »Mars ») Année <- 2008:2010 outer(Mois,Année,FUN= »paste », sep= »-« )Read More →

Les fonctions acast() et dcast() associées à la fonction melt(), du package reshape2, permettent d’obtenir une table de contingence. library(reshape2) # On charge le package reshape2 airquality aqm <- melt(airquality, id=c(« Month », « Day »), na.rm=TRUE) #On passe d’un format “Wide” à un format “Long” #Pour un array acast(aqm, Month ~ variable, mean) #On obtient une table de contingence contenant la moyenne de chaque variable en fonction du mois acast(aqm, Month ~ variable, mean, margins = TRUE) #On ajoute les moyennes de chaque variable pour l’ensemble des mois #et les moyennes de chaque mois pour l’ensemble des variables #Pour un data.frame dcast(aqm, Month ~ variable, mean, margins =Read More →

Si l’on veut sélectionner un sous-ensemble d’un jeu de données à partir d’une condition simple étendue, d’une condition multiple exclusive, d’une condition multiple inclusive, d’une condition multiple exclusive étendue, ou d’une condition multiple inclusive étendue, il faut utiliser les opérateurs logiques OU et/ou ET.Dans R, le ET s’écrit « & », et le OU s’écrit « | ». Une condition simple porte sur une seule colonne.Une condition multiple porte sur plusieurs colonnes à la fois (comme pour les régressions).Une condition étendue porte sur l’union de plusieurs modalités/critères au sein d’une même colonne : elle utilise l’opérateur logique OU.Une condition exclusive est une condition multiple quiRead More →

Si l’on veut sélectionner un sous-ensemble d’un jeu de données à partir d’une condition simple étendue, d’une condition multiple exclusive, d’une condition multiple inclusive, d’une condition multiple exclusive étendue, ou d’une condition multiple inclusive étendue, il faut utiliser les opérateurs logiques OU et/ou ET.Dans R, le ET s’écrit « & », et le OU s’écrit « | ». Une condition simple porte sur une seule colonne.Une condition multiple porte sur plusieurs colonnes à la fois (comme pour les régressions).Une condition étendue porte sur l’union de plusieurs modalités/critères au sein d’une même colonne : elle utilise l’opérateur logique OU.Une condition exclusive est une condition multiple quiRead More →