Le test d’égalité teste l’hypothèse H0 : µ1 = µ2. La puissance d’un test est la probabilité de rejeter l’hypothèse H0 sans commettre une erreur, c’est-à-dire lorsque µ1 est effectivement  différente de µ2.   Nous voulons donc calculer la puissance du test avec un nombre n d’individus grâce à la fonction power.t.test().   Exemple : dans une expérience nous avons un écart type de 1.7, une moyenne de 1 et on prend le seuil classique α=5%. On calcule la puissance du test avec 15 individus par groupe. power.t.test(n=15, delta=1, sd=1.7, sig.level=0.05)$power [1] 0.3430475     Si l’on décide de n’utiliser que 15 individus dans l’expérimentation, alors onRead More →

Les conditions permettent d’exécuter une commande en fonction d’une ou plusieurs conditions. La forme la plus simple s’écrit :   if (condition){ +    commande1 +    commande2 +    … +}   Exemple :   B<-TRUE x<-2   if (B==TRUE){      x<-x+1      y<-10 }   x [1] 3 y [1] 10   Dans ce cas là si B est différent de TRUE rien n’est effectué. Pour ajouter une des commandes lorsque que la première condition n’est pas vérifiée on utilise else :   if (condition){ +    commande1 +    commande2 +    … } else (condition){ +    commande1 +    commande2 +    … +}   Exemple : B<-FALSE x<-2   if (B==TRUE){     Read More →

Le test du khi2 permet de tester l’indépendance de deux variables pour cela nous calculons la valeur de la statistique  ainsi que la probabilité critique.   Pour pouvoir réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire dans chaque échantillon et que chaque effectif théorique soit supérieur ou égal à 5.   Pour effectuer ce test nous utilisons la fonction chisq.test().   Exemple : Nous nous demandons si nombre de fumeurs dépend de l’âge ou non, c’est-à-dire : l’âge influence t’il la propension à fumer?   mat<-matrix(c(15,10,15,20,10,10),3) dimnames(mat) <- list(c(« 15-30″, »31-45″, »46-70 ») ,c(« oui », »non »))   mat       oui non 15-30  15  20 31-45  10  10 46-70  15  10  Read More →

Le test de Mac Nemar Permet de savoir si deux proportions appariées mesurées sont identiques ou non.   Pour pouvoir réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire dans chaque échantillon, que chaque effectif soit supérieur ou égal à 5 et que tous les individus passent d’un état à l’autre.   Pour appliquer le test de Mac Nemar nous utilisons la fonction mcnemar.test().   Exemple : Nous nous demandons si la proportion de fumeur  a varié  dans le temps ? mat<-matrix(c(20,2,10,28),2) dimnames(mat) <- list(« avant » = c(« fumeur », « non    fumeur »), »apres » = c(« fumeur », « non fumeur »))   mat             apres avant        fumeur non fumeur   fumeur        Read More →

La fonction prop.test() permet de savoir si deux proportions mesurées sont identiques ou non.   Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire dans chaque échantillon, que chaque effectif soit supérieur ou égal à 5 et que tous les échantillons soient indépendants.   Exemple : On se demande si la proportion de fumeuses est différente de celle des fumeurs mat<-matrix(c(15,10,15,20),2) dimnames(mat) <- list(c(« homme », »femme ») ,c(« oui », »non »))   > mat       oui non homme  15  15 femme  10  20   #On obtient une matrice avec 4 effectifs suppérieurs à 5   prop.test(mat)   #        2-sample test for equality of proportions with continuityRead More →

La fonction binom.test() réalise un test de conformité d’une proportion mesurée dans un échantillon et permet de savoir si cette proportion est différente d’une valeur cible. Pour cela on compare Pobs à Pthéo, dans un échantillon de n individus.   Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire et que la condition suivante soit respecter : n Pobs  ≥ 5  et n (1-Pobs ) ≥ 5   On utilise la fonction binom.test(x, n, p) où :                                x : nombre de succès                                n : nombre d’essais                                p : probabilité théorique   Exemple :                # 92Read More →

Le coefficient de corrélation, mesuré par la fonction cor(), permet de savoir à quel point deux variables quantitatives sont corrélées. Il existe 3 méthodes pour tester la significativité de ce coefficient : la méthode de « Pearson », de « Kendall », et de « Spearman ».   Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire et qu’il n’y ait pas de données manquantes. Si les deux variables suivent une loi Normale et que leur relation est supposée linéaire on utilise la méthode de « Pearson ». Si la relation entre les deux variables est supposée monotone on utilise la méthode de « Kendall » ou de « Spearman ». Nous utilisons les fonctions suivantes :Read More →

Le test non-paramétrique de Wilcoxon permet de tester l’égalité de deux moyennes lorsque l’hypothèse de normalité n’est pas validée. L’hypothèse H0 est « les moyennes sont égales » ou « la moyenne vaut une valeur x ». Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire et que les lois suivies par les deux variables étudiées soient les mêmes. Pour tester l’hypothèse H0 on utilise la fonction wilcox.test(). A<-subset(iris,Species== »setosa »)[,4] #échantillonnage de la largeur des pétales chez l’espèce Setosa.   B<-subset(iris,Species== »versicolor »)[,4] #échantillonnage de la largeur des pétales chez l’espèce Versicolor.      #On test si la moyenne de la largeur des pétales de l’espèce Setosa vaut 0.5 : wilcox.test(A,0.5)Read More →

Le test de Student permet de tester l’égalité de deux moyennes. L’hypothèse H0 est « les moyennes sont égales » ou « la moyenne vaut une valeur x ». Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire de chaque individu et que les ces deux échantillons suivent une loi Normale. Pour tester l’hypothèse H0 on utilise la fonction t.test(). data(iris) A<-subset(iris,Species== »setosa »)[,2] #On isole la 2ème colonne : la largeur des sépales   On commence par tester la normalité de cette variable grâce au test de Shapiro : shapiro.test(A)           Shapiro-Wilk normality test   data:  A W = 0.9717, p-value = 0.2715   La p-value est supérieurRead More →

L’opérateur %in% teste le contenu de deux vecteurs en retournant des éléments booléens (TRUE si l’élément est présent dans les deux vecteurs, False sinon), de la même longueur que le premier vecteur testé.   fleurs_A <- c(« Bleuet », « Campanule », « Capucines », « Clématite », « Coquelicot »)   fleurs_B <- c(« Bleuet », « Bruyère », « Campanule », « Capucines », « Colchique », « Clématite », « Coquelicot », « Gentiane », « Géranium », « Iris »)   fleurs_B %in% fleurs_A #On teste si le contenu de « fleurs_B » est présent dans  «  fleurs_A »     On obtient : fleurs_B %in% fleurs_A TRUE FALSE  TRUE  TRUE FALSE  TRUE  TRUE FALSE FALSE FALSE  TRUE  TRUE  Read More →