Le coefficient de corrélation, mesuré par la fonction cor(), permet de savoir à quel point deux variables quantitatives sont corrélées. Il existe 3 méthodes pour tester la significativité de ce coefficient : la méthode de « Pearson », de « Kendall », et de « Spearman ».

 

Pour réaliser ce test il est nécessaire d’avoir un échantillonnage aléatoire et qu’il n’y ait pas de données manquantes. Si les deux variables suivent une loi Normale et que leur relation est supposée linéaire on utilise la méthode de « Pearson ». Si la relation entre les deux variables est supposée monotone on utilise la méthode de « Kendall » ou de « Spearman ».

Nous utilisons les fonctions suivantes :

Soit x la première variable et y la deuxième variable.

 

Pour la méthode de « Pearson », cor.test(x,y,method= « pearson »)

Pour la méthode de « Kendall », cor.test(x,y,method= « kendall »)

Pour la méthode de « Spearman », cor.test(x,y,method= « spearm »)                                     

               

Exemple :



x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1)

y <- c( 2.6,  3.1,  2.5,  5.0,  3.6,  4.0,  5.2,  2.8,  3.8)

 

cor.test(x, y, method = "kendall")

#        Kendall's rank correlation tau

 

#data:  x and y

#T = 26, p-value = 0.1194

#alternative hypothesis: true tau is not equal to 0

#sample estimates:

#      tau

#0.4444444

# tau est le coefficient de corrélation de Kendall

 

 

 

cor.test(x, y, method = "spearm")

#        Spearman's rank correlation rho

 

#data:  x and y

#S = 48, p-value = 0.0968

#alternative hypothesis: true rho is not equal to 0

#sample estimates:

#rho

#0.6

# rho est le coefficient de corrélation de Spearman

 

 

cor.test(x, y, method = "pearson")

#        Pearson's product-moment correlation

 

#data:  x and y

#t = 1.8411, df = 7, p-value = 0.1082

#alternative hypothesis: true correlation is not equal to 0

#95 percent confidence interval:

# -0.1497426  0.8955795

#sample estimates:

#      cor

#0.5711816

# cor est le coefficient de corrélation de Pearson