Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# ANOVA à plusieurs facteurs :Remarque : Besoin de quelques rappels pour l'importation et la préparation du jeu de données? {#rq_preparation_donnees_graphiques_de_base, toggle=collapse, title-display=show} Le jeu de données utilisé dans cette partie sur l'ANOVA est le jeu de données "Cépages". Ce jeu de données répertorie les pH de vins associés à trois cépages : Merlot, Cabernet Sauvignon (CS) et Cabernet Franc (CF). Le lien ci-dessous permet de télécharger le fichier de données et d'obtenir les lignes de code pour importer le jeu de données sur R. | Jeu de données | CSV | Commande R | |-----------------|-------------|------------| | Données Cépages | [](donnees/Cepages.csv) | [Importer le jeu de données](#ligne_code_importation_cepages) | :Exemple {#ligne_code_importation_cepages, toggle=popup} ```r donnees <- read.csv2("donnees/Cepages.csv", header = TRUE, stringsAsFactors = TRUE) ``` Il est vivement conseillé de vérifier que R a bien identifié la variable et le facteur. On peut utiliser : ```r str(donnees) ``` ``` ## 'data.frame': 15 obs. of 2 variables: ## $ Cepage: Factor w/ 3 levels "CF","CS","Merlot": 3 3 3 3 3 2 2 2 2 2 ... ## $ pH : num 3.32 3.15 3.19 3.24 3.3 3.53 3.63 3.54 3.57 3.6 ... ``` Des modifications peuvent être effectuées suivant les modalités présentées dans la partie [Manipulation de données](caps_2_7_corriger_type_variables.html). :Objectifs * Réaliser une ANOVA à plusieurs facteurs Les données pour les exemples sont accessibles via le fichier : [](donnees/DonneesVins.csv) Pour mettre en oeuvre une analyse de variance à plusieurs facteurs, on utilise également la commande **aov( )** en tenant compte des différents facteurs et d'éventuelles interactions (on note $F_i$ les différentes facteurs étudiés). Ainsi, c'est essentuiellement l'écriture du modèle qui diffère par rapport à l'ANOVA à un facteur. | Rôle |Arguments **aov( )**| Exemple | |------------------------------|------------------|---------------------------------| | 2 facteurs avec répétitions | variable ~ $F_1$ `*` $F_2$ | [ici](#repet) | | 2 facteurs sans répétition | variable ~ $F_1 + F_2$ | [ici](#sansrepet) | | 3 facteurs sans répétition |variable ~ $F_1 + F_2 + F_3$ | | :Compléments sur l'écriture des modèles {#mod, toggle=collapse} Pour plus d'information sur l'écriture des modèles en régression multiple, on peut consulter [cette page](caps_11_5_plans_experiences_regression_anova.html) :Exemple{#repet, toggle=popup} Testons l'effet de la couleur et l'origine (en tenant compte d'éventuelles interactions) sur le pH de vins. ```r donnees = read.csv2("donnees/DonneesVins.csv", header = TRUE) anova = aov(pH ~ Origine*Couleur, data=donnees) summary(anova) ``` ``` ## Df Sum Sq Mean Sq F value Pr(>F) ## Origine 1 0.0420 0.0420 1.696 0.202 ## Couleur 1 1.2581 1.2581 50.777 4.37e-08 *** ## Origine:Couleur 1 0.0272 0.0272 1.099 0.302 ## Residuals 32 0.7929 0.0248 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ``` On constate qu'il y a un effet très hautement significatif de la couleur. A noter que les conditions d'utilisation peuvent être vérifiées suivant les mêmes modalités que pour l'anova monofactorielle. ```r affichage = par(mfrow = c(2, 2)) plot(anova) ``` ``` ## hat values (leverages) are all = 0.1111111 ## and there are no factor predictors; no plot no. 5 ```  Des boxplots associés simultanément aux couleurs et origines peuvent être obtenus en utilisant : ```r plot(pH ~ interaction(Couleur, Origine), data=donnees, col = rainbow(4)) ```  Un graphique des interactions peut également être obtenu : ```r Origine=donnees$Origine Couleur=donnees$Couleur pH=donnees$pH interaction.plot(Origine, Couleur, pH,col=c('pink','black'), lwd=3) ```  :Exemple{#sansrepet, toggle=popup} Testons l'effet de la couleur et l'origine (sans tenir compte d'éventuelles interactions) sur l'alcool contenu dans les vins. ```r donneesVin = read.csv2("donnees/DonneesVins.csv", header = TRUE) anova = aov(Alcool ~ Origine+Couleur, data=donneesVin) summary(anova) ``` ``` ## Df Sum Sq Mean Sq F value Pr(>F) ## Origine 1 3.87 3.868 2.055 0.161 ## Couleur 1 0.22 0.218 0.116 0.736 ## Residuals 33 62.10 1.882 ``` On constate qu'il n'y a pas d'effet significatif de la couleur ou de l'origine sur l'alcool présent dans ces vins. :Suite ANOVA {#anova, toggle=collapse} [ANOVA à un facteur : représentations graphiques](caps_12_1_anova1_gestion_graphiques.html) [ANOVA à un facteur : Réalisation et Vérification des hypothèses](caps_12_2_anova1_hypotheses.html) [ANOVA à un facteur : Récupération des résultats du tableau d'ANOVA](caps_12_3_anova1_resultats.html) [ANOVA à un facteur : Tests de comparaison post-hoc](caps_12_4_anova1_posthoc.html) [ANOVA à plusieurs facteurs](caps_12_5_anova_mult_posthoc.html) [Exercice bilan](caps_12_6_anova_exbilan.html)