Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# ANOVA : Exercice bilan :Remarque : Besoin de quelques rappels pour l'importation et la préparation du jeu de données? {#rq_preparation_donnees_graphiques_de_base, toggle=collapse, title-display=show} Le jeu de données utilisé dans cette partie sur l'ANOVA est le jeu de données "Cépages". Ce jeu de données répertorie les pH de vins associés à trois cépages : Merlot, Cabernet Sauvignon (CS) et Cabernet Franc (CF). Le lien ci-dessous permet de télécharger le fichier de données et d'obtenir les lignes de code pour importer le jeu de données sur R. | Jeu de données | CSV | Commande R | |-----------------|-------------|------------| | Données Cépages | [](donnees/Cepages.csv) | [Importer le jeu de données](#ligne_code_importation_cepages) | :Exemple {#ligne_code_importation_cepages, toggle=popup} ```r donnees <- read.csv2("donnees/Cepages.csv", header = TRUE, stringsAsFactors = TRUE) ``` Il est vivement conseillé de vérifier que R a bien identifié la variable et le facteur. On peut utiliser : ```r str(donnees) ``` ``` ## 'data.frame': 15 obs. of 2 variables: ## $ Cepage: Factor w/ 3 levels "CF","CS","Merlot": 3 3 3 3 3 2 2 2 2 2 ... ## $ pH : num 3.32 3.15 3.19 3.24 3.3 3.53 3.63 3.54 3.57 3.6 ... ``` Des modifications peuvent être effectuées suivant les modalités présentées dans la partie [Manipulation de données](caps_2_7_corriger_type_variables.html). :Objectifs * Mettre en application les concepts liés à l'ANOVA :Exercice Les données pour cet exercice sont accessibles via le fichier ci-dessous (Données i-Share) : [](donnees/DonneesIShare.csv) La situation économique de la famille pendant l'enfance et l'adolescence des **garçons** a-t-elle une influence sur le temps moyen d'activités physiques hebdomadaire ? On admettra que les distributions de temps moyens d'activités sont normales et homoscédastiques. :Corrigé {#Q1, toggle=collapse} ```r donnees = read.csv2("donnees/DonneesIShare.csv", header = TRUE, stringsAsFactors = TRUE) extraction = subset(donnees, donnees$sexe=='G') anova = aov(exercice ~ situation, data = extraction) summary(anova) ``` ``` ## Df Sum Sq Mean Sq F value Pr(>F) ## situation 2 2570 1285 0.265 0.767 ## Residuals 1487 7200626 4842 ``` Le tableau de l'ANOVA renvoie une p-value (voisine de 0.767) supérieure à 5 %. On peut donc considérer qu'il n'y a pas d'effet significatif de la situation économique sur le temps moyen d'activités physiques hebdomadaire. :Suite ANOVA {#anova, toggle=collapse} [ANOVA à un facteur : représentations graphiques](caps_12_1_anova1_gestion_graphiques.html) [ANOVA à un facteur : Réalisation et Vérification des hypothèses](caps_12_2_anova1_hypotheses.html) [ANOVA à un facteur : Récupération des résultats du tableau d'ANOVA](caps_12_3_anova1_resultats.html) [ANOVA à un facteur : Tests de comparaison post-hoc](caps_12_4_anova1_posthoc.html) [ANOVA à plusieurs facteurs](caps_12_5_anova_mult_posthoc.html) [Exercice bilan](caps_12_6_anova_exbilan.html)