Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# Graphiques de base :Objectifs * Construire des graphiques standards :Remarque : Besoin de quelques rappels pour l'importation et la préparation du jeu de données ? {#rq_preparation_donnees_graphiques_de_base, toggle=collapse, title-display=show} Le jeu de données Melons est issu d'une étude réelle relative à un essai variétal sur des melons. Elle a pour objectif de repérer les facteurs influençant le calibre des melons. Les liens ci-dessous permettent de télécharger le fichier de données, de visionner une vidéo expliquant la description associée et d'obtenir les lignes de code pour importer le jeu de données sur R. | Jeu de données | Excel | CSV | Présentation | Commande R | Explication | |-----------------|--------|-------------|----------------|------------|-------------| | Donnees Melons | [](donnees/DonneesMelons.xlsx) | [](donnees/DonneesMelons.csv) | [](video/DonneesMelons.html) | [Lignes de code pour importer et préparer le jeu de données](#ligne_code_importation) | [Explications sur la préparation du jeu de données](#explication_preparation_importation) | :Exemple {#ligne_code_importation, toggle=popup} ```{rC5-0-A, echo=T, eval=F} Melons <- read.csv2("DonneesMelons.csv", header = TRUE, stringsAsFactors = TRUE) Melons <- transform(Melons, Creneau = as.ordered(Creneau), Couverture = as.factor(Couverture)) quatre_melons <- subset(Melons, Variete=='Cezanne'|Variete=='Fidji'|Variete=='Hugo'|Variete=='Manta') quatre_melons$Variete <- droplevels(quatre_melons$Variete) ``` :Exemple {#explication_preparation_importation, toggle=popup} Dans un premier temps, [importer le jeu de données melons sur R Studio](caps_2_3_importation_CSV.html). ```r Melons <- read.csv2("DonneesMelons.csv", header = TRUE, stringsAsFactors = TRUE) Melons <- transform(Melons, Creneau = as.ordered(Creneau), Couverture = as.factor(Couverture)) ``` Pour ne pas alourdir les tableaux et représentations à venir, seuls quatre variétés de melons sont considérés dans la suite : `Cezanne`, `Fidji`, `Hugo` et `Manta`. Pour cela, l'extraction peut être effectuée à l'aide de la fonction **`subset()`** : ```r quatre_melons <- subset(Melons, Variete=='Cezanne'|Variete=='Fidji'|Variete=='Hugo'|Variete=='Manta') levels(quatre_melons$Variete) ``` ``` ## [1] "Anasta" "Bastille" "Cezanne" "Escrito" "Fidji" "Heliobel" ## [7] "Hugo" "Indola" "Manta" "Mehari" "Metis" "Theo" ``` Après sélection des quatre variétés, le jeu de données garde la trace des anciennes variétés. La fonction **`droplevels()`** permet de **nettoyer** le jeu de données en éliminant les modalités non utilisées : ```r quatre_melons$Variete <- droplevels(quatre_melons$Variete) levels(quatre_melons$Variete) ``` ``` ## [1] "Cezanne" "Fidji" "Hugo" "Manta" ``` Désormais, les données sont accessibles via la variable `quatre_melons`, définie sur R comme un objet de type `data.frame`. Voici la liste des fonctions graphiques de base disponibles en langage R (plus précisément dans le package `graphics`) : | Rôle | Commande R | Exemple | |-------------|---------------------------------------------------------|--------------------| | Graphique avec barres verticales ou horizontales | `barplot()` | [ici](#ex_barplot) | | Boxplot | `boxplot()` | [ici](#ex_boxplot) | | Histogramme | `hist()` | [ici](#ex_hist) | | Diagramme en secteurs (« camembert ») | `pie()` | [ici](#ex_pie) | | Nuage de points | `plot()` | [ici](#ex_plot) | :Exemple {#ex_barplot, toggle=popup} Le diagramme en barres ci-dessous représente le rendement moyen pour chaque variété de melons. Pour cela, il faut d'abord calculer la valeur moyenne de la variable rendement (`Rdt`) pour chacune des modalités de la variable `Variete`, et ensuite réaliser le graphique à l'aide de la fonction `barplot()`. ```r moyennes <- tapply(quatre_melons$Rdt, INDEX = quatre_melons$Variete, FUN = mean, na.rm=TRUE) barplot(moyennes) ```  :Remarque {#rq_na_rm} Dans la fonction `tapply()`, l'argument `na.rm` permet de supprimer les valeurs manquantes. :Exemple {#ex_boxplot, toggle=popup} L'instruction suivante permet de réaliser le boxplot de la variable rendement (`Rdt`) : ```r boxplot(quatre_melons$Rdt) ```  Et celle-ci permet de réaliser quatre boxplots de la variable rendement (`Rdt`), un pour chacune des modalités de la variable `Variete` : ```r boxplot(quatre_melons$Rdt~quatre_melons$Variete) ```  :Exemple {#ex_hist, toggle=popup} L'instruction suivante permet de réaliser l'histogramme de la variable rendement (`Rdt`) : ```r hist(quatre_melons$Rdt) ```  :Exemple {#ex_pie, toggle=popup} L'instruction suivante permet de réaliser un camembert illustrant la répartition des variétés de melons : ```r effectifs <- table(quatre_melons$Variete) pie(effectifs) ```  :Exemple {#ex_plot, toggle=popup} L'instruction suivante permet de réaliser un nuage de points de la variable rendement (`Rdt`) en fonction de l'apport en azote (`N`) : ```r plot(quatre_melons$Rdt~quatre_melons$N) ```  On remarque ci-dessus que l'utilisation du symbole `~` permet de signifier que l'on souhaite représenter la variable rendement `Rdt` _en fonction de_ la variable apport en azote `N`. Une autre écriture consiste à utiliser deux arguments, le premier désignant la variable en abscisse `N`, le second la variable en ordonnées `Rdt` : ```r plot(quatre_melons$N,quatre_melons$Rdt) ``` Les rubriques d'aide des fonctions fournissent en général des exemples. Il suffit de les copier sur la console ou dans un script et de les exécuter pour obtenir des exemples d'utilisation. :Suite de Tracer des graphiques {#graph, toggle=collapse, title-display=hidden} [Présentation des graphiques de base](caps_5_1_graphiques_de_base.html) [Réaliser plusieurs graphiques en un seul](caps_5_2_realiser_plusieurs_graphiques_en_un_seul.html) [Gestion des symboles, couleurs, titre et étiquettes](caps_5_3_gestion_symboles_couleurs_titre_etiquettes.html) [Paramètres spécifiques de la fonction "boxplot"](caps_5_4_parametres_specifiques_boxplot.html) [Exercice bilan](caps_5_5_exercice_bilan_personnalisation_graphiques.html)