Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# STATISTIQUES UNIVARIÉES - Autour de données qualitatives :Objectifs 1. Caractériser des variables qualitatives 2. Présenter des données qualitatives sous forme de tableaux Les exemples de la suite sont tirés du [jeu de données Melons](caps_2_1_presentation_donnees_melons.html). ## Description de variables qualitatives ### Tableau d'effectifs et mode Pour une variable qualitative (ordinale ou nominale), l'identification des modalités et la mise sous forme de tableau d'effectifs sont immédiates. |Rôle | Commande R | Exemple | |-------------------|-----------------------------|------------------------------------| |La liste des modalités (niveaux) |`levels()` |[ ici ](#ex_levels) | |Les effectifs |`table()` |[ ici ](#ex_table) | |Le mode |`which.max()` |[ ici ](#ex_mode) | :Exemple {#ex_levels, toggle=popup} Les différents niveaux (modalités) de la variable `Veriete` peuvent être récupérés à l'aide de la fonction **`levels()`** : ```r niveaux_Varietes = levels(melons$Variete) niveaux_Varietes ``` ``` ## [1] "Anasta" "Bastille" "Cezanne" "Escrito" "Fidji" "Heliobel" ## [7] "Hugo" "Indola" "Manta" "Mehari" "Metis" "Theo" ``` :Exemple {#ex_table, toggle=popup} Les effectifs de chaque variété s'obtiennent à l'aide de la fonction `table()` : ```r effectifs_Varietes = table(melons$Variete) effectifs_Varietes ``` ``` ## ## Anasta Bastille Cezanne Escrito Fidji Heliobel Hugo Indola ## 8 6 25 14 10 1 12 6 ## Manta Mehari Metis Theo ## 30 7 9 7 ``` :Exemple {#ex_mode, toggle=popup} Bien que la lecture d'un tableau d'effectifs soit évidente, il peut être utile d'en récupérer le **mode** (la catégorie la plus représentée). Pour cela, à l'aide de la fonction `which.max()`, il faut trouver l'indice du maximum dans le tableau d'effectifs. ```r effectifs_Varietes = table(melons$Variete) indice_max = which.max(effectifs_Varietes) indice_max ``` ``` ## Manta ## 9 ``` ```r niveaux_Varietes = levels(melons$Variete) mode = niveaux_Varietes[indice_max] mode ``` ``` ## [1] "Manta" ``` :Exercice : Autour d'une variable qualitative ordinale {#Ex_quali, toggle=collapse} Déterminer les effectifs partiels associés à chaque modalité et le mode de la variable `Creneau` du jeu de données `Melons`. :Corrigé {#Reponse_Ex_quali, toggle=collapse} On récupère les noms des modalités de la variable `Creneau` ```r melons$Creneau = as.factor(melons$Creneau) niveauxCreneau = levels(melons$Creneau) niveauxCreneau ``` ``` ## [1] "1" "2" "3" "5" "6" ``` On calcule le tableau des effectifs ```r effectifs_Creneau = table(melons$Creneau) effectifs_Creneau ``` ``` ## ## 1 2 3 5 6 ## 45 12 38 26 14 ``` On cherche l'indice de la modalité la plus représentée puis on affiche le nom de cette modalité. ```r indice_max = which.max(effectifs_Creneau) mode <- niveauxCreneau[indice_max] mode ``` ``` ## [1] "1" ``` Le créneau de plantation le plus représenté est le créneau `1`. :Suite Statistiques descriptives univariées {#univ, toggle=collapse, title-display=hidden} [Description des variables](caps_uni_1_descriptif.html) [Description de variables qualitatives](caps_uni_quali_1.html) [Représentation de variables qualitatives](caps_uni_quali_2.html) [Description paramètrique de variables quantitatives](caps_uni_3_quanti_1.html)