Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# Description paramétrique de variables quantitatives :Objectifs Obtenir des résumés paramétriques de variables quantitatives. Les exemples de la suite sont tirés du [jeu de données Melons](caps_2_1_presentation_donnees_melons.html). ## Paramètres de tendance centrale |Rôle | Commande R |Exemple | |-----------|-----------------|----------------------------| |Médiane |`median()` | [ ici ](#mediane_poids) | |Moyenne |`mean()` | [ ici ](#moyenne_poids) | :Exemple{#mediane_poids, toggle=popup} ```r median(melons$Poids) ``` ``` ## [1] 954 ``` :Exemple{#moyenne_poids, toggle=popup} ```r mean(melons$Poids) ``` ``` ## [1] 959.7259 ``` ## Autres paramètres de position |Rôle | Commande R |Exemple | |-----------|-----------------|------------------------| |Minimum |`min()` | [ ici ](#min) | |Maximum |`max()` | [ ici ](#max) | |Quantiles |`quantile()` | [ ici ](#quantiles) | :Exemple{#min, toggle=popup} ```r min(melons$Poids) ``` ``` ## [1] 669 ``` :Exemple{#max, toggle=popup} ```r max(melons$Poids) ``` ``` ## [1] 1370 ``` :Exemple{#quantiles, toggle=popup} Les quantiles (quartiles, déciles, centiles) s'obtiennent de façon très directe avec la fonction `quantile()`. Le premier quartile s'obtient par exemple de la façon suivante : ```r quantile(melons$Poids, probs=0.25) ``` ``` ## 25% ## 832 ``` Pour le premier décile, il faut indiquer _probs=0.1_, etc. ## Paramètres de dispersion |Rôle | Commande R |Exemple | |-----------------------|-----------------------------------------------|-----------------------| |Étendue |`range()` | [ ici ](#etendue) | :Exemple{#etendue, toggle=popup} L'étendue de la variable `Poids` s'obtient comme ceci : ```r range(melons$Poids) ``` ``` ## [1] 669 1370 ``` :Exercice : Calculs de variance et écart-type empirique {#Var, toggle=popup, title-display=show} Déterminer la variance et l'écart-type des poids des melons (variable `Poids`). :Aide {#tapply, toggle=collapse, title-display=show} On rappelle que, pour un échantillon de $n$ valeurs $x_i$, la variance, notée $s^2$ est définie par $$ s^2 = \dfrac{1}{n} \displaystyle\sum_{i=1}^n \left( x_i - \bar{x} \right)^2 $$ La fonction `var` implémentée dans R est associée à l'estimation ponctuelle de la variance définie par $$ var = \dfrac{1}{n-1} \displaystyle\sum_{i=1}^n \left( x_i - \bar{x} \right)^2 $$ On a donc $$ s^2 = \dfrac{n-1}{n} var$$ La fonction `sd` implémentée dans R renvoie, quant à elle, la racine carrée du résultat obtenue avec `var`, souvent prise comme estimation de l'écart-type d'une population. Le calcul de la variance peut donc s'obtenir en utilisant la somme des carrés des écarts ou en "corrigeant" le résultat renvoyé par la fonction `var`. :Corrigé {#Reponse_Var, toggle=collapse, title-display=show} ```r poids = melons$Poids n = length(poids) moyenne = mean(poids) ecarts = poids-moyenne SCE = sum(ecarts^2) variance_empirique = SCE/n variance_empirique ``` ``` ## [1] 23951.44 ``` ```r # Autre solution (n-1)/n*var(poids) ``` ``` ## [1] 23951.44 ``` La variance des poids des melons est environ égale à 2.39514 × 10
4
. L'écart-type empirique $s$, s'obtient alors en considérant la racine carrée de la variance ou en corrigeant l'écart-type renvoyé par la fonction `sd`. On a $$ s = \sqrt{\dfrac{n-1}{n}} sd $$ ```r ecart_type_empirique = sqrt(variance_empirique) ecart_type_empirique ``` ``` ## [1] 154.7625 ``` ```r # Autre solution sqrt((n-1)/n)*sd(poids) ``` ``` ## [1] 154.7625 ``` On obtient que $s$ est environ égal à 154.8 g. :Suite Statistiques descriptives univariées {#univ, toggle=collapse, title-display=hidden} [Description des variables](caps_uni_1_descriptif.html) [Description de variables qualitatives](caps_uni_quali_1.html) [Représentation de variables qualitatives](caps_uni_quali_2.html) [Description paramètrique de variables quantitatives](caps_uni_3_quanti_1.html)