Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# Caractéristiques d'un jeu de données :Objectifs Accéder à une ligne d'un tableau. Déterminer le nombre de lignes et de colonnes d'un tableau. Déterminer le nom des variables. Une fois importées par la fonction `read.csv2()`, les données sont disponibles pour réaliser des traitements numériques sur R. Pour y accéder, il suffit de taper le nom du jeu de données. Pour accéder à une colonne (i.e. variable) particulière, il faut y associer le nom de la variable, séparé par un `$`. Les exemples de la suite sont tirés du [jeu de données Melons](caps_2_1_presentation_donnees_melons.html). :Exemple {#example_dollar_melons} ```r Melons$Couverture ``` ``` ## [1] 1 1 1 1 1 5 5 5 5 5 5 5 5 5 5 1 1 1 1 1 1 5 5 5 5 5 1 1 1 1 1 1 1 1 1 1 1 ## [38] 1 1 1 1 1 1 1 1 1 3 3 1 3 3 3 3 3 3 3 3 1 3 1 3 3 5 3 3 3 5 5 3 3 3 3 3 3 ## [75] 3 1 3 1 5 5 5 5 5 5 5 5 5 5 5 3 5 5 5 5 5 3 5 3 3 1 1 3 5 3 3 3 3 5 3 3 3 ## [112] 1 3 3 5 3 3 5 1 3 5 5 5 5 5 5 3 5 5 5 5 5 5 5 5 ``` Les valeurs de la variable `Couverture` prises par les 135 lignes du jeu de données `Melons` sont alors affichées à la suite sur la console RStudio. L'affichage se fait en plusieurs lignes lorsque le nombre de données est trop grand. Les numéros entre crochets au début des lignes indiquent les numéros des premiers éléments de chaque ligne. :Remarque : obtenir le nombre de lignes, de colonnes et le nom des variables {#nom_lignes} |Rôle | Commande R |Exemple| |--- |---------------------|-------|--------| |Obtenir le nombre de lignes et de colonnes|`nrow()`, `ncol()`| [ici](#nmelons)| |Obtenir la dimension du jeu de données |`dim()`| [ici](#dimmelons)| |Obtenir les noms des variables|`names()`| [ici](#vmelons)| :Exemple {#nmelons, toggle=popup} Comme les individus sont en ligne et les variables en colonne dans la base de données sur les melons, **`nrow()`** permet de déterminer le nombre d'observations (individus) dans l'échantillon. La fonction **`ncol()`** permet d'obtenir le nombre de colonnes. ```r nrow(Melons) ``` ``` ## [1] 135 ``` ```r ncol(Melons) ``` ``` ## [1] 12 ``` :Exemple {#dimmelons, toggle=popup} La fonction **`dim()`** permet d'obtenir la dimension d'un jeu de données. Le nombre d'individus (de lignes) correspond au premier élément du tableau de sortie tandis que le nombre de variables (de colonnes) correspond au deuxième élément. ```r dim(Melons) ``` ``` ## [1] 135 12 ``` :Exemple {#vmelons, toggle=popup} La fonction **`names()`** avec pour argument le nom dans R de la base de données permet d'obtenir le nom des variables. ```r names(Melons) ``` ``` ## [1] "Essai" "Annee" "Variete" "Creneau" "Couverture" ## [6] "Plantation" "Duree" "N" "P" "K" ## [11] "Rdt" "Poids" ``` :Suite de la Manipulation de données {#manipulation, toggle=collapse, title-display=hidden} [Présentation du jeu de données](caps_2_1_presentation_donnees_melons.html) : présentation du jeu de données "Melons" sur lequel sont basés les exemples de cette partie [Conversion Excel -> CSV](caps_2_2_conversion_exel_vers_csv.html) : Comment convertir un fichier Excel en un fichier .csv [Importation sous R d'un fichier CSV](caps_2_3_importation_csv.html) [Solutions aux problèmes d'importation d'un fichier CSV](caps_2_4_probleme_importation_csv.html) [Caractéristiques d'un jeu de données](caps_2_5_caracterisitique_jeu_donnees.html) [Vérification du type de variables](caps_2_6_verification_type_variables.html) [Corriger la nature d'une variable](caps_2_7_corriger_type_variables.html) [Transformantion d'un jeu de données](caps_2_8_transformer_jeu_donnees.html) [Accéder à un sous-ensemble de variables et/ou d'individus](caps_2_9_extraire_sous_ensemble.html) [Extraire un sous-ensemble avec la fonction "subset"](caps_2_10_extraire_sous_ensemble_subset.html) [Sauvegarder un jeu de données](caps_2_11_sauvegarder_jeu_donnees_csv.html) [Manipulation d'un tableau de données (dataframe)](caps_2_13_dataframe.html) [Exercice bilan](caps_2_12_exercice_bilan_manipulation_jeu_donnees.html)