Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# Manipulation d'un tableau de données (`dataframe`) Les tableaux de données (`dataframes` en anglais) sont une structure particulière sur R. Elles permettent de stocker un jeu de données composé de différents individus (ou observations) en ligne et de différentes variables en colonne. :Remarque Contrairement aux matrices, les éléments d'une ligne ou d'une colonne peuvent être de types différents. L'exemple ci-dessous montre que, pour une matrice, la première variable est interprétée comme une variable qualitative contenant les modalités `"1"`, `"2"` et `"3"` car la deuxième variable est qualitative. ```r M = matrix(c(1,2,3, "janvier", "février", "mars"), nrow=3, ncol=2, byrow=FALSE) M ``` ``` ## [,1] [,2] ## [1,] "1" "janvier" ## [2,] "2" "février" ## [3,] "3" "mars" ``` | Rôle | Commande R | Exemples | |:---------:|:-----------:|:--------:| | Créer un dataframe | `data.frame()` | [ici](#example1_creation_dataframe) | | Modifier le nom des variables | `colnames()` | [ici](#example1_colnames) | | Modifier le nom des individus | `rownames()` | [ici](#example1_rownames) | | Créer un dataframe et modifier le nom des variables et des individus | `data.frame()`, `colnames()`, `rownames()` | [ici](#example1_complet_dataframe) | :Exemple {#example1_creation_dataframe, toggle=popup} La fonction `data.frame()` permet de créer un dataframe. Par défaut, les noms des colonnes sont `X1` et `X2` et les individus sont nommés de `1` à `3`. ```r M = data.frame(M) M ``` ``` ## X1 X2 ## 1 1 janvier ## 2 2 février ## 3 3 mars ``` :Exemple {#example1_colnames, toggle=popup} La fonction `colnames()` permet de renommer le nom des colonnes d'un `dataframe`. ```r M = data.frame(M) colnames(M) <- c("numéro", "mois") M ``` ``` ## numéro mois ## 1 1 janvier ## 2 2 février ## 3 3 mars ``` :Exemple {#example1_rownames, toggle=popup} La fonction `rownames()` permet de renommer le nom des lignes d'un `dataframe`. ```r M = data.frame(M) rownames(M) <- c("individu 1", "individu 2", "individu 3") M ``` ``` ## X1 X2 ## individu 1 1 janvier ## individu 2 2 février ## individu 3 3 mars ``` :Exemple {#example1_complet_dataframe, toggle=popup} Après avoir converti la matrice `M` en jeu de données à l'aide de la fonction `data.frame()`, les fonctions `colnames()` et `rownames()` sont utilisées pour renommer le nom des variables et des individus de `M`. ```r M = data.frame(M) colnames(M) <- c("numéro", "mois") rownames(M) <- c("individu 1", "individu 2", "individu 3") M ``` ``` ## numéro mois ## individu 1 1 janvier ## individu 2 2 février ## individu 3 3 mars ``` :Remarque Il est également possible de nommer le nom des lignes d'un `dataframe` en utilisant l'argument `row.names`. Le nom des variables est obtenu automatiquement par le nom des arguments données (ici `numéro` et `mois`). ```r M <- data.frame(numéro=c(1,2,3), mois=c("janvier", "février", "mars"), row.names=c("individu 1", "individu 2", "individu 3") ) M ``` ``` ## numéro mois ## individu 1 1 janvier ## individu 2 2 février ## individu 3 3 mars ``` :Remarque Lors de l'import d'un fichier csv via la commande `read.csv2`, R génère automatiquement un dataframe. :Suite de la Manipulation de données {#manipulation, toggle=collapse, title-display=hidden} [Présentation du jeu de données](caps_2_1_presentation_donnees_melons.html) : présentation du jeu de données "Melons" sur lequel sont basés les exemples de cette partie [Conversion Excel -> CSV](caps_2_2_conversion_excel_vers_csv.html) : Comment convertir un fichier Excel en un fichier .csv [Importation sous R d'un fichier CSV](caps_2_3_importation_csv.html) [Solutions aux problèmes d'importation d'un fichier CSV](caps_2_4_probleme_importation_csv.html) [Caractéristiques d'un jeu de données](caps_2_5_caracterisitique_jeu_donnees.html) [Vérification du type de variables](caps_2_6_verification_type_variables.html) [Corriger la nature d'une variable](caps_2_7_corriger_type_variables.html) [Transformantion d'un jeu de données](caps_2_8_transformer_jeu_donnees.html) [Accéder à un sous-ensemble de variables et/ou d'individus](caps_2_9_extraire_sous_ensemble.html) [Extraire un sous-ensemble avec la fonction "subset"](caps_2_10_extraire_sous_ensemble_subset.html) [Sauvegarder un jeu de données](caps_2_11_sauvegarder_jeu_donnees_csv.html) [Manipulation d'un tableau de données (dataframe)](caps_2_13_dataframe.html) [Exercice bilan](caps_2_12_exercice_bilan_manipulation_jeu_donnees.html)