Begin'R
Les statistiques avec R
Navigation
[Retour au sommaire]
# Transformation d'un jeu de données : `transform()` Il est très facile de transformer une variable (une colonne) d'un `data.frame` sous R. Il suffit pour cela de lui appliquer la fonction **`transform()`**. Les exemples de la suite sont tirés du [jeu de données Melons](caps_2_1_presentation_donnees_melons.html). :Exemple {#exemple1ter} L'instruction suivante permet de calculer le logarithme de la variable `Poids` de la base de données `Melons` et de stocker le résultat dans la variable `logPoids` (une nouvelle variable apparaît dans la fenêtre `Environment` de RStudio) : ```r logPoids <- log(Melons$Poids) ``` Une opération plus intéressante consiste à rajouter à la base `Melons` une variable donnant le logarithme du poids. C'est fait grâce à l'instruction ci-dessous : ```r Melons <- transform(Melons, logPoids = log(Poids)) ``` La base `Melons` est alors transformée en lui adjoignant la variable `logPoids` qui est calculée par la formule `log(Melons$Poids)`. Constater en visualisant la base `Melons` qu'une nouvelle colonne `logPoids` a été rajoutée. Pour modifier une variable déjà présente dans la base de données, il suffit d'utiliser le nom de cette variable dans l'appel à la fonction `transform()`. L'instruction ci-dessous permet par exemple de modifier la variable `Couverture` : ```r Melons <- transform(Melons, Couverture = factor(Couverture, labels = c("thermique", "perforée", "sans_couverture"))) ``` :Remarque {#remarque3} Les deux instructions suivantes sont équivalentes : ```r Melons <- transform(Melons, logPoids = log(Poids)) Melons$logPoids <- log(Melons$Poids) ``` Cependant, l'avantage de la fonction `transform()` est qu'elle permet d'ajouter ou modifier plusieurs variables en une seule fois et qu'il n'est pas nécessaire de répéter "`Melons$`" à chaque fois qu'une variable est considérée : ```r Melons <- transform(Melons, logPoids = log(Poids), Couverture = factor(Couverture, labels = c("thermique", "perforée", "sans_couverture")), Annee = as.character(Annee)) ``` Une fois que les données sont correctement formatées, il est possible de réaliser différents traitements sur les jeux de données comme [extraire un sous ensemble de données](caps_2_9_extraire_sous_ensemble.html). :Suite de la Manipulation de données {#manipulation, toggle=collapse, title-display=hidden} [Présentation du jeu de données](caps_2_1_presentation_donnees_melons.html) : présentation du jeu de données "Melons" sur lequel sont basés les exemples de cette partie [Conversion Excel -> CSV](caps_2_2_conversion_exel_vers_csv.html) : Comment convertir un fichier Excel en un fichier .csv [Importation sous R d'un fichier CSV](caps_2_3_importation_csv.html) [Solutions aux problèmes d'importation d'un fichier CSV](caps_2_4_probleme_importation_csv.html) [Caractéristiques d'un jeu de données](caps_2_5_caracterisitique_jeu_donnees.html) [Vérification du type de variables](caps_2_6_verification_type_variables.html) [Corriger la nature d'une variable](caps_2_7_corriger_type_variables.html) [Transformantion d'un jeu de données](caps_2_8_transformer_jeu_donnees.html) [Accéder à un sous-ensemble de variables et/ou d'individus](caps_2_9_extraire_sous_ensemble.html) [Extraire un sous-ensemble avec la fonction "subset"](caps_2_10_extraire_sous_ensemble_subset.html) [Sauvegarder un jeu de données](caps_2_11_sauvegarder_jeu_donnees_csv.html) [Manipulation d'un tableau de données (dataframe)](caps_2_13_dataframe.html) [Exercice bilan](caps_2_12_exercice_bilan_manipulation_jeu_donnees.html)