Tidyverse

Sammelalbum

Seit einiger Zeit gibt es die genialen R-Pakete des tidyverse-Universums als „Sammelpaket“ tidyverse (mehr dazu hier). Im Klartext bedeutet das, dass Pakete wie ggplot2, dplyr, tidyr, readr oder broom nun nicht mehr einzeln, installiert und geladen werden müssen, vielmehr geht das jetzt auch einfach im Bundle:

# install.packages("tidyverse")
library(tidyverse)
## Loading tidyverse: ggplot2
## Loading tidyverse: tibble
## Loading tidyverse: tidyr
## Loading tidyverse: readr
## Loading tidyverse: purrr
## Loading tidyverse: dplyr
## Conflicts with tidy packages ----------------------------------------------
## filter(): dplyr, stats
## lag():    dplyr, stats

Mit Blick auf die Installation stellt das sicher eine deutliche Vereinfachung dar, schließlich gehören eigentlich alle Pakete des tidyverse zu den absoluten „must haves“ und müssen jetzt nicht mehr umständlich einzeln angegeben werden. Beim Laden der Pakete sieht das aber anders aus. Aus meiner Sicht gibt es einige gute Gründe, die für das einzelne Laden der Pakete je nach Bedarf sprechen:

  • Es ist wichtig zu wissen, welche Funktion zu welchem Paket gehört (insbeondere beim Debuggen!).
  • Vor allem für Einsteiger kann es schnell verwirrend werden, weil nicht wirklich klar ist, welche Pakete eigentlich geladen werden und wozu die Pakete da sind.
  • Mit der Anzahl an Paketen, die geladen werden (ohne sie im Einzelfall dann auch tatsächlich zu brauchen) steigt die Wahrscheinlichkeit für Namenskonflikte!
  • Die exakte Angabe der geladenen und verwendeten Paketen sorgt für Transparenz im Skript – und das ist vor allem beim Arbeiten im Team wichtig.

Das mag am Schluss aber auch einfach nur Geschmacksache sein. Und in der Tat ertappe ich mich in den letzten Tagen auch dabei, einfach library(tidyverse) zu tippen. Vermutlich siegt irgendwann einfach die Faulheit.

Sebastian Kuhn
Sebastian Kuhn
Politikwissenschaftler & Soziologe im Gesundheitswesen

Ähnliches