1.1 Beispieldaten
Als Anwendungsbeispiele werden einige Datensätze verwendet, die verschiedene Probleme illustrieren:
azprocedure: Patienten kardiovaskulärer Behandlungen in Arizona- Count:
los, Dauer eines Krankenhausaufenthalts in Tagen (1 - 83) - Kovariablen:
sex: Male (1), female(0)admit: Type of admission. Urgent/emergency (1), elective (0)
- Count:
rwm5yr(rwm1984): “German health registry” 1984-1988 (bzw. nur 1984)- Count:
docvis: Anzahl der Arztbesuche (0 - 121) - Kovariablen:
outwork: Arbeitslos (1), arbeitend (0)age: Alter (25 - 64)
- Count:
fish: Geangelte Fische an einem Campingwochenende- Count:
count, Anzahl der Fische - Kovariablen:
child: Anzahl der Kinder in der Campergruppepersons: Anzahl der Personen in der Campergruppecamper:[0, 1]Hat die Gruppe einen Campingwagen mitgebracht?
- Count:
Diese Datensätze finden sich entweder in R-packages oder auf der website der UCLA IDRE:
| Dataset | R Package | Quelle |
|---|---|---|
| azprocedure | COUNT | Hilbe (2014) |
| rwm5yr | COUNT | Hilbe (2014) |
| rwm1984 | COUNT | Hilbe (2014) |
| nuts | COUNT | Hilbe (2014) |
| fish | – | UCLA IDRE (https://stats.idre.ucla.edu) |
Daten aus Hilbe (2014) sind zusätzlich verfügbar als CSV (HILBE-MCD-CVS-data) auf der Website des Autors.
Die Datensätze des UCLA IDRE können wie folgt eingelesen werden:
fish <- haven::read_sas("https://stats.idre.ucla.edu/stat/sas/code/fish.sas7bdat")
fish <- within(fish, {
nofish <- factor(nofish)
livebait <- factor(livebait)
camper <- factor(camper)
})
# Cache locally
saveRDS(fish, "data/fish.rds")
# Read from cache later:
# fish <- readRDS("data/fish.rds")Um Daten aus R direkt in SAS-freundlichem sas7bdat zu speichern, kann folgender Code unter Verwendung des packages haven verwendet werden:
Literatur
Hilbe, Joseph M. 2014. Modeling Count Data. Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9781139236065.