B.1 Missing values und missingness patterns

Zu den Begriffen im Kontext von missingness wird folgende Unterscheidung bezüglich der Verteilung der missing values für eine Variable \(Y\) gemacht (vgl. auch Little und Rubin (2002), p. 12):

  • MCAR (missing completely at random): Das Fehlen eines Wertes in \(Y\) ist völlig unabhängig von sowohl beobachteten als auch unbeobachtet Daten. Dieser Fall wäre der idealzustand, ist allerdings in der Regel weder realistisch noch verifizierbar.
  • MAR (missing at random): Es gibt einen Zusammenhang zwischen Ausfallwahrscheinlichkeit und beobachteten Daten. Das heißt auch, dass missingness durch beobachtete Daten erklärt werden kann, weshalb dieser Fall noch akzeptabel wäre.
  • MNAR / NMAR (missing not at random): Weder MCAR noch MAR – die Ausfallwahrscheinlichkeit hängt von unbeobachten Daten ab. Das heißt, es gibt ein Ausfallmuster in \(Y\), das nicht durch vorliegende Daten erklärt werden kann, wodurch in der Regel verzerrte Effektschätzungen entstehen.

Literatur

Little, Roderick J. A., und Donald B. Rubin. 2002. Statistical Analysis with Missing Data. 2nd ed. Wiley Series in Probability and Statistics. Hoboken, N.J: Wiley.