B.3 Hurdle models
Die nachfolgende Beschreibung dient daher eher der Vollständigkeit, da hurdle models in bestimmten Anwendungsgebieten scheinbar recht populär sind – allerdings ist es vermutlich eher schwierig sie auf binäre outcomes anzuwenden.
Im Allgemeinen kann man zwei Arten von hurdle models unterscheiden, die jeweils aus zwei Modellkomponenten bestehen:
- Nested hurdle models: Beide Komponenten nested (e.g. beide Poisson).
- Non-nested hurdle models: Hurdle-Komponente als vollständig anderer Prozess betrachtet und via e.g. logit modelliert.
Zwei gängige Komponenten für unnested hurdle models:
- Binary 0,1 response, (logit oder probit)
- Modellierung der Wahrscheinlichkeit für die non-zero counts
- Zero-truncated count model
- Erlauben sowohl under- als auch overdispersion
- (Unnested models) erlauben systematischen Unterschied im Prozess, der zu e.g. Outcomes = 0 vs. Outcomes > 0 führt, was durch die Wahl unterschiedlicher Modelle für beide Komponenten abgebildet wird
In diesem Fall entspricht das Resultat eines hurdle models zwei separat gefitteten Modellen (e.g. Pois + Logit), die getrennt interpretierbar sind (im Gegensatz zu zero-inflated models!).
Definition B.1 (Hurdle Model) Nach Winkelmann (2010), p. 179f:
Sei g1(0) die Wahrscheinlichkeit des Outcomes 0 und g1(k),k=1,2,3,… die Wahrscheinlichkeitsfunktion für natürliche Zahlen, dann ist die Wahrscheinlichkeitsfunktion eines hurdle-at-zero Modells:
Bzw. nach Mullahy (1986) mit f1 und f2 als PMFs für natürliche Zahlen
Wobei
- f2 als parent process bezeichnet wird
- 1−f1(0) die Wahrscheinlichkeit angibt, die Hürde (y=0) zu “überqueren” (“crossing the hurdle”).
- 1−f2(0) zur Normalisierung von f2 dient, um deren truncation zu berücksichtigen.
Der Erwartungswert des hurdle models ist
Eh(y)=Θ∞∑k=1kf2(k)=ΘE2(y)
Mit E2 als Erwartunsgwert von f2.
Mit f2=Poisson:
- 0<Θ<1: Overdispersion
- 1<Θ<λ2+1λ2: Underdispersion
“By far the most popular hurdle model in practice is the hurdle-at-zero negative bonomial model” (Winkelmann 2010, p. 183)
mit f1∼NB(β1,α1) und f2∼NB(β2,α2)
Literatur
Mullahy, John. 1986. „Specification and Testing of Some Modified Count Data Models“. Journal of Econometrics 33 (3): 341–65. https://doi.org/10.1016/0304-4076(86)90002-3.
Winkelmann, Rainer. 2010. Econometric Analysis of Count Data. 5th ed. Berlin: Springer Berlin.