Erwartungswerte und mehr: Methoden zur Regression von Verteilungsfunktionen in der Epidemiologie und Biostatistik

Antragsteller Professor Dr. Torsten Hothorn

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik

Förderung Förderung von 2012 bis 2018

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 225384399

Erstellungsjahr 2016

Zusammenfassung der Projektergebnisse

Die meisten wohlbekannten Regressionsmodelle konzentrieren sich auf die Schätzung des bedingten Erwartungswerts gegeben einer Reihe von erklärenden Variablen. Höhere Momente der Verteilungsfunktion werden üblicherweise als konstant angenommen. Damit verbunden sind typischerweise starke Annahmen wie Homoskedastizität oder eine symmetrische Verteilungsfunktion. In der ﬂexiblen Modellklasse der konditionalen Transformationsmodelle (CTMs) hingegen wird die gesamte bedingte Verteilungsfunktion direkt modelliert. Dadurch dürfen auch höhere Momente der bedingten Verteilungsfunktion (wie Varianz, Wölbung und Schiefe) von den erklärenden Variablen abhängen. CTMs enthalten wiederum lineare Transformationsmodelle (z.B. Proportional Hazards und Proportional Odds Modelle) als Spezialfall, die ein nützliches Instrument zur Datenanalyse in zahlreichen Anwendungsgebieten darstellen. Um einen umfassenden Überblick zu geben, wurde im Rahmen dieses Projekts die Literatur über Transformationsmodelle strukturiert, zusammengefasst und bewertet. Gängige Regressionsmodelle für stetige und diskrete Zielgrößen wurden in den Transformationsmodellkontext eingeordnet. Die Deﬁnition von bedingten Transformationsmodellen fasst alle Spezialmodelle in einer allgemeinen Modellklasse zusammen und verdeutlich deren gemeinsame Modellbasis. Ein weiterer methodischer Schwerpunkt ist die Einführung von CLTMs, die einen wichtigen Spezialfall von CTMs darstellen und die Erweiterung von CTMs auf zensierte Zielgrößen. Der Einﬂuss der erklärenden Variablen auf die ersten beiden Momente der Verteilungsfunktion ist in den vorgeschlagenen Parametrisierungen von CLTMs interpretierbar und detailliertere Einblicke in die Modellstruktur werden ermöglicht. Die Modellinterpretierbarkeit konnte folglich in CLTMs deutlich erhöht werden. Als Alternative zum komponentenweisen Boosting-Algorithmus wird ein einheitlicher Likelihoodbasierter Schätzansatz für CTMs vorgestellt, der sich leicht auf beliebige Zensierungs- und Trunkierungsmuster erweitern lässt. Die damit verbundene Maximum-Likelihood Theorie macht diesen Schätzansatz zusätzlich attraktiv. Insbesondere für Anwendungen in der Überlebenszeitanalyse wird die Zielfunktion im Boosting-Algorithmus durch die Berücksichtigung von inverse probability of censoring weights auf rechtszensierte Zielgrößen erweitert. Die Überlegenheit von C(L)TMs im Vergleich zu weniger ﬂexiblen Standardregressionsmodellen wurde in Simulationsstudien untersucht. Der Einﬂuss von Ultraschallmessungen auf das zukünftige Geburtsgewicht von Neugeborenen aus der Perinatalen Datenbank Erlangen (Deutschland) wurde mit Hilfe von C(L)TMs analysiert. Dabei war die Schätzung von fötusspeziﬁschen Prädiktionsintervallen für das zukünftige Geburtsgewicht von besonderer Bedeutung. In der Überlebenszeitanalyse ist die Schätzung von patientenspeziﬁschen Überlebensfunktionen in Abhängigkeit von Patienteneigenschaften von speziellem Interesse. Dabei ist die Verwendung von CTMs besonders empfehlenswert, da die bedingte Überlebensfunktion direkt geschätzt wird. Zur näheren Illustration wurde das Überleben von Patienten, die an chronischer myeloischer Leukämie leiden unter Verwendung von CTMs analysiert. Um den breiten Anwendungsbereich von CTMs weiter zu verdeutlichen, werden Likelihood-basierte CTMs exemplarisch zur Dichteschätzung für zensierte und unzensierte Zielgrößen, zur Quantilregression, zur Analyse rechtszensierter Überlebenszeiten und zur Zähldatenregression verwendet.

Projektbezogene Publikationen (Auswahl)

(2013). Conditional transformation models by example. In V. M. R. Muggeo, V. Capursi, G. Boscaino, and G. Lovison (Eds.), Proceedings of the 28th International Workshop on Statistical Modelling, pp. 15–26. Universitá Degli Studi Di Palermo
Hothorn, T., T. Kneib, and P. Bühlmann
(2014). Conditional transformation models. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 76(1), 3–27
Hothorn, T., T. Kneib, and P. Bühlmann
(2015). Conditional Transformation Models - Interpretable Parametrisations and Censoring. Dr. Hut Verlag
Möst, L.
(2015). Conditional transformation models for survivor function estimation. International Journal of Biostatistics 11(1), 23–50
Möst, L. and T. Hothorn
(2016). Most likely transformations
Hothorn, T., L. Möst, and P. Bühlmann
(2016). Predicting birth weight with conditionally linear transformation models. Statistical Methods in Medical Research
Möst, L., M. Schmid, F. Faschingbauer, and T. Hothorn

Servicenavigation

Hauptnavigation

Erwartungswerte und mehr: Methoden zur Regression von Verteilungsfunktionen in der Epidemiologie und Biostatistik

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Servicenavigation

Hauptnavigation

Erwartungswerte und mehr: Methoden zur Regression von Verteilungsfunktionen in der Epidemiologie und Biostatistik

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Textvergrößerung und Kontrastanpassung