Detailseite
Projekt Druckansicht

Erwartungswerte und mehr: Methoden zur Regression von Verteilungsfunktionen in der Epidemiologie und Biostatistik

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Förderung Förderung von 2012 bis 2018
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 225384399
 
Erstellungsjahr 2016

Zusammenfassung der Projektergebnisse

Die meisten wohlbekannten Regressionsmodelle konzentrieren sich auf die Schätzung des bedingten Erwartungswerts gegeben einer Reihe von erklärenden Variablen. Höhere Momente der Verteilungsfunktion werden üblicherweise als konstant angenommen. Damit verbunden sind typischerweise starke Annahmen wie Homoskedastizität oder eine symmetrische Verteilungsfunktion. In der flexiblen Modellklasse der konditionalen Transformationsmodelle (CTMs) hingegen wird die gesamte bedingte Verteilungsfunktion direkt modelliert. Dadurch dürfen auch höhere Momente der bedingten Verteilungsfunktion (wie Varianz, Wölbung und Schiefe) von den erklärenden Variablen abhängen. CTMs enthalten wiederum lineare Transformationsmodelle (z.B. Proportional Hazards und Proportional Odds Modelle) als Spezialfall, die ein nützliches Instrument zur Datenanalyse in zahlreichen Anwendungsgebieten darstellen. Um einen umfassenden Überblick zu geben, wurde im Rahmen dieses Projekts die Literatur über Transformationsmodelle strukturiert, zusammengefasst und bewertet. Gängige Regressionsmodelle für stetige und diskrete Zielgrößen wurden in den Transformationsmodellkontext eingeordnet. Die Definition von bedingten Transformationsmodellen fasst alle Spezialmodelle in einer allgemeinen Modellklasse zusammen und verdeutlich deren gemeinsame Modellbasis. Ein weiterer methodischer Schwerpunkt ist die Einführung von CLTMs, die einen wichtigen Spezialfall von CTMs darstellen und die Erweiterung von CTMs auf zensierte Zielgrößen. Der Einfluss der erklärenden Variablen auf die ersten beiden Momente der Verteilungsfunktion ist in den vorgeschlagenen Parametrisierungen von CLTMs interpretierbar und detailliertere Einblicke in die Modellstruktur werden ermöglicht. Die Modellinterpretierbarkeit konnte folglich in CLTMs deutlich erhöht werden. Als Alternative zum komponentenweisen Boosting-Algorithmus wird ein einheitlicher Likelihoodbasierter Schätzansatz für CTMs vorgestellt, der sich leicht auf beliebige Zensierungs- und Trunkierungsmuster erweitern lässt. Die damit verbundene Maximum-Likelihood Theorie macht diesen Schätzansatz zusätzlich attraktiv. Insbesondere für Anwendungen in der Überlebenszeitanalyse wird die Zielfunktion im Boosting-Algorithmus durch die Berücksichtigung von inverse probability of censoring weights auf rechtszensierte Zielgrößen erweitert. Die Überlegenheit von C(L)TMs im Vergleich zu weniger flexiblen Standardregressionsmodellen wurde in Simulationsstudien untersucht. Der Einfluss von Ultraschallmessungen auf das zukünftige Geburtsgewicht von Neugeborenen aus der Perinatalen Datenbank Erlangen (Deutschland) wurde mit Hilfe von C(L)TMs analysiert. Dabei war die Schätzung von fötusspezifischen Prädiktionsintervallen für das zukünftige Geburtsgewicht von besonderer Bedeutung. In der Überlebenszeitanalyse ist die Schätzung von patientenspezifischen Überlebensfunktionen in Abhängigkeit von Patienteneigenschaften von speziellem Interesse. Dabei ist die Verwendung von CTMs besonders empfehlenswert, da die bedingte Überlebensfunktion direkt geschätzt wird. Zur näheren Illustration wurde das Überleben von Patienten, die an chronischer myeloischer Leukämie leiden unter Verwendung von CTMs analysiert. Um den breiten Anwendungsbereich von CTMs weiter zu verdeutlichen, werden Likelihood-basierte CTMs exemplarisch zur Dichteschätzung für zensierte und unzensierte Zielgrößen, zur Quantilregression, zur Analyse rechtszensierter Überlebenszeiten und zur Zähldatenregression verwendet.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung