Zwei-Phasen Methodik zur gemeinsamen Auswertung von Sekundärdatenquellen
Empirical Social Research
Public Health, Healthcare Research, Social and Occupational Medicine
Final Report Abstract
Routinedaten gesetzlicher Krankenkassen sind eine wichtige Datengrundlage für epidemiologische Studien in der Versorgungs- und Arzneimittelrisikoforschung. Allerdings fehlen in diesen Datenquellen wichtige Einflussfaktoren, wie z.B. Body Mass Index (BMI), Laborwerte oder Lebensstilfaktoren. Sofern für einen Teil der Patienten (Phase 2) diese Information in anderen Datenquellen verfügbar ist, kann die Zwei-Phasen Methodik unter Einbeziehung der gesamten Studienpopulation (Phase 1) genutzt werden, um zu validen Studienergebnissen zu gelangen. Ziel des Projekts war die Untersuchung der Zwei-Phasen Methodik anhand einer aktuellen pharmakoepidemiologischen Studie basierend auf Routinedaten der Techniker Krankenkasse und Daten des Disease Management Programms (DMP) Diabetes mellitus Typ 2, wobei die umfangreiche Phase 1 Information und die Selektivität der DMP-Teilnehmer berücksichtigt werden musste. Es wurde eine zwei-phasige Fall-Kontroll-Studie zum Vergleich zweier Behandlungen mit Antidiabetika bezüglich des Risikos eines kombinierten kardiovaskulären Ereignisses durchgeführt. Basierend auf Empfehlungen des Vorgängerprojekts wurden dabei Stratifizierungen nach Kreuzklassifikationen von wenigen, entscheidenden Faktoren in Phase 1 genutzt. Alle gewählten Stratifizierungsstrategien kamen zu vergleichbaren Schätzungen des Behandlungseffekts. Zum Umgang mit Selektivität wurde eine Erweiterung der Zwei-Phasen Methodik angewandt, die keine Stratifizierung, sondern die geschätzte Wahrscheinlichkeit für die Teilnahme an Phase 2 benutzt. Auch hier führten verschiedene Modelle zur Schätzung der Teilnahmewahrscheinlichkeit zu ähnlichen Effektschätzungen der Behandlung, was durch das Fehlen starker Confounder/Prädiktoren für Teilnahme in Phase 2 in der Studie erklärt werden kann. In einer Simulationsstudie wurde die erweiterte Zwei-Phasen Methodik in Situationen mit starkem Confounding und/oder Selektivität der Phase 2 mit der multiplen Imputation (MI) verglichen. In allen betrachteten Szenarien erzielte MI präzisere und weniger verzerrte Ergebnisse als die erweiterte Zwei-Phasen Methodik. Neben zwei-phasigen Fall-Kontroll-Studien wurden zwei-phasige Kohortenstudien durchgeführt. Da die Zwei-Phasen Methodik nur bedingt auf diesen Studientyp übertragen werden konnte und MI in den simulierten Fall-Kontroll-Studien der Zwei-Phasen Methodik überlegen war, wurden die Daten ebenfalls mit MI untersucht. Zwei-phasige Kohortenstudien mit zeitabhängigen Behandlungen können dabei durch Kombination aus MI und marginalen Strukturmodellen (MSM) analysiert werden. Vor Kombination der beiden Verfahren war allerdings eine Herleitung des konsistenten Varianzschätzers bei MSM Analysen nötig, um eine Untersuchung des üblicherweise genutzten robusten Varianzschätzers durchzuführen. Es zeigte sich, dass der robuste und konsistente Varianzschätzer nur geringfügig voneinander abwichen. Das im Vorgängerprojekt weiterentwickelte SAS-Makro-Paket zur zwei-phasigen logistischen Regression wurde um zusätzliche Funktionen erweitert und durch eine Bereitstellung auf der Homepage des BIPS dem Anwendungspartner als auch der Fachöffentlichkeit zugänglich gemacht. Zur Analyse von Zwei-Phasen Studien basierend auf Sekundärdaten mit umfangreicher Phase 1 Information wird nach den Erkenntnissen des Projekts MI empfohlen: Eine Erweiterung der Zwei-Phasen Methodik behebt zwar das Problem der unzureichenden Ausnutzung der Phase 1 Information, aber Simulationen mit starkem Confounding und Selektivität der Phase 2 zeigten, dass MI zu präziseren und weniger verzerrten Effektschätzern der Behandlung führt. MI ist zusätzlich leicht auf andere Studientypen wie z.B. zwei-phasige Kohortenstudien übertragbar und in Standardsoftware implementiert.
Publications
-
(2018) Comparison of multiple imputation and two-phase logistic regression to analyse two-phase case–control studies with rich phase 1: a simulation study. Journal of Statistical Computation and Simulation 88 (11) 2201–2214
Enders, Dirk; Kollhorst, Bianca; Engel, Susanne; Linder, Roland; Pigeot, Iris
-
(2018) Robust versus consistent variance estimators in marginal structural Cox models. Statistics in medicine 37 (24) 3455–3470
Enders, Dirk; Engel, Susanne; Linder, Roland; Pigeot, Iris
-
(2016). Comparative risk for cardiovascular diseases of dipeptidyl peptidase-4 inhibitors vs. sulfonylureas in combination with metformin: Results of a two-phase study. Journal of Diabetes and its Complications 30(7): 1339-1346
Enders, D., Kollhorst, B., Engel, S., Linder, R., Verheyen, F., Pigeot, I.