Automatische Beurteilung von Clusterplots (ABC-Plots)
Final Report Abstract
Die visuelle Beurteilung von Clusterplots (Signalintensitätsplots) durch mindestens zwei unabhängige Betrachter ist das Standardverfahren zur abschließenden Beurteilung der Güte von Einzelnukleotidpolymorphismen (SNPs) in Hochdurchsatz-Genotypisierungsstudien. Ziel dieses Projekts war es, statistische Methoden zu entwickeln, die die subjektive und zeitintensive manuelle Beurteilung durch geeignete statistische Verfahren unterstützen bzw. sogar ersetzen können. Um die effiziente Analyse von Signalintensitätsdaten durchführen zu können, war es notwendig geignete Software zu entwickeln. Dies ist im Rahmen eines Teilprojektes erfolgt. Das dabei entstandene R-Paket ATOMIC ist auf der Seite http://www.imbs-luebeck.de in der Rubrik Software verfügbar. In einem weiteren Teilprojekt wurden neben verschiedenen Kriterien aus der Cluster-Analyse auch eigene Ansätze hinsichtlich ihrer Eignung untersucht. Dies geschah anhand von Realdaten aus der Gutenberg-Gesundheitsstudie. Dabei stellten sich der Engelman-Hartigan Test auf Unimodalität und eine Modifikation des ACPA-Kriteriums als vielversprechend heraus. Im dritten Teilprojekt wurde die Anwendbarkeit von diskreten Mischverteilungsmodellen für die Qualitätskontrolle von Clusterplots untersucht. Hierzu wurden finite Mischverteilungen von bivariaten Normalverteilungen untersucht. Hier ist eine wesentliche Frage die Schätzung der Zahl der Mischungskomponenten k. Dazu wurde der VEM-Algorithmus mit einer unbekannten Anzahl von Mischungskomponenten k für den bivariaten Fall weiterentwickelt und in das R-Paket CAMAN integriert. Dieser bivariate Ansatz eignet sich zur Modellierung von ABC-Plots. Im Gegensatz dazu sind univariate Mischverteilungsanalysen der zugehörigen Achsen nicht geeignet. Ebenso ist eine univariate Mischverteilungsanalyse des Kontrastes nicht geeignet, da in wesentlichen Beispielen dieses Verfahren nicht zum Ziel führt. Das bivariate Verfahren wurde in Simulationsstudien untersucht. Die alleinige Kombination von VEM- und EM-Algorithmus führte zu einer Überschätzung der Mischkomponenten k. Simulationsstudien unter der Verwendung eines zusätzlichen Likelihood Ratio Tests H0 : k = 3 vs. H1 : k > 3 haben gezeigt, dass die Zahl der Klassen unter der Null-Hypothese zuverlässig geschätzt werden kann. Ebenso untersucht, ob das Verfahren in der Lage ist, Konfigurationen mit mehr als drei Klassen zuverlässig zu identifizieren. Die durchgeführten Simulationen haben gezeigt, dass dies mit dem Verfahren gelingt. Die Untersuchungen auf der Grundlage bivariater Daten und Verfahren haben dazu geführt, dass auch diagnostische Meta-Analysen durchgeführt wurden. Ebenso wurde ein diskretes Mischverteilungsmodell für die Durchführung diagnostischer Meta-Analysen entwickelt und in R implementiert.
Publications
- ACPA: automated cluster plot analysis of genotype data. BMC Proc (2009) Nr. S7, S. 58
Schillert, A; Schwarz, DF; Vens, M; Szymczak, S; König, IR; Ziegler, A
- Genome-wide association studies: quality control and population-based measures. Genet Epidemiol (2009) Nr. 33, S.45-50
Ziegler A
- Statistische Qualitätssicherung von Hochdurchsatz-Genotypisierungsdaten. Dissertation, Universität zu Lübeck, (2010)
Schillert A
- Affymetrix Genotypisierungs-Chips: Genotypbestimmung und Qualitätsfilter. In Qualitätsmanagement von Hochdurchsatz-Genotypisierungsdaten. Krawczak M und Freudigmann M (Hrsg.),(2011), Nr. 9, S. 11-38 Schriftenreihe der TMF -Technologie- und Methodenplattform für die Vernetzte Medizinische Forschung e.V.
Schillert A und Ziegler A
- Influence of coronary artery disease prevalence on predictive values of coronary CT angiography: a meta-regression analysis Eur Radiol (2011), Nr. 9, S. 1904-13
Schlattmann P, Schuetz GM, Dewey M
- Genotype calling for the Affymetrix platform. Methods Mol Biol (2012) Nr. 850, S. 513-23
Schillert A und Ziegler A
- Use of 3 × 2 tables with an intention to diagnose approach to assess clinical performance of diagnostic tests: meta-analytical evaluation of coronary CT angiography studies BMJ (2012), Nr. 24, S. e6717
Schuetz GM, Schlattmann P, Dewey M
(See online at https://doi.org/10.1136/bmj.e6717) - Procalcitonin as a diagnostic marker for sepsis: a systematic review and meta-analysis. Lancet Infect Dis (2013), Nr. 13, S. 426–435
Wacker, C; Prkno, A; Brunkhorst, FM; Schlattmann, P
(See online at https://doi.org/10.1016/S1473-3099(12)70323-7) - Mixture models in diagnostic meta-analyses—Clustering summary receiver operating characteristic curves accounted for heterogeneity and correlation. Journal of Clinical Epidemiology
Volume 68, Issue 1, January 2015, Pages 61-72
Schlattmann, P Verba, M; Dewey, M; Walther, M
(See online at https://doi.org/10.1016/j.jclinepi.2014.08.013)