Detailseite
Projekt Druckansicht

Automatische Beurteilung von Clusterplots (ABC-Plots)

Fachliche Zuordnung Epidemiologie und Medizinische Biometrie/Statistik
Förderung Förderung von 2009 bis 2013
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 150447427
 
Erstellungsjahr 2014

Zusammenfassung der Projektergebnisse

Die visuelle Beurteilung von Clusterplots (Signalintensitätsplots) durch mindestens zwei unabhängige Betrachter ist das Standardverfahren zur abschließenden Beurteilung der Güte von Einzelnukleotidpolymorphismen (SNPs) in Hochdurchsatz-Genotypisierungsstudien. Ziel dieses Projekts war es, statistische Methoden zu entwickeln, die die subjektive und zeitintensive manuelle Beurteilung durch geeignete statistische Verfahren unterstützen bzw. sogar ersetzen können. Um die effiziente Analyse von Signalintensitätsdaten durchführen zu können, war es notwendig geignete Software zu entwickeln. Dies ist im Rahmen eines Teilprojektes erfolgt. Das dabei entstandene R-Paket ATOMIC ist auf der Seite http://www.imbs-luebeck.de in der Rubrik Software verfügbar. In einem weiteren Teilprojekt wurden neben verschiedenen Kriterien aus der Cluster-Analyse auch eigene Ansätze hinsichtlich ihrer Eignung untersucht. Dies geschah anhand von Realdaten aus der Gutenberg-Gesundheitsstudie. Dabei stellten sich der Engelman-Hartigan Test auf Unimodalität und eine Modifikation des ACPA-Kriteriums als vielversprechend heraus. Im dritten Teilprojekt wurde die Anwendbarkeit von diskreten Mischverteilungsmodellen für die Qualitätskontrolle von Clusterplots untersucht. Hierzu wurden finite Mischverteilungen von bivariaten Normalverteilungen untersucht. Hier ist eine wesentliche Frage die Schätzung der Zahl der Mischungskomponenten k. Dazu wurde der VEM-Algorithmus mit einer unbekannten Anzahl von Mischungskomponenten k für den bivariaten Fall weiterentwickelt und in das R-Paket CAMAN integriert. Dieser bivariate Ansatz eignet sich zur Modellierung von ABC-Plots. Im Gegensatz dazu sind univariate Mischverteilungsanalysen der zugehörigen Achsen nicht geeignet. Ebenso ist eine univariate Mischverteilungsanalyse des Kontrastes nicht geeignet, da in wesentlichen Beispielen dieses Verfahren nicht zum Ziel führt. Das bivariate Verfahren wurde in Simulationsstudien untersucht. Die alleinige Kombination von VEM- und EM-Algorithmus führte zu einer Überschätzung der Mischkomponenten k. Simulationsstudien unter der Verwendung eines zusätzlichen Likelihood Ratio Tests H0 : k = 3 vs. H1 : k > 3 haben gezeigt, dass die Zahl der Klassen unter der Null-Hypothese zuverlässig geschätzt werden kann. Ebenso untersucht, ob das Verfahren in der Lage ist, Konfigurationen mit mehr als drei Klassen zuverlässig zu identifizieren. Die durchgeführten Simulationen haben gezeigt, dass dies mit dem Verfahren gelingt. Die Untersuchungen auf der Grundlage bivariater Daten und Verfahren haben dazu geführt, dass auch diagnostische Meta-Analysen durchgeführt wurden. Ebenso wurde ein diskretes Mischverteilungsmodell für die Durchführung diagnostischer Meta-Analysen entwickelt und in R implementiert.

Projektbezogene Publikationen (Auswahl)

 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung