Verbesserte statistische Erkennung von krankheitsassoziierten SNPs und SNP-Interaktionen in genomweiten Assoziationsstudien
Zusammenfassung der Projektergebnisse
Variationen im menschlichen Genom können das Risiko der Erstehung einer Krankheit entscheidend beeinflussen. Solche Variationen umfassen häufig nur eine einzige Basenpaarstelle in der DNA und werden in diesem Fall als Einzelnukleotidpolymorphismus oder kurz als SNP (Single Nucleotide Polymorphism) bezeichnet. Zur Identifizierung von SNPs, die mit einer Krankheit assoziiert sind und somit zu einem erhöhten Krankheitsrisiko führen können, werden in manchen Studien einige zehn bis wenige tausend SNPs aus biologisch interessanten DNA-Abschnitten analysiert, oder genomweit Hunderttausende oder Millionen von SNPs betrachtet, um neue biologische Hypothesen zur Krankheitsentwicklung zu generieren. Ziel meines Forschungsprojekts war es, zu einer verbesserten statistischen Erkennung von krankheitsassoziierten SNPs beizutragen. So haben wir zum einen ein statistisches Verfahren entwickelt, das es ermöglicht, Vorwissen über die SNPs (z.B. die Wahrscheinlichkeit, dass die Ausprägung eines SNPs richtig bestimmt wurde), das üblicherweise nicht berücksichtigt wird, mit in die Analyse einzubauen. Zum anderen schlagen wir einen Test vor, der im Gegensatz zu den typischerweise verwendeten Tests auch SNPs identifizieren kann, die erst in gemeinsamer Betrachtung mit anderen SNPs das Krankheitsrisiko beeinflussen. Ferner haben wir durch die Herleitung einer analytischen Lösung die Berechnung der Statistik eines Tests, der häufig auf Fall-Eltern-Trio-Daten mit erkrankten Kindern und deren Eltern angewendet wird, beschleunigt, so dass sämtliche SNPs aus genomweiten Assoziationsstudien nun in wenigen Minuten anstelle von mehreren Stunden statistisch getestet werden können. Bei komplexen Krankheiten wie Krebs sind häufig nicht einzelne SNPs, sondern Kombinationen mehrerer SNPs die relevanten Risikofaktoren. Im Gegensatz zu populationsbasierten Studien, in denen nicht miteinander verwandte Personen betrachtet werden, wurde bisher nur eine einzige Methode für Fall-Eltern-Trio-Studien entwickelt, die eine direkte Suche nach krankheitsassoziierten SNP-Interaktionen ermöglicht, ohne dass die zu untersuchenden Interaktionen vorher spezifiziert werden müssen. Basierend auf diesem Verfahren haben wir eine Prozedur zur stabilisierten Suche nach solchen SNP-Interaktionen vorgeschlagen, mit der darüber hinaus die Wichtigkeit der gefundenen Interaktionen für das Krankheitsrisiko quantifiziert und diese SNP-Interaktionen getestet werden können. Ähnlich wie bei vergleichbaren Methoden für die Analyse von populationsbasierten SNP-Daten ist dieses Verfahren auf einige hundert bis wenige tausend SNPs begrenzt. Für populationsbasierte Daten haben wir deshalb eine Methode entwickelt, die auch auf zehntausende SNPs, wie sie in Zukunft häufig in Studien, in denen z.B. DNA-Regionen oder das Exom sequenziert werden, anwendbar ist. Diese Methode wollen wir noch weiterentwickeln und für die Analyse von Fall-Eltern-Trio-Daten adaptieren.
Projektbezogene Publikationen (Auswahl)
-
(2011). Importance Measures for Epistatic Interactions in Case-Parent Trios. Annals of Human Genetics, 75, 122-132
Schwender, H., Bowers, K., Fallin, M. D. und Ruczinski, I.
-
(2011). Testing SNPs and Sets of SNPs for Importance in Association Studies. Biostatistics, 12, 18-32
Schwender, H., Ruczinski, I. und Ickstadt, K.