Detailseite
Bedingte Unabhängigkeitstests basierend auf Deep Learning mit Anwendung in der genetischen Analyse von Bildgebungsphänotypen
Antragstellerinnen / Antragsteller
Professorin Dr. Sonja Greven; Professor Dr. Christoph Lippert
Fachliche Zuordnung
Medizininformatik und medizinische Bioinformatik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Epidemiologie und Medizinische Biometrie/Statistik
Statistik und Ökonometrie
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Epidemiologie und Medizinische Biometrie/Statistik
Statistik und Ökonometrie
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 459422098
Deep Learning ist ein essentielles Werkzeug für die biomedizinische Datenanalyse, da es in der Lage ist, hochgradig nichtlineare Assoziationen zu nutzen, um genaue Vorhersagemodelle zu trainieren, insbesondere für strukturierte Daten wie Bilder oder Sequenzen. Die Qualität der Vorhersage allein - die durch Störfaktoren beeinflusst werden kann - ist jedoch unzureichend, um von den Daten zum Verständnis der zugrunde liegenden Biologie zu gelangen. Statistische Unabhängigkeitstests, die um potenzielle Störfaktoren bereinigen, machen fundierte Aussagen über Abhängigkeiten zwischen biologischen Variablen auf Populationsebene. Die derzeitigen statistischen Tests sind jedoch nicht auf die Anwendung auf strukturierte Daten zugeschnitten. In diesem Projekt entwickeln wir bedingte Unabhängigkeitstests für die statistische Assoziation zwischen einer kontinuierlichen skalaren Zielgröße Y und einer Eingabevariable/Kovariate X, während wir gleichzeitig auf Kovariaten Z bedingen, die die Assoziation aufgrund von Abhängigkeiten sowohl von X als auch von Y verfälschen können. Wir betrachten insbesondere solche Fälle, in denen eine oder beide der Variablen X und Z strukturiert sind (vor allem Bilder). Unser Ansatz nutzt Deep Learning, um strukturierte Daten X und/oder Z auf stetige Einbettungen abzubilden, die zum Beispiel aus dem Transferlernen stammen können. Anschließend verwenden wir Tests in linearisierten gemischten Modellen auf eingebetteten Variablen, wobei zufällige Effekte eine sparsame Modellierung in hohen Dimensionen ermöglichen. Wir werden die theoretischen Eigenschaften aller entwickelten Tests untersuchen und effiziente Algorithmen und Implementierungen bereitstellen. Wir konzentrieren uns insbesondere auch auf gute Powereigenschaften in endlichen Stichproben und leiten Berechnungen für Stichprobengröße und Power her.Die entwickelten Methoden sind durch Anwendungen in der genetischen Analyse von Bildgebungsphänotypen motiviert, wo bedingte Unabhängigkeitstests verwendet werden, um vererbbare Phänotypen in Bildern auf genetische Loci abzubilden und dabei Verzerrungen durch Populationsstruktur und Verwandtschaft durch Konditionierung zu korrigieren. Populationsbasierte Bildgebung ermöglicht eine effiziente Quantifizierung von Phänotypen, einschließlich Biomarkern für Krankheiten. Während derzeitige genomweite Assoziationsstudien a priori bekannte skalare Biomarker wie Organgrößen analysieren, besteht das Ziel dieses Projekts darin, unverzerrte Tests auf das Vorhandensein jeglicher vererbbarer phänotypischer Variation in Bildern zu ermöglichen, um neue Biomarker zu entdecken. Insbesondere werden wir unsere Methoden für genbasierte Assoziationsstudien von 2D-Netzhautfundusbildern und 3D-Magnetresonanzbildern des Gehirns in der UK Biobank einsetzen.
DFG-Verfahren
Forschungsgruppen