Detailseite
FOR 5363: KI-FOR Integration von Deep Learning und Statistik zum Verständnis strukturierter biomedizinischer Daten
Fachliche Zuordnung
Informatik, System- und Elektrotechnik
Medizin
Sozial- und Verhaltenswissenschaften
Medizin
Sozial- und Verhaltenswissenschaften
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 459422098
Hochdurchsatzmessungen in den biomedizinischen Wissenschaften wie z.B. Bilder, Genomsequenzen oder Zeitreihen stellen strukturierte Daten dar, die durch inhärente Abhängigkeiten zwischen den Messungen, oft nicht-vektorielle Struktur und das Vorhandensein von Störgrößen und Stichprobenverzerrung gekennzeichnet sind. So können z.B. die Populationsstruktur, systematische Messartefakte, nicht unabhängige Stichproben oder unterschiedliche Altersverteilungen in den Gruppen zu falschen Ergebnissen führen, wenn sie nicht berücksichtigt werden. Deep Learning (DL) zeichnet sich in vielen Anwendungen auf strukturierten Daten durch die Fähigkeit aus, komplexe Abhängigkeiten innerhalb und zwischen Eingaben und Ausgaben zu erfassen, was eine genaue Prädiktion ermöglicht. Trotz der jüngsten Fortschritte bei erklärbarer künstlicher Intelligenz und Bayesschen neuronalen Netzen gibt es beim DL immer noch Einschränkungen hinsichtlich der Unsicherheitsquantifizierung, Interpretierbarkeit und Validierung. Dies sind jedoch wichtige Komponenten, um über die Prädiktion hinaus Verständnis der zugrunde liegenden Biologie zu erlangen. Zu diesem Zweck wurde in den biomedizinischen Wissenschaften traditionell die Statistik verwendet, aufgrund der interpretierbaren Modellergebnisse und der statistischen Inferenz, die u.a. eine Quantifizierung der Unsicherheit, Adjustierung für Störgrößen und Testen von Hypothesen mit statistischer Fehlerkontrolle ermöglicht. Methoden der klassischen Statistik sind jedoch begrenzt in ihrer Modellierungsflexibilität für strukturierte Daten und ihrer Fähigkeit, komplexe Nichtlinearitäten datengesteuert zu erfassen.In dieser Forschungsgruppe bringen wir Experten aus dem Bereich des maschinellen Lernens und der Statistik mit Erfahrung in biomedizinischen Anwendungen zusammen, um die folgenden übergreifenden Ziele zu erreichen:(O1) Integration von DL und Statistik zur Verbesserung der Interpretierbarkeit, Unsicherheitsquantifizierung und statistischen Inferenz für DL und zur Verbesserung der Modellierungsflexibilität statistischer Methoden für strukturierte Daten. Insbesondere werden wir Methoden entwickeln, die statistische Inferenz für strukturierte Daten durch Unsicherheitsquantifizierung, Testen von Hypothesen und Adjustierung für Störgrößen ermöglichen, und die Erklärungen strukturierter Daten durch hybride statistische und Deep-Learning-Modelle, Erklärungen auf Populations- und Verteilungsebene und robuste dünnbesetzte Erklärungen verbessern. (O2) Schaffung einer Rückkopplungsschleife zwischen dieser Methodenentwicklung und biomedizinischen Anwendungen, wobei wir bei der Entwicklung neuer Methoden die Bedürfnisse bei der Analyse der Daten berücksichtigen und biomedizinische Erkenntnisse aus den Anwendungen der entwickelten Methoden auf die Daten gewinnen wollen. Zu den Anwendungen gehören die Analyse von MRT-, fMRT- und Mikroskopie-Bildern, Krankheitsverlaufsmodellierung, DNA-Sequenzanalysen und genetische Assoziationsstudien.
DFG-Verfahren
Forschungsgruppen
Projekte
- Bedingte Unabhängigkeitstests basierend auf Deep Learning mit Anwendung in der genetischen Analyse von Bildgebungsphänotypen (Antragstellerinnen / Antragsteller Greven, Sonja ; Lippert, Christoph )
- Kombination von geometrisch orientiertem statistischem und tiefem Lernen für Neurobildgebungsdaten (Antragstellerinnen Greven, Sonja ; Ritter, Kerstin )
- Koordinationsfonds (Antragstellerin Greven, Sonja )
- Probabilistische Lernansätze für komplexe Krankheitsverläufe auf der Grundlage hochdimensionaler MRT-Daten (Antragstellerinnen Klein, Nadja ; Ritter, Kerstin )
- Regularisierungsstrategien für interpretierbare tiefe Modelle und robuste Erklärungen mit Anwendung in der Genomik (Antragsteller Ohler, Uwe ; Samek, Wojciech )
- Strukturierte Erklärbarkeit von Interaktionen in Deep Learning Modellen mit Anwendung auf Pathogenitätsprädiktion (Antragstellerinnen / Antragsteller Klein, Nadja ; Renard, Bernhard )
- Unsicherheitsbewertung und kontrastive Erklärungen für die Instanzensegmentierung (Antragstellerinnen / Antragsteller Kainmüller, Dagmar ; Samek, Wojciech )
- Visuelle Erklärungen für statistische Tests und statistische Tests für visuelle Erklärungen mit Anwendung auf die genetische Analyse von Bildgebungsphänotypen (Antragsteller Lippert, Christoph ; Samek, Wojciech )
Sprecherin
Professorin Dr. Sonja Greven