Detailseite
SFB 1597: Small Data
Fachliche Zuordnung
Medizin
Biologie
Informatik, System- und Elektrotechnik
Mathematik
Physik
Sozial- und Verhaltenswissenschaften
Biologie
Informatik, System- und Elektrotechnik
Mathematik
Physik
Sozial- und Verhaltenswissenschaften
Förderung
Förderung seit 2023
Webseite
Zur Homepage
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 499552394
Die jüngsten Fortschritte im Bereich der künstlichen Intelligenz wurden durch große Datenmengen und datengesteuerte Modellierungsansätze begünstigt, insbesondere bei Deep-Learning-Techniken, wie sie hauptsächlich in der Informatik entwickelt wurden. Es gibt jedoch eine größere Anzahl von Anwendungen, besonders in der Medizin, bei denen die Modellierung mit einer relativ kleinen Anzahl von Beobachtungen durchgeführt werden muss. Bei der datengesteuerten Modellierung kann dies durch den Transfer zusätzlicher Information erreicht werden. Alternativ kann die Modellierung auf stärkeren strukturellen Annahmen beruhen, die z. B. medizinische Expertise widerspiegeln, wie dies bei wissensbasierten Ansätzen der Fall ist, die häufig in der Mathematik und Statistik/Systemmodellierung entwickelt werden. So sind Ansätze für kleiner Datenmengen derzeit auf verschiedene Daten-Disziplinen verstreut. Um umfassende Lösungen zu schaffen, die spannende neue Ideen vereinen, ist es daher notwendig, Beiträge aus der Informatik, der Mathematik und der Statistik/Systemmodellierung zu integrieren. Diese Methodenentwicklung benötigt auch Beiträge aus Anwendungsbereichen wie der Biomedizin. Dementsprechend haben wir unsere SFB-Initiative SmallData mit einem starken Fokus auf die Entwicklung eines interdisziplinären Methodenrahmens konzipiert. Wir konzentrieren uns auf die zentralen SmallData-Aufgaben der Kombination ähnlicher Datensätze und der Übertragung von Information aus zusätzlichen Quellen unter Berücksichtigung und Reduzierung von Unsicherheit. Dies spiegelt sich in den drei Kernbereichen von SmallData wider: Similarity, Transfer und Uncertainty. Methodisch konzentrieren wir uns auf die Kombination von datengesteuerten und wissensgesteuerten Modellierungsansätzen, z.B. basierend auf neuronalen Netzen und Differentialgleichungen. Meta-Learning und Pre-Training sind zwei weitere Komponenten unseres Methodenrahmens zur Übertragung von Information über Modell- oder Tuning-Parameter zwischen Datensätzen. Darüber hinaus haben wir einen Fusion Hub konzipiert, der sich mit übergreifenden Themen befasst, welche die drei Bereiche miteinander verbinden, indem er Methoden aus verschiedenen Disziplinen fusioniert. Dazu gehören Ansätze, die auf den Konzepten der „attention“ und des „few-shot learning“ beruhen, welche in jüngster Zeit in der Informatik weiterentwickelt wurden. Die Entwicklung der Theorie geht Hand in Hand mit der Anpassung der Methoden an prototypische medizinische Anwendungen aus der Forensischen Medizin, Gentherapie, Nephrologie, Psychiatrie, Radiologie und zu seltenen Erkrankungen. Darüber hinaus wird unser integriertes Graduiertenkolleg eine gemeinsame Sprache für alle Disziplinen fördern. Zudem haben wir das SmallData Compendium als eine Webplattform konzipiert, welche unseren interdisziplinären Methodenrahmen für den Austausch von Konzepten und Methoden mit der internationalen Gemeinschaft bereitstellen wird, um auch so das Small-Data-Feld zu prägen.
DFG-Verfahren
Sonderforschungsbereiche
Laufende Projekte
- A01 - Integration von Information aus ähnlichen Standorten bei der Entwicklung von klinischen Vorhersagemodellen für Patienten aus eines Zielstandortes (Teilprojektleiterinnen Rohde, Angelika ; Zöller, Daniela )
- A02 - Ermittlung von Best-Practice-Behandlungsstrategien durch Einbeziehung von Information aus ähnlichen Behandlungspfaden (Teilprojektleiterinnen / Teilprojektleiter Binder, Nadine ; Dette, Holger )
- A03 - Ähnlichkeit individueller latenter Dynamiken in longitudinalen Kohortendaten (Teilprojektleiter Binder, Harald ; Schmidt, Thorsten )
- A04 - Ein effektiver Ähnlichkeitsintegrationsansatz für multimodale neuronale Netze zur verbesserten Priorisierung von Krankheitsgenen (Teilprojektleiterinnen / Teilprojektleiter Backofen, Rolf ; Schmidts, Miriam )
- A05 - Ermöglichung der effektiven und sicheren Anwendung des CRISPR/Cas-Systems in primären Humanzellen mittels Deep-Learning-basierter Vorhersagealgorithmen auf der Basis gut untersuchter Zelltypen (Teilprojektleiter Backofen, Rolf ; Cathomen, Toni )
- B01 - Transfer- und Meta-Learning in tiefen Netzen für die Analyse menschlicher Gehirnsignale (Teilprojektleiter Ball, Tonio ; Hutter, Ph.D., Frank )
- B02 - Transfer Learning für die Vorhersage kurzer Umweltzeitreihen mit prozess-geleiteten neuronale Netze (Teilprojektleiter Bödecker, Joschka ; Dormann, Carsten )
- B03 - Verknüpfung von Kohorten und Expertenwissen durch kategoriale Darstellung zur verbesserten Wissensextraktion aus Längsschnittdaten (Teilprojektleiterinnen / Teilprojektleiter Has, Cristina ; Hess, Moritz )
- B04 - Grundlagen des Few-Shot-Lernens für Bilder (Teilprojektleiter Brox, Thomas ; Valada, Abhinav )
- B05 - Modalitätsübergreifendes Repräsentationslernen, mit Anwendungen für die Suche in radiologischen Berichten und das automatische Ausfüllen von Berichtsvorlagen (Teilprojektleiterinnen / Teilprojektleiter Bast, Hannah ; Brox, Thomas ; Kotter, Elmar )
- B06 - Wechselseitiger Wissenstransfer von populationsbasierten genetischen Screens zu Ganzkörper- und organaufgelöste Modelle des menschlichen Stoffwechsels (Teilprojektleiterinnen / Teilprojektleiter Hertel, Johannes ; Köttgen, Anna )
- C01 - Quantifizierung der Unsicherheit bei der Klassifikation mit Anwendungen in der forensischen Genetik (Teilprojektleiterinnen / Teilprojektleiter Lutz-Bonengel, Sabine ; Pfaffelhuber, Peter ; Rohde, Angelika )
- C02 - Unsicherheit und Heterogenität in Netzwerk-Meta-Analysen mit kleinen Untergruppen und wenigen Studien (Teilprojektleiterinnen Nikolakopoulou, Adriani ; Schramm, Ph.D., Elisabeth )
- C03 - Verringerung der Unsicherheiten bei der Parameteroptimierung von dynamischen Modellen durch Meta-Learning (Teilprojektleiter Kreutz, Clemens ; Timmer, Jens )
- C04 - Schnelles und effizientes Erlernen der Hyperparameterkontrolle für Deep Reinforcement Learning auf kleinen Datenmengen (Teilprojektleiterinnen / Teilprojektleiter Awad, Ph.D., Noor ; Bödecker, Joschka )
- C05 - Meta-Lernen zur Regularisierung von tiefen Netzen bei kleinen Datenmengen (Teilprojektleiter Grabocka, Josif ; Hutter, Ph.D., Frank )
- F - Fusion Hub (Teilprojektleiter Binder, Harald )
- MGK - Integriertes Graduiertenkolleg (Teilprojektleiterinnen / Teilprojektleiter Backofen, Rolf ; Binder, Nadine )
- Z - Zentrales Verwaltungsprojekt (Teilprojektleiter Binder, Harald )
Antragstellende Institution
Albert-Ludwigs-Universität Freiburg
Beteiligte Hochschule
Ruhr-Universität Bochum
Fakultät für Mathematik; Universitätsmedizin Greifswald
Klinik und Poliklinik für Psychiatrie und Psychotherapie
Fakultät für Mathematik; Universitätsmedizin Greifswald
Klinik und Poliklinik für Psychiatrie und Psychotherapie
Sprecher
Professor Dr. Harald Binder