Detailseite
Starke Konsistenzbedingungen für robustes, interpretierbares und generalisierbares maschinelles Sehen
Antragsteller
Professor Dr. Wieland Brendel
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 448601360
Deep Learning ist das Arbeitspferd der heutigen Maschinenintelligenz, die zahlreiche Erfolgsgeschichten in Wissenschaft, Industrie und Gesellschaft hervorgebracht hat. Dieser rasche und weit verbreitete Erfolg hat jedoch vier schwerwiegende und grundlegende Probleme verdeckt, die Deep Learning auf vergleichsweise wenige, eng umrissene Anwendungsbereiche beschränken. Zum einen sind tiefe neuronale Netzwerke (DNNs) nicht robust und selbst kleine Eingangsstörungen wie JPEG-Artefakte oder nicht wahrnehmbares, aber sorgfältig konstruiertes Rauschen können ihr Verhalten grundlegend stören. Zweitens sind die Darstellungen von DNNs nicht interpretierbar und lassen sich nicht ohne weiteres mit für den Menschen verständlichen Konzepten in Beziehung setzen. Drittens lassen sich die Darstellungen von DNNs ohne zusätzliches überwachtes Lernen nicht gut in anderen Aufgaben oder Bereichen nutzen. Und schließlich haben wir nur ein geringes theoretisches Verständnis für die von DNNs erlernten Darstellungen, was die Lösung der oben genannten Probleme erschwert.Um in diesen Bereichen Fortschritte zu erzielen, schlage ich hier einen Satz von vier Konsistenzbedingungen vor, die die visuellen Darstellungen von DNNs erfüllen sollten. Diese Bedingungen bieten eine solide theoretische Grundlage für das Lernen unbeaufsichtigter Repräsentationen, die neue Wege zur Untersuchung und Verbesserung der Robustheit, Interpretierbarkeit und Generalisierung eröffnet. Durch die Ausrichtung auf diese grundlegenden Fragen des Deep Learning wird diese Arbeit die Unterschiede zwischen menschlicher und maschineller Bildverarbeitung verringern, die Zuverlässigkeit und Erklärbarkeit von DNNs erhöhen, die Methodenentwicklung beschleunigen und neue Anwendungsbereiche eröffnen.
DFG-Verfahren
Emmy Noether-Nachwuchsgruppen
Großgeräte
Computing Server with 8 GPUs
Gerätegruppe
7030 Dedizierte, dezentrale Rechenanlagen, Prozeßrechner