Detailseite
Projekt Druckansicht

Starke Konsistenzbedingungen für robustes, interpretierbares und generalisierbares maschinelles Sehen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 448601360
 
Deep Learning ist das Arbeitspferd der heutigen Maschinenintelligenz, die zahlreiche Erfolgsgeschichten in Wissenschaft, Industrie und Gesellschaft hervorgebracht hat. Dieser rasche und weit verbreitete Erfolg hat jedoch vier schwerwiegende und grundlegende Probleme verdeckt, die Deep Learning auf vergleichsweise wenige, eng umrissene Anwendungsbereiche beschränken. Zum einen sind tiefe neuronale Netzwerke (DNNs) nicht robust und selbst kleine Eingangsstörungen wie JPEG-Artefakte oder nicht wahrnehmbares, aber sorgfältig konstruiertes Rauschen können ihr Verhalten grundlegend stören. Zweitens sind die Darstellungen von DNNs nicht interpretierbar und lassen sich nicht ohne weiteres mit für den Menschen verständlichen Konzepten in Beziehung setzen. Drittens lassen sich die Darstellungen von DNNs ohne zusätzliches überwachtes Lernen nicht gut in anderen Aufgaben oder Bereichen nutzen. Und schließlich haben wir nur ein geringes theoretisches Verständnis für die von DNNs erlernten Darstellungen, was die Lösung der oben genannten Probleme erschwert.Um in diesen Bereichen Fortschritte zu erzielen, schlage ich hier einen Satz von vier Konsistenzbedingungen vor, die die visuellen Darstellungen von DNNs erfüllen sollten. Diese Bedingungen bieten eine solide theoretische Grundlage für das Lernen unbeaufsichtigter Repräsentationen, die neue Wege zur Untersuchung und Verbesserung der Robustheit, Interpretierbarkeit und Generalisierung eröffnet. Durch die Ausrichtung auf diese grundlegenden Fragen des Deep Learning wird diese Arbeit die Unterschiede zwischen menschlicher und maschineller Bildverarbeitung verringern, die Zuverlässigkeit und Erklärbarkeit von DNNs erhöhen, die Methodenentwicklung beschleunigen und neue Anwendungsbereiche eröffnen.
DFG-Verfahren Emmy Noether-Nachwuchsgruppen
Großgeräte Computing Server with 8 GPUs
Gerätegruppe 7030 Dedizierte, dezentrale Rechenanlagen, Prozeßrechner
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung