Detailseite
Projekt Druckansicht

Effizientes Aktives Online Lernen für 3D Rekonstruktion und Szenenverstehen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2014 bis 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 260350367
 
Maschinelle Lernalgorithmen sind ein bedeutender Bestandteil in modernen Systemen des Computersehens geworden. Die meisten dieser Systeme basieren jedoch auf Offline-Lernmethoden, d.h. der Lernschritt wird nur einmal, vor dem eigentlich Einsatz des Systems durchgeführt, und zukünftige Anpassungen an unbeobachtete Gegebenheiten sind unmöglich. Ausserdem ist die Menge der für den Lernprozess benötigten annotierten Trainingsdaten üblicherweise sehr hoch, da das System keine Möglchkeit hat, Untermengen des Trainingssatzes auszuwählen, welche besonders geeignet wären für die erforderliche Klassifikationsaufgabe. In starkem Gegensatz dazu, beruht menschliche Wahrnehmung stark auf unserer Fähigkeit, ständing zu lernen und unser erworbenes Wissen an neue Situationen und Umstände anzupassen. Das Ziel in diesem Projekt ist es diese Probleme anzugehen, indem neuartige Lernmethoden entwickelt werden, die die Lernaufgabe mit einen höheren Grad an Autonomie durchführen als es aktuelle Systeme tun. Hierbei bedeutet Autonomie die Fähigkeit des Systems zu entscheiden, welche Art von Information nützlicher ist für ein effizienteres Lernen. Um dies zu erreichen werden wir ein Aktives Lernsystem entwickeln, in dem das Lernen in Zyklen stattfindet: nach einer anfänglichen Trainingsphase werden dem System neue Beobachtungen gezeigt, die es klassifiziert. Von diesen wählt es die, die am informativsten sind und erfragt für sie entsprechende Bezeichnungen von einem Menschen. Die so erhaltenen annotierten Daten werden dann in der nächsten Trainingsrunde verwendet. Dies wird zu zwei wichtigen Verbesserungen im Vergleich zu aktuellen Systemen führen: zum einen wird die benötigte Menge an Trainingsdaten signifikant kleiner sein, da die verwendeten Daten viel mehr kontextorientiert gewählt werden. Zum anderen wird das System eine viel größere Fähigkeit des Anpassens an neue Situationen und Umgebungen haben, da das Lernen in einem andauernden Prozess erfolgt. Wir werden unser Aktives Lernsystem in zwei besonders relevanten Forschungsgebieten innerhalb des Computersehens anwenden, nämlich auf die 3D-Rekonstruktion und das Szenenverstehen. Dabei ist das Ziel, eine erhebliche Leistungssteigerung auf diesen Gebieten mithilfe des von uns vorgeschlagenen autonomen, d.h. in diesem Fall Aktiven, Lernansatz zu erzielen.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung