Detailseite
Projekt Druckansicht

Angewandtes Quantum Computing für maschinelles Sehen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung seit 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 534951134
 
Computer Vision Systeme müssen oft große Datenmengen verarbeiten um die komplexe menschliche Wahrnehmung nachbilden zu können. Infolgedessen benötigen sie immer mehr Hardware-Ressourcen, um die steigenden Anforderungen an die Datenverarbeitung erfüllen zu können. Gleichzeitig wurden bisher nur wenige Versuche unternommen, Quantencomputing in der Computer Vision anzuwenden, obwohl die Computer Vision mit anspruchsvollen kombinatorischen Formulierungen viele Probleme hat, die potenziell auf Quantencomputern gelöst werden können. Es ist daher von größter Bedeutung zu untersuchen, wie das maschinelle Sehen von moderner Quantenhardware profitieren kann. Zwar können Quantencomputer heutzutage noch nicht zur Lösung der größten Bildverarbeitungsprobleme eingesetzt werden, jedoch glauben wir an einen hohen gegenseitigen Nutzen beider Forschungsgebiete, der Computer Vision und dem Quantum Computing, bereits heute Formulierungen für CV-Probleme auf Quantencomputern zu erforschen und zu evaluieren. Ziel dieses Antrags ist es daher, zu untersuchen, wie die Computer Vision von Quantencomputern profitieren könnte. Wir werden untersuchen, 1) wie Quantum Annealing in der Computer Vision angewandt werden kann, um Ansätze mit besseren Eigenschaften zu entwickeln (z.B. höhere Genauigkeit), und 2) wie Quantum Machine Learning (QML) auf gatterbasierten Quantencomputern für die automatische Kodierung von 3D-Daten verwendet werden kann, um die Kompaktheit und Expressivität der erlernten 3D-Darstellungen zu verbessern. Das Forschungsprojekt ist in fünf Arbeitspaketen aufgebaut. Zunächst untersuchen wir, wie die Zielprobleme in einer Form formuliert werden können, die von modernen Quanten-Annealern gelöst werden kann, d.h. als quadratische, unrestringierte binäre Optimierungsprobleme (QUBO). Da viele Computer-Vision-Probleme (lineare) Nebenbedingungen beinhalten, ist ein Arbeitspaket ihrer Integration in QUBOs gewidmet. Als nächstes wird neben der analytischen Herleitung von QUBOs das Lernen anwendungsspezifischer Kosten sowie die Kodierung von Lösungen mittels binärer Repräsentationen betrachtet. Darüber hinaus wird untersucht, ob QUBOs sich zum Training von neuronalen Netzwerken mit binären Gewichten mittels splitting-Verfahren eignen. In Erwartung rascher Fortschritte bei gatterbasierter Quantenhardware definieren wir ein Arbeitspaket für diese Hardware für ein Problem, das in der Community auf breites Interesse stößt, herausfordernd ist und bisher weitgehend unerforscht blieb, nämlich die Auto-Enkodierung von 3D-Daten. Diese hat das Potenzial, die Kompaktheit der erlernten 3D-Darstellungen zu verbessern. Die Fragen im Zusammenhang mit diesem Arbeitspaket sind die Kodierung klassischer Daten in Quantenzustände, die Interpretation der transformierten Quantenzustände als klassische Strukturen, die Architektur der Quantenschaltung und das gemeinsame Training von Quanten-/Hybrid-Quanten-Architekturen mit einer Variante des Back-Propagation-Algorithmus.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung