Detailseite
Statistische Modellierung für die Objekterkennung in Bildern
Antragsteller
Professor Dr.-Ing. Hermann Ney
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2003 bis 2009
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5412085
Die automatische Erkennung von Objekten in Bildern wird unter anderem für die Schrifterkennung, die Steuerung autonomer Roboter oder die inhaltsbasierte Kategorisierung von Bilddaten aus großen Bilddatenbanken benötigt. In eigenen Vorarbeiten konnte gezeigt werden, dass statistische Verfahren zur Schrifterkennung auf Anhieb international konkurrenzfähige Ergebnisse erreichen, die andere Verfahren erst nach langer Optimierung erzielen. Das Ziel dieses Vorhabens ist die eingehende Untersuchung weiterführender statistischer Modelle. Dabei soll das Projekt von Erfahrungen auf dem Gebiet der statistischen Modellierung im Bereich der automatischen Sprachverarbeitung profitieren. Die Forschungsarbeiten gliedern sich in drei Modellierungsebenen: 1. Modellierung der Objekt-Wahrscheinlichkeitsverteilung: Hier soll die Übertragung des Maximum-Entropy-Ansatzes auf die Objekterkennung evaluiert werden. Dieser viel versprechende Ansatz wurde bisher nicht in der Objekterkennung eingesetzt. 2. Modellierung der Variabilität von Bildobjekten: Diese ist für die Erkennung wichtig, da Objekte unabhängig von der stets auftretenden Variation erkannt werden sollen. Hier soll die Erweiterung von pixelbasierten Modellen im Vordergrund stehen. Diese zum Beispiel als Hidden-Markov-Modell realisierten Beschreibungen sind in der echten zweidimensionalen Variante bisher kaum untersucht worden. 3. Modellierung von ganzen Bildszenen: Die automatische Erkennung komplexen Szenen ist bisher nur in sehr eingeschränkten Domänen möglich. Eine genaue Untersuchung des sog. holistischen Ansatzes der Bilderkennung' (d.h. ohne explizite Segmentierung), wie sie in der Spracherkennung erfolgreich ist, ist hier das Ziel der Forschungsarbeiten. Die Komplexität der zu untersuchenden Algorithmen stellt angesichts der wachsenden Rechnerleistung kein wesentliches Hindernis mehr dar, so dass auch aufwändigere Methoden für die Praxis relevant werden. Gesamtziel des Vorhabens ist ein besseres Verständnis der Modellierungsebenen für die Objekterkennung um so den Stand der Technik in der statistischen Bilderkennung weiter voranzutreiben.
DFG-Verfahren
Sachbeihilfen