Automatische Identifikation und Klassifikation von Personen als Key-Visual-Kandidaten

Antragsteller Professor Dr. Otthein Herzog; Professor Peter Ludes, Ph.D.

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing

Förderung Förderung von 2008 bis 2013

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 71861393

Erstellungsjahr 2013

Zusammenfassung der Projektergebnisse

Obwohl das Format der Fernsehjahresrückblicke sowohl qualitativ als auch quantitativ über verschiedene Medienkulturen hinweg ausdifferenziert ist, konnte die Stabilität des Auftretens bestimmter nationaler, trans-kultureller und globaler Schlüsselbilder gezeigt werden. An den thematischen Schwerpunkten der Jahresrückblicke in den USA und Deutschland im vergangenen Jahrzehnt zeigen sich historische Machtdarstellungsunterschiede sowie die begrenzte Wahrnehmung internationaler Beziehungspartner. So war Deutschland für das 20. Jahrhundert im Fokus der US-Rückblicke – im vergangenen Jahrzehnt hingegen der Irak. Die berücksichtigten chinesischen Fernsehjahresrückblicke zeigen, wie sehr die USA als Gegenüber wahrgenommen werden. Differenzierte Analysen nach Ländern, Jahren, Genre und Akteurstypen wurden durchgeführt; denn erst eine mit Text- und Statistikauswertungen gleich berechtigte Konzentration auf visuelle Daten kann sonst unterbelichtete Perspektiven eines neuen Strukturwandels der Öffentlichkeit erhellen und hierdurch lassen sich nicht in Worte übersetzbare Semantiken als Schlüssel zu sonst unsichtbar bleibenden sozialen Figurationen und Prozessen erschließen. Die unterschiedlichen Darstellungshäufigkeiten von Staatsoberhäuptern zu einfachen Leuten z. B. in den von uns untersuchten Fernsehjahresrückblicken aus Brasilien, China, Deutschland und den USA, hier nur für 2008 bis 2010, sind signifikant, für Deutschland 1:4,6, die USA 1:2,2, Brasilien 1:2,3 und China 1:20,0. Damit sind die brasilianischen, deutschen und US-amerikanischen Machtpräsentationen wesentlich ähnlicher untereinander als mit China. Um die Analysen durchführen zu können, wurden Werkzeuge zur manuellen und automatischen Videoannotation erstellt. Die Software erlaubt den Datenexport zu Statistikwerkzeugen für weitere Analysen. Automatisierte Übereinstimmungstests anhand der Messung von Krippendorffs Alpha zwischen verschiedenen Annotationen lassen auf die Verlässlichkeit des Datenmaterials schließen. Die Annotation wurde durch automatische Verfahren zur Erkennung von Schnittgrenzen, Gesichtern und verschiedenen Arten von Schlüsselbildern unterstützt. Hierzu wurde ein Gesichtsdetektor entwickelt, der nicht nur frontale, sondern auch stark seitliche Ansichten erkennt. Eine effiziente Merkmalsdarstellung wurde entwickelt, welche einen schnellen und numerisch stabilen Vergleich visueller Muster erlaubt, welcher nicht durch die Hochdimensionalität der Vektordarstellungen beeinträchtigt ist. Es wurden erfolgreiche Anwendungen des Verfahrens in der Objekterkennung, Gesichtserkennung, Stereoanalyse und dem Objekttracking demonstriert und damit die Grundlagen für die automatisierte Erkennung eines Satzes von Key Visuals geschaffen.

Projektbezogene Publikationen (Auswahl)

Binarising SIFT-Descriptors to Reduce the Curse of Dimensionality in Histogram-Based Object Recognition. In: D. Slezak, S. K. Pal, B.-H. Kang, J. Gu, H. Kurada (eds). Int. Symp. on Signal Processing, Image Processing and Pattern Recognition (SIP), Jeju Island, Korea, 10. –12. December 2009. Springer: Heidelberg, 2009. S. 320–327
M. Stommel, O. Herzog
SIFT-Based Object Recognition with Fast Alphabet Creation and Reduced Curse of Dimensionality. In D. Bailey (ed.), Int. Conf. on Image and Vision Computing New Zealand (IVCNZ), Wellington, New Zealand, Nov. 23–25, 2009, IEEE, 2009. S. 136-141
M. Stommel, O. Herzog
Learning of Face Components in Coherent and Disturbed Constellations. In A. Bainbridge-Smith and R. Green (eds.), Int. Conf. on Image and Vision Computing New Zealand (IVCNZ), Queenstown, New Zealand, Nov. 8 –9, 2010. IEEE, 2010. S. 1-8
M. Stommel und O. Herzog
Networks of Culture, Bd. 2 von The World Language of Key Visuals: Computer Sciences, Humanities, Social Sciences, hrsgg. von P. Ludes und O. Herzog. LIT Verlag: Münster. 2010
S. Kramer und P. Ludes (Hrsg.)
Algorithms of Power – Key Invisibles, Bd. 3 von The World Language of Key Visuals: Computer Sciences, Humanities, Social Sciences, hrsgg. von P. Ludes and O. Herzog .LIT Verlag: Münster. 2011
P. Ludes (Hrsg.)
Classification of Semantic Concepts to Support the Analysis of the Inter-Cultural Visual Repertoires of TV News Reviews. German Conf. on Artificial Intelligence (KI), Berlin, Germany, Oct. 4–7, 2011. Springer: Heidelberg, 2011. S. 325-329
M. Stommel, M. Duemcke, O. Herzog
Elemente internationaler Medienwissenschaften: Eine Einführung in innovative Konzepte. VS Verlag, 2011
P. Ludes
Interpreting motion events of pairs of moving objects. GeoInformatica, 15(2):247–271, 2011
B. Gottfried
Wide Range Face Pose Estimation by Modeling the 3D Arrangement of Robustly Detectable Sub-Parts. A. Berciano (Ed.), IAPR International Conference on Computer Analysis of Images and Patterns (CAIP), Seville (Spain), Aug. 29–31, 2011. Springer: Heidelberg, 2011. S. 237–244
T. Wiedemeyer, M. Stommel, O. Herzog
Schlüsselbilder und Schlüssel zu Unsichtbarem: Brasilianische, chinesische, deutsche und US-amerikanische Fernsehsichten, in: Joachim Knape, Anne Ulrich (Hrsg.): Fernsehbilder im Ausnahmezustand. Zur Rhetorik des Televisuellen in Krieg und Krise. Weidler: Berlin, 2012 (neue rhetorik 11). S. 65-96
P. Ludes
The Bitvector Machine: A Fast and Robust Machine Learning Algorithm for Non-linear Problems. In P. Flach et al. (eds.). Proc. Europ. Conf. on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD) 2012. Springer: Heidelberg, 2012. S. 175–190
S. Edelkamp, M. Stommel
Automatische, computergestützte Bilderkennung. In T. Petersen, C. Schwender (Hrsg.): Die Entschlüsselung der Bilder: Methoden der Visuellen Kommunikationsforschung. Herbert von Halem: Köln. S. 246–263
M. Stommel, J. Müller

Servicenavigation

Hauptnavigation

Automatische Identifikation und Klassifikation von Personen als Key-Visual-Kandidaten

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Servicenavigation

Hauptnavigation

Automatische Identifikation und Klassifikation von Personen als Key-Visual-Kandidaten

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Textvergrößerung und Kontrastanpassung