Automatische Identifikation und Klassifikation von Personen als Key-Visual-Kandidaten
Zusammenfassung der Projektergebnisse
Obwohl das Format der Fernsehjahresrückblicke sowohl qualitativ als auch quantitativ über verschiedene Medienkulturen hinweg ausdifferenziert ist, konnte die Stabilität des Auftretens bestimmter nationaler, trans-kultureller und globaler Schlüsselbilder gezeigt werden. An den thematischen Schwerpunkten der Jahresrückblicke in den USA und Deutschland im vergangenen Jahrzehnt zeigen sich historische Machtdarstellungsunterschiede sowie die begrenzte Wahrnehmung internationaler Beziehungspartner. So war Deutschland für das 20. Jahrhundert im Fokus der US-Rückblicke – im vergangenen Jahrzehnt hingegen der Irak. Die berücksichtigten chinesischen Fernsehjahresrückblicke zeigen, wie sehr die USA als Gegenüber wahrgenommen werden. Differenzierte Analysen nach Ländern, Jahren, Genre und Akteurstypen wurden durchgeführt; denn erst eine mit Text- und Statistikauswertungen gleich berechtigte Konzentration auf visuelle Daten kann sonst unterbelichtete Perspektiven eines neuen Strukturwandels der Öffentlichkeit erhellen und hierdurch lassen sich nicht in Worte übersetzbare Semantiken als Schlüssel zu sonst unsichtbar bleibenden sozialen Figurationen und Prozessen erschließen. Die unterschiedlichen Darstellungshäufigkeiten von Staatsoberhäuptern zu einfachen Leuten z. B. in den von uns untersuchten Fernsehjahresrückblicken aus Brasilien, China, Deutschland und den USA, hier nur für 2008 bis 2010, sind signifikant, für Deutschland 1:4,6, die USA 1:2,2, Brasilien 1:2,3 und China 1:20,0. Damit sind die brasilianischen, deutschen und US-amerikanischen Machtpräsentationen wesentlich ähnlicher untereinander als mit China. Um die Analysen durchführen zu können, wurden Werkzeuge zur manuellen und automatischen Videoannotation erstellt. Die Software erlaubt den Datenexport zu Statistikwerkzeugen für weitere Analysen. Automatisierte Übereinstimmungstests anhand der Messung von Krippendorffs Alpha zwischen verschiedenen Annotationen lassen auf die Verlässlichkeit des Datenmaterials schließen. Die Annotation wurde durch automatische Verfahren zur Erkennung von Schnittgrenzen, Gesichtern und verschiedenen Arten von Schlüsselbildern unterstützt. Hierzu wurde ein Gesichtsdetektor entwickelt, der nicht nur frontale, sondern auch stark seitliche Ansichten erkennt. Eine effiziente Merkmalsdarstellung wurde entwickelt, welche einen schnellen und numerisch stabilen Vergleich visueller Muster erlaubt, welcher nicht durch die Hochdimensionalität der Vektordarstellungen beeinträchtigt ist. Es wurden erfolgreiche Anwendungen des Verfahrens in der Objekterkennung, Gesichtserkennung, Stereoanalyse und dem Objekttracking demonstriert und damit die Grundlagen für die automatisierte Erkennung eines Satzes von Key Visuals geschaffen.
Projektbezogene Publikationen (Auswahl)
-
Binarising SIFT-Descriptors to Reduce the Curse of Dimensionality in Histogram-Based Object Recognition. In: D. Slezak, S. K. Pal, B.-H. Kang, J. Gu, H. Kurada (eds). Int. Symp. on Signal Processing, Image Processing and Pattern Recognition (SIP), Jeju Island, Korea, 10. –12. December 2009. Springer: Heidelberg, 2009. S. 320–327
M. Stommel, O. Herzog
-
SIFT-Based Object Recognition with Fast Alphabet Creation and Reduced Curse of Dimensionality. In D. Bailey (ed.), Int. Conf. on Image and Vision Computing New Zealand (IVCNZ), Wellington, New Zealand, Nov. 23–25, 2009, IEEE, 2009. S. 136-141
M. Stommel, O. Herzog
-
Learning of Face Components in Coherent and Disturbed Constellations. In A. Bainbridge-Smith and R. Green (eds.), Int. Conf. on Image and Vision Computing New Zealand (IVCNZ), Queenstown, New Zealand, Nov. 8 –9, 2010. IEEE, 2010. S. 1-8
M. Stommel und O. Herzog
-
Networks of Culture, Bd. 2 von The World Language of Key Visuals: Computer Sciences, Humanities, Social Sciences, hrsgg. von P. Ludes und O. Herzog. LIT Verlag: Münster. 2010
S. Kramer und P. Ludes (Hrsg.)
-
Algorithms of Power – Key Invisibles, Bd. 3 von The World Language of Key Visuals: Computer Sciences, Humanities, Social Sciences, hrsgg. von P. Ludes and O. Herzog .LIT Verlag: Münster. 2011
P. Ludes (Hrsg.)
-
Classification of Semantic Concepts to Support the Analysis of the Inter-Cultural Visual Repertoires of TV News Reviews. German Conf. on Artificial Intelligence (KI), Berlin, Germany, Oct. 4–7, 2011. Springer: Heidelberg, 2011. S. 325-329
M. Stommel, M. Duemcke, O. Herzog
-
Elemente internationaler Medienwissenschaften: Eine Einführung in innovative Konzepte. VS Verlag, 2011
P. Ludes
-
Interpreting motion events of pairs of moving objects. GeoInformatica, 15(2):247–271, 2011
B. Gottfried
-
Wide Range Face Pose Estimation by Modeling the 3D Arrangement of Robustly Detectable Sub-Parts. A. Berciano (Ed.), IAPR International Conference on Computer Analysis of Images and Patterns (CAIP), Seville (Spain), Aug. 29–31, 2011. Springer: Heidelberg, 2011. S. 237–244
T. Wiedemeyer, M. Stommel, O. Herzog
-
Schlüsselbilder und Schlüssel zu Unsichtbarem: Brasilianische, chinesische, deutsche und US-amerikanische Fernsehsichten, in: Joachim Knape, Anne Ulrich (Hrsg.): Fernsehbilder im Ausnahmezustand. Zur Rhetorik des Televisuellen in Krieg und Krise. Weidler: Berlin, 2012 (neue rhetorik 11). S. 65-96
P. Ludes
-
The Bitvector Machine: A Fast and Robust Machine Learning Algorithm for Non-linear Problems. In P. Flach et al. (eds.). Proc. Europ. Conf. on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD) 2012. Springer: Heidelberg, 2012. S. 175–190
S. Edelkamp, M. Stommel
-
Automatische, computergestützte Bilderkennung. In T. Petersen, C. Schwender (Hrsg.): Die Entschlüsselung der Bilder: Methoden der Visuellen Kommunikationsforschung. Herbert von Halem: Köln. S. 246–263
M. Stommel, J. Müller