Detailseite
Projekt Druckansicht

Anaphernresolution für die Zusammenfassung gesprochener Dialoge (DIANA Summ)

Fachliche Zuordnung Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung Förderung von 2004 bis 2008
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5424319
 
Die automatische Zusammenfassung gesprochener Dialoge ist ein relativ neues Forschungsgebiet der Computerlinguistik. Existierende Ansätze sind methodisch stark an der Zusammenfassung von geschriebenen Texten orientiert. Sie lassen wichtige Besonderheiten spontan-sprachlicher Dialoge, insbesondere die signifikant höhere Anzahl an Pronomen, außer acht. Es ist zu erwarten, daß die Resolution von Pronomen eine signifikante Verbesserung sowohl für die Erstellung einer Zusammenfassung durch automatische Selektion relevanter Äußerungen als auch für ihre Lesbarkeit bewirkt. Im vorliegenden Projekt soll der Beitrag einer Anaphernresolutionskomponente für die automatische Dialogzusammenfassung untersucht werden. Dazu soll eine solche Komponente entwickelt, in ein weitgehend aus Standardkomponenten bestehendes und auf Selektion relevanter Äußerungen basierendes Zusammenfassungssystem integriert und anschließend ihr Beitrag evaluiert werden. Sowohl für die Anaphernresolutionskomponente als auch für das Zusammenfassungssystem sollen dabei quantitative, auf maschinellem Lernen (Machine Learning, (ML)) basierende Verfahren zum Einsatz kommen. Neben größerer Robustheit haben diese Verfahren den Vorteil, weitgehend domänenunabhängig und damit einfach auf andere Einsatzbereiche übertragbar zu sein. Am Ende des Projekts soll ein praktisch einsetzbares, um Anaphernresolution ergänztes Zusammenfassungssystem für gesprochene Dialoge stehen, das einen ersten Schritt zur automatischen Erzeugung von Gesprächsprotokollen darstellt.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung