Detailseite
Anaphernresolution für die Zusammenfassung gesprochener Dialoge (DIANA Summ)
Antragsteller
Professor Dr. Michael Strube
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2004 bis 2008
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5424319
Die automatische Zusammenfassung gesprochener Dialoge ist ein relativ neues Forschungsgebiet der Computerlinguistik. Existierende Ansätze sind methodisch stark an der Zusammenfassung von geschriebenen Texten orientiert. Sie lassen wichtige Besonderheiten spontan-sprachlicher Dialoge, insbesondere die signifikant höhere Anzahl an Pronomen, außer acht. Es ist zu erwarten, daß die Resolution von Pronomen eine signifikante Verbesserung sowohl für die Erstellung einer Zusammenfassung durch automatische Selektion relevanter Äußerungen als auch für ihre Lesbarkeit bewirkt. Im vorliegenden Projekt soll der Beitrag einer Anaphernresolutionskomponente für die automatische Dialogzusammenfassung untersucht werden. Dazu soll eine solche Komponente entwickelt, in ein weitgehend aus Standardkomponenten bestehendes und auf Selektion relevanter Äußerungen basierendes Zusammenfassungssystem integriert und anschließend ihr Beitrag evaluiert werden. Sowohl für die Anaphernresolutionskomponente als auch für das Zusammenfassungssystem sollen dabei quantitative, auf maschinellem Lernen (Machine Learning, (ML)) basierende Verfahren zum Einsatz kommen. Neben größerer Robustheit haben diese Verfahren den Vorteil, weitgehend domänenunabhängig und damit einfach auf andere Einsatzbereiche übertragbar zu sein. Am Ende des Projekts soll ein praktisch einsetzbares, um Anaphernresolution ergänztes Zusammenfassungssystem für gesprochene Dialoge stehen, das einen ersten Schritt zur automatischen Erzeugung von Gesprächsprotokollen darstellt.
DFG-Verfahren
Sachbeihilfen