Detailseite
Argumentationsanalyse für das Web
Antragstellerinnen / Antragsteller
Professorin Dr. Iryna Gurevych; Professor Dr. Benno Stein
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2016 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 289260690
"Argumentation Mining" ist die automatische Identifikation von Argumenten und ihren Beziehungen in natürlichsprachlichem Text. Bislang wird dies nur auf kleinen Korpora durchgeführt. Das beantragte Projekt widmet sich der Herausforderung, Argumentation Mining im großen Maßstab auf dem World Wide Web erfolgreich einsetzen zu können. Ziel ist, die Grundlagen für Algorithmen zu schaffen, die (1) robust vielfältige Formen von Web-Argumentation verarbeiten, (2) effizient die Größe des Webs nutzen und (3) effektiv wichtige Qualitätsaspekte von Web-Argumentation erfassen, indem sie Argumentation Mining durch eine Argumentationsanalyse ergänzen.Die Motivation unseres Vorhabens ist offensichtlich: Für viele Entscheidungen vergleichen Menschen Argumente, etwa beim Produktkauf oder bei der Meinungsbildung über politische Kontroversen. Während die ergiebigste und aktuellste Quelle für Argumente das Web ist, bleibt eine Websuche nach Argumenten aufwendig; viele Texte sind durchzuarbeiten, um relevante Argumente und ihre Beziehungen zu identifizieren. State-of-the-Art-Forschung behandelt die Identifikation innerhalb eingegrenzter Domänen (etwa in juristischen Texten), sie reicht aber nicht aus, um erfolgreich Web-Argumentation zu verarbeiten.Das Web beinhaltet zahlreiche Formen von Text mit sowohl monologischer Argumentation (wie subjektive News-Artikel) als auch dialogischer Argumentation (wie Diskussionen unter den Artikeln). Existierende Mining-Ansätze basieren auf theoretischen Argumentationsmodellen, die diese Vielfalt nicht erfassen. Die Ansätze benötigen manuell annotierte Texte, die sich nicht ansatzweise für alle Domänen erstellen lassen. Auch wird die Argumentationsqualität bislang vernachlässigt; gerade im Web schwanken Aspekte wie Klarheit, Kohärenz und das Vorhandensein von Fehlschlüssen stark.Im Vorhaben werden theoretische Modelle weiterentwickelt, um sie auf gängige Web-Argumentationsformen anwenden zu können. Davon ausgehend ist geplant, annotierte Korpora mit argumentativen Web-Texten in fünfstelliger Anzahl zu erstellen. Der Annotationsaufwand soll durch Techniken wie Distant Supervision und Games-with-a-Purpose bewältigt werden. Die Korpora dienen der Entwicklung und Evaluierung innovativer Algorithmen, um Web-Argumentation zu verarbeiten und Muster darin zu lernen, die messbare Qualitätsaspekte beeinflussen. Der Vielfalt des Webs wird mit Verfahren der Domänenanpassung begegnet. Die Größe der Korpora erfordert effiziente Ansätze, birgt aber die Chance, neue statistische Einsichten über Argumentation im Allgemeinen zu gewinnen.Wir erwarten Erkenntnisse über typische, gute und schlechte Argumentationsweisen von Menschen im Web, welche die Kluft zwischen Theorie und praktischer Verwendung von Argumentation verringern. Die geplanten Korpora werden dauerhaften Wert für die gesamte Argumentationsforschung haben; in den Modellen und Algorithmen sehen wir darüber hinaus das Potential, die zukünftige Websuche zu prägen.
DFG-Verfahren
Sachbeihilfen