Detailseite
Offenes Argument-Mining
Antragstellerinnen / Antragsteller
Professorin Dr. Iryna Gurevych; Professor Dr. Steffen Staab
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2018 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 413534432
Politische Debatten enthalten so viele Argumente, dass fundierte Entscheidungen die kognitiven Fähigkeiten der interessierten Öffentlichkeit oder der verantwortlichen Experten überschreiten. Neue Argumente werden kontinuierlich eingebracht (Herausforderung C1), sind oft unvollständig (C2) und zum Verständnis wird Wissen über Fakten und frühere Argumente benötigt (C3).Projektziel ist es, Algorithmen zu entwickeln, die i) ihre Fähigkeit, Argumente in laufenden Debatten zu erkennen, kontinuierlich verbessern, ii) unvollständige Argumente mit früheren Argumenten und automatisch erworbenem Hintergrundwissen verbinden und iii) semantische Wissensbasen ständig um Informationen erweitern, die zum Verständnis von Argumenten erforderlich sind.Um diese Ziele zu erreichen, verfolgen wir einen interdisziplinären Ansatz, der die Forschungsgebiete Argument Mining und Knowledge Graph Construction kombiniert und deren Methoden erweitert. Um mit Konzeptverschiebungen in laufenden Debatten umzugehen, werden wir Argumentextraktionsmethoden mit wissensbasierten, lebenslangen Lernansätzen voran treiben.Wir werden neue neuronale Architekturen zum Lernen von Argumentationsmerkmalen und der Beziehung zum Diskussionsthema entwickeln, semantisches Wissen in neuronale Netzwerke integrieren und Selbsttraining nutzen, um Trainingsdaten kontinuierlich zu erweitern. Zum Umgang mit unvollständigen Argumenten werden sie mit bekannten Argumenten und Hintergrundwissen verknüpft. Wir verbinden die Entitäten in Argumenten mit Hintergrundwissen, indem wir Linkfindung und Schlüsselwortsuche kombinieren. Dieses Wissen wird in inkrementelle Methoden zur Gruppierung ähnlicher Argumente in Cluster einfließen. Argumentative Relationen zwischen Clustern werden durch überwachtes Lernen ermittelt. Um das erforderliche Hintergrundwissen automatisch zu erwerben, planen wir moderne Wissensbasen mit enzyklopädischen und allgemeinemWissen (Babelnet und ConceptNet) undzielgerichteter Wissensextraktion aus unstrukturierten Webkorpora (Common Crawl) zu kombinieren. Wir werden existierende Wissenseinbettungstechniken zu inkrementellen Verfahren modifizieren, um Hintergrundwissen in kontinuierliche Lernmodelle zu integrieren. Weiterer Schwerpunkt ist die Entwicklung neuer Annotationsschemata und Benchmark-Korpora, um unsere Methoden über Themen, Texttypen und unterschiedliche Zeitstempel hinweg zu evaluieren.Das Ergebnis werden neuartige Methoden sein, um einen Offenen Argumentationsgraphen zu erhalten, der Gruppen ähnlicher Argumente mit Hintergrundwissen verbindet und mit argumentativen Relationen verknüpft. Um eine breite Abdeckung von Argumentationsstilen zu gewährleisten werden wir unsere Methoden auf verschiedene Themen anwenden, die häufig in Online-Nachrichten und Twitter-Nachrichten diskutiert werden, und sowohl Evaluationen mit annotierten Golddaten als auch Post-Hoc-Auswertungen durchführen.
DFG-Verfahren
Sachbeihilfen