Modeling the lexical-semantic relations of collocations (MoCo)
Final Report Abstract
Im Projekt Modellierung lexikalisch-semantischer Beziehungen von Kollokationen (MoKo) wurden umfangreiche lexikografische und korpusbasierte Untersuchungen von Adjektiv-Nomen Kollokationen für einen ausgewählten Teilbereich des deutschen Wortschatzes durchgeführt. Das Forschungsprojekt ist eine Zusammenarbeit des Zentrums Sprache der BBAW und des Seminars für Sprachwissenschaft der Universität Tübingen. Das Projekt besteht aus vier Phasen: In der ersten Projektphase wurde der Begriff Kollokation im Projekt definiert. Kollokationen sind Mehrwortausdrücke, die aus einer Basis (Nomen) und einem Kollokator (Adjektiv) bestehen. Die Bedeutung des Kollokators ist nicht-transparent: in Verbindung mit dem jeweiligen Nomen entspricht die Bedeutung des Adjektivs nicht der ersten wörtlichen Bedeutung des DWDS-Wörterbuchs. Als nächstes wurde ein Goldstandard Datensatz GerCo (German Collocations) für Adjektiv-Nomen Paare des Deutschen erstellt. Dafür wurde zuerst ein Standard für die Bewertung von Adjektiv-Nomen-Verbindungen hinsichtlich ihres Kollokationsstatus‘ erarbeitet. Die mit Hilfe des DWDS-Wortprofils ermittelten Kollokationskandidaten wurden manuell annotiert. Parallel dazu wurde an der BBAW in Berlin ein statistisches Tool entwickelt, das den Wortprofil-Service mit der semantischen Ontologie LexikoNet verbindet. Damit lässt sich die Produktivität der Basiswörter in den verschiedenen semantischen Klassen statistisch darstellen. In der letzten Projektphase wurden verschiedene und laut Arbeitshypothese komplementäre theoretischen Ansätze miteinander verglichen. Ursprünglich hätten nur die Meaning-Text Theory und die Theorie des Generativen Lexikons untersucht werden sollen. Im Laufe des Projektes wurde festgestellt, dass diese zwei Theorien nicht ausreichend sind. Daher wurden zwei zusätzliche Ansätze hinzugezogen: Fillmores Frame-Semantik und Hundnurscher & Splett‘s semantische Klassifikation für Adjektive des Deutschen. Durch eine Synthese dieser vier Theorien ist es gelungen, ein Inventar von semantischen Relationen für der Adjektiv-Nomen Paare im Deutschen zu erarbeiten. Schließlich wurde das Klassifikationsschema auf den GerCo-Datensatz erfolgreich angewendet und die Ergebnisse evaluiert. Die Analyse zeigt, dass es Relationen gibt, die typisch für Kollokationen sind (z.B. Intensität), aber manchmal werden auch die weniger typischen Bedeutung (z.B. Dimension) kollokativ ausgedrückt. Das entwickelte Klassifikationsschema ist auf Kollokationen und auf freie Wortverbindungen gleichermaßen anwendbar.
Publications
- (2019). Semantic modelling of adjective-noun collocations using FrameNet. In: Proceedings of the Joint Workshop on Multiword Expressions and WordNet (MWE-WN 2019), S. 104–113, Florenz, Italien. Association for Computational Linguistics
Strakatova, Yana und Hinrichs, Erhard
- (2020). All That Glitters is Not Gold: A Gold Standard of Adjective-Noun Collocations for German. In: Proceedings of the 12th Language Resources and Evaluation Conference. Mai 2020, S. 4368-4378. European Language Resources Association
Strakatova, Yana und Falk, Neele und Fuhrmann, Isabel und Hinrichs, Erhard und Rossmann, Daniela