Project Details
Projekt Print View

Speech representation - A literary and linguistic corpus study

Subject Area General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
German Literary and Cultural Studies (Modern German Literature)
Term from 2016 to 2021
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 322751860
 
Final Report Year 2020

Final Report Abstract

Das Projekt beschäftigte sich mit der empirischen Erforschung von Redewiedergabeformen im Deutschen. Im Fokus standen die Typen direkte (Er sagte: „Ich habe Hunger.“), indirekte (Er sagte, er habe Hunger.), freie indirekte (Er war ratlos. Wo sollte er jetzt nur etwas zu essen finden?) und erzählte Wiedergabe (Sie sprachen über das Mittagessen.). Es wurden zwei Hauptergebnisse erarbeitet, die der Forschungsgemeinschaft frei zur Verfügung gestellt werden: 1. Aufwendig manuell nach Redewiedergabeformen annotierte Sprachdaten (Zeitraum: 1840-1920; fiktionale und nicht-fiktionale Texte): a. Kernkorpus „Redewiedergabe“: ca. 490.000 Tokens; Textmaterial balanciert nach Dekaden und fiktional vs. nicht-fiktional; Konsensannotation erstellt auf Grundlage von zwei unabhängigen Annotationen b. Zusatzmaterial: ca. 3 Millionen Tokens zusätzlich annotiertes Material, z.T. mit vereinfachtem Annotationssystem und semi-automatisch 2. Automatische Erkenner, beruhend auf DeepLearning, für vier Typen von Redewiedergabe (direkte, indirekte, erzählte und freie indirekte Wiedergabe) Das umfangreiche Korpus-Material kann zum einen für quantitative Studien zu Redewiedergabeformen – auch im diachronen Verlauf und im Kontrast fiktional vs. nicht-fiktional – verwendet werden. Zum anderen kann es auch als Trainingsmaterial für maschinelles Lernen für die weitere Entwicklung von automatischen Redewiedergabe-Erkennern dienen, die die im Projekt selbst bereits entwickelte Erkenner ergänzen. Die Erkenner können zur automatischen Markierung von Redewiedergabetypen in deutschen Texten verwendet werden, um so quantitative Studien an großen Textmengen zu ermöglichen. Sie wurden während des Projektverlaufs in einer quantitativen Studie zur Verwendung von Redewiedergabeformen in Heftromanen vs. Hochliteratur erfolgreich zur ersten Anwendung gebracht.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung