Project Details
Erweiterung einer Lexikalisch-Funktionalen Grammatik für ds Deutsche und Entwicklung einer Disambiguierungskomponente
Applicant
Professor Dr. Christian Rohrer (†)
Subject Area
General and Comparative Linguistics, Experimental Linguistics, Typology, Non-European Languages
Term
from 2004 to 2007
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5431662
Am Institut für Maschinelle Sprachverarbeitung ist in Projekten des SFB 340 und des TFB 32 eine Grammatik entstanden, mit der auf deutschem Zeitungstext eine Abdeckung von rund 70% erreicht wird. Ziel des beantragten Vorhabens ist es, (1) die Abdeckung durch die Erweiterung von Grammatik und Lexikon und mittels der Einbindung von Partial-Parsing-Techniken auf 95% zu steigern und (2) die Grammatik mit einem Disambiguierungsmodul auszustatten, das aus den oft sehr zahlreichen von der rein symbolischen Grammatik gelieferten Analyse die n wahrscheinlichsten ermittelt. Dies erlaubt dann die syntaktische Annotation von Corpora mit mehreren zig oder hundert Millionen Wörtern. Beide Teilvorhaben werden corpusbasiert sein. [...] Es werden drei Typen von Ergebnissen aus dem Projekt erwartet: verbesserte Grammatikressourcen, analysiertes und klassifiziertes Textmaterial als Ressource für die Grammatikentwicklung, sowie methodische Einsichten in Fragen der Grammatikabdeckung und der Interaktion zwischen Grammatik und Lexikon.
DFG Programme
Research Grants