Detailseite
Erweiterung einer Lexikalisch-Funktionalen Grammatik für ds Deutsche und Entwicklung einer Disambiguierungskomponente
Antragsteller
Professor Dr. Christian Rohrer (†)
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2004 bis 2007
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5431662
Am Institut für Maschinelle Sprachverarbeitung ist in Projekten des SFB 340 und des TFB 32 eine Grammatik entstanden, mit der auf deutschem Zeitungstext eine Abdeckung von rund 70% erreicht wird. Ziel des beantragten Vorhabens ist es, (1) die Abdeckung durch die Erweiterung von Grammatik und Lexikon und mittels der Einbindung von Partial-Parsing-Techniken auf 95% zu steigern und (2) die Grammatik mit einem Disambiguierungsmodul auszustatten, das aus den oft sehr zahlreichen von der rein symbolischen Grammatik gelieferten Analyse die n wahrscheinlichsten ermittelt. Dies erlaubt dann die syntaktische Annotation von Corpora mit mehreren zig oder hundert Millionen Wörtern. Beide Teilvorhaben werden corpusbasiert sein. [...] Es werden drei Typen von Ergebnissen aus dem Projekt erwartet: verbesserte Grammatikressourcen, analysiertes und klassifiziertes Textmaterial als Ressource für die Grammatikentwicklung, sowie methodische Einsichten in Fragen der Grammatikabdeckung und der Interaktion zwischen Grammatik und Lexikon.
DFG-Verfahren
Sachbeihilfen