Detailseite
Algorithmische Korpus-basierte Ansätze zum typologischen Vergleich komplexer Sätze
Antragsteller
Professor Dr. Michael Cysouw; Professor Dr. Uwe Quasthoff
Fachliche Zuordnung
Angewandte Sprachwissenschaften, Computerlinguistik
Förderung
Förderung von 2011 bis 2016
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 199869892
Es gibt eine Vielzahl von Forschungsarbeiten, in denen linguistische Korpora verwendetwerden, um die Strukturen einzelner Sprachen zu untersuchen; dagegen gibt es nur sehrwenige Studien, in denen linguistische Strukturen sprachübergreifend auf korpuslinguistischerGrundlage untersucht werden. Dieses Projekt widmet sich der Entwicklung quantitativerund korpusbasierter Methoden zur Analyse sprachlicher Strukturen aus typologischerbzw. sprachvergleichender Perspektive. Dabei gehen wir davon aus, dass sich eine guteAnnäherung an die Strukturen einzelner Sprachen mit Hilfe von generellen algorithmischenVerfahren erreichen lässt. Die Ziele des Projekts lassen sich in drei Punkten zusammenfassen:Ersten werden wir Korpora zu wenig erforschten Sprachen mit computerlinguistischenVerfahren so weit aufarbeiten, dass sie für einen typologischen Sprachvergleich zur Verfügungstehen. Da die so aufgearbeiteten Korpora nicht annotiert sind, werden wir ergänzendmit parallelen Korpora arbeiten, die für uns einen Ausgangspunkt bilden, um die nichtannotiertenKorpora mit automatischen Verfahren zu untersuchen. Zweitens wird dieses Projektbestehende Algorithmen benutzen und neue Algorithmen entwickeln, um die von unserstellten Korpora zu annotieren und um einschlägige Statistiken für die automatische Bestimmungtypologischer Parameter komplexer Sätze aus den Korpora zu extrahieren.Schließlich soll in der zweiten Projektphase der Forschergruppe untersucht werden, wie vielsprachliches Wissen zu einzelnen Sprachen erforderlich ist, um einen typologischen Parameterzu bestimmen.
DFG-Verfahren
Sachbeihilfen