Project Details
Projekt Print View

Referenzkorpus Mittelhochdeutsch (1050-1350)

Subject Area Applied Linguistics, Computational Linguistics
Term from 2009 to 2017
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 89085660
 
Im Rahmen des Projektes soll ein Referenzkorpus für die mittelhochdeutsche Sprachstufe im Rahmen des Korpus historischer Texte des Deutschen (Deutsch Diachron Digital = DDD) bereitgestellt werden, in dem die hochdeutschen Sprachdenkmäler von ca. 1050 bis 1200 weitestgehend vollständig und von ca. 1200 bis 1350 in strukturierter Auswahl zusammengefasst und für eine breite Nutzergemeinde verfügbar gemacht werden. Ziel ist es, eine hinlänglich umfangreiche, verlässliche und handschriftengetreue Datenbasis des Mittelhochdeutschen (1050-1350) zu schaffen, die historiolinguistische und mediävistische Recherchen in einem Maße erlaubt, das weit über das bisher Mögliche hinausgeht. Dieses Ziel soll auf drei Wegen erreicht werden: 1. Vollständige Digitalisierung und grammatische Erschließung der überlieferten Textzeugen der älteren mittelhochdeutschen Zeit bis zum Ende des 12. Jahrhunderts; 2. Anpassung aller bereits vorliegenden linguistisch tief annotierten mhd. Texte an einen erweiterten und modifizierten, mit dem Projekt „Referenzkorpus Altdeutsch“ gemeinsamen STTS-basierten Annotationsstandard; zusammen mit den neu zu annotierenden frühmittelhochdeutschen Texten Konvertierung in das XML-Standoff-Format PAULA und Verfügbarmachen über die linguistische Datenbank ANNIS; 3. Komplette Digitalisierung und Annotation bislang nur ausschnitthaft digitalisierter Texte (und damit Verbesserung der Grundlage zur Untersuchung syntaktischer Strukturen – z.B. eingebettete Sätze – im Mittelhochdeutschen). Insgesamt wird das Referenzkorpus nach der ersten Projektphase etwa 210 mhd. Texte von annähernd 2 Mio. Wortformen enthalten.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung