Detailseite
Projekt Druckansicht

Referenzkorpus Mittelhochdeutsch (1050-1350)

Fachliche Zuordnung Angewandte Sprachwissenschaften, Computerlinguistik
Förderung Förderung von 2009 bis 2017
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 89085660
 
Im Rahmen des Projektes soll ein Referenzkorpus für die mittelhochdeutsche Sprachstufe im Rahmen des Korpus historischer Texte des Deutschen (Deutsch Diachron Digital = DDD) bereitgestellt werden, in dem die hochdeutschen Sprachdenkmäler von ca. 1050 bis 1200 weitestgehend vollständig und von ca. 1200 bis 1350 in strukturierter Auswahl zusammengefasst und für eine breite Nutzergemeinde verfügbar gemacht werden. Ziel ist es, eine hinlänglich umfangreiche, verlässliche und handschriftengetreue Datenbasis des Mittelhochdeutschen (1050-1350) zu schaffen, die historiolinguistische und mediävistische Recherchen in einem Maße erlaubt, das weit über das bisher Mögliche hinausgeht. Dieses Ziel soll auf drei Wegen erreicht werden: 1. Vollständige Digitalisierung und grammatische Erschließung der überlieferten Textzeugen der älteren mittelhochdeutschen Zeit bis zum Ende des 12. Jahrhunderts; 2. Anpassung aller bereits vorliegenden linguistisch tief annotierten mhd. Texte an einen erweiterten und modifizierten, mit dem Projekt „Referenzkorpus Altdeutsch“ gemeinsamen STTS-basierten Annotationsstandard; zusammen mit den neu zu annotierenden frühmittelhochdeutschen Texten Konvertierung in das XML-Standoff-Format PAULA und Verfügbarmachen über die linguistische Datenbank ANNIS; 3. Komplette Digitalisierung und Annotation bislang nur ausschnitthaft digitalisierter Texte (und damit Verbesserung der Grundlage zur Untersuchung syntaktischer Strukturen – z.B. eingebettete Sätze – im Mittelhochdeutschen). Insgesamt wird das Referenzkorpus nach der ersten Projektphase etwa 210 mhd. Texte von annähernd 2 Mio. Wortformen enthalten.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung