Reference Corpus of German Inscriptions
Final Report Abstract
Zielsetzung des Projekts bestand in der Erfassung und Aufbereitung für sprachwissenschaftliche Analysen mittels Präeditierung, Lemmatisierung und morphologischer Annotation aller deutschsprachigen Inschriften bis 1650, die im Rahmen des Akademievorhabens Deutsche Inschriften (DI) gesammelt, ediert und größtenteils bereits digitalisiert wurden. Dazu wurden die Inschriften, die bereits als digitale Datensätze vorlagen, an die gemeinsamen Standards der Referenzkorpusprojekte zu historischen Sprachstufen angepasst und in die Datenbank CorA zur morphologischen Annotation eingelesen. Einige Bände, die von Deutsche Inschriften online (DIO) in absehbarer Zeit nicht nicht digitalisiert werden, wurden manuell transkribiert, kollationiert und dann ebenfalls an die Standard der Referenzkorpusprojekte angepasst. Dazu wurden u.a. alle verfügbaren Abbildungen von Inschriften in Augenschein genommen und die bereits vorhandenen Editionen abgeglichen. Alle aufgenommenen Inschriften wurden außerdem mit ausführlichen Metadaten versehen, die sich sämtlich als Abfragekriterien für die Korpusrecherche eignen. Auf diese Weise konnten 49 Bände aufbereitet und in CorA automatisch vorannotiert werden. 7 Bände sind endkorrigiert und können nach Konvertierung in das dafür benötigte Format in die Abfragedatenbank ANNIS hochgeladen werden. Inschriften, die im Referenzkorpusprojekt ‚Deutsche Inschriften‘ aufgrund von Datierung, Sprache oder Zustand keine Aufnahme fanden, wurden dennoch mit einem „kleinen“ Header versehen mit dem Ziel, die Sprache jeder Inschrift festzuhalten. Alle aufgenommenen Inschriften haben zudem in einem umfangreichen Header eine ganze Reihe von Metadaten erhalten. Beide Header werden zusätzlich zum annotierten Material der Internetpräsenz DIO zur Verfügung gestellt. Der ursprüngliche Zeitplan, das Material im Rahmen eines sehr kleingeschnittenen Projekts vollständig zu bearbeiten, erwies sich als zu eng kalkuliert, da sich einige Sachverhalte als weitaus schwieriger und zeitaufwändiger gestalteten als wir dies vermutet hatten, dazu gehören etwa die manuelle Erfassung von mehr Inschriftenbänden als ursprünglich angenommen sowie ein zeitaufwändiger, aber aus Sicht der Datenqualität unerlässlicher Abbildungsabgleich. Nach Abschluss des Projekts wird das Material für zahlreiche sprachgeschichtliche Auswertungen (von graphischen bis zu syntaktischen Untersuchungen) und kulturhistorische Studien (Verteilung bestimmter Formen, Träger, Quellbereiche etc.) zur Verfügung stehen. Das Projekt ‚Referenzkorpus Deutsche Inschriften‘ ergänzt damit die bereits weit gediehenen Projekte zu den verschiedenen Referenzkorpora um eine bisher sprachwissenschaftlich nicht erforschte Textsorte, die zudem für einen großen Zeit- und Sprachraum vollständig erfasst wird (von den Anfängen bis 1650). Da das Akademievorhaben ‚Deutsche Inschriften‘ bis 2030 geplant ist, ist die mittel- bis langfristige Sicherung und Pflege des Materials sichergestellt.
Publications
- ‚Referenzkorpus Deutsche Inschriften‘ – Chancen und Grenzen der Auswertung. In: PerspektivWechsel oder: Die Wiederentdeckung der Philologie. Bd. 1: Sprachdaten und Grundlagenforschung in der Historischen Linguistik. Hrsg. von Sarah Kwekkeboom und Sandra Waldenberger. Berlin 2016, S. 27–41
Herbers, Birgit
- (2017): Die älteste datierte Inschrift in deutscher Sprache. In: ZfdA 146, Heft 1, S. 41–53
Kroiß, Daniel