Detailseite
Projekt Druckansicht

Einstieg in die Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR-D) als Projektpartner

Antragsteller Dr. Rainer Stotzka
Förderung Förderung von 2017 bis 2019
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 390834936
 
Die Deutsche Forschungsgemeinschaft hat zum 06.05.2015 die Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren der Optical Character Recognition, im Folgenden OCR-D genannt, bewilligt. Der vorliegende Antrag bezieht sich auf die Eingliederung des Antragstellers in dieses Projekt.Die Ausrichtung des Koordinierungsprojekts hat sich seit der Ausschreibungsphase der DFG im Frühjahr 2014 fortentwickelt. Daher hat die Gutachtergruppe empfohlen, die notwendige Zusammenführung der Modulprojektergebnisse zu einem Workflow - diese für das Projekt zentralen Aufgaben - bereits zeitlich vor den anderen Modulprojekten anzugehen. Durch die damit erfolgte Verlagerung werden neue Kenntnisse und Fähigkeiten gebraucht, die im Ursprungsantrag nicht ausreichend berücksichtigt wurden.Der hier beantragte Bedarf ergänzt die Kompetenz von OCR-D im Bereich Softwaretechnologie mit den Zielen, die technische Realisierbarkeit der aus den OCR-D Modulprojekten erstellten Workflows und die Interoperabilität der Modulprojektergebnisse sicherzustellen. Intention ist die Unterstützung der Partner aus OCR-D bei der Erreichung der beschriebenen Ziele, insbesondere bei der Betreuung der ausgeschriebenen Modulprojekte gemäß der Ausschreibung Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke und der Integration der Modulergebnisse.Es wird ein OCR-D-Framework erstellt, mit dem die in den Modulprojekten und in den Arbeitspaketen des Koordinierungsprojekts OCR-D erstellten Software-Werkzeuge und Ergebnisse einsetzbar sind und zusammenwirken können. Im Wesentlichen wird das Framework aus einer Workflow Engine und einem OCR-Forschungsdatenrepositorium bestehen. Die OCR-Ergebnisse werden anschließend zur Veröffentlichung vorbereitet und der Langzeitarchivierung zugeführt.
DFG-Verfahren Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung