Detailseite
NN/FST - Unsupervised OCR-Postcorrection based on Neural Networks and Finite-state Transducers
Antragsteller
Professor Dr. Gerhard Heyer
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Softwaretechnik und Programmiersprachen
Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Softwaretechnik und Programmiersprachen
Förderung
Förderung von 2018 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 394341797
Im Projekt NN/FST sollen einsatzfähige Software-Lösungen für das Modul 3 Textoptimierung für das OCR-D Funktionsmodell entwickelt werden. Schwerpunkt der Entwicklungen liegen im Bereich 3.B (Nachkorrektur), wobei deren Einsatz im Zusammenhang mit verschiedenen aktuellen OCR-Systemen (Bereich 3.A) evaluiert wird. Als maßgebliche Technologien werden Neuronale Netze (NN) gemeinsam mit endlichen Transduktoren (FST) zur Dekodierung erkannter Textzeilen in einem Noisy-Channel-Modell eingesetzt.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)