Project Details
Projekt Print View

Project: Scribe identification from historic music scores; subproject: Document-server of music scores: Storage and retrieval

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 2003 to 2006
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5396392
 
Final Report Year 2006

Final Report Abstract

Wenn es um den Erhalt unseres kulturellen Erbes geht, ist bislang immer nur von Aspekten der Digitalisierung von historischem Material und der Bereitstellung für ein breites Publikum die Rede. Das "Verständlichmachen" dieser Inhalte für den Computer, so dass dieser in der Lage ist, bei der Suche in großen Datenbeständen zu helfen und Anfragen schnell und bequem zu beantworten, steckt noch in den Kinderschuhen. Das interdisziplinäre Projekt "eNoteHistory" versuchte diesen Anforderungen gerecht zu werden. Hier wurden Anwendungen mit Hilfe von Datenbanken für eine auf dem Inhalt basierende Recherche in historischen Notenhandschriften entworfen. Kern dieses Projekts war die Entwicklung von Indizierungs- und Retrieval-Techniken für verschiedenste Datentypen wie beispielsweise Texte und Bilder. Eine der großen Herausforderungen für die Musikwissenschaft ist die Zuordnung von Notenhandschriften zu ihren ursprünglichen Schreibern. Die Frage nach dem wann, wo und für wen die Noten zu Papier gebracht wurden, steht in engem Zusammenhang mit der eigentlichen Komposition. Durch den Vorgang des Abschreibens der Notenblätter brachte der Schreiber bewusst oder unbewusst eine eigene Komponente ein. Anhand der individuellen Handschrift lässt sich ein Schreiber identifizieren. Auch das verwendete Papier, die Tinte und das Wasserzeichen verraten weitere Einzelheiten. Für die informative und interaktive Benutzung, beispielsweise über das World Wide Web, wurden historische Notendokumente im Rahmen einer Digitalen Bibliothek an der Universität Rostock bereitgestellt. Dazu wurde ein digitales Archiv entworfen, das die Notenhandschriften, die zugehörigen bibliographischen Metadaten sowie die Merkmale der jeweiligen Schreiber verwalten kann. Die benötigten Schreibererkennungswerkzeuge wurden auf Basis musikwissenschaftlichen Expertenwissens und Methoden der Bildverarbeitung entwickelt und in die Datenbankumgebung des digitalen Archivs integriert. Eine digitale Notenhandschrift besteht aus mehreren, verschiedenen Datentypen. Nach der Erschließung erhält man zum einen digitale Bilder der gescannten Seiten einer Notenhandschrift und zum anderen Texte aus Bibliothekskatalogen. Die Textdaten bestehen i.d.R. aus strukturierten Merkmalen wie Signatur, Name des Komponisten etc. und unstrukturierten Daten wie Papierbeschreibung, Konkordanz etc. Bei der manuellen, musikwissenschaftlichen Handschriftenanalyse wird aus jedem Blatt eine Art "Fingerabdruck" des wahrscheinlichsten Schreibers erstellt, bei dem bestimmte als relevant eingestufte Merkmale berücksichtigt werden. Man nimmt hierbei an, dass jeder Schreiber eine ganz individuelle Handschrift besaß. Bis zu 13 verschiedene Merkmale zur Einordnung der Notenhandschrift werden dabei berücksichtigt, darunter die Schriftneigung, die Form der Notenköpfe und die Form der Fähnchen, welche die Schrift eines Schreibers repräsentieren. Um eine unbekannte Notenhandschrift zu analysieren, sind so viele Merkmale wie möglich zu bestimmen. Für jedes Merkmal ist einem Pfad in der Baumstruktur zu folgen, bis am Ende Beispiele in Form von Bildern repräsentiert werden. Hier wird das dem Merkmal des Notenblattes ähnlichste Beispiel ausgewählt. Bewertungsskalen und Data Mining Verfahren werden für den Vergleich zweier Handschriften benutzt. Als Ergebnis erhält man eine sortierte Liste von möglichen Schreibern. Neben diesen semi-automatischen Analysen der Notenhandschriften wurde ein zweiter Ansatz zur automatischen Handschriftenanalyse zusammen mit dem Projektpartner Fraunhofer-Institut realisiert. Ziel dieses Ansatzes war es, die Merkmale der Notenhandschrift durch Bildverarbeitungsalgorithmen zu extrahieren. Hierfür wurden Verfahren für die Implementation von Datenbankerweiterungen für das inhaltsbasierte Retrieval von Bildern eingesetzt. Diese Erweiterungen ermöglichen die Indexierung komplexer Datenstrukturen der extrahierten Merkmale in der Datenbank, sowie die Integration von Methoden zur Bildanalyse. Für die Schreiberidentifikation auf der Basis von automatisch extrahierten Merkmalen wurden Data Mining Verfahren auch mit Hilfe von Datenbankerweiterungen implementiert. Der so realisierte Ansatz zur automatischen Schreiberidentifikation ermöglicht eine schnellere Ermittlung der vermutlichen Schreiber. Was der Nutzer zu tun hat, ist nur ein Bild eines gescannten Notenhandschriftenblatts mit Hilfe der webbasierten Nutzerschnittstelle der Datenbanbank zu verschicken. Das Bild wird in der Datenbank analysiert und mit den Data Mining Verfahren - in diesem Fall ein Entscheidungsbaum - als Ergebnis eine Liste mit vermutlichen Schreibern zurückgeliefert. Die Integration solcher spezialisierter Archive in heutigen Digitalen Bibliotheken ist auch eine aktuelle Herausforderung für die Forschung. Hierzu wurden im Projekt Konzepte für die Abbildung der Datenstrukturen und Zugriffsmethoden spezialisierter Archivsysteme vorgeschlagen. Dies geschieht auf der Basis der Datenmodelle und Nutzerschnittstellen der Digitalen Bibliotheken.

Publications

  • Andreas Heuer, Temenushka Ignatova: Datenbanken und Bildverarbeitung im Dienste der Musikforschung und des Kulturerbes. In: Landestechnologieanzeiger, S. 7, Ausgabe 2, 2005.

 
 

Additional Information

Textvergrößerung und Kontrastanpassung