Project Details
Projekt Print View

Mehrschichtige Analyse und Strukturierung von Musiksignalen

Subject Area Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term from 2011 to 2016
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 190606912
 
Final Report Year 2015

Final Report Abstract

Die automatische Strukturanalyse - die Zerlegung einer gegebenen Audioaufnahme in zeitliche Segmente und die Gruppierung dieser Segmente in musikalisch sinnvolle Kategorien - stellt eines der zentralen Probleme des Music Information Retrieval dar. Aufgrund verschiedener Strukturierungsprinzipien wie zeitliche Reihenfolge, Wiederholungen, kontrastierende Elemente, Variationen und Homogenität ist das Auffinden der musikalischen Struktur eine herausfordernde und oftmals unzureichend spezifizierte Problemstellung. Das Kernziel des METRUM-Projekts war die Entwicklung innovativer Verfahren und Methoden zur automatischen Strukturierung von Musikaufnahmen. Im Gegensatz zu vielen der bisherigen Ansätzen sollten dabei Verfahren entwickelt werden, die unterschiedliche Strukturierungsaspekte simultan berücksichtigen. Im Folgenden wollen wir auf eine aus unserer Sicht sehr interessante, grundsätzliche Erkenntnis eingehen, die wir aus dem METRüM-Projekt gewonnen haben. Die algorithmischen Hauptergebnisse basieren von einer abstrakten Ebene aus gesehen alle auf einer Kombination oder simultanen Betrachtung lokaler und globaler struktureller Aspekte. So wurden zum Beispiel neuartige Strukturmerkmale, die globale Struktureigenschaften des Musiksignals erfassen, mit lokal operierenden Novelty-Berechnungen kombiniert. Weiterhin wurde ein Optimierungsverfahren zur wiederholungsbasierten Strukturanalyse vorgestellt, das lokale Operationen (Pfadextraktion) und globale Aspekte (Transitivität, Segment-Gruppierung) durch eine simultane Optimierung berücksichtigt. Schließlich wurden bei der Konvertierung von Pfad- zu Blockstrukturen global wirkende Eigenwertzerlegungen von Selbstähnlichkeitsmatrizen verwendet, um lokale Pfad- und Blockstrukturen in Relation zu setzten. Dieser Ansatz steht in enger Verbindung mit graphentheoretischen Algorithmen zur Berechnung von Zusammenhangskomponenten. Insgesamt haben wir im METRUM-Projekt festgestellt, dass man durch die simultane Betrachtung globaler und lokaler Eigenschaften vergleichsweise robuste Verfahren erhält, die auch beim Vorliegen von erheblichen musikalischen Variabilitäten noch sinnvolle Strukturanalyseergebnisse erzielen können. Neben diesen algorithmisch-konzeptionellen Einsichten wurden im METRUM-Projekt viele neuartige Ideen für Visualisierungskonzepte zur intuitiv erfassbaren Darstellung struktureller Eigenschaften entwickelt. Diese Visualisierungskonzepte haben sich häufig direkt aus den abstrakten, den Algorithmen zugrundliegenden Datenstrukturen ergeben. Eine weitere für unsere Arbeit wichtige Erkenntnis ist, dass solche Visualisierungen nicht nur tiefere Einblicke in die Arbeitsweisen der Algorithmen und der zugrundeliegenden Daten liefern, sondern auch den Brückenschlag zu Anwendungen in anderen nicht-technischen Disziplinen wie den Musikwissenschaften erheblich erleichtern. In dieser Richtung sehen wir sehr viel Potential für interdisziplinäre Kooperationen im Bereich der Digital Humanities.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung