Detailseite
Hooray - Evaluation der Leistungsgrenzen eines am Kopf getragenen Mikrofon-Arrays für auf Deep Learning basierende dynamische akustische Szenenanalyse
Antragsteller
Professor Dr. Jürgen Peissig
Fachliche Zuordnung
Akustik
Förderung
Förderung seit 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 517437545
Ziel des Projekts ist die Beantwortung der Frage, ob kopfgetragene Mikrofonarrays mit KI-Signalverarbeitung den aktuellen Stand der Technik bezüglich dynamischer Schallszenenanalyse die der bisher eingesetzten Beamforming-Technologien in Hörgeräten oder Telefon-Headsets übertreffen können. Darüber hinaus wollen wir untersuchen, welcher Leistungsgewinn bei der Verwendung von bis zu 16 um den Kopf verteilten Mikrofonen in Kombination mit Deep-Learning- Modellen zu erwarten ist. Es soll dabei eingegangen werden sowohl auf die Verallgemeinerung auf beliebige Szenarien und Räume als auch auf die Einflüsse dynamischer Parameter wie zeitvarianter Kopfbewegungen unter kontrollierten Bedingungen bei verschiedenen akustischen Szenenkomplexitäten. Dem neuronalen Netz sollen dabei sowohl die dynamisch variierten akustischen Signale als auch die dynamische Kopfposition zu Verfügung stehen. Neben der Bewertung der Modellleistung hinsichtlich Genauigkeit und Verallgemeinerbarkeit mittels klassischer Metriken, wollen wir die Modelle auch mit Interpretierbarkeitsverfahren für neuronale Netze analysieren, um ein tieferes Verständnis der Entscheidungsfindung zu gewinnen. Einerseits werden wir die Plausibilität der Deep-Learning-Modelle untersuchen, indem wir bekannte akustische Parameter und deren Einfluss auf das Lokalisierungsergebnis identifizieren. Andererseits werden wir versuchen, neue dynamische Parameter zu identifizieren, die für ein gutes Lokalisierungsergebnis entscheidend sind und in bestehende klassische Lokalisierungsmodelle aufgenommen werden könnten.
DFG-Verfahren
Sachbeihilfen