Project Details
Künstliche Erweiterung der Bandbreite von Sprachsignalen mittels phonetischer Transkription
Applicant
Professor Dr.-Ing. Tim Fingscheidt
Subject Area
Electronic Semiconductors, Components and Circuits, Integrated Systems, Sensor Technology, Theoretical Electrical Engineering
Term
from 2008 to 2010
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 72435333
Geplant ist die Entwicklung von Algorithmen zur Verbesserung von Sprachsignalen, die außer dem eigentlichen Sprachsignal synchron vorliegende phonetische Transkriptionen (Symbole zur Aussprache) nutzen. Auf dieser Grundlage sind neuartige Ansätze zur künstlichen Erweiterung der Sprachbandbreite von Schmalbandsprache (Bandbreite 300 ... 3400 Hz) auf Breitbandsprache (50 Hz ... 7000 Hz) mit hoher Qualität denkbar.Sprachtelefonie mit Breitbandsprache wird in naher Zukunft eine deutlich verbesserte Sprachqualität und Verständlichkeit bieten - vorausgesetzt, beide Kommunikationspartner verfügen über ein breitbandfähiges Endgerät. Telefonbasierte Sprachdialogsysteme könnten dann ebenfalls Breitbandsprache verarbeiten und eine höhere Worterkennungsrate verzeichnen - vorausgesetzt, aufwendige breitbandige Telefon-Sprachdatensammlungen zum Training der Spracherkenner werden durchgeführt.Ziel des Vorhabens ist es daher,• dass auch Anrufe von einem Schmalband-Telefon bei einem breitband-fähigen Empfänger mit verbesserter Qualität/Verständlichkeit dargeboten werden (Mensch zu Mensch),• dass Sprachdialogsysteme auf Basis bereits vorhandener Schmalband-Telefonsprachdaten für die neue Breitband-Sprachtelefonie mit verbesserter Worterkennungsrate trainiert werden können (Mensch zu Computer).Für die erste Anwendung (Sprachtelefonie) müssen geeignete Phonemklassen in Echtzeit geschätzt werden, während die phonetischen Transkriptionen bei der zweiten Anwendung in den schmalbandigen Telefon-Sprachdatenbasen bereits vollständig vorhanden sind.
DFG Programme
Research Grants