Project Details
Projekt Print View

Künstliche Erweiterung der Bandbreite von Sprachsignalen mittels phonetischer Transkription

Subject Area Electronic Semiconductors, Components and Circuits, Integrated Systems, Sensor Technology, Theoretical Electrical Engineering
Term from 2008 to 2010
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 72435333
 
Geplant ist die Entwicklung von Algorithmen zur Verbesserung von Sprachsignalen, die außer dem eigentlichen Sprachsignal synchron vorliegende phonetische Transkriptionen (Symbole zur Aussprache) nutzen. Auf dieser Grundlage sind neuartige Ansätze zur künstlichen Erweiterung der Sprachbandbreite von Schmalbandsprache (Bandbreite 300 ... 3400 Hz) auf Breitbandsprache (50 Hz ... 7000 Hz) mit hoher Qualität denkbar.Sprachtelefonie mit Breitbandsprache wird in naher Zukunft eine deutlich verbesserte Sprachqualität und Verständlichkeit bieten - vorausgesetzt, beide Kommunikationspartner verfügen über ein breitbandfähiges Endgerät. Telefonbasierte Sprachdialogsysteme könnten dann ebenfalls Breitbandsprache verarbeiten und eine höhere Worterkennungsrate verzeichnen - vorausgesetzt, aufwendige breitbandige Telefon-Sprachdatensammlungen zum Training der Spracherkenner werden durchgeführt.Ziel des Vorhabens ist es daher,• dass auch Anrufe von einem Schmalband-Telefon bei einem breitband-fähigen Empfänger mit verbesserter Qualität/Verständlichkeit dargeboten werden (Mensch zu Mensch),• dass Sprachdialogsysteme auf Basis bereits vorhandener Schmalband-Telefonsprachdaten für die neue Breitband-Sprachtelefonie mit verbesserter Worterkennungsrate trainiert werden können (Mensch zu Computer).Für die erste Anwendung (Sprachtelefonie) müssen geeignete Phonemklassen in Echtzeit geschätzt werden, während die phonetischen Transkriptionen bei der zweiten Anwendung in den schmalbandigen Telefon-Sprachdatenbasen bereits vollständig vorhanden sind.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung