Detailseite
Künstliche Erweiterung der Bandbreite von Sprachsignalen mittels phonetischer Transkription
Antragsteller
Professor Dr.-Ing. Tim Fingscheidt
Fachliche Zuordnung
Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung
Förderung von 2008 bis 2010
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 72435333
Geplant ist die Entwicklung von Algorithmen zur Verbesserung von Sprachsignalen, die außer dem eigentlichen Sprachsignal synchron vorliegende phonetische Transkriptionen (Symbole zur Aussprache) nutzen. Auf dieser Grundlage sind neuartige Ansätze zur künstlichen Erweiterung der Sprachbandbreite von Schmalbandsprache (Bandbreite 300 ... 3400 Hz) auf Breitbandsprache (50 Hz ... 7000 Hz) mit hoher Qualität denkbar.Sprachtelefonie mit Breitbandsprache wird in naher Zukunft eine deutlich verbesserte Sprachqualität und Verständlichkeit bieten - vorausgesetzt, beide Kommunikationspartner verfügen über ein breitbandfähiges Endgerät. Telefonbasierte Sprachdialogsysteme könnten dann ebenfalls Breitbandsprache verarbeiten und eine höhere Worterkennungsrate verzeichnen - vorausgesetzt, aufwendige breitbandige Telefon-Sprachdatensammlungen zum Training der Spracherkenner werden durchgeführt.Ziel des Vorhabens ist es daher,• dass auch Anrufe von einem Schmalband-Telefon bei einem breitband-fähigen Empfänger mit verbesserter Qualität/Verständlichkeit dargeboten werden (Mensch zu Mensch),• dass Sprachdialogsysteme auf Basis bereits vorhandener Schmalband-Telefonsprachdaten für die neue Breitband-Sprachtelefonie mit verbesserter Worterkennungsrate trainiert werden können (Mensch zu Computer).Für die erste Anwendung (Sprachtelefonie) müssen geeignete Phonemklassen in Echtzeit geschätzt werden, während die phonetischen Transkriptionen bei der zweiten Anwendung in den schmalbandigen Telefon-Sprachdatenbasen bereits vollständig vorhanden sind.
DFG-Verfahren
Sachbeihilfen