Detailseite
Projekt Druckansicht

Invariante Merkmale für die automatische Spracherkennung

Fachliche Zuordnung Elektronische Halbleiter, Bauelemente und Schaltungen, Integrierte Systeme, Sensorik, Theoretische Elektrotechnik
Förderung Förderung von 2007 bis 2011
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 36043764
 
Die Leistungsfähigkeit heutiger Spracherkennungssysteme liegt trotz großer Anstrengungen noch weit hinter der des Menschen. Dies gilt insbesondere dann, wenn ungünstige akustische Bedingungen herrschen oder wenn große Variationen innerhalb der Gruppe der betrachteten Sprecher vorliegen. Als Gründe sind hierbei die noch unzureichenden Methoden der robusten Merkmalsextraktion, der Adaptation, der Modellierung von Spracheinheiten und der Modellierung von Dialekten und Aussprachevariationen zu nennen. Die Schwächen liegen sowohl in der Behandlung extrinsischer Variabilitäten (Nachhall, Störungen, Mikrofon) als auch im Umgang mit intrinsischen Sprach-Variabilitäten wie Sprecher, Alter, Geschlecht, Vokaltraktdimension, Akzent/Dialekt, Sprechgeschwindigkeit und emotionaler Zustand. Das vorliegende Forschungsvorhaben soll sich insbesondere mit denjenigen Variabilitäten in Sprachsignalen befassen, die auf unterschiedliche Vokaltraktlängen der Sprecher zurückzuführen sind. Ziel ist es dabei, die Erkennungsleistung und Robustheit der automatischen Spracherkennung in sprecherunabhängigen Erkennungsaufgaben deutlich zu erhöhen und dabei ebenfalls eine Robustheit gegenüber extrinsischen Einflüssen zu erzielen. Erreicht werden soll das Ziel durch die Entwicklung und Optimierung spezieller Methoden zur Invariantengewinnung.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung