Project Details
Projekt Print View

Invariante Merkmale für die automatische Spracherkennung

Subject Area Electronic Semiconductors, Components and Circuits, Integrated Systems, Sensor Technology, Theoretical Electrical Engineering
Term from 2007 to 2011
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 36043764
 
Die Leistungsfähigkeit heutiger Spracherkennungssysteme liegt trotz großer Anstrengungen noch weit hinter der des Menschen. Dies gilt insbesondere dann, wenn ungünstige akustische Bedingungen herrschen oder wenn große Variationen innerhalb der Gruppe der betrachteten Sprecher vorliegen. Als Gründe sind hierbei die noch unzureichenden Methoden der robusten Merkmalsextraktion, der Adaptation, der Modellierung von Spracheinheiten und der Modellierung von Dialekten und Aussprachevariationen zu nennen. Die Schwächen liegen sowohl in der Behandlung extrinsischer Variabilitäten (Nachhall, Störungen, Mikrofon) als auch im Umgang mit intrinsischen Sprach-Variabilitäten wie Sprecher, Alter, Geschlecht, Vokaltraktdimension, Akzent/Dialekt, Sprechgeschwindigkeit und emotionaler Zustand. Das vorliegende Forschungsvorhaben soll sich insbesondere mit denjenigen Variabilitäten in Sprachsignalen befassen, die auf unterschiedliche Vokaltraktlängen der Sprecher zurückzuführen sind. Ziel ist es dabei, die Erkennungsleistung und Robustheit der automatischen Spracherkennung in sprecherunabhängigen Erkennungsaufgaben deutlich zu erhöhen und dabei ebenfalls eine Robustheit gegenüber extrinsischen Einflüssen zu erzielen. Erreicht werden soll das Ziel durch die Entwicklung und Optimierung spezieller Methoden zur Invariantengewinnung.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung