Project Details
Invariante Merkmale für die automatische Spracherkennung
Applicant
Professor Dr.-Ing. Alfred Mertins
Subject Area
Electronic Semiconductors, Components and Circuits, Integrated Systems, Sensor Technology, Theoretical Electrical Engineering
Term
from 2007 to 2011
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 36043764
Die Leistungsfähigkeit heutiger Spracherkennungssysteme liegt trotz großer Anstrengungen noch weit hinter der des Menschen. Dies gilt insbesondere dann, wenn ungünstige akustische Bedingungen herrschen oder wenn große Variationen innerhalb der Gruppe der betrachteten Sprecher vorliegen. Als Gründe sind hierbei die noch unzureichenden Methoden der robusten Merkmalsextraktion, der Adaptation, der Modellierung von Spracheinheiten und der Modellierung von Dialekten und Aussprachevariationen zu nennen. Die Schwächen liegen sowohl in der Behandlung extrinsischer Variabilitäten (Nachhall, Störungen, Mikrofon) als auch im Umgang mit intrinsischen Sprach-Variabilitäten wie Sprecher, Alter, Geschlecht, Vokaltraktdimension, Akzent/Dialekt, Sprechgeschwindigkeit und emotionaler Zustand. Das vorliegende Forschungsvorhaben soll sich insbesondere mit denjenigen Variabilitäten in Sprachsignalen befassen, die auf unterschiedliche Vokaltraktlängen der Sprecher zurückzuführen sind. Ziel ist es dabei, die Erkennungsleistung und Robustheit der automatischen Spracherkennung in sprecherunabhängigen Erkennungsaufgaben deutlich zu erhöhen und dabei ebenfalls eine Robustheit gegenüber extrinsischen Einflüssen zu erzielen. Erreicht werden soll das Ziel durch die Entwicklung und Optimierung spezieller Methoden zur Invariantengewinnung.
DFG Programme
Research Grants