Ausnutzung zeitlicher Redundanzen der cepstralen Sprachmerkmale
Details
In der automatischen Spracherkennung hat sich ein statistischer Modellierungsansatz auf der Basis von Markovmodellen (HMMs) etabliert. Das Ziel der vorliegenden Arbeit ist die Berücksichtigung statistischer Abhängigkeiten zwischen den Sprachmerkmalen verschiedener Sprachrahmen innerhalb dieses statistischen Spracherkennungsansatzes. Bei der Merkmalsentstörung können Inter-Frame Korrelationen ausgenutzt werden, indem die Dynamik der cepstralen Sprachmerkmale mit schaltenden, linearen Dynamikmodellen (SLDMs) beschrieben wird. Zur Modellierung des Rauschens wird ein neues Zustandsmodell eingeführt, für das Expectation-Maximization-(EM-) Algorithmen zur Parameterschätzung hergeleitet werden. Im Back-End des Spracherkenners werden die statistischen Abhängigkeiten zwischen den Sprachmerkmalen auf der Ebene der Mischungskomponenten des HMMs approximiert. Ein weiterer Schwerpunkt der Untersuchungen ist der Austausch von Informationen zwischen der Stufe der Merkmalsentstörung und der Erkennung. In einem mehrstufigen Erkennungsansatz werden Informationen aus dem Erkenner bei der Merkmalsentstörung der jeweils nächsten Erkennungsstufe ausgenutzt.
Autorentext
Stefan Windmann wurde 1980 in Bielefeld geboren. Von 1999 bis2004 studierte er Elektrotechnik und Ing.-Informatik an derUniversität Paderborn. Zwischen 2005 und 2008 promovierte er imBereich der automatischen Spracherkennung. Seit 2008 ist er inder automatischen Bildverbesserung tätig.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09783838108292
- Sprache Deutsch
- Größe H220mm x B150mm x T13mm
- Jahr 2009
- EAN 9783838108292
- Format Kartonierter Einband
- ISBN 978-3-8381-0829-2
- Veröffentlichung 18.06.2009
- Titel Ausnutzung zeitlicher Redundanzen der cepstralen Sprachmerkmale
- Autor Stefan Windmann
- Untertitel Methoden zur geruschrobusten Spracherkennung
- Gewicht 304g
- Herausgeber Südwestdeutscher Verlag für Hochschulschriften
- Anzahl Seiten 192
- Genre Bau- & Umwelttechnik