Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Zuverlässige Sprechererkennungs-systeme
Details
In den letzten Jahren hat die Sprechererkennung zwar großes Potenzial gezeigt, ihre breite Einführung wurde jedoch durch eine suboptimale Leistung behindert, die durch geringe Genauigkeit und Zuverlässigkeitsprobleme gekennzeichnet war. Die Bewältigung dieser Herausforderungen ist jedoch unerlässlich, um die Möglichkeiten der biometrischen Stimmerkennung voll auszuschöpfen, da Umfragen eine Präferenz für biometrische Stimmerkennung zeigen. In Situationen, in denen eine biometrische Fernauthentifizierung von Sprechern eingesetzt wird, ist die Aufrechterhaltung der Integrität der extrahierten Cepstrum-Merkmalsvektoren bei Vorhandensein von Kanalrauschen von größter Bedeutung. Um die Genauigkeit der Sprechererkennung in Fernanwendungen zu verbessern, wird ein neuartiger Ansatz vorgeschlagen, bei dem Low-Density-Parity-Check-Codes (LDPC-Codes) und Polarcodes sowohl für die Speicherung als auch für die Übertragung der aus Sprachproben abgeleiteten Mel-Frequenz-Cepstrum-Koeffizienten (MFCC) verwendet werden. Es werden vier vorgeschlagene und implementierte Methoden beschrieben, die zu niedrigeren Bitfehlerraten über verrauschte Kanäle sowie zu einer hohen Genauigkeitsrate für Fernsprecherkennungssysteme führen. Dieses Buch schließt mit dem Vorschlag, LDPC- und Polarcodierung als integralen Bestandteil der Fernsprecherkennung als Teil eines multimodalen biometrischen Authentifizierungssystems zu verwenden.
Autorentext
Nilashree Madakath, Ph.D. vom VJTI, Universität Mumbai (2024), derzeit als Dozentin am Fr. C. R. I. T, Vashi, Mumbai, Indien, tätig.Sushama Wagh, Ph.D. von der University of Western Australia (2012), Forschungsstipendiatin an der Tufts University, Boston (2015), Gastwissenschaftlerin am SLAC, USA (2022) und derzeit Dozentin am VJTI, Mumbai, Indien.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786202200813
- Sprache Deutsch
- Genre Sonstige Technikbücher
- Größe H220mm x B150mm x T8mm
- Jahr 2025
- EAN 9786202200813
- Format Kartonierter Einband
- ISBN 978-620-2-20081-3
- Veröffentlichung 18.09.2025
- Titel Zuverlässige Sprechererkennungs-systeme
- Autor Nilashree Madakath , Sushama Wagh
- Untertitel Eine vergleichende Genauigkeitsanalyse mit LDPC- und Polar-Codes
- Gewicht 191g
- Herausgeber Verlag Unser Wissen
- Anzahl Seiten 116