Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Glättung von F0-Konturen in Text-To-Speech Systemen
Details
Ein wesentlicher Bestandteil für das Verständnis und die Deutung einer Äußerung in einem lautsprachlichen Kommunikationsprozess ist die vom Sprecher produzierte Sprachmelodie. Mit ihrer Hilfe kann der vermittelte Inhalt unterstützt und linguistisch verdeutlicht werden. Für die Mensch-Maschine-Kommunikation und im Speziellen für die künstliche Sprachsynthese ist es eine besondere Herausforderung, diesen Prozess auf möglichst adäquate Weise nachzubilden. Wesentlich für den Natürlichkeitseindruck ist neben der Steuerung der Sprachmelodie vor allem die Beseitigung von Störungen und Fehlern im sprachmelodischen Verlauf einer künstlichen Äußerung. In Sprachsynthesesystemen, die auf Konkatenation kleinerer Segmente zu größeren Einheiten zurückgreifen, liegen derartige Störungen der Sprachmelodie besonders an den Verknüpfungsstellen der Sprachbausteine vor. In der vorliegenden Arbeit soll daher der folgende Punkt untersucht werden: Kann eine nachträgliche Glättung der Grundfrequenzkontur in synthetisierten Äußerungen und damit die Reduzierung von Störungen innerhalb sprachmelodischer Abläufe perzeptiv relevante Verbesserungen liefern und welche Methoden führen zu den besten Ergebnissen.
Autorentext
1982 Geboren in Gummersbach - Studium der Phonetik, Computerlinguistik und Philosophie an der Rheinischen Friedrich-Wilhelms-Universität Bonn - Seit Februar 2009 berufstätig im sprachtechnologischen Bereich
Klappentext
Ein wesentlicher Bestandteil für das Verständnis und die Deutung einer Äußerung in einem lautsprachlichen Kommunikationsprozess ist die vom Sprecher produzierte Sprachmelodie. Mit ihrer Hilfe kann der vermittelte Inhalt unterstützt und linguistisch verdeutlicht werden. Für die Mensch-Maschine-Kommunikation und im Speziellen für die künstliche Sprachsynthese ist es eine besondere Herausforderung, diesen Prozess auf möglichst adäquate Weise nachzubilden. Wesentlich für den Natürlichkeitseindruck ist neben der Steuerung der Sprachmelodie vor allem die Beseitigung von Störungen und Fehlern im sprachmelodischen Verlauf einer künstlichen Äußerung. In Sprachsynthesesystemen, die auf Konkatenation kleinerer Segmente zu größeren Einheiten zurückgreifen, liegen derartige Störungen der Sprachmelodie besonders an den Verknüpfungsstellen der Sprachbausteine vor. In der vorliegenden Arbeit soll daher der folgende Punkt untersucht werden: Kann eine nachträgliche Glättung der Grundfrequenzkontur in synthetisierten Äußerungen und damit die Reduzierung von Störungen innerhalb sprachmelodischer Abläufe perzeptiv relevante Verbesserungen liefern und welche Methoden führen zu den besten Ergebnissen.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09783639260298
- Genre Kommunikationswissenschaft
- Anzahl Seiten 96
- Herausgeber VDM Verlag
- Größe H220mm x B150mm x T6mm
- Jahr 2010
- EAN 9783639260298
- Format Kartonierter Einband (Kt)
- ISBN 978-3-639-26029-8
- Titel Glättung von F0-Konturen in Text-To-Speech Systemen
- Autor Anne Schönwandt
- Untertitel Evaluation verschiedener Interpolationsmethoden zur Glättung von Grundfrequenzkonturen im Hinblick auf akustische Akzeptanz
- Gewicht 159g
- Sprache Deutsch