Vergleich des Einusses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen

CHF 35.60
Auf Lager
SKU
1CUT16NUE36
Stock 1 Verfügbar
Geliefert zwischen Mo., 09.02.2026 und Di., 10.02.2026

Details

Sprachsynthese (Text-to-Speech, TTS) bezeichnet die computergestützte Umwandlung von Text in Sprache, wobei Verständlichkeit und Natürlichkeit zentrale Qualitätskriterien sind. Neuronale Ansätze haben die Sprachqualität in den letzten Jahren deutlich verbessert, ermöglichen jedoch bislang keine präzise Kontrolle der Lautdauer auf Phonemebene. Diese Arbeit untersucht, ob ein neuronales TTS-System bereits während des Trainings explizit lernen sollte, die Lautdauer auf Phonemebene zu steuern, oder ob ein rein implizites Lernen aus umfangreichen Sprachdaten ausreicht. Hierfür wurde ein bestehendes TTS-System erweitert, um mithilfe automatischer Lautdauerannotation explizit zu lernen. Dazu erfolgten eine phonemische Transkription der Aufnahmen, die zeitliche Ausrichtung sowie die Einteilung der Lautdauern in vier Quantile. Eine subjektive Evaluation über Amazon Mechanical Turk zeigte, dass der explizite Ansatz für Englisch die Natürlichkeit bei gleichbleibender Verständlichkeit hochsignifikant verbesserte. Objektive Messungen stützten die qualitative Überlegenheit des expliziten Ansatzes. Eine ergänzende Nebenstudie belegte zudem, dass mit beiden Ansätzen auch für Mandarin eine natürliche und verständliche Sprache erzeugt werden konnte. Die Methode erhöht die Steuerbarkeit und Natürlichkeit neuronaler Sprachsynthese und eröffnet neue Möglichkeiten für die linguistische Forschung.

Weitere Informationen

  • Allgemeine Informationen
    • GTIN 09783961002870
    • Genre Informatik & EDV
    • Lesemotiv Verstehen
    • Anzahl Seiten 468
    • Herausgeber Universitätsverlag Chemnitz
    • Größe H27mm x B148mm x T210mm
    • EAN 9783961002870
    • Titel Vergleich des Einusses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen
    • Autor Stefan Taubert
    • Gewicht 673g

Bewertungen

Schreiben Sie eine Bewertung
Nur registrierte Benutzer können Bewertungen schreiben. Bitte loggen Sie sich ein oder erstellen Sie ein Konto.
Made with ♥ in Switzerland | ©2025 Avento by Gametime AG
Gametime AG | Hohlstrasse 216 | 8004 Zürich | Schweiz | UID: CHE-112.967.470
Kundenservice: customerservice@avento.shop | Tel: +41 44 248 38 38