Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem
Seiten
2003
|
1., Aufl.
w.e.b. (Hersteller)
978-3-935712-80-4 (ISBN)
w.e.b. (Hersteller)
978-3-935712-80-4 (ISBN)
- Titel ist leider vergriffen;
keine Neuauflage - Artikel merken
Die vorliegende Arbeit gibt zunächst einen Überblick über verschiedene prosodische Modelle, die in Sprachsynthesesystemen zur Prosodiegenerierung verwendet werden. Anschließend wird das prosodische Modell beschrieben, das im multilingualen Sprachsynthesesystem PAPAGENO eingesetzt wird. In diesem Modell werden perzeptive prosodische Marker eingesetzt, die anschließend zur Grundfrequenz-, Lautdauer- und Lautenergiegenerierung verwendet werden.
Der Schwerpunkt der Arbeit liegt auf der datenbasierten Generierung der perzeptiven prosodischen Marker. Dabei werden speziell an die Erfordernisse angepaßte neuronale Netzwerkarchitekturen eingesetzt, mit denen eine hohe Vorhersagegenauigkeit für die Marker erreicht wird. Neben der hohen Vorhersagegenauigkeit wird auch eine hohe Qualität bei der Vorhersage erreicht, was anhand einer umfangreichen qualitativen Auswertung gezeigt wird. Die beschriebenen Verfahren werden zur datenbasierten Generierung prosodischer Marker für drei Sprachen angewendet. Die guten Ergebnisse für alle drei untersuchten Sprachen sprechen dafür, daß die Verfahren für weitere Sprachen (multilingual) erfolgreich eingesetzt werden können.
Der Schwerpunkt der Arbeit liegt auf der datenbasierten Generierung der perzeptiven prosodischen Marker. Dabei werden speziell an die Erfordernisse angepaßte neuronale Netzwerkarchitekturen eingesetzt, mit denen eine hohe Vorhersagegenauigkeit für die Marker erreicht wird. Neben der hohen Vorhersagegenauigkeit wird auch eine hohe Qualität bei der Vorhersage erreicht, was anhand einer umfangreichen qualitativen Auswertung gezeigt wird. Die beschriebenen Verfahren werden zur datenbasierten Generierung prosodischer Marker für drei Sprachen angewendet. Die guten Ergebnisse für alle drei untersuchten Sprachen sprechen dafür, daß die Verfahren für weitere Sprachen (multilingual) erfolgreich eingesetzt werden können.
Achim F. Müller, geboren 1973, studierte von 1993 bis 1998 Elektrotechnik und Informationstechnik an der TU München und der École Nationale Supérieure de Techniques Avancées (ENSTA, Paris). Anschließend arbeitete er drei Jahre in der Zentralabteilung Technik (Corporate Technology) der Siemens AG in München an der Entwicklung eines multilingualen datengetriebenen Sprachsynthesesystems mit. In dieser Zeit entstanden die Arbeiten zu der vorliegenden Dissertation. Achim F. Müller arbeitet seit Mai 2002 in der Patentanwaltskanzlei Müller, Hoffmann und Partner in München.
Reihe/Serie | Studientexte zur Sprachkommunikation ; 27 |
---|---|
Zusatzinfo | zahlr. Abb. u. Taf. |
Sprache | deutsch |
Maße | 170 x 240 mm |
Einbandart | kartoniert |
Themenwelt | Technik ► Elektrotechnik / Energietechnik |
Schlagworte | HC/Technik/Elektronik, Elektrotechnik, Nachrichtentechnik • Prosodie • Sprachanalyse • Sprachsynthese |
ISBN-10 | 3-935712-80-4 / 3935712804 |
ISBN-13 | 978-3-935712-80-4 / 9783935712804 |
Zustand | Neuware |
Haben Sie eine Frage zum Produkt? |
Mehr entdecken
aus dem Bereich
aus dem Bereich
Grundlagen der Feldtheorie - Praxis der Feldmesstechnik
(2023)
Hüthig (Hersteller)
CHF 88,10