Zum Hauptinhalt springen
Nicht aus der Schweiz? Besuchen Sie lehmanns.de
Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning - Jakob Behnke

Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning

(Autor)

Buch | Softcover
XIII, 87 Seiten
2026
Springer Fachmedien Wiesbaden GmbH (Verlag)
978-3-658-50047-4 (ISBN)
CHF 97,95 inkl. MwSt
  • Noch nicht erschienen - erscheint am 17.01.2026
  • Versandkostenfrei
  • Auch auf Rechnung
  • Artikel merken

In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.

Jakob Behnke hat seinen Master of Science in Informatik an der Universität zu Lübeck erfolgreich abgeschlossen. Während seines Studiums arbeitete er in der Arbeitsgruppe Ambient Computing am Institut für Telematik.

 

Einleitung.- Grundlagen.- Störempfindlichkeitsanalyse.- Optimierung.- Fazit.

Erscheinungsdatum
Reihe/Serie BestMasters
Zusatzinfo XIII, 87 S. 21 Abb.
Verlagsort Wiesbaden
Sprache deutsch
Maße 148 x 210 mm
Themenwelt Informatik Theorie / Studium Künstliche Intelligenz / Robotik
Mathematik / Informatik Mathematik Angewandte Mathematik
Technik
Schlagworte ambient computing • Automatic speech recognition • Geräuschtypen • Störgeräusche • Transkript-Fehlerrate
ISBN-10 3-658-50047-6 / 3658500476
ISBN-13 978-3-658-50047-4 / 9783658500474
Zustand Neuware
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich
Eine kurze Geschichte der Informationsnetzwerke von der Steinzeit bis …

von Yuval Noah Harari

Buch | Hardcover (2024)
Penguin (Verlag)
CHF 39,95
die materielle Wahrheit hinter den neuen Datenimperien

von Kate Crawford

Buch | Hardcover (2024)
C.H.Beck (Verlag)
CHF 44,75