Zum Hauptinhalt springen
Nicht aus der Schweiz? Besuchen Sie lehmanns.de
Verstärkungslernen - Dr Satyanarayana S, N V Madhu Bindu

Verstärkungslernen

Buch | Softcover
144 Seiten
2023
Verlag Unser Wissen
978-620-6-40312-8 (ISBN)
CHF 96,45 inkl. MwSt
  • Keine Verlagsinformationen verfügbar
  • Artikel merken
Dieses Buch ist in fünf Einheiten gegliedert und bietet eine ganzheitliche Lernerfahrung. Die Reise beginnt mit einer Einführung in Bandit-Algorithmen, wobei Kernkonzepte wie die Algorithmen Upper Confidence Bound (UCB) und Probably Approximately Correct (PAC) erforscht werden. Die nächste Einheit führt in den vollständigen Rahmen des Reinforcement Learning (RL) ein und geht dabei über Bandit-Algorithmen hinaus, um Interaktionen zwischen Akteur und Umgebung über mehrere Zeitschritte zu berücksichtigen. Markov-Entscheidungsprozesse (MDPs) werden als grundlegender Rahmen für die Modellierung sequenzieller Entscheidungsaufgaben eingeführt. Die vierte Einheit befasst sich mit Methoden der dynamischen Programmierung, temporalen Differenzen (TD) und der Bellman-Optimalitätsgleichung in RL. Diese Konzepte ermöglichen es Agenten, ihre Aktionen effektiv zu planen, zu lernen und zu optimieren. Die letzte Einheit beschäftigt sich mit fortgeschrittenen RL-Techniken wie Eligibility Traces, Funktionsannäherung, Methoden der kleinsten Quadrate, Fitted Q-learning, Deep Q-Network (DQN) und Policy Gradient Algorithmen.

Dr. Satyanarayana S. ist ein angesehener Wissenschaftler, Professor, Algo-Handelsstratege, Erfinder, Autor und Wirtschaftsführer, der in Indien geboren wurde. Er erhielt seinen MTech in Informatik und Ingenieurwesen und seinen Ph.D. in Computational Graph Machine Learning Algorithms von der Acharya Nagarjuna University bzw. der Dravidian University.

Erscheinungsdatum
Sprache deutsch
Maße 152 x 229 mm
Gewicht 222 g
Themenwelt Mathematik / Informatik Informatik Netzwerke
Schlagworte Reinforcement Learning
ISBN-10 620-6-40312-2 / 6206403122
ISBN-13 978-620-6-40312-8 / 9786206403128
Zustand Neuware
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich