Seminare
Seminare

Reinforcement Learning: Lernen durch Belohnung

Seminar - PROKODA GmbH

Reinforcement Learning: Lernen durch Belohnung
Termin Ort Preis*
06.07.2026- 08.07.2026 München 1.773,10 €
06.07.2026- 08.07.2026 online 1.773,10 €
12.10.2026- 14.10.2026 online 1.773,10 €
12.10.2026- 14.10.2026 München 1.773,10 €

Alle Termine anzeigen

*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:
  • RL-Grundlagen, Begriffe, Denkmodelle
    • MDP, Zustände, Aktionen, Rewards, Episoden
    • Policy, Value Function, Return, Discounting
    • Exploration vs. Exploitation und typische Fallstricke
  • Value-based Methoden: Von Tabular bis Deep
    • Dynamic Programming, Monte Carlo, Temporal Difference
    • Q-Learning, SARSA, Eligibility Traces
    • Deep Q-Networks (DQN): Stabilität, Replay, Target Networks
  • Policy Gradients und Actor-Critic
    • REINFORCE, Baselines und Varianzreduktion
    • Advantage, GAE und Actor-Critic-Intuition
    • PPO: warum es in der Praxis oft gewinnt
  • Reward Design und sichere Lernumgebungen
    • Reward Shaping ohne „Reward Hacking“
    • Constraints, Penalties, Safety Checks
    • Offline vs. Online RL: Datenqualität und Risiken
  • Experiment-Setup, Debugging, Evaluation
    • Trainingskurven richtig lesen: Instabilität, Collapse, Overfitting
    • Seed-Management, Reproduzierbarkeit, Ablations
    • Metrics: Sample Efficiency, Regret, Robustheit
  • Praxisprojekte: Von der Idee zum lauffähigen Agenten
    • Gymnasium-Umgebungen und eigene Environments
    • Hyperparameter, Normalisierung, Logging
    • Deployment-Denken: Grenzen, Monitoring, Drift
Teilnahmevoraussetzungen:
  • Solide Python-Grundlagen und Erfahrung mit Jupyter-Workflows
  • Grundverständnis von Machine Learning und neuronalen Netzen ist hilfreich
Zielgruppe:
  • Machine-Learning-Engineers und Data Scientists
  • Softwareentwicklerinnen und Softwareentwickler mit ML-Bezug
  • Forschungs- und Innovations-Teams in Produktentwicklung
  • MLOps- und Plattform-Teams, die RL-Prototypen betreuen
  • Für alle, die Agenten bauen wollen, die durch Belohnung lernen und Entscheidungen in Simulationen nachvollziehbar verbessern.
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha