Reinforcement Learning: Lernen durch Belohnung

Seminar - PROKODA GmbH

Termin	Ort	Preis^*
06.07.2026- 08.07.2026	München	1.773,10 €	jetzt buchen
06.07.2026- 08.07.2026	online	1.773,10 €	jetzt buchen
12.10.2026- 14.10.2026	online	1.773,10 €	jetzt buchen
12.10.2026- 14.10.2026	München	1.773,10 €	jetzt buchen

Alle Termine anzeigen

^*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

RL-Grundlagen, Begriffe, Denkmodelle
- MDP, Zustände, Aktionen, Rewards, Episoden
- Policy, Value Function, Return, Discounting
- Exploration vs. Exploitation und typische Fallstricke
Value-based Methoden: Von Tabular bis Deep
- Dynamic Programming, Monte Carlo, Temporal Difference
- Q-Learning, SARSA, Eligibility Traces
- Deep Q-Networks (DQN): Stabilität, Replay, Target Networks
Policy Gradients und Actor-Critic
- REINFORCE, Baselines und Varianzreduktion
- Advantage, GAE und Actor-Critic-Intuition
- PPO: warum es in der Praxis oft gewinnt
Reward Design und sichere Lernumgebungen
- Reward Shaping ohne „Reward Hacking“
- Constraints, Penalties, Safety Checks
- Offline vs. Online RL: Datenqualität und Risiken
Experiment-Setup, Debugging, Evaluation
- Trainingskurven richtig lesen: Instabilität, Collapse, Overfitting
- Seed-Management, Reproduzierbarkeit, Ablations
- Metrics: Sample Efficiency, Regret, Robustheit
Praxisprojekte: Von der Idee zum lauffähigen Agenten
- Gymnasium-Umgebungen und eigene Environments
- Hyperparameter, Normalisierung, Logging
- Deployment-Denken: Grenzen, Monitoring, Drift

Teilnahmevoraussetzungen:

Solide Python-Grundlagen und Erfahrung mit Jupyter-Workflows
Grundverständnis von Machine Learning und neuronalen Netzen ist hilfreich

Zielgruppe:

Machine-Learning-Engineers und Data Scientists
Softwareentwicklerinnen und Softwareentwickler mit ML-Bezug
Forschungs- und Innovations-Teams in Produktentwicklung
MLOps- und Plattform-Teams, die RL-Prototypen betreuen
Für alle, die Agenten bauen wollen, die durch Belohnung lernen und Entscheidungen in Simulationen nachvollziehbar verbessern.

Nach unten

Nach oben

Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.

Akzeptieren Nicht akzeptieren

Ihr Name:

Firma (optional):

Ihre E-Mail-Adresse:

Telefonnummer (optional):

Ihre Nachricht:

Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.

Reinforcement Learning: Lernen durch Belohnung

Detaillierte Informationen zum Seminar

Anbieterinformationen