Návrh Školení

Úvod do reinforcement learningu a agenty AI

  • Rozhodování při nejistotě a sekvenční plánování.
  • Klíčové komponenty RL: agenty, prostředí, stavy a odměny.
  • Role RL v adaptivních a agenty systémech AI.

Markov Decision Processes (MDPs)

  • Formální definice a vlastnosti MDPs.
  • Funkce hodnoty, Bellmanovy rovnice a dynamické programování.
  • Hodnocení, zlepšování a iterace politik.

Model-Free Reinforcement Learning

  • Monte Carlo a Temporal-Difference (TD) učení.
  • Q-learning a SARSA.
  • Praktická část: implementace tabulkových metod RL v Pythonu.

Deep Reinforcement Learning

  • Kombinace neuronových sítí a RL pro funkční aproximaci.
  • Deep Q-Networks (DQN) a experience replay.
  • Architektury Actor-Critic a policy gradients.
  • Praktická část: trénování agenta pomocí DQN a PPO s Stable-Baselines3.

Explorace strategií a reward shaping

  • Rovnováha mezi průzkumem a využitím (ε-greedy, UCB, entropy methods).
  • Návrh funkce odměny a předcházení nechtěných chování.
  • Reward shaping a curriculum learning.

Pokročilé témata v RL a rozhodování

  • Multi-agent reinforcement learning a kooperativní strategie.
  • Hierarchický reinforcement learning a options framework.
  • Offline RL a imitation learning pro bezpečnější nasazení.

Simulační prostředí a hodnocení

  • Použití OpenAI Gym a vlastních prostředí.
  • Kontinuální vs. diskrétní akční prostory.
  • Metriky pro výkon, stabilitu a efektivitu vzorkování agenta.

Integrace RL do systémů agenty AI

  • Kombinace uvažování a RL v hybridních architekturách agentů.
  • Integrace reinforcement learningu s agenty používajícími nástroje.
  • Operační záležitosti pro škálování a nasazení.

Klinový projekt

  • Návrh a implementace agenta reinforcement learningu pro simulační úkol.
  • Analýza výkonu trénování a optimalizace hyperparametrů.
  • Demonstrovaní adaptivního chování a rozhodování v kontextu agenty AI.

Shrnutí a další kroky

Požadavky

  • Vynikající znalost programování v Pythonu
  • Pevné porozumění konceptů strojového učení a hlubokého učení.
  • Odbornost na lineární algebru, pravděpodobnost a základní metody optimalizace.

Cílová skupina

  • Inženýři a aplikovaní vědci pracující s reinforcement learningem.
  • Vývojáři robotiky a automatizace.
  • Inženýrské týmy pracující na adaptivních a agenty systémech AI.
 28 hodiny

Počet účastníků


Cena za účastníka

Reference (3)

Nadcházející kurzy

Související kategorie