Návrh Školení

Úvod do reforčního učení

  • Přehled o reforčním učení a jeho aplikacích
  • Rozdíly mezi řízeným, nerozděleným a reforčním učením
  • Klíčové pojmy: agent, prostředí, odměny a politika

Markovské rozhodovací procesy (MDPs)

  • Porozumění stavům, akcím, odměnám a přechodům mezi stavy
  • Funkce hodnot a Bellmanova rovnice
  • Dynamické programování pro řešení MDPs

Základní RL algoritmy

  • Tabulkové metody: Q-Learning a SARSA
  • Politikové metody: REINFORCE algoritmus
  • Frameworky Aktér-Kritik a jejich aplikace

Profundní reforční učení

  • Úvod do Deep Q-Networks (DQN)
  • Replay zkušeností a cílové sítě
  • Gradyenty politik a pokročilá metoda hlubokého reforčního učení

Frameworky a nástroje RL

  • Úvod do OpenAI Gym a jiných prostředí pro RL
  • Použití PyTorch nebo TensorFlow pro vývoj modelů RL
  • Trénování, testování a benchmarking agentů RL

Výzvy v RL

  • Zohlednění rovnováhy mezi průzkumem a vykořisťováním při tréninku
  • Řešení problémů s vzácnými odměnami a přidělování zpětné vazby
  • Výpočetní a škálovací výzvy v RL

Praktické aktivity

  • Implementace Q-Learning a SARSA algoritmů od nuly
  • Trénování agenta založeného na DQN pro hraní jednoduché hry v OpenAI Gymu
  • Ostrahování modelů RL pro lepší výkon v vlastních prostředích

Shrnutí a další kroky

Požadavky

  • Silný pochopení principů a algoritmů strojového učení
  • Odbornost v programování Python
  • Znalosti s neuronovými sítěmi a rámci hlubokého učení

Cílová skupina

  • Inženýři v oblasti strojového učení
  • Odborníci na umělá rozumění (AI)
 14 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie