Návrh Školení

Úvod do Reinforcement Learning

  • Co je posilovací učení?
  • Klíčové pojmy: agent, prostředí, stavy, akce a odměny
  • Výzvy v posilovacím učení

Průzkum a těžba

  • Vyvažování průzkumu a těžby v modelech RL
  • Průzkumné strategie: epsilon-chtivý, softmax a další

Q-Learning a Deep Q-Networks (DQN)

  • Úvod do Q-learningu
  • Implementace DQN pomocí TensorFlow
  • Optimalizace Q-learningu pomocí přehrávání zkušeností a cílových sítí

Metody založené na zásadách

  • Algoritmy gradientu zásad
  • Algoritmus REINFORCE a jeho implementace
  • Metody herecké kritiky

Práce s OpenAI Gym

  • Nastavení prostředí v OpenAI Gym
  • Simulace agentů v dynamických prostředích
  • Hodnocení výkonu agenta

Pokročilé Reinforcement Learning techniky

  • Multi-agent posílení učení
  • Deep deterministic policy gradient (DDPG)
  • Proximální optimalizace zásad (PPO)

Nasazení Reinforcement Learning modelů

  • Reálné aplikace posilovacího učení
  • Integrace RL modelů do produkčního prostředí

Shrnutí a další kroky

Požadavky

  • Zkušenosti s programováním Python
  • Základní porozumění konceptům hlubokého učení a strojového učení
  • Znalost algoritmů a matematických konceptů používaných v posilovacím učení

Publikum

  • Datoví vědci
  • Praktici strojového učení
  • výzkumníci AI
 28 hodiny

Počet účastníků


Price per participant

Reference (4)

Upcoming Courses

Související kategorie