Návrh Školení

Vstup do Reinforcement Learning

  • Co je učení s reforcementem?
  • Klíčové pojmy: agent, prostředí, stavy, akce a odměny
  • Výzvy v učení s reforcementem

Explorace a eksploatace

  • Závazek k rovnováze mezi explorací a eksploatací v modelu RL
  • Strategie pro exploraci: epsilon-greedy, softmax a další

Q-learning a hluboké Q-sítě (DQN)

  • Úvod do Q-learningu
  • Implementace DQN pomocí TensorFlow
  • Optimalizace Q-learningu s použitím záznamů zkušeností a cílových sítí

Metody na základě politiky

  • Algoritmy gradientové politiky
  • REINFORCE algoritmus a jeho implementace
  • Metody actor-critic

Práce s OpenAI Gym

  • Nastavení prostředí v OpenAI Gym
  • Simulace agentů ve dynamických prostředích
  • Hodnocení výkonu agenta

Pokročilé techniky Reinforcement Learning

  • Multi-agentovo učení s reforcementem
  • Deep deterministic policy gradient (DDPG)
  • Proximal policy optimization (PPO)

Publikování modelů Reinforcement Learning

  • Skutečné aplikace učení s reforcementem
  • Integrace RL modelů do produkčních prostředí

Závěr a další kroky

Požadavky

  • Zkušenosti s programováním Python
  • Základní znalost konceptů hlubokého učení a strojového učení
  • Vědomosti o algoritmech a matematických pojmů používaných v reforčním učení

Cílová skupina

  • Datoví vědci
  • Praktikanti strojového učení
  • Výzkumníci umělé inteligence
 28 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie