Návrh Školení

Úvod

Reinforcement Learning Základy

Základní Reinforcement Learning Techniky

Úvod do BURLAP

Iterace konvergence hodnoty a politiky

Tvarování odměny

Průzkum

Zobecnění

Částečně pozorovatelné MDP

Možnosti

Logistika

TD Lambda

Přechody zásad

Hluboké Q-Learning

Témata z teorie her

Shrnutí a další kroky

Požadavky

  • Znalost Pythonu
  • Porozumění vysokoškolskému kalkulu a lineární algebře
  • Základní porozumění pravděpodobnosti a Statistics
  • Zkušenosti s tvorbou modelů strojového učení v Pythonu a Numpy

Publikum

  • Vývojáři
  • Data Scientists
 21 hodiny

Počet účastníků



Price per participant

Související kurzy

Související kategorie