Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Úvod do Reinforcement Learning
- Co je posilovací učení?
- Klíčové pojmy: agent, prostředí, stavy, akce a odměny
- Výzvy v posilovacím učení
Průzkum a těžba
- Vyvažování průzkumu a těžby v modelech RL
- Průzkumné strategie: epsilon-chtivý, softmax a další
Q-Learning a Deep Q-Networks (DQN)
- Úvod do Q-learningu
- Implementace DQN pomocí TensorFlow
- Optimalizace Q-learningu pomocí přehrávání zkušeností a cílových sítí
Metody založené na zásadách
- Algoritmy gradientu zásad
- Algoritmus REINFORCE a jeho implementace
- Metody herecké kritiky
Práce s OpenAI Gym
- Nastavení prostředí v OpenAI Gym
- Simulace agentů v dynamických prostředích
- Hodnocení výkonu agenta
Pokročilé Reinforcement Learning techniky
- Multi-agent posílení učení
- Deep deterministic policy gradient (DDPG)
- Proximální optimalizace zásad (PPO)
Nasazení Reinforcement Learning modelů
- Reálné aplikace posilovacího učení
- Integrace RL modelů do produkčního prostředí
Shrnutí a další kroky
Požadavky
- Zkušenosti s programováním Python
- Základní porozumění konceptům hlubokého učení a strojového učení
- Znalost algoritmů a matematických konceptů používaných v posilovacím učení
Publikum
- Datoví vědci
- Praktici strojového učení
- výzkumníci AI
28 hodiny
Reference (4)
velmi přátelské a užitečné
Aktar Hossain - Unit4
Kurz - Building Microservices with Microsoft Azure Service Fabric (ASF)
Machine Translated
Ruční nastavení bez serveru. Také jsem neměl žádné výstupy webové konzole Idea sls, což je hezké.
Rafal Kucharski - The Software House sp. z o.o.
Kurz - Serverless Framework for Developers
Machine Translated
All good, nothing to improve
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Kurz - AWS Lambda for Developers
IOT applications