Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod do reinforcement learningu a agenty AI
- Rozhodování při nejistotě a sekvenční plánování.
- Klíčové komponenty RL: agenty, prostředí, stavy a odměny.
- Role RL v adaptivních a agenty systémech AI.
Markov Decision Processes (MDPs)
- Formální definice a vlastnosti MDPs.
- Funkce hodnoty, Bellmanovy rovnice a dynamické programování.
- Hodnocení, zlepšování a iterace politik.
Model-Free Reinforcement Learning
- Monte Carlo a Temporal-Difference (TD) učení.
- Q-learning a SARSA.
- Praktická část: implementace tabulkových metod RL v Pythonu.
Deep Reinforcement Learning
- Kombinace neuronových sítí a RL pro funkční aproximaci.
- Deep Q-Networks (DQN) a experience replay.
- Architektury Actor-Critic a policy gradients.
- Praktická část: trénování agenta pomocí DQN a PPO s Stable-Baselines3.
Explorace strategií a reward shaping
- Rovnováha mezi průzkumem a využitím (ε-greedy, UCB, entropy methods).
- Návrh funkce odměny a předcházení nechtěných chování.
- Reward shaping a curriculum learning.
Pokročilé témata v RL a rozhodování
- Multi-agent reinforcement learning a kooperativní strategie.
- Hierarchický reinforcement learning a options framework.
- Offline RL a imitation learning pro bezpečnější nasazení.
Simulační prostředí a hodnocení
- Použití OpenAI Gym a vlastních prostředí.
- Kontinuální vs. diskrétní akční prostory.
- Metriky pro výkon, stabilitu a efektivitu vzorkování agenta.
Integrace RL do systémů agenty AI
- Kombinace uvažování a RL v hybridních architekturách agentů.
- Integrace reinforcement learningu s agenty používajícími nástroje.
- Operační záležitosti pro škálování a nasazení.
Klinový projekt
- Návrh a implementace agenta reinforcement learningu pro simulační úkol.
- Analýza výkonu trénování a optimalizace hyperparametrů.
- Demonstrovaní adaptivního chování a rozhodování v kontextu agenty AI.
Shrnutí a další kroky
Požadavky
- Vynikající znalost programování v Pythonu
- Pevné porozumění konceptů strojového učení a hlubokého učení.
- Odbornost na lineární algebru, pravděpodobnost a základní metody optimalizace.
Cílová skupina
- Inženýři a aplikovaní vědci pracující s reinforcement learningem.
- Vývojáři robotiky a automatizace.
- Inženýrské týmy pracující na adaptivních a agenty systémech AI.
28 hodiny
Reference (3)
Dobrý zmatek znalostí a praxe
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurz - Agentic AI for Enterprise Applications
Přeloženo strojem
Míchání teorie a praxe a pohledů z vysokého i nízkého úrovní
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurz - Autonomous Decision-Making with Agentic AI
Přeloženo strojem
praktické cvičení
Daniel - Facultatea S.A.I.A.P.M.
Kurz - Agentic AI in Multi-Agent Systems
Přeloženo strojem