Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Úvod do Reinforcement Learning
- Přehled posilovacího učení a jeho aplikací
- Rozdíly mezi učením pod dohledem, bez dozoru a posilováním
- Klíčové pojmy: agent, prostředí, odměny a politika
Markovovské rozhodovací procesy (MDP)
- Pochopení stavů, akcí, odměn a stavových přechodů
- Hodnotové funkce a Bellmanova rovnice
- Dynamické programování pro řešení MDP
Základní RL algoritmy
- Tabulkové metody: Q-Learning a SARSA
- Metody založené na zásadách: Algoritmus REINFORCE
- Actor-Critic frameworks a jejich aplikace
hluboká Reinforcement Learning
- Úvod do Deep Q-Networks (DQN)
- Zažijte opakované přehrávání a cílové sítě
- Politické gradienty a pokročilé metody hlubokého RL
Rámce a nástroje RL
- Úvod do OpenAI Tělocvična a další prostředí RL
- Použití PyTorch nebo TensorFlow pro vývoj RL modelu
- Školení, testování a srovnávání RL agentů
Výzvy v RL
- Vyvažování zkoumání a využívání ve výcviku
- Řešení problémů s řídkými odměnami a přidělováním kreditů
- Scalaschopnosti a výpočetní problémy v RL
Hands-On Activities
- Implementace Q-Learning a algoritmů SARSA od začátku
- Školení agenta založeného na DQN, aby mohl hrát jednoduchou hru v OpenAI Gym
- Jemné ladění modelů RL pro lepší výkon ve vlastních prostředích
Shrnutí a další kroky
Požadavky
- Silné porozumění principům a algoritmům strojového učení
- Znalost programování Python
- Znalost neuronových sítí a rámců hlubokého učení
Publikum
- Inženýři strojového učení
- specialisté na AI
14 hodiny
Reference (1)
Trainer reaguje na otázky na místě.
Adrian
Kurz - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated