Návrh Školení

Základy agenčních systémů v produkci

  • Agenční architektury: smyčky, nástroje, paměť a orchestrační vrstvy
  • Životní cyklus agentů: vývoj, nasazení a kontinuální provozování
  • Výzvy správy agentů na produkční škále

Infrastruktura a modely nasazení

  • Nasazení agentů v kontejnerizovaných a cloudových prostředích
  • Škálovací vzory: horizontální vs vertikální škálování, konkurenceschopnost a zpomalení
  • Orchestrace více agentů a vyvažování úlohových zatížení

Monitorování a sledovatelnost

  • Klíčové metriky: latence, úspěšnost, využití paměti a hloubka agentových volání
  • Sledování aktivity agentů a grafů volání
  • Instrumentace sledovatelnosti pomocí Prometheus, OpenTelemetry a Grafana

Protokolování, audit a dodržování předpisů

  • Centralizované protokolování a shromažďování strukturovaných událostí
  • Dodržování předpisů a auditovatelnost v agenčních pracovních postupech
  • Návrh auditních tras a mechanismů pro opakování k ladění chyb

Optimalizace výkonu a zdrojů

  • Snížení nákladů na inferenci a optimalizace cyklu orchestrování agentů
  • Mezipaměť modelů a lehké vložené pro rychlejší zpětné volání
  • Zátěžové testování a stresové scénáře pro AI potrubí

Kontrola nákladů a správa

  • Porozumění ovlivňovacím faktorům nákladů agentů: volání API, paměť, výpočetní zdroje a externí integrace
  • Sledování nákladů na úrovni agentů a implementace modelů chargebacku
  • Automatizační politiky pro prevenci rozšiřování agentů a využívání nečinných zdrojů

CI/CD a strategie nasazení agentů

  • Integrace potrubí agentů do systémů CI/CD
  • Testování, verzování a strategie rollbacku pro iterativní aktualizace agentů
  • Postupné nasazení a bezpečné mechanismy nasazení

Obnovení po selhání a inženýrství spolehlivosti

  • Návrh na odolnost před selháním a hladkou degradaci
  • Vzory pro opakování, časové limity a okružní zámky pro spolehlivost agentů
  • Reakce na incidenty a rámcové postupy pro operace AI po přežití

Kompasová úloha

  • Postavení a nasazení agenčního systému AI s plným monitorováním a sledováním nákladů
  • Simulace zatížení, měření výkonu a optimalizace využití zdrojů
  • Prezentace konečné architektury a monitorovacího dashboardu kolegům

Shrnutí a další kroky

Požadavky

  • Silné porozumění MLOps a produkčním strojovým učícím se systémům
  • Zkušenosti s kontejnerizovanými nasazeními (Docker/Kubernetes)
  • Zapojení do optimalizace cloudových nákladů a sledovatelnostních nástrojů

Účastníci

  • MLOps inženýři
  • Inženýři pro spolehlivost systému (SREs)
  • Manažeři inženýrských týmů dohlížející na AI infrastrukturu
 21 hodiny

Počet účastníků


Cena za účastníka

Reference (3)

Nadcházející kurzy

Související kategorie