Návrh Školení

Úvod do prediktivního AIOps

  • Přehled prediktivní analýzy v IT operacích
  • Datové zdroje pro predikci (záznamy, metriky, události)
  • Klíčové koncepty časových řad a anomálních vzorců

Návrh modelů predikce incidentů

  • Označování historických incidentů a chování systému
  • Výběr a trénink modelů (např. LSTM, Random Forest, AutoML)
  • Hodnocení výkonu modelu a zpracování falešně pozitivních výsledků

Sběr dat a inženýrství funkcí

  • Zpracování a zarovnání dat záznamů a metrik pro vstup do modelu
  • Extrahování funkcí ze strukturovaných a nestrukturovaných dat
  • Zpracování šumu a chybějících dat v operačních potocích

Automatizace analýzy hlavní příčiny (RCA)

  • Grafická korelace služeb a infrastruktury
  • Použití ML pro odvozování pravděpodobných hlavních příčin z řetězců událostí
  • Vizualizace RCA s topologicky vědomými řídicími panely

Remediační a pracovní postupy automatizace

  • Integrace s platformami automatizace (např. Ansible, Rundeck)
  • Spouštění vrácení zpět, restartů nebo přesměrování provozu
  • Revize a dokumentace automatizovaných intervenčních opatření

Škálování inteligentních potoků AIOps

  • MLOps pro pozorovatelnost: trénink a verze modelů
  • Provádění predikcí v reálném čase na distribuovaných uzlech
  • Nejlepší postupy pro nasazení AIOps v produkčních prostředích

Studie případů a praktické aplikace

  • Analýza reálných dat incidentů pomocí prediktivních modelů AIOps
  • Nasazení potoků RCA s syntetickými a produkčními daty
  • Přehled odvětvových případů: výpady cloudu, nestabilita mikroslužeb, degradace sítě

Shrnutí a další kroky

Požadavky

  • Zkušenosti s monitorovacími systémy jako Prometheus nebo ELK
  • Pracovní znalost Pythonu a základů strojového učení
  • Odborné znalosti pracovních postupů řízení incidentů

Účastníci

  • Starší inženýři pro spolehlivost systému (SRE)
  • Architekti IT automatizace
  • Liderové DevOps a platformy s pozorovatelností
 14 Hodiny

Počet účastníků


Cena za účastníka

Nadcházející kurzy

Související kategorie