Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod do prediktivního AIOps
- Přehled prediktivní analýzy v IT operacích
- Datové zdroje pro predikci (záznamy, metriky, události)
- Klíčové koncepty časových řad a anomálních vzorců
Návrh modelů predikce incidentů
- Označování historických incidentů a chování systému
- Výběr a trénink modelů (např. LSTM, Random Forest, AutoML)
- Hodnocení výkonu modelu a zpracování falešně pozitivních výsledků
Sběr dat a inženýrství funkcí
- Zpracování a zarovnání dat záznamů a metrik pro vstup do modelu
- Extrahování funkcí ze strukturovaných a nestrukturovaných dat
- Zpracování šumu a chybějících dat v operačních potocích
Automatizace analýzy hlavní příčiny (RCA)
- Grafická korelace služeb a infrastruktury
- Použití ML pro odvozování pravděpodobných hlavních příčin z řetězců událostí
- Vizualizace RCA s topologicky vědomými řídicími panely
Remediační a pracovní postupy automatizace
- Integrace s platformami automatizace (např. Ansible, Rundeck)
- Spouštění vrácení zpět, restartů nebo přesměrování provozu
- Revize a dokumentace automatizovaných intervenčních opatření
Škálování inteligentních potoků AIOps
- MLOps pro pozorovatelnost: trénink a verze modelů
- Provádění predikcí v reálném čase na distribuovaných uzlech
- Nejlepší postupy pro nasazení AIOps v produkčních prostředích
Studie případů a praktické aplikace
- Analýza reálných dat incidentů pomocí prediktivních modelů AIOps
- Nasazení potoků RCA s syntetickými a produkčními daty
- Přehled odvětvových případů: výpady cloudu, nestabilita mikroslužeb, degradace sítě
Shrnutí a další kroky
Požadavky
- Zkušenosti s monitorovacími systémy jako Prometheus nebo ELK
- Pracovní znalost Pythonu a základů strojového učení
- Odborné znalosti pracovních postupů řízení incidentů
Účastníci
- Starší inženýři pro spolehlivost systému (SRE)
- Architekti IT automatizace
- Liderové DevOps a platformy s pozorovatelností
14 Hodiny