Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod do Predictive AIOps
- Přehled prediktivní analýzy v provozu IT
- Zdroje dat pro předpovědi (logy, metriky, události)
- Klíčové pojmy v časových řadách a vzorcích anomálií
Návrh Modelů Předpovědi Incidentů
- Označování historických incidentů a systémového chování
- Výběr a školení modelů (např. LSTM, Random Forest, AutoML)
- Hodnocení výkonu modelů a zpracování neplatných pozitivních odpovědí
Sběr Dat a Inženýrství Vlastností
- Zpracovávání a shoda logů a metrik pro vstupy do modelu
- Extrakce vlastností z strukturovaných a nestrukturovaných dat
- Řešení šumu a chybějících dat v operativních potrubích
Automatizace Analýzy Příčiny (RCA)
- Grafická korelace služeb a infrastruktury
- Použití ML pro odvození pravděpodobných příčin z řetězů událostí
- Vizualizace RCA pomocí panelů s podporou topologie
Remediace a Workflow Automation
- Integrace s platformami automatizace (např. Ansible, Rundeck)
- Spuštění rollbacků, restartů nebo přesměrování provozu
- Auditing a dokumentování automatických intervenčních akcí
Escalace Inteligentních AIOps Potrubí
- MLOps pro zřetelnost: opakové školení a verzování modelů
- Provádění předpovědí v reálném čase na rozprostřených uzlech
- Nejlepší postupy pro nasazování AIOps do produkčních prostředí
Případové Studie a Praktická Použití
- Analýza skutečných dat incidentů pomocí prediktivních AIOps modelů
- Nasazení potrubí RCA se syntetickými a produkčními daty
- Revize užití v průmyslu: výpadky cloudových služeb, nestability mikroslužeb, zhoršení sítě
Shrnutí a Další Kroky
Požadavky
- Zkušenosti s monitorovacími systémy jako Prometheus nebo ELK
- Praktické znalosti Python a základů strojového učení
- Znalost pracovních postupů pro správu incidentů
Cílová skupina
- Odborníci na zajištěnost služeb (SRE)
- Architekti automatizace IT
- Vedoucí platform DevOps a sledovatelnosti
14 hodiny