Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod do AIOps
- Co je to AIOps a proč je důležité
- Tradiční monitorování vs. pozorovatelnost poháněná AIOps
- Architektura a klíčové komponenty AIOps
Shromažďování a normalizace operačních dat
- Typy dat pro pozorovatelnost: metriky, logy a trasování
- Ingesting dat z různých zdrojů (serverů, kontejnerů, cloudu)
- Použití agentů a exportérů (Prometheus, Beats, Fluentd)
Korelace dat a detekce anomálií
- Korelace časových řad a statistické metody
- Použití modelů strojového učení pro detekci anomálií
- Detekce incidentů v rozprostřených systémech
Upozornění a snížení šumu
- Navrhování inteligentních pravidel a práhů pro upozornění
- Tlumení, deduplikace a seskupení upozornění
- Integrace s Alertmanagerem, Slackem, PagerDuty nebo Opsgenie
Analýza kořených příčin a vizualizace
- Použití řídicích panelů k vizualizaci metrik a detekci trendů
- Prozkoumání událostí a časových os pro analýzu kořených příčin (RCA)
- Trasování problémů napříč vrstvami pomocí nástrojů pro rozprostřené trasování
Automatizace a odstraňování potíží
- Spouštění automatizovaných skriptů nebo pracovních postupů z incidentů
- Integrace s ITSM systémy (ServiceNow, Jira)
- Použití případů: samohealing, škálování, přesměrování provozu
Open Source a komerční platformy AIOps
- Přehled nástrojů: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Kritéria pro vyhodnocení a výběr platformy AIOps
- Ukázka a praktická práce s vybranou stanicí
Shrnutí a další kroky
Požadavky
- Pochopení IT operací a konceptů systémového monitorování
- Zkušenosti s nástroji nebo řídicími panely pro monitorování
- Opačení se základními formáty logů a metrik
Cílová skupina
- Týmy operací odpovědné za infrastrukturu a aplikace
- Inženýři site reliability (SREs)
- Týmy IT monitorování a pozorovatelnosti
14 Hodiny