Návrh Školení

Úvod do AIOps

  • Co je to AIOps a proč je důležité
  • Tradiční monitorování vs. pozorovatelnost poháněná AIOps
  • Architektura a klíčové komponenty AIOps

Shromažďování a normalizace operačních dat

  • Typy dat pro pozorovatelnost: metriky, logy a trasování
  • Ingesting dat z různých zdrojů (serverů, kontejnerů, cloudu)
  • Použití agentů a exportérů (Prometheus, Beats, Fluentd)

Korelace dat a detekce anomálií

  • Korelace časových řad a statistické metody
  • Použití modelů strojového učení pro detekci anomálií
  • Detekce incidentů v rozprostřených systémech

Upozornění a snížení šumu

  • Navrhování inteligentních pravidel a práhů pro upozornění
  • Tlumení, deduplikace a seskupení upozornění
  • Integrace s Alertmanagerem, Slackem, PagerDuty nebo Opsgenie

Analýza kořených příčin a vizualizace

  • Použití řídicích panelů k vizualizaci metrik a detekci trendů
  • Prozkoumání událostí a časových os pro analýzu kořených příčin (RCA)
  • Trasování problémů napříč vrstvami pomocí nástrojů pro rozprostřené trasování

Automatizace a odstraňování potíží

  • Spouštění automatizovaných skriptů nebo pracovních postupů z incidentů
  • Integrace s ITSM systémy (ServiceNow, Jira)
  • Použití případů: samohealing, škálování, přesměrování provozu

Open Source a komerční platformy AIOps

  • Přehled nástrojů: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kritéria pro vyhodnocení a výběr platformy AIOps
  • Ukázka a praktická práce s vybranou stanicí

Shrnutí a další kroky

Požadavky

  • Pochopení IT operací a konceptů systémového monitorování
  • Zkušenosti s nástroji nebo řídicími panely pro monitorování
  • Opačení se základními formáty logů a metrik

Cílová skupina

  • Týmy operací odpovědné za infrastrukturu a aplikace
  • Inženýři site reliability (SREs)
  • Týmy IT monitorování a pozorovatelnosti
 14 Hodiny

Počet účastníků


Cena za účastníka

Nadcházející kurzy

Související kategorie