Návrh Školení

Vedoucí kurz AIOps

  • Co je AIOps a proč to má význam
  • Tradiční monitorování vs. observability řízená AIOps
  • Architektura AIOps a klíčové komponenty

Sběr a normalizace provozních dat

  • Typy dat pro observability: metriky, logy a trasování
  • Nahrávání dat ze více zdrojů (serverů, kontejnerů, cloudu)
  • Používání agentů a exportérů (Prometheus, Beats, Fluentd)

Korelace dat a detekce anomálií

  • Casové řady korelace a statistické metody
  • Použití modelů strojového učení pro detekci anomálií
  • Detekce incidentů v distribuovaných systémech

Vystrašení a redukce šumu

  • Návrh inteligentních pravidel a práh pro vystrašení
  • Supresí, deduplikace a skupinování výstrah
  • Připojení k Alertmanageru, Slack, PagerDuty nebo Opsgenie

Vizualizace a analýza základních příčin

  • Použití dashboardů pro vizualizaci metrik a detekci trendů
  • Prozkoumání událostí a časových os pro RCA
  • Sledování problémů na různých úrovních pomocí nástrojů distribuovaného trasování

Automatizace a zotavení

  • Vyvolávání automatizovaných skriptů nebo pracovních toků při incidentech
  • Připojení k systémům ITSM (ServiceNow, Jira)
  • Použití případů: samoobhospodařování, škálování, přesměrování provozu

Open-source a komerční platformy AIOps

  • Přehled nástrojů: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kritéria pro hodnocení a výběr platformy AIOps
  • Demonstrační cvičení s vybranou sadou nástrojů

Závěr a další kroky

Požadavky

  • Pochopení IT operací a konceptů monitorování systémů
  • Zkušenosti s nástroji nebo dashboardy pro monitorování
  • Znalost základních formátů logů a metrik

Cílová skupina

  • Týmy operací odpovědné za infrastrukturu a aplikace
  • Inženýři zajištění spolehlivosti (SREs)
  • Týmy pro monitorování a pozorovatelnost IT
 14 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie