Návrh Školení

Úvod do AI-ově podporovaných operací Kubernetes

  • Proč je AI důležitá pro moderní operační cluster
  • Omezení tradiční logiky škálování a plánování
  • Klíčové koncepty ML pro správu zdrojů

Základy správy zdrojů Kubernetes

  • Základy alokace CPU, GPU a paměti
  • Pochopení kvót, limitů a požadavků
  • Identifikace láhve a neefektivit

Strojové učení pro plánování

  • Supervizované a nesupervizované modely pro umístění pracovních úloh
  • Prediktivní algoritmy pro poptávku po zdrojích
  • Použití funkcí ML ve vlastních plánovácích

Posilovací učení pro inteligentní autoskalování

  • Jak RL agenty učí clusterové chování
  • Návrh funkce odměny pro efektivitu
  • Vytváření strategií autoskalování řízených RL

Prediktivní autoskalování s metrikami a telemetrií

  • Použití dat Prometheus pro predikci
  • Aplikace časových řad do autoskalování
  • Hodnocení přesnosti predikce a úprava modelů

Implementace nástrojů AI-ově podporované optimalizace

  • Integrace ML rámčíků s kontrolery Kubernetes
  • Nasazení inteligentních kontrolních smyček
  • Rozšíření KEDA pro AI-ově podporované rozhodování

Strategie optimalizace nákladů a výkonu

  • Snížení výpočetních nákladů prostřednictvím prediktivního škálování
  • Zlepšení využití GPU pomocí ML-ově řízeného umístění
  • Vyvažování latence, propustnosti a efektivnosti

Praktické scénáře a příklady z praxe

  • Autoskalování vyslovaných aplikací pomocí AI
  • Optimalizace heterogenních skupin uzlů
  • Aplikace ML do multi-tenantských prostředí

Shrnutí a další kroky

Požadavky

  • Pochopení základních principů Kubernetes
  • Zkušenosti s nasazením kontejnerizovaných aplikací
  • Odborné znalosti operace clusteru a správy zdrojů

Účastníci

  • SRE pracující s velkými distribuovanými systémy
  • Operátoři Kubernetes spravující vysokonáročné pracovní úlohy
  • Platformní inženýři optimalizující výpočetní infrastrukturu
 21 Hodiny

Počet účastníků


Cena za účastníka

Reference (5)

Nadcházející kurzy

Související kategorie