Návrh Školení

Úvod do architektury Biren GPU

  • Přehled Biren a případné použití
  • Hardware rozvržení: jádra, paměť, výpočetní clustery
  • Porovnání s NVIDIA a AMD GPUs

Nastavení prostředí Biren Programming

  • Instalace Biren SDK a runtime
  • Pochopení nástrojové řady a modelu kompilátoru
  • Základní struktura projektu a proces sestavení

GPU Programming pomocí Biren stacku

  • Modely vláken a bloků
  • Správa paměti a přenosy dat
  • Vývoj jádra a modely spouštění

Převod z CUDA do Biren

  • Techniky překladu pro kód CUDA
  • Společné mapování API a adaptace
  • Praktické cvičení s konverzí kódu

Ladicí nástroje a profilování

  • Použití ladicího programu a profileru Biren
  • Identifikace průlivů
  • Vzory přístupu k paměti a optimalizace

Techniky optimalizace

  • Rozvrhování vláken a pipelining instrukcí
  • Rozbalení smyček a použití sdílené paměti
  • Pokročilé optimalizace jádra pro propustnost

Případová studie a příklady aplikací

  • Trénování modelu s Biren akcelerátory
  • Převod a profilování modelů v oblasti poznávacích systémů nebo NLP
  • Porovnání výkonu proti CUDA/NVIDIA

Shrnutí a další kroky

Požadavky

  • Přehled architektury GPU a paralelního zpracování
  • Zkušenosti s CUDA, OpenCL, nebo podobnými prostředími pro programování GPU
  • znalost frameworků hlubokého učení jako PyTorch nebo TensorFlow

Cílová skupina

  • Vývojáři HPC
  • Inženýři infrastruktury AI
  • Odborníci na optimalizaci výkonu
 21 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie