Návrh Školení

Základy bezpečné a spravedlivé AI

  • Klíčové koncepty: bezpečnost, předsudky, spravedlnost, transparentnost
  • Typy předsudků: v datových sadech, reprezentativní, algoritmické
  • Přehled regulačních rámcest (EU AI Act, GDPR atd.)

Předsudky ve fejn-tunovaných modelech

  • Jak může fejn-tuning zavést nebo zvýšit předsudky
  • Případové studie a skutečné selhání
  • Identifikace předsudků ve vstupních datech a predikcích modelu

Techniky pro zmírňování předsudků

  • Strategie na úrovni dat (vyrovnávání, augmentace)
  • Strategie během tréninku (regularizace, adversariální odstranění předsudků)
  • Postprocessingové strategie (filtrace výstupů, kalibrace)

Bezpečnost a robustnost modelů

  • Rozpoznávání nebezpečných nebo škodlivých výstupů
  • Zpracování adversariálních vstupů
  • Vyhledávání chyb a stresové testy fejn-tunovaných modelů

Audit a monitorování AI systémů

  • Metry pro hodnocení předsudků a spravedlnosti (např. demografická parita)
  • Nástroje pro vysvětlitelnost a transparentní rámce
  • Ongoing monitorování a postupy řízení

Toolkity a praktické cvičení

  • Používání open-source knihoven (např. Fairlearn, Transformers, CheckList)
  • Praktická část: Rozpoznávání a zmírňování předsudků ve fejn-tunovaném modelu
  • Vytváření bezpečných výstupů prostřednictvím návrhu vstupních proměnných a omezujících podmínek

Podnikové případové studie a připravenost k dodržování norm

  • Osvědčené postupy pro integraci bezpečnosti do pracovních postupů s LLM
  • Dokumentace a modelové karty pro dodržování norm
  • Příprava na audit a externí kontroly

Souhrn a další kroky

Požadavky

  • Pochopení modelů strojového učení a procesů jejich tréninku
  • Zkušenosti s jemnou kalibrací (fine-tuning) a velkými jazykovými modelemi (LLMs)
  • Odborná znalost Pythonu a konceptů zpracování přirozeného jazyka (NLP)

Cílová skupina

  • Timy pro dodržování pravidel v oblasti umělé inteligence (AI)
  • Inženýři strojového učení (ML)
 14 hodiny

Počet účastníků


Cena za účastníka

Nadcházející kurzy

Související kategorie