Návrh Školení
Úvod do vícemodálního umělého rozumu (AI)
- Co je vícemodální AI?
- Jak fungují modely vícemodální AI
- Příklady využití ve různých odvětvích
Základy inženýrství promptu
- Průvodce efektivním návrhem promptů
- Přehled chování odpovědí AI
- Obecné chyby a jak je vyřešit
Optimalizace promptů založených na textu
- Strukturování promptů pro přesné generování textu
- Finetuning odpovědí pro různé kontexty
- Zvládání nejasností a biasu v textových promptech
Generování a manipulace s obrázky
- Optimalizace promptů pro AI vygenerované obrázky
- Ovládání stylu, kompozice a prvků
- Práce s AI podporovanými nástroji pro úpravy
Zpracování zvuku a řeči
- Generování řeči na základě textových promptů
- AI podporované zdokonalení a syntéza zvuků
- Vytvoření interakcí s hlasem pomocí AI
Vytváření videa pomocí AI
- Generování videoklipů pomocí AI promptů
- Kombinace textu, obrázků a zvuku vygenerovaných AI
- Upravování a úpravy vytvořeného videa pomocí AI
Integrace vícemodální AI do pracovních postupů
- Kombinace textu, obrázků a zvuků výstupů
- Vytváření automatizovaných AI podporovaných zpracovacích linek obsahu
- Případové studie a skutečné aplikace
Etnické aspekty a nejlepší postupy
- Bias AI a moderace obsahu
- Soukromí v vícemodální AI
- Zajištění odpovědného používání AI
Shrnutí a další kroky
Požadavky
- Přehled o modelech umělé inteligence a jejich použití
- Zkušenosti s programováním (doporučujeme Python)
- znalost API a pracovních postupů založených na umělé inteligenci
Cílová skupina
- Výzkumci v oblasti umělé inteligence
- Tvůrčí umělci multimédií
- Vývojáři pracující s vícemodálními modelema
Reference (1)
Náš instruktor Yashank byl neuvěřitelně vzdělaný. Upravil kurzy tak, aby odpovídaly tomu, co jsme skutečně potřebovali seznat, a s ním jsme měli skvělé zkušenosti se studiem. Jeho znalost oblasti, kterou nám přednášel, byla ohromující; sdílel s námi přehledy z praxe a pomohl nám vyřešit skutečné problémy, s kterými se setkávali naše pracovní týmy.
Ahmed Nazeem - Maldives Pension Administration Office
Kurz - Multimodal AI for Enhanced User Experience
Přeloženo strojem