Návrh Školení
Modul 1: Jádro Pythonu pro ML pracovní postupy
• Zahájení kurzu a nastavení prostředí
Srovnání cílů a nastavení reprodukovatelného Python ML pracovního prostoru
• Základy jazyka Python (rychlá tréninková verze)
Revize syntaxe, ovládací struktury, funkcí a vzorů často používaných v kódu ML
• Datové struktury pro ML
Seznamy, slovníky, množiny a n-tice pro vlastnosti, štítky a metadata
• Comprehensions a funkcionální nástroje
Provedení transformací pomocí comprehensions a vyšších funkcí
• Objektově orientovaný Python pro ML vývojáře
Třídy, metody, kompozice a praktické návrhové rozhodnutí
• dataclasses a lehká modelování
Typové kontejnery pro konfiguraci, příklady a výsledky
• Dekorátory a context managers
Časování, vyhotovování mezipaměti, protokolování a vzory bezpečného spouštění zdrojů
• Práce s soubory a cestami
Robustní zpracování datových sad a formáty serializace
• Výjimky a defenzivní programování
Psaní skriptů ML, které selhávají bezpečně a transparentně
• Moduly, balíčky a struktura projektu
Organizace opakovatelných kódových základů ML
• Typování a kvalita kódu
Typové návrhy, dokumentace a struktura přátelská pro linter
Modul 2: Numerický Python, SciPy a zpracování dat
• Základy NumPy pro vektorizované výpočty
Efektivní operace s polem a výpočetně vědomé programování
• Indexování, řezání, broadcasting a tvary
Bezpečné manipulace s tenzory a tvary
• Lineární algebra s NumPy a SciPy
Stabilní operace s maticemi a rozklady používané v ML
• Úvod do SciPy
Statistiky, optimalizace, aproximace křivek a řídké matice
• Pandas pro tabulková data ML
Čištění, spojování, agregace a příprava datových sad
• Úvod do scikit-learn
Rozhraní estimatoru, potrubí a reprodukovatelné pracovní postupy
• Základy vizualizace
Diagnostické grafy pro průzkum dat a chování modelu
Modul 3: Programovací vzory pro vytváření aplikací ML
• Od poznámkového bloku k udržitelnému projektu
Refactoring průzkumného kódu do strukturovaných balíčků
• Správa konfigurace
Externí parametry a ověření při startu
• Protokolování, upozornění a sledování
Strukturované protokolování pro laditelné ML systémy
• Opakovatelné komponenty s OOP a kompozicí
Návrh extenzibilních transformerů a prediktorů
• Praktické návrhové vzory
Potrubí, Factory nebo Registry, Strategy a Adapter vzory
• Validace dat a kontrola schémat
Prevence tichých problémů s daty
• Výkon a profilování
Identifikace zádrhelů a aplikace optimalizačních technik
• Vstup a výstup modelů a rozhraní pro odvození
Bezpečná trvalost a čistá rozhraní pro předpovědi
• Zkoušební postup od konce k začátku
Pracovní proces ML v produkčním stylu s konfigurací a protokolováním
Modul 4: Statistické učení pro tabulková, textová a obrazová data
• Základy hodnocení
Rozdělení na trénink a validaci, upřímná křížová validace a metriky přizpůsobené podnikání
• Pokročilé učení pro tabulková data
Regularizované GLM, ensemble stromů a preprocessing bez úniku informací
• Kalibrace a neurčitost
Plattovo škálování, izotonická regrese, bootstrap a conformální predikce
• Klasické metody NLP
Výměna tokenizace, TF-IDF, lineární modely a Naive Bayes
• Tématové modelování
Základy LDA a praktická omezení
• Klasické počítačové vidění
HOG, PCA a feature-based potrubí
• Analýza chyb
Detekce biasu, šum v štítcích a náhodné korelace
• Praktické laboratoře
Bezpečný tréninkový potrubí pro tabulková data
Porovnání a interpretace baseline pro text
Klasické baseline pro počítačové vidění s strukturovanou analýzou selhání
Modul 5: Neuronové sítě pro tabulková, textová a obrazová data
• Ovládání tréninkové smyčky
Čisté smyčky PyTorch s AMP, clippingem a reprodukovatelností
• Optimalizace a regularizace
Inicializace, normalizace, optimalizátory a plánovače
• Smíšená přesnost a škálování
Gradientové akumulace a strategie checkpointingu
• Neuronové sítě pro tabulková data
Kategorické vložení, feature crosses a ablation studies
• Neuronové sítě pro text
Vložení, CNN, BiLSTM nebo GRU a zpracování sekvencí
• Neuronové sítě pro vizualizaci
Základy CNN a architektury stylu ResNet
• Praktické laboratoře
Opakovatelný tréninkový rámec
Porovnání neuronové sítě pro tabulková data s boostingem
CNN s augmentací a experimenty s plánováním
Modul 6: Pokročilé neuronové architektury
• Strategie transferového učení
Měnové a uvolňovací vzory, diskriminační učení s různými rychlostmi
• Architektury transformerů pro text
Interní mechanismy sebe-pozornosti a přístupy k fine-tuningu
• Základní architektury pro vizualizaci a husté predikce
ResNet, EfficientNet, Vision Transformers a koncepty U-Net
• Pokročilé architektury pro tabulková data
TabTransformer, FT-Transformer a hluboké a křížové sítě
• Aspekty časových řad
Časové rozdělení a detekce posunu kovariátů
• PEFT a efektivní techniky
LoRA, distilace a obchodování kvantizací
• Praktické laboratoře
Fine-tuning předtrénovaných transformerů pro text
Fine-tuning předtrénovaných vizualizačních modelů
Porovnání TabTransformeru s GBDT
Modul 7: Generativní AI systémy
• Základy vytváření popisků
Strukturované vytváření popisků a kontrolovaná generace
• Základy LLM
Tokenizace, úprava instrukcí a odstranění halucinací
• Generace podporovaná vyhledáváním
Rozdělení na bloky, vložení, hybridní vyhledávání a metriky hodnocení
• Strategie fine-tuningu
LoRA a QLoRA s kontroly kvality dat
• Difuzní modely
Intuice latentní difuze a praktická adaptace
• Synthetická tabulková data
CTGAN a bezpečnostní aspekty
• Praktické laboratoře
Minimální aplikace RAG v produkčním stylu
Strukturovaná validace výstupu s vynucením schématu
Volitelné experimentování s difuzí
Modul 8: AI agenty a MCP
• Návrh smyčky agenta
Pozorování, plánování, akce, reflexe a trvání
• Architektury agentů
ReAct, plán a vykonání a koordinace více agentů
• Správa paměti
Epizodické, semantické a scratchpad přístupy
• Integrace nástrojů a bezpečnost
Smluvní vazby nástrojů, sandboxing a obrana proti útokům prostřednictvím popisků
• Rámce hodnocení
Přehrávané stopy, úložní sady a regresní testování
• MCP a protokolová interoperabilita
Návrh MCP serverů s bezpečným expozicí nástrojů
• Praktické laboratoře
Vytvoření agenta od nuly
Expozice nástrojů prostřednictvím serveru stylu MCP
Vytvoření hodnotícího mechanismu s bezpečnostními omezeními
Požadavky
Účastníci by měli mít pracovní znalost programování v Pythonu.
Tento program je určený pro středně a pokročilé technické profesionály.
Reference (2)
ML ekosystém neobsahuje pouze MLflow, ale také Optuna, Hyperopt, Docker a Docker Compose
Guillaume GAUTIER - OLEA MEDICAL
Kurz - MLflow
Přeloženo strojem
Rád jsem se zúčastnil školení Kubeflow, které proběhlo vzdáleně. Toto školení mi umožnilo prohloubit znalosti o službách AWS, K8s a všech devOps nástrojích kolem Kubeflow, což jsou nezbytné základy pro správný přístup k tématu. Rád bych poděkoval Marcinovi Malawskimu za jeho trpělivost a profesionální přístup při školení a poradách o osvědčených postupech. Malawski se k tématu přibližuje z různých úhlů, používá různé nástroje pro nasazení jako Ansible, EKS kubectl a Terraform. Teď jsem naprosto přesvědčen, že vstupuji do správného oboru aplikace.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurz - Kubeflow
Přeloženo strojem