Návrh Školení

Úvod do aplikovaného strojového učení

  • Srovnání statistického učení a strojového učení
  • Iterace a hodnocení
  • Vztah náklonu a rozptylu (bias-variance trade-off)
  • Srovnaní dozorovaného a nedozorovaného učení
  • Problémy řešené strojovým učením
  • Trenink, validace a testování – workflow ML pro předcházení overfittingu
  • Workflow strojového učení
  • Strojové algoritmy učení
  • Výběr vhodného algoritmu k problému

Hodnocení algoritmů

  • Hodnocení numerických predikcí
    • Míry přesnosti: ME, MSE, RMSE, MAPE
    • Přesnost parametrů a predikcí
  • Hodnocení klasifikačních algoritmů
    • Přesnost a její problémy
    • Konfundenční matice (confusion matrix)
    • Problém nevyvážených tříd (unbalanced classes problem)
  • Vizualizace výkonu modelu
    • Zisková křivka (profit curve)
    • Křivka ROC
    • Lift křivka
  • Výběr modelu
  • Fine-tuning modelu – strategie grid search

Příprava dat pro modelování

  • Import a ukládání dat
  • Základní průzkum dat
  • Manipulace s daty pomocí knihovny pandas
  • Data transformations – úpravy dat (data wrangling)
  • Explorativní analýza
  • Detekce a řešení chybějících hodnot
  • Detekce a strategie řešení odlehlých hodnot (outliers)
  • Standardizace, normalizace, binární kódování
  • Kódování kvalitativních dat

Algoritmy strojového učení pro detekci odlehlých hodnot (outliers)

  • Dozorované algoritmy
    • K-nejbližších sousedů (KNN)
    • Ensemble Gradient Boosting
    • Support Vector Machines (SVM)
  • Nedozičované algoritmy
    • Vzdálenostní metody
    • Hustotové metody
    • Pravděpodobnostní metody
    • Modelové metody

Porozumění hlubokému učení (deep learning)

  • Přehled základních konceptů hlubokého učení
  • Rozdíl mezi strojovým a hlubokým učením
  • Přehled aplikací hlubokého učení

Přehled neuronových sítí (neural networks)

  • Co jsou neuronové sítě
  • Srovnaní neuronových sítí a regresních modelů
  • Porozumění matematickým základům a učícím mechanismům
  • Vytváření umělých neuronových sítí
  • Porozumění neuronovým uzlům a spojením
  • Práce s neurony, vrstvami a vstupními a výstupními daty
  • Porozumění jednovrstvým perceptronům (single layer perceptrons)
  • Rozdíl mezi dozorovaným a nedozorovaným učením
  • Učení feedforward a feedback neuronových sítí
  • Porozumění forward propagation a back propagation

Vytváření jednoduchých modelů hlubokého učení pomocí Kerasu

  • Vytvoření modelu v Kerasu
  • Porozumění vašim datům
  • Specifikace vašeho modelu hlubokého učení
  • Kompilace vašeho modelu
  • Trenink vašeho modelu
  • Práce s daty pro klasifikaci
  • Práce s klasifikačními modely
  • Použití vašich modelů

Práce s TensorFlow pro hluboké učení

  • Příprava dat
    • Stažení dat
    • Příprava trénovacích dat
    • Příprava testovacích dat
    • Škálování vstupů
    • Použití placeholderů a proměnných
  • Specifikace architektury sítě
  • Použití funkce nákladu (cost function)
  • Použití optimalizátoru (optimizer)
  • Použití inicializátorů
  • Trenink neuronové sítě
  • Vytváření grafu
    • Inference
    • Ztráta (loss)
    • Trenink
  • Trenink modelu
    • Graf
    • Sesíťové prostředí (session)
    • Treninková smyčka (train loop)
  • Hodnocení modelu
    • Vytvoření grafu pro hodnocení (eval graph)
    • Hodnocení s výstupy eval
  • Trenink modelů ve velkém měřítku
  • Vizualizace a hodnocení modelů pomocí TensorBoard

Aplikace hlubokého učení v detekci odlehlých hodnot (anomaly detection)

  • Autoencoder
    • Architektura enkodér-dekodér
    • Ztráta rekonstrukce (reconstruction loss)
  • Variational Autoencoder
    • Variational inference
  • Generative Adversarial Network
    • Architektura generátor-diskriminátor
    • Přístupy k detekci odlehlých hodnot pomocí GAN

Rámce pro ensemble (ensemble frameworks)

  • Kombinace výsledků různých metod
  • Bootstrap Aggregating (bagging)
  • Příklonové skóre outlierů (outlier score averaging)

Požadavky

  • Zkušenosti s programováním v Pythonu
  • Základní znalost statistiky a matematických pojmů

Cílová skupina

  • Vývojáři
  • Data science specialisté
 28 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie