Návrh Školení

Úvod do aplikovaného strojového učení

  • Statistické učení vs. Strojové učení
  • Iterace a hodnocení
  • Compromise mezi předpojatostí a variabilitou (bias-variance trade-off)
  • Supervizované vs. Nesupervizované učení
  • Problémy řešené strojovým učením
  • Trénink, validace a test – pracovní postup ML pro předcházení přetrenování (overfitting)
  • Pracovní postup strojového učení
  • Algoritmy strojového učení
  • Výběr vhodného algoritmu pro problém

Hodnocení algoritmů

  • Hodnocení numerických predikcí
    • Měřítko přesnosti: ME, MSE, RMSE, MAPE
    • Stabilita parametrů a predikcí
  • Hodnocení algoritmů klasifikace
    • Přesnost a její problémy
    • Matice záměn (confusion matrix)
    • Problém nerovných tříd (unbalanced classes problem)
  • Vizualizace výkonnosti modelu
    • Profitní křivka
    • ROC křivka
    • Lift křivka
  • Výběr modelu
  • Tuning modelu – strategie mřížkového hledání (grid search strategies)

Příprava dat pro modelování

  • Import a ukládání dat
  • Chápání dat – základní průzkumy
  • Manipulace s daty pomocí knihovny pandas
  • Transformace dat – úpravy dat (data wrangling)
  • Průzkumná analýza
  • Zjišťování a řešení chybějících hodnot (missing observations)
  • Detekce odlehlých hodnot (outliers) – strategie
  • Standardizace, normalizace, binarizace
  • Kódování kvalitativních dat

Algoritmy strojového učení pro detekci odlehlých hodnot (outliers)

  • Supervizované algoritmy
    • KNN
    • Ensemble Gradient Boosting
    • SVM
  • Nesupervizované algoritmy
    • Vzdálenostní metody
    • Metody založené na hustotě (density based methods)
    • Pravděpodobnostní metody
    • Modelové metody

Chápání hloubkového učení

  • Přehled základních konceptů hloubkového učení
  • Rozdíl mezi strojovým a hloubkovým učením
  • Přehled aplikací hloubkového učení

Přehled neuronových sítí

  • Co jsou neuronové sítě
  • Neuronové sítě vs. Regresní modely
  • Chápání matematických základů a učebních mechanismů
  • Vytváření umělých neuronových sítí
  • Chápání neuronových uzlů a spojení
  • Práce s neurony, vrstvami a vstupními a výstupními daty
  • Chápání jednovrstevných perceptronů (Single Layer Perceptrons)
  • Rozdíly mezi supervizovaným a nesupervizovaným učením
  • Využití feedforward a feedback neuronových sítí
  • Chápání forward propagation a back propagation

Vytváření jednoduchých modelů hloubkového učení pomocí Kerasu

  • Vytváření modelu v Kerasu
  • Chápání vašich dat
  • Specifikace modelu hloubkového učení
  • Kompilace modelu
  • Trénink modelu
  • Práce s daty klasifikace
  • Práce s modelemmi klasifikace
  • Použití modelů

Práce s TensorFlowem pro hloubkové učení

  • Příprava dat
    • Stažení dat
    • Příprava tréninkových dat
    • Příprava testovacích dat
    • Měření vstupů (scaling inputs)
    • Použití zástupců a proměnných (placeholders and variables)
  • Specifikace architektury sítě
  • Použití funkce nákladů (cost function)
  • Použití optimalizátoru
  • Použití inicializátorů
  • Trénink neuronové sítě
  • Vytváření grafu (building the graph)
    • Inferencia
    • Ztráta (loss)
    • Trénink
  • Trénink modelu
    • Graf (The Graph)
    • Relace (The Session)
    • Tréninková smyčka (Train Loop)
  • Hodnocení modelu
    • Vytváření evaluačního grafu (building the eval graph)
    • Hodnocení s výstupem evaluace (evaluating with eval output)
  • Trénink modelů na velkou měřítku (training models at scale)
  • Vizualizace a hodnocení modelů s TensorBoardem

Aplikace hloubkového učení v detekci odlehlých hodnot (anomaly detection)

  • Autoencoder
    • Architektura encoder-decoderu
    • Ztráta rekonstrukce (reconstruction loss)
  • Variational Autoencoder
    • Variační inference
  • Generative Adversarial Network (GAN)
    • Architektura generátoru a diskriminátoru
    • Přístupy k AN pomocí GAN

Ensembléové frameworky

  • Kombinace výsledků různých metod
  • Bootstrap Aggregating (bagging)
  • Průměrování skóre odlehlých hodnot

Požadavky

  • Zkušenosti s programováním v Pythonu
  • Základní znalost statistiky a matematických konceptů

Cílová skupina

  • Vývojáři
  • Data scientists
 28 Hodiny

Počet účastníků


Cena za účastníka

Reference (5)

Nadcházející kurzy

Související kategorie