Návrh Školení

1. Chápání klasifikace pomocí nejblíže sousedů

  • Algoritmus kNN
  • Výpočet vzdálenosti
  • Vybrání vhodného k
  • Příprava dat pro použití s kNN
  • Proč je algoritmus kNN "lazy"?

2. Chápání naivní Bayesové metody

  • Základní koncepty bayesiánských metod
  • Pravděpodobnost
  • Spojité pravděpodobnosti
  • Podmíněná pravděpodobnost s Bayesovou větou
  • Naivní Bayesův algoritmus
  • Naivní Bayesová klasifikace
  • Laplaceův estimační přístup
  • Použití numerických vlastností s naivním Bayesem

3. Chápání rozhodovacích stromů

  • Rozděl a panuj
  • C5.0 algoritmus rozhodového stromu
  • Výběr nejlepšího rozdělení
  • Pruning rozhodového stromu

4. Chápání klasifikačních pravidel

  • Rozděl a panuj
  • Algoritmus One Rule
  • Algoritmus RIPPER
  • Pravidla z rozhodových stromů

5. Chápání regrese

  • Jednoduchá lineární regrese
  • Obyčejné metody nejmenších čtverců
  • Korelace
  • Vícenásobná lineární regrese

6. Chápání regresních stromů a modelových stromů

  • Přidání regrese do stromů

7. Chápání neuronových sítí

  • Od biologických k umělým neurónům
  • Aktivační funkce
  • Síťová topologie
  • Počet vrstev
  • Smer informací v síti
  • Počet uzlů ve každé vrstvě
  • Trenování neuronových sítí pomocí backpropagation

8. Chápání podporujících vektorových strojů (SVM)

  • Klasifikace pomocí hyperrovinností
  • Hledání maximálního odstupu
  • Případ lineárně separovatelných dat
  • Případ ne-lineárně separovatelných dat
  • Použití jádrové funkce pro ne-lineární prostory

9. Chápání asociativních pravidel

  • Algoritmus Apriori pro učení asociativních pravidel
  • Měření zájmu pravidla – podpora a důvěra
  • Vytváření sady pravidel pomocí principu Apriori

10. Chápání shlukování (clustering)

  • Shlukování jako úloha strojového učení
  • Algoritmus k-means pro shlukování
  • Použití vzdálenosti pro přiřazení a aktualizaci shluků
  • Výběr vhodného počtu shluků

11. Měření výkonu klasifikace

  • Práce s daty predikce klasifikace
  • Důkladnější pohled na matice záměn (confusion matrices)
  • Použití matic záměn pro měření výkonu
  • Za přesností – další míry výkonu
  • Kappa statistika
  • Citlivost a specifita
  • Přesnost a odvolání (recall)
  • F-míra
  • Vizualizace obchodů výkonu
  • Křivky ROC
  • Odhad budoucího výkonu
  • Metoda holdout
  • Križová validace (cross-validation)
  • Vzorkování bootstrapem

12. Dostavení modelů k lepšímu výkonu

  • Použití caret pro automatizované nastavování parametrů
  • Vytvoření jednoduchého dostaveného modelu
  • Přizpůsobení procesu dostavování
  • Zlepšení výkonu modelu pomocí meta-uceňování (meta-learning)
  • Chápání souborů modelů (ensembles)
  • Pouzití bagging
  • Použití boosting
  • Náhodné lesy (random forests)
  • Trenování náhodných lesů
  • Hodnocení výkonu náhodných lesů

13. Hluboké učení (Deep Learning)

  • Tři třídy hlubokého učení
  • Hluboké autoenkodery
  • Předtrénované hluboké neuronové sítě
  • Hluboké složené sítě (deep stacking networks)

14. Diskuse o konkrétních aplikačních oblastech

 21 hodiny

Počet účastníků


Cena za účastníka

Reference (1)

Nadcházející kurzy

Související kategorie