Návrh Školení

Úvod

Tato část poskytuje obecný úvod o tom, kdy použít „strojové učení“, co je třeba vzít v úvahu a co to všechno znamená, včetně výhod a nevýhod. Datové typy (strukturované/nestrukturované/statické/streamované), validita/objem dat, data řízená vs. uživatelsky řízená analytika, statistické modely vs. modely strojového učení/výzvy učení bez dozoru, kompromis odchylky-variance, iterace/hodnocení, křížové validační přístupy , pod dohledem/bez dozoru/posílení.

HLAVNÍ TÉMATA

1. Pochopení naivní Bayes

  • Základní pojmy bayesovských metod
  • Pravděpodobnost
  • Souhrnná pravděpodobnost
  • Podmíněná pravděpodobnost s využitím Bayesova teorému
  • Algoritmus naivního Bayesa
  • Klasifikace pomocí naivního Bayese
  • Laplaceův odhad
  • Používání numerických vlastností s naivním Bayesem

2. Pochopení rozhodovacích stromů

  • Rozdělovat a vládnout
  • C5.0 algoritmus rozhodovacích stromů
  • Výběr nejlepšího rozdělení
  • Řezání rozhodovacího stromu

3. Pochopení neuronových sítí

  • Z biologických k umělým neuronům
  • Aktivační funkce
  • Síťová topologie
  • Počet vrstev
  • Počet uzlů v každé vrstvě
  • Trénink neuronových sítí pomocí backpropagation
  • Deep Learning

4. Pochopení podpůrných vektorových strojů

  • Klasifikace pomocí hyperrovin
  • Nalezení maximálního okraje
  • Případ lineárně separovatelných dat
  • Případ ne-lineárně separovatelných dat
  • Použití jader pro ne-lineární prostory

5. Pochopení shlukování

  • Shlukování jako úloha strojového učení
  • K-means algoritmus pro shlukování
  • Použití vzdálenosti k přiřazování a aktualizaci shluků
  • Výběr vhodného počtu shluků

6. Měření výkonu pro klasifikaci

  • Práce s daty predikcí klasifikace
  • Přiblížené pohledy na matice konfuze
  • Použití matic konfuze k měření výkonu
  • Víc než jen přesnost – další měřítka výkonu
  • Kappa statistika
  • Citlivost a specifickita
  • Přesnost a sensitivity
  • F-měřítko
  • Vizuální představení obchodních výhod výkonu
  • Křivky ROC
  • Odhad budoucího výkonu
  • Metoda holdout
  • Křížová validace
  • Bootstrap vzorkování

7. Ladění modelů pažby pro lepší výkon

  • Použití caretu pro automatické ladění parametrů
  • Vytvoření jednoduchého laděného modelu
  • Personalizace procesu ladění
  • Zlepšování výkonu modelu pomocí meta-učení
  • Pochopení ensemblů
  • Bağging
  • Boosting
  • Náhodné lesy
  • Trénink náhodných lesů
  • Hodnocení výkonu náhodných lesů

MENŠÍ TÉMATA

8. Pochopení klasifikace pomocí nejbližších sousedů

  • KNN algoritmus
  • Výpočet vzdálenosti
  • Výběr vhodného k
  • Příprava dat pro použití s KNN
  • Proč je KNN algoritmus lenivý?

9. Pochopení klasifikačních pravidel

  • Rozdělovat a vládnout
  • Jedno pravidlo algoritmu
  • RIPPER algoritmus
  • Pravidla z rozhodovacích stromů

10. Pochopení regrese

  • Jednoduchá lineární regrese
  • Obyčejné nejmenší čtverce odhadu
  • Korelace
  • Vícekroková lineární regrese

11. Porozumění regresním stromům a modelovým stromům

  • Přidání regrese do stromů

12. Pochopení asociačních pravidel

  • Apriori algoritmus pro učení asociačních pravidel
  • Měření zájmu o pravidla – podpora a důvěryhodnost
  • Vytvoření sady pravidel pomocí principu Apriori

Extra

  • Spark/PySpark/MLlib a Multi-armed bandits

Požadavky

Python znalosti

 21 hodiny

Počet účastníků


Price per participant

Reference (7)

Upcoming Courses

Související kategorie