Zkuste nás kontaktovat

Návrh Školení

Úvod

Tato sekce poskytuje obecný úvod do tématu, kdy je vhodné použít 'strojové učení', na co je třeba dbát a co to vše znamená, včetně výhod a nevýhod. Datové typy (strukturované/nestrukturované/statické/streamované), platnost a objem dat, analytika řízená daty versus řízená uživatelem, statistické modely versus modely strojového učení, výzvy nepřesného učení, kompromis mezi biasem a variancí, iterace/evaluace, přístupy křížové validace, nadzorované/přesné/výchozí učení.

HLAVNÍ TÉMATA

1. Pojetí algoritmu Naive Bayes

  • Základní koncepty bayesovských metod
  • Pravděpodobnost
  • Spolu-pravděpodobnost (Joint probability)
  • Kondicionální pravděpodobnost s použitím Bayesova věty
  • Algoritmus Naive Bayes
  • Klasifikace pomocí Naive Bayes
  • Laplaceův odhad
  • Použití numerických vlastností s Naive Bayes

2. Pojetí rozhodovacích stromů

  • Rozděl a panuj (Divide and conquer)
  • Algoritmus rozhodovacích stromů C5.0
  • Výběr nejlepšího rozdělení
  • Pruning (odstraňování větví) rozhodovacího stromu

3. Pojetí neuronových sítí

  • Od biologických k umělým neuronům
  • Apikační funkce
  • Topologie sítě
  • Počet vrstev
  • Směr toku informace
  • Počet uzelů v každé vrstvě
  • Výcvik neuronových sítí pomocí zpětného šíření chyby (backpropagation)
  • Hluboké učení

4. Pojetie podpůrných vektorů (Support Vector Machines)

  • Klasifikace pomocí nadploch
  • Nalezení maximální mezery (margin)
  • Případ lineárně oddělitelných dat
  • Případ nelineárně oddělitelných dat
  • Použití jaderných funkcí pro nelineární prostory

5. Pojetí shlukování

  • Shlukování jako úloha strojového učení
  • Algoritmus k-means pro shlukování
  • Použití vzdálenosti při přiřazování a aktualizaci shluků
  • Výběr vhodného počtu shluků

6. Měření výkonu pro klasifikaci

  • Práce s daty předpovědí klasifikace
  • Podrobnější pohled na zmatkové matice
  • Použití zmatkových matic pro měření výkonu
  • Více než přesnost – další míry výkonu
  • Kappova statistika
  • Specificita a senzitivita
  • Přesnost a úplnost (Precision a recall)
  • F-míra
  • Visualizace kompromisů ve výkonu
  • Křivky ROC
  • Odhad budoucího výkonu
  • Metoda hold-out
  • Křížová validace
  • Bootstrapové vzorkování

7. Ladění základních modelů pro lepší výkon

  • Použití balíčku caret pro automatizované ladění parametrů
  • Vytvoření jednoduchého laděného modelu
  • Úprava procesu ladění
  • Zlepšení výkonu modelu pomocí meta-vyučování
  • Pojetí ensemblů
  • Bagging
  • Boosting
  • Přesná lesní (Random forests)
  • Výcvik přesných lesů
  • Evaluace výkonu přesných lesů

VEDLEJŠÍ TÉMATA

8. Pojetí klasifikace pomocí nejbližších sousedů

  • Algoritmus kNN
  • Výpočet vzdálenosti
  • Výběr vhodného k
  • Příprava dat pro použití s kNN
  • Proč je algoritmus kNN 'lenoch?'

9. Pojetí pravidel klasifikace

  • Separate a conquer
  • Algoritmus One Rule
  • Algoritmus RIPPER
  • Pravidla z rozhodovacích stromů

10. Pojetí regrese

  • Jednoduchá lineární regrese
  • Odhad metodou nejmenších čtverců
  • Korelace
  • Více lineární regrese

11. Pojetí regresečních stromů a modelových stromů

  • Přidání regrese ke stromům

12. Pojetí asociačních pravidel

  • Algoritmus Apriori pro učení asociačních pravidel
  • Měření zájmu o pravidlo – podpora a důvěra
  • Sestavení sady pravidel s použitím principu Apriori

Doplňkové informace

  • Spark/PySpark/MLlib a multi-armed bandits

Požadavky

Znalost programovacího jazyka Python

 21 Hodiny

Počet účastníků


Cena za účastníka

Reference (7)

Nadcházející kurzy

Související kategorie