Návrh Školení
Úvod
Tato část poskytuje obecný úvod o tom, kdy použít „strojové učení“, co je třeba vzít v úvahu a co to všechno znamená, včetně výhod a nevýhod. Datové typy (strukturované/nestrukturované/statické/streamované), validita/objem dat, data řízená vs. uživatelsky řízená analytika, statistické modely vs. modely strojového učení/výzvy učení bez dozoru, kompromis odchylky-variance, iterace/hodnocení, křížové validační přístupy , pod dohledem/bez dozoru/posílení.
HLAVNÍ TÉMATA
1. Pochopení naivní Bayes
- Základní pojmy Bayesových metod Pravděpodobnost Společná pravděpodobnost Podmíněná pravděpodobnost s Bayesovou větou Naivní Bayesův algoritmus Naivní Bayesova klasifikace Laplaceův odhad Použití numerických znaků s naivním Bayesem
2. Pochopení rozhodovacích stromů
- Rozděl a panuj Algoritmus rozhodovacího stromu C5.0 Výběr nejlepšího rozdělení Prořezávání rozhodovacího stromu
3. Pochopení neuronových sítí
- Od biologických k umělým neuronům Aktivační funkce Topologie sítě Počet vrstev Směr pohybu informace Počet uzlů v každé vrstvě Tréninkové neuronové sítě se zpětnou propagací Deep Learning
4. Pochopení podpůrných vektorových strojů
- Klasifikace s nadrovinami Nalezení maximální rezervy Případ lineárně separovatelných dat Případ nelineárně separovatelných dat Použití jader pro nelineární prostory
5. Pochopení shlukování
- Shlukování jako úloha strojového učení Algoritmus k-means pro shlukování Použití vzdálenosti k přiřazení a aktualizaci clusterů Výběr vhodného počtu clusterů
6. Měření výkonu pro klasifikaci
- Práce s daty predikce klasifikace Bližší pohled na matoucí matice Používání matoucích matic k měření výkonu Kromě přesnosti – další měřítka výkonu Statistika kappa Citlivost a specifičnost Přesnost a vybavitelnost F-measure Vizualizace kompromisů výkonu ROC křivky Odhad budoucího výkonu Metoda prodlevy Cross- validace Bootstrap vzorkování
7. Ladění modelů pažby pro lepší výkon
- Použití stříšky pro automatické ladění parametrů Vytvoření jednoduchého laděného modelu Přizpůsobení procesu ladění Zlepšení výkonu modelu pomocí meta-learningu Pochopení souborů Posílení pytlování Náhodné lesy Trénink náhodných lesů Vyhodnocení náhodného výkonu lesa
MENŠÍ TÉMATA
8. Pochopení klasifikace pomocí nejbližších sousedů
- Algoritmus kNN Výpočet vzdálenosti Výběr vhodného k Příprava dat pro použití s kNN Proč je algoritmus kNN líný?
9. Pochopení klasifikačních pravidel
- Oddělte a ovládněte Algoritmus jediného pravidla Algoritmus RIPPER Pravidla z rozhodovacích stromů
10. Pochopení regrese
- Jednoduchá lineární regrese Obyčejný odhad nejmenších čtverců Korelace Vícenásobná lineární regrese
11. Porozumění regresním stromům a modelovým stromům
- Přidání regrese ke stromům
12. Pochopení asociačních pravidel
- Apriori algoritmus pro učení asociačních pravidel Měření zájmu pravidel – podpora a důvěra Vytváření sady pravidel s Apriori principem
Extra
- Spark/PySpark/MLlib a vícerucí bandité
Reference (5)
Aby to bylo krátké a jednoduché. Vytváření intuice a vizuálních modelů kolem pojmů (graf rozhodovacího stromu, lineární rovnice, ruční výpočet y_pred pro prokázání, jak model funguje).
Nicolae - DB Global Technology
Kurz - Machine Learning
Machine Translated
Pomohlo mi to dosáhnout mého cíle porozumět ML. Velká úcta k Pablovi za to, že poskytl správný úvod do tohoto tématu, protože po 3 dnech školení je zřejmé, jak rozsáhlé toto téma je. Také se mi HODNĚ líbila myšlenka virtuálních strojů, které jste poskytli a které měly velmi dobrou latenci! To umožnilo každému kursantovi dělat experimenty vlastním tempem.
Silviu - DB Global Technology
Kurz - Machine Learning
Machine Translated
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Kurz - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Kurz - Machine Learning
I liked the lab exercises.