Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Rychlý přehled
- Zdroje dat
- Správa dat
- Doporučovací systémy
- Cílový marketing
Typy dat
- Strukturovaná vs nestrukturovaná data
- Statická vs streamovaná data
- Změnové, chování a demografické údaje
- Data-odvedená vs uživatelsky odvedená analýza
- platnost dat
- Hmotnost, rychlost a rozmanitost dat
Modely
- Vytváření modelů
- Statistické modely
- Strojové učení
Klasifikace dat
- Klustering
- kGroups, k-means, nejbližší sousedé
- Mušle ant, pohyby ptáků
Přediktivní modely
- Rostlinné stromy
- Support vector machine (SVM)
- Naive Bayes klasifikace
- Neuronové sítě
- Markovský model
- Regrésní analýza
- Souborové metody
ROI (návratnost investice)
- Poměr přínosu a nákladů
- Náklady na software
- Náklady na vývoj
- Potenciální přínosy
Vytváření modelů
- Příprava dat (MapReduce)
- Očištění dat
- Výběr metod
- Vývoj modelu
- Testování modelu
- Hodnocení modelu
- Nasazení a integrace modelu
Přehled open source a komerčního software
- Výběr balíčků R-project
- Knihovny Pythonu
- Hadoop a Mahout
- Vybrané Apache projekty související s big data a analýzou dat
- Komerční řešení
- Integrace s existujícím softwarem a zdroji dat
Požadavky
Pochopení tradičních metod správy a analýzy dat jako SQL, datové sklady, business intelligence, OLAP atd... Pochopení základních statistik a pravděpodobnosti (střední hodnota, rozptyl, pravděpodobnost, podmíněná pravděpodobnost atd...)
21 hodiny
Reference (2)
Obsah, protože mi přišel velmi zajímavý a myslím, že by mi pomohl v posledním ročníku na univerzitě.
Krishan - NBrown Group
Kurz - From Data to Decision with Big Data and Predictive Analytics
Přeloženo strojem
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.