Návrh Školení

Rychlý přehled

    Data Sources Minding Data Recommender systems Cíl Marketing

Typy dat

    Strukturovaná vs. nestrukturovaná Statická vs. streamovaná Postojová, behaviorální a demografická data Platnost analytických dat řízená daty vs. uživateli řízená Objem, rychlost a rozmanitost dat

Modelky

    Budování modelů Statistické modely Strojové učení

Klasifikace dat

    Seskupení kGroups, k-prostředí, nejbližší sousedé mravenčí kolonie, hejna ptáků

Prediktivní modely

    Rozhodovací stromy Support vector machine Naivní Bayesova klasifikace Neuronové sítě Markovův model Metody regresního souboru

ROI

    Poměr přínos/náklady Náklady na software Náklady na vývoj Potenciální přínosy

Modely budov

    Příprava dat (MapReduce) Čištění dat Výběr metod Vývoj modelu Testování modelu Hodnocení modelu Nasazení a integrace modelu

Přehled Open Source a komerčního softwaru

    Výběr balíčku R-projektů Python knihovny Hadoop a Mahout Vybrané projekty Apache související s Big Data a Analytics Vybrané komerční řešení Integrace se stávajícím softwarem a datovými zdroji

Požadavky

Pochopení tradičních metod správy a analýzy dat jako SQL, datové sklady, business intelligence, OLAP atd... Pochopení základních statistik a pravděpodobnosti (střední hodnota, rozptyl, pravděpodobnost, podmíněná pravděpodobnost atd...)

 21 hodiny

Počet účastníků



Price per participant

Reference (1)

Související kategorie