Návrh Školení
Úvod
Instalace a konfigurace Dataiku Data Science Studio (DSS)
- Systémové požadavky pro Dataiku DSS Nastavení integrací Apache Hadoop a Apache Spark Konfigurace Dataiku DSS pomocí webových proxy Přechod z jiných platforem na Dataiku DSS
Přehled funkcí a architektury Dataiku DSS
- Základní objekty a grafy, které jsou základem Dataiku DSS Co je recept v Dataiku DSS? Typy datových sad podporované Dataiku DSS
Vytvoření projektu Dataiku DSS
Definování datových sad pro připojení k datovým zdrojům v Dataiku DSS
- Práce s konektory DSS a formáty souborů Standardní formáty DSS vs Hadoop-specifické formáty Nahrávání souborů pro projekt Dataiku DSS
Přehled souborového systému serveru v Dataiku DSS
Vytváření a používání spravovaných složek
- Recept Dataiku DSS pro slučovací složku Místní vs nelokální spravované složky
Vytvoření datové sady souborového systému pomocí obsahu spravované složky
- Provádění čištění pomocí receptury kódu DSS
Práce s datovou sadou metrik a datovou sadou interních statistik
Implementace DSS Download Recipe pro HTTP Dataset
Přemístění SQL Datové sady a Datové sady HDFS pomocí DSS
Objednávání datových sad v Dataiku DSS
- Objednávání zapisovatele vs. objednávání v době čtení
Zkoumání a příprava datových vizuálů pro projekt Dataiku DSS
Přehled schémat Dataiku, typů úložiště a významů
Provádění skriptů pro čištění, normalizaci a obohacení dat v Dataiku DSS
Práce s rozhraním Dataiku DSS Charts a typy vizuálních agregací
Využití interaktivní Statistics funkce DSS
- Jednorozměrná analýza vs bivariační analýza Využití nástroje DSS Analýza hlavních komponent (PCA)
Přehled Machine Learning s Dataiku DSS
- Dohlížené ML vs. ML bez dohledu Reference pro DSS ML Algoritmy a zpracování funkcí Deep Learning s Dataiku DSS
Přehled toku odvozeného z datových sad a receptů DSS
Transformace existujících datových sad v DSS pomocí vizuálních receptů
Využití DSS receptů na základě uživatelem definovaného kódu
Optimalizace zkoumání kódu a experimentování s DSS Code Notebooky
Psaní pokročilých vizualizací DSS a vlastních funkcí frontendu pomocí webových aplikací
Práce s funkcí Dataiku DSS Code Reports
Sdílení datového projektu Elements a seznámení s DSS Dashboard
Návrh a balení projektu Dataiku DSS jako opakovaně použitelné aplikace
Přehled pokročilých metod v Dataiku DSS
- Implementace optimalizovaného dělení datových sad pomocí DSS Provádění specifických částí zpracování DSS prostřednictvím výpočtů v Kubernetes kontejnerech
Přehled Collaboration a Řízení verzí v Dataiku DSS
Implementace automatizačních scénářů, metrik a kontrol pro testování projektu DSS
Nasazení a aktualizace projektu pomocí uzlu a balíčků automatizace DSS
Práce s Real-Time API v Dataiku DSS
- Další API a Rest API v DSS
Analýza a Forecasting Časové řady Dataiku DSS
Zabezpečení projektu v Dataiku DSS
- Správa oprávnění k projektu a oprávnění řídicího panelu Implementace pokročilých možností zabezpečení
Integrace Dataiku DSS s cloudem
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Zkušenosti s programovacími jazyky Python, SQL a R
- Základní znalost zpracování dat pomocí Apache Hadoop a Spark
- Pochopení konceptů strojového učení a datových modelů
- Pozadí ve statistických analýzách a konceptech datové vědy
- Zkušenosti s vizualizací a komunikací dat
Publikum
- Inženýři
- Data Scientists
- Analytici dat