Návrh Školení
Úvod
Instalace a konfigurace Dataiku Data Science Studio (DSS)
- Systémové požadavky na Dataiku DSS
- Nastavení integrací Apache Hadoop a Apache Spark
- Konfigurace Dataiku DSS s webovými proxy servery
- Migrace z jiných platform na Dataiku DSS
Přehled funkcí a architektury Dataiku DSS
- Základní objekty a grafy v Dataiku DSS
- Co je recept v Dataiku DSS?
- Typy datových souborů podporované Dataiku DSS
Vytvoření projektu v Dataiku DSS
Definování datových sad pro připojení k datovým zdrojům v Dataiku DSS
- Práce s konektory a formáty souborů DSS
- Standardní formáty DSS vs. formáty specifické pro Hadoop
- Nahrávání souborů do projektu v Dataiku DSS
Přehled serverového systému souborů v Dataiku DSS
Vytvoření a používání spravovaných složek
- Recept pro sloučení složek v Dataiku DSS
- Lokální vs. ne-lokální spravované složky
Vytvoření datové sady systému souborů pomocí obsahu spravovaných složek
- Provádění čištění pomocí kódu v DSS
Práce s metrikovými datovými sady a interními statistikami
Implementace receptu pro stažení HTTP datové sady v DSS
Přesun SQL a HDFS datových sad pomocí DSS
Řazení datových sad v Dataiku DSS
- Řazení při zápisu vs. řazení při čtení
Průzkum a příprava vizualizací dat pro projekt v Dataiku DSS
Přehled schémat, typů úložišť a znamenání v Dataiku
Provedení čištění, normalizace a obohacení dat pomocí skriptů v Dataiku DSS
Práce s rozhraním grafů a typy vizuálních agregací v Dataiku DSS
Využití interaktivní funkce statistik v DSS
- Univariátní analýza vs. bivariátní analýza
- Použití nástroje pro hlavní komponentu (PCA) v DSS
Přehled strojového učení s Dataiku DSS
- Supervizované ML vs. nesupervizované ML
- Reference pro algoritmy a funkce zpracování dat v DSS
- Hluboké učení s Dataiku DSS
Přehled toku odvozeného z datových sad a receptů v DSS
Transformace existujících datových sad v DSS pomocí vizuálních receptů
Využití receptů v DSS založených na uživatelsky definovaném kódu
Optimalizace průzkumu a experimentování s kódem pomocí kódotáhů DSS
Psaní pokročilých vizualizací a vlastních front-end funkcí pomocí webových aplikací
Práce s funkcí kódových zpráv v Dataiku DSS
Sdílení prvků datového projektu a seznámení s řídicím panely DSS
Návrh a balení projektu v Dataiku DSS jako opakovaně použitelné aplikace
Přehled pokročilých metod v Dataiku DSS
- Implementace optimalizovaného dělení datových sad pomocí DSS
- Spouštění specifických částí zpracování DSS prostřednictvím výpočtů v kontejnerech Kubernetes
Přehled spolupráce a řízení verzí v Dataiku DSS
Implementace automatizačních scénářů, metrik a kontrol pro testování projektu v DSS
Nasazování a aktualizace projektu s pomocí uzlu automatizace DSS a balíčků
Práce s reálně časovými rozhraními API v Dataiku DSS
- Další rozhraní API a Rest API v DSS
Analýza a prognózování časových řad v Dataiku DSS
Zabezpečení projektu v Dataiku DSS
- Správa oprávnění k projektu a autorizací řídicích panelů
- Implementace pokročilých možností zabezpečení
Integrace Dataiku DSS s cloudu
Řešení potíží
Shrnutí a uzávěr
Požadavky
- Zkušenosti s programovacími jazyky Python, SQL a R
- Základní znalosti zpracování dat pomocí Apache Hadoopu a Sparku
- Chápání konceptů strojového učení a datových modelů
- Pozadí ve statistických analýzách a konceptech datové vědy
- Zkušenosti s vizualizací a komunikací dat
Cílová skupina
- Inženýři
- Datoví vědci
- Analýti dat