Návrh Školení

Úvod

Instalace a konfigurace Dataiku Data Science Studio (DSS)

    Systémové požadavky pro Dataiku DSS Nastavení integrací Apache Hadoop a Apache Spark Konfigurace Dataiku DSS pomocí webových proxy Přechod z jiných platforem na Dataiku DSS

Přehled funkcí a architektury Dataiku DSS

    Základní objekty a grafy, které jsou základem Dataiku DSS Co je recept v Dataiku DSS? Typy datových sad podporované Dataiku DSS

Vytvoření projektu Dataiku DSS

Definování datových sad pro připojení k datovým zdrojům v Dataiku DSS

    Práce s konektory DSS a formáty souborů Standardní formáty DSS vs Hadoop-specifické formáty Nahrávání souborů pro projekt Dataiku DSS

Přehled souborového systému serveru v Dataiku DSS

Vytváření a používání spravovaných složek

    Recept Dataiku DSS pro slučovací složku Místní vs nelokální spravované složky

Vytvoření datové sady souborového systému pomocí obsahu spravované složky

    Provádění čištění pomocí receptury kódu DSS

Práce s datovou sadou metrik a datovou sadou interních statistik

Implementace DSS Download Recipe pro HTTP Dataset

Přemístění SQL Datové sady a Datové sady HDFS pomocí DSS

Objednávání datových sad v Dataiku DSS

    Objednávání zapisovatele vs. objednávání v době čtení

Zkoumání a příprava datových vizuálů pro projekt Dataiku DSS

Přehled schémat Dataiku, typů úložiště a významů

Provádění skriptů pro čištění, normalizaci a obohacení dat v Dataiku DSS

Práce s rozhraním Dataiku DSS Charts a typy vizuálních agregací

Využití interaktivní Statistics funkce DSS

    Jednorozměrná analýza vs bivariační analýza Využití nástroje DSS Analýza hlavních komponent (PCA)

Přehled Machine Learning s Dataiku DSS

    Dohlížené ML vs. ML bez dohledu Reference pro DSS ML Algoritmy a zpracování funkcí Deep Learning s Dataiku DSS

Přehled toku odvozeného z datových sad a receptů DSS

Transformace existujících datových sad v DSS pomocí vizuálních receptů

Využití DSS receptů na základě uživatelem definovaného kódu

Optimalizace zkoumání kódu a experimentování s DSS Code Notebooky

Psaní pokročilých vizualizací DSS a vlastních funkcí frontendu pomocí webových aplikací

Práce s funkcí Dataiku DSS Code Reports

Sdílení datového projektu Elements a seznámení s DSS Dashboard

Návrh a balení projektu Dataiku DSS jako opakovaně použitelné aplikace

Přehled pokročilých metod v Dataiku DSS

    Implementace optimalizovaného dělení datových sad pomocí DSS Provádění specifických částí zpracování DSS prostřednictvím výpočtů v Kubernetes kontejnerech

Přehled Collaboration a Řízení verzí v Dataiku DSS

Implementace automatizačních scénářů, metrik a kontrol pro testování projektu DSS

Nasazení a aktualizace projektu pomocí uzlu a balíčků automatizace DSS

Práce s Real-Time API v Dataiku DSS

    Další API a Rest API v DSS

Analýza a Forecasting Časové řady Dataiku DSS

Zabezpečení projektu v Dataiku DSS

    Správa oprávnění k projektu a oprávnění řídicího panelu Implementace pokročilých možností zabezpečení

Integrace Dataiku DSS s cloudem

Odstraňování problémů

Shrnutí a závěr

Požadavky

  • Zkušenosti s programovacími jazyky Python, SQL a R
  • Základní znalost zpracování dat pomocí Apache Hadoop a Spark
  • Pochopení konceptů strojového učení a datových modelů
  • Pozadí ve statistických analýzách a konceptech datové vědy
  • Zkušenosti s vizualizací a komunikací dat

Publikum

  • Inženýři
  • Data Scientists
  • Analytici dat
 21 hodiny

Počet účastníků



Price per participant

Související kurzy

Související kategorie