Návrh Školení

Úvod

Instalace a konfigurace Dataiku Data Science Studio (DSS)

  • Systémové požadavky na Dataiku DSS
  • Nastavení integrací Apache Hadoop a Apache Spark
  • Konfigurace Dataiku DSS s webovými proxy servery
  • Migrace z jiných platform na Dataiku DSS

Přehled funkcí a architektury Dataiku DSS

  • Základní objekty a grafy v Dataiku DSS
  • Co je recept v Dataiku DSS?
  • Typy datových souborů podporované Dataiku DSS

Vytvoření projektu v Dataiku DSS

Definování datových sad pro připojení k datovým zdrojům v Dataiku DSS

  • Práce s konektory a formáty souborů DSS
  • Standardní formáty DSS vs. formáty specifické pro Hadoop
  • Nahrávání souborů do projektu v Dataiku DSS

Přehled serverového systému souborů v Dataiku DSS

Vytvoření a používání spravovaných složek

  • Recept pro sloučení složek v Dataiku DSS
  • Lokální vs. ne-lokální spravované složky

Vytvoření datové sady systému souborů pomocí obsahu spravovaných složek

  • Provádění čištění pomocí kódu v DSS

Práce s metrikovými datovými sady a interními statistikami

Implementace receptu pro stažení HTTP datové sady v DSS

Přesun SQL a HDFS datových sad pomocí DSS

Řazení datových sad v Dataiku DSS

  • Řazení při zápisu vs. řazení při čtení

Průzkum a příprava vizualizací dat pro projekt v Dataiku DSS

Přehled schémat, typů úložišť a znamenání v Dataiku

Provedení čištění, normalizace a obohacení dat pomocí skriptů v Dataiku DSS

Práce s rozhraním grafů a typy vizuálních agregací v Dataiku DSS

Využití interaktivní funkce statistik v DSS

  • Univariátní analýza vs. bivariátní analýza
  • Použití nástroje pro hlavní komponentu (PCA) v DSS

Přehled strojového učení s Dataiku DSS

  • Supervizované ML vs. nesupervizované ML
  • Reference pro algoritmy a funkce zpracování dat v DSS
  • Hluboké učení s Dataiku DSS

Přehled toku odvozeného z datových sad a receptů v DSS

Transformace existujících datových sad v DSS pomocí vizuálních receptů

Využití receptů v DSS založených na uživatelsky definovaném kódu

Optimalizace průzkumu a experimentování s kódem pomocí kódotáhů DSS

Psaní pokročilých vizualizací a vlastních front-end funkcí pomocí webových aplikací

Práce s funkcí kódových zpráv v Dataiku DSS

Sdílení prvků datového projektu a seznámení s řídicím panely DSS

Návrh a balení projektu v Dataiku DSS jako opakovaně použitelné aplikace

Přehled pokročilých metod v Dataiku DSS

  • Implementace optimalizovaného dělení datových sad pomocí DSS
  • Spouštění specifických částí zpracování DSS prostřednictvím výpočtů v kontejnerech Kubernetes

Přehled spolupráce a řízení verzí v Dataiku DSS

Implementace automatizačních scénářů, metrik a kontrol pro testování projektu v DSS

Nasazování a aktualizace projektu s pomocí uzlu automatizace DSS a balíčků

Práce s reálně časovými rozhraními API v Dataiku DSS

  • Další rozhraní API a Rest API v DSS

Analýza a prognózování časových řad v Dataiku DSS

Zabezpečení projektu v Dataiku DSS

  • Správa oprávnění k projektu a autorizací řídicích panelů
  • Implementace pokročilých možností zabezpečení

Integrace Dataiku DSS s cloudu

Řešení potíží

Shrnutí a uzávěr

Požadavky

  • Zkušenosti s programovacími jazyky Python, SQL a R
  • Základní znalosti zpracování dat pomocí Apache Hadoopu a Sparku
  • Chápání konceptů strojového učení a datových modelů
  • Pozadí ve statistických analýzách a konceptech datové vědy
  • Zkušenosti s vizualizací a komunikací dat

Cílová skupina

  • Inženýři
  • Datoví vědci
  • Analýti dat
 21 hodiny

Počet účastníků


Price per participant

Upcoming Courses

Související kategorie