Návrh Školení

Úvod do platformy Stratio

  • Přehled architektury Stratio a jejích základních modulů
  • Role modulu Rocket a Intelligence v životním cyklu dat
  • Přihlášení a navigace v uživatelském rozhraní Stratio

Práce s modulem Rocket

  • Úvod dat a vytváření kanálů
  • Připojování zdrojů dat a konfigurace transformací
  • Použití PySpark pro předzpracování úloh v Rocketu

Základy PySpark pro uživatele Stratio

  • Datové struktury a operace v PySpark
  • Cyklické konstrukce: použití for, while, if/else
  • Vytváření vlastních funkcí pomocí def a jejich aplikace

Pokročilé používání Rocketu s PySpark

  • Streamovací úvod dat a transformace
  • Použití cyklů a funkcí v batch a reálném čase scénářích
  • Nejlepší praktiky pro výkon ve frontách PySpark

Prozkoumání modulu Intelligence

  • Přehled funkcí modelování a analýzy dat
  • Výběr, transformace a průzkum vlastností
  • Role PySpark při vytváření vlastních analytických nástrojů a zážitků

Vytváření pokročilých analytických pracovních postupů

  • Vytvoření uživatelsky definovaných funkcí (UDF) v Intelligence
  • Použití podmínek a cyklů pro data logiku
  • Případné použití: segmentace, agregace a předpovědi

Nasazení a Collaboration

  • Ukládání, export a reužívání pracovních postupů
  • Spolupráce s ostatními členy týmu v Stratio
  • Revize výstupu a integrace se zpracovači dat níže v řetězi

Shrnutí a další kroky

Požadavky

  • Zkušenosti s programováním v Python
  • Pojem o datové analýze nebo zpracování velkých dat
  • Základní znalost Apache Spark a distribuovaného výpočetního prostředí

Cílová skupina

  • Datoví inženieri pracující na platformách založených na Stratio
  • Analysté nebo vývojáři používající moduly Rocket a Intelligence
  • Technické týmy přecházející na PySpark pracovní postupy v rámci Stratio
 14 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie