Návrh Školení
Úvod do platformy Stratio
- Přehled architektury Stratio a hlavních modulů
- Role Rocket a Intelligence ve životním cyklu dat
- Přihlášení a navigace v uživatelském rozhraní Stratio
Práce s modulem Rocket
- Ingest dat a vytváření potoků (pipelines)
- Připojování zdrojů dat a konfigurace transformací
- Použití PySpark pro úkoly předzpracování dat v Rocketu
Základy PySpark pro uživatele Stratio
- Datové struktury a operace v PySpark
- Smyčkové konstrukce: for, while, if/else použití
- Psaní vlastních funkcí s def a jejich aplikace
Pokročilé použití Rocketu s PySparkem
- Streamovací ingest dat a transformace
- Použití smyček a funkcí v dávkových i reálném čase
- Osobní rady k výkonu v PySpark potocích (pipelines)
Průzkum modulu Intelligence
- Přehled funkcí modelování a analýzy dat
- Výběr, transformace a průzkum funkcí (features)
- Role PySparku ve vlastní analýze a získávání poznatků
Vytváření pokročilých pracovních postupů s analýzou dat
- Vytváření uživatelsky definovaných funkcí (UDFs) v Intelligence
- Použití podmínek a smyček pro datovou logiku
- Případové studie: segmentace, agregace a predikce
Nasazení a spolupráce
- Ukládání, export a opakovatelné použití pracovních postupů (workflows)
- Spolupráce s ostatními členy týmu v rámci Stratio
- Zkoumání výstupu a integrace s nástroji na dolní úrovni (downstream tools)
Shrnutí a další kroky
Požadavky
- Zkušenosti s programováním v Pythonu
- Pochopení konceptů analýzy dat nebo zpracování big data
- Základní znalosti Apache Spark a distribuovaného výpočtu
Cílová skupina
- Data inženýři pracující na platformách založených na Stratio
- Analitičtí pracovníci nebo vývojáři používající moduly Rocket a Intelligence
- Technické týmy přecházející na práce s PySpark v rámci Stratio
Reference (4)
The thing I liked the most about the training was the organization and the location
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Kurz - ArcGIS for Spatial Analysis
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kurz - ArcGIS Fundamentals
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
Kurz - Python for Geographic Information System (GIS)
All the topics which he covered including examples. And also explained how they are helpful in our daily job.