Návrh Školení
Úvod
Přehled přístupů k přístupu k datům (Hive, databáze atd.)
Přehled funkcí a architektury Sparku
Nainstalování a konfigurace Sparku
Porozumění DataFrame v Sparku
Definování tabulek a import datových souborů
Dotazování na DataFrames pomocí SQL
Provádění agregací, JOINů a vnořených dotazů
Nahrávání a přístup k datům
Dotazování různých typů dat
- JSON, Parquet atd.
Dotazování data lakes pomocí SQL
Řešení problémů
Závěr a shrnutí
Požadavky
- Zkušenosti s dotazy SQL
- Programovací zkušenosti v jakémkoli jazyce
Cílová skupina
- Data analytičtí odborníci
- Data vedci
- Data inženýři
Reference (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
practice tasks