Návrh Školení
Úvod
Přehled přístupů k přístupu k datům (Hive, databáze atd.)
Přehled funkcí a architektury Sparku
Nainstalování a konfigurace Sparku
Porozumění DataFrame v Sparku
Definování tabulek a import datových souborů
Dotazování na DataFrames pomocí SQL
Provádění agregací, JOINů a vnořených dotazů
Nahrávání a přístup k datům
Dotazování různých typů dat
- JSON, Parquet atd.
Dotazování data lakes pomocí SQL
Řešení problémů
Závěr a shrnutí
Požadavky
- Zkušenosti s dotazy SQL
- Programovací zkušenosti v jakémkoli jazyce
Cílová skupina
- Data analytičtí odborníci
- Data vedci
- Data inženýři
Reference (3)
Líbilo se mi, že to bylo praktické. Miloval jsem aplikovat teoretické znalosti na praktické příklady.
Aurelia-Adriana - Allianz Services Romania
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem
Skutečnost, že jsme mohli s sebou vzít většinu informací, kurzů, prezentací a cvičení, které jsme absolvovali, takže si je můžeme prohlédnout a možná opakovat to, co jsme poprvé nepochopili, nebo vylepšit to, co jsme již udělali.
Raul Mihail Rat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem