Návrh Školení
Úvod
- Apache Spark vs Hadoop MapReduce
Přehled funkcí a architektury Apache Sparku
Výběr programovacího jazyka
Nastavení Apache Sparku
Vytvoření ukázkové aplikace
Výběr datové sady
Provádění analýzy dat
Zpracování strukturovaných dat pomocí Spark SQL
Zpracování streamovacích dat pomocí Spark Streaming
Integrace Apache Sparku s třetími stranami nástroji pro strojové učení
Použití Apache Sparku pro grafickou zpracování
Optimalizace Apache Sparku
Řešení potíží
Souhrn a závěr
Požadavky
- Zkušenosti s příkazovým řádkem Linuxu
- Obecné pochopení zpracování dat
- Programovací zkušenosti s Javou, Scalou, Pythonem nebo R
Cílová skupina
- Vývojáři
Reference (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
practice tasks