Návrh Školení
Úvod
- Apache Spark vs Hadoop MapReduce
Přehled funkcí a architektury Apache Sparku
Výběr programovacího jazyka
Nastavení Apache Sparku
Vytvoření ukázkové aplikace
Výběr datové sady
Provádění analýzy dat
Zpracování strukturovaných dat pomocí Spark SQL
Zpracování streamovacích dat pomocí Spark Streaming
Integrace Apache Sparku s třetími stranami nástroji pro strojové učení
Použití Apache Sparku pro grafickou zpracování
Optimalizace Apache Sparku
Řešení potíží
Souhrn a závěr
Požadavky
- Zkušenosti s příkazovým řádkem Linuxu
- Obecné pochopení zpracování dat
- Programovací zkušenosti s Javou, Scalou, Pythonem nebo R
Cílová skupina
- Vývojáři
Reference (5)
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem
Dostatečně praktické, odborník je dobře informovaný
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Přeloženo strojem
Při této školení se naučíte Spark Streaming, Databricks a AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
Přeloženo strojem
cvičné úkoly
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem