Návrh Školení
Úvod
- Přehled funkcí a architektury Spark a Hadoop
- Porozumění velkým datům
- Python základy programování
Začínáme
- Nastavení Python, Spark a Hadoop
- Pochopení datových struktur v Python
- Pochopení PySpark API
- Pochopení HDFS a MapReduce
Integrace Spark a Hadoop s Python
- Implementace Spark RDD v Python
- Zpracování dat pomocí MapReduce
- Vytváření distribuovaných datových sad v HDFS
Machine Learning s Spark MLlib
Zpracování Big Data s Spark Streaming
Práce s Recommender Systems
Práce s Kafkou, Sqoopem, Kafkou a Flume
Apache Mahout se Sparkem a Hadoop
Odstraňování problémů
Shrnutí a další kroky
Požadavky
- Zkušenosti se Sparkem a Hadoop
- Python zkušenosti s programováním
Publikum
- Datoví vědci
- Vývojáři
Reference (3)
Skutečnost, že jsme mohli s sebou vzít většinu informací, kurzů, prezentací a cvičení, které jsme absolvovali, takže si je můžeme prohlédnout a možná opakovat to, co jsme poprvé nepochopili, nebo vylepšit to, co jsme již udělali.
Raul Mihail Rat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
Oběloval jsem, že se podařilo položit základy tématu a pokročit i k některým dosti pokročilým cvičením. Kromě toho byly nabídnuty jednoduché způsoby psaní a testování kódu.
Ionut Goga - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem