Návrh Školení

Úvod

    Přehled funkcí a architektury Spark a Hadoop Pochopení základů programování velkých dat Python

Začínáme

    Nastavení Python, Spark a Hadoop Porozumění datovým strukturám v Python Porozumění PySpark API Porozumění HDFS a MapReduce

Integrace Spark a Hadoop s Python

    Implementace Spark RDD v Python Zpracování dat pomocí MapReduce Vytváření distribuovaných datových sad v HDFS

Machine Learning s Spark MLlib

Zpracování velkých dat pomocí Spark Streaming

Práce s Recommender Systems

Práce s Kafkou, Sqoopem, Kafkou a Flume

Apache Mahout se Sparkem a Hadoop

Odstraňování problémů

Shrnutí a další kroky

Požadavky

  • Zkušenosti se Sparkem a Hadoopem
  • Python zkušenosti s programováním

Publikum

  • Datoví vědci
  • Vývojáři
  21 hodiny
 

Počet účastníků


Začátek

Konec


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Reference (3)

Související kurzy

Související kategorie