Návrh Školení

Úvod

    Přehled funkcí a architektury Spark a Hadoop Pochopení základů programování velkých dat Python

Začínáme

    Nastavení Python, Spark a Hadoop Porozumění datovým strukturám v Python Porozumění PySpark API Porozumění HDFS a MapReduce

Integrace Spark a Hadoop s Python

    Implementace Spark RDD v Python Zpracování dat pomocí MapReduce Vytváření distribuovaných datových sad v HDFS

Machine Learning s Spark MLlib

Zpracování velkých dat pomocí Spark Streaming

Práce s Recommender Systems

Práce s Kafkou, Sqoopem, Kafkou a Flume

Apache Mahout se Sparkem a Hadoop

Odstraňování problémů

Shrnutí a další kroky

Požadavky

  • Zkušenosti se Sparkem a Hadoopem
  • Python zkušenosti s programováním

Publikum

  • Datoví vědci
  • Vývojáři
 21 hodiny

Počet účastníků



Price per participant

Reference (3)

Související kurzy

Související kategorie