Návrh Školení

 

Úvod:

    Apache Spark v Hadoop Ecosystem Krátké intro pro python, scala

Základy (teorie):

    Architektura RDD Transformace a akce Fáze, úloha, závislosti

Pomocí prostředí Databricks porozumět základům (praktický workshop):

    Cvičení využívající RDD API Základní akční a transformační funkce PairRDD Join Strategie ukládání do mezipaměti Cvičení využívající DataFrame API SparkSQL DataFrame: výběr, filtr, seskupení, řazení UDF (User Defined Function) Pohled do DataSet API Streaming

Pomocí prostředí AWS porozumět nasazení (praktický workshop):

    Základy lepidla AWS Porozumět rozdílům mezi AWS EMR a AWS Glue Příklady úloh v obou prostředích Porozumět výhodám a nevýhodám

Další:

    Úvod do Apache Airflow orchestrace

Požadavky

Schopnosti programování (nejlépe python, scala)

SQL základy

  21 hodiny

Počet účastníků


Začátek

Konec


Dates are subject to availability and take place between 09:30 and 16:30.

Price per participant

Reference (3)

Související kurzy

Související kategorie