Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Úvod:
- Apache Spark v Hadoop Ecosystem Krátké intro pro python, scala
Základy (teorie):
- Architektura RDD Transformace a akce Fáze, úloha, závislosti
Pomocí prostředí Databricks porozumět základům (praktický workshop):
- Cvičení využívající RDD API Základní akční a transformační funkce PairRDD Join Strategie ukládání do mezipaměti Cvičení využívající DataFrame API SparkSQL DataFrame: výběr, filtr, seskupení, řazení UDF (User Defined Function) Pohled do DataSet API Streaming
Pomocí prostředí AWS porozumět nasazení (praktický workshop):
- Základy lepidla AWS Porozumět rozdílům mezi AWS EMR a AWS Glue Příklady úloh v obou prostředích Porozumět výhodám a nevýhodám
Další:
- Úvod do Apache Airflow orchestrace
Požadavky
Schopnosti programování (nejlépe python, scala)
SQL základy
21 hodiny
Reference (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurz - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Kurz - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift