Návrh Školení

Úvod

    Apache Beam vs MapReduce, Spark Streaming, Kafka Streaming, Storm a Flink

Instalace a konfigurace Apache Beam

Přehled Apache Beam Vlastnosti a architektura

    Beam Model, SDK, Beam Pipeline Runners Distribuované back-endy zpracování

Pochopení modelu Apache Beam Programming

    Jak se provádí potrubí

Spuštění vzorkového potrubí

    Příprava WordPočítacího potrubí Lokální provedení potrubí

Navrhování potrubí

    Plánování struktury, výběr transformací a stanovení vstupních a výstupních metod

Vytvoření potrubí

    Psaní programu ovladače a definování kanálu Použití tříd Apache Beam Datové sady, transformace, I/O, kódování dat atd.

Provádění potrubí

    Spuštění kanálu lokálně, na vzdálených počítačích a ve veřejném cloudu Výběr konfigurací pro běžce Runner

Testování a ladění Apache Beam

    Použití tipů k emulaci statického typování Správa Python Závislostí potrubí

Zpracování vázaných a neohraničených datových sad

    Okna a spouštěče

Vaše potrubí bude znovu použitelné a udržovatelné

Vytvářejte nové zdroje dat a jímky

    Apache Beam Source and Sink API

Integrace Apache Beam s jinými Big Data systémy

    Apache Hadoop, Apache Spark, Apache Kafka

Odstraňování problémů

Shrnutí a závěr

Požadavky

  • Zkušenosti s Python programováním.
  • Zkušenosti s příkazovým řádkem Linuxu.

Publikum

  • Vývojáři
 14 hodiny

Počet účastníků



Price per participant

Reference (1)

Související kurzy

Související kategorie