Návrh Školení

Sekce 1: Úvod do Hadoop

  • historie a koncepty Hadoop
  • eco systém
  • distribuce
  • vysokorozvinutá architektura
  • mythologie o Hadoop
  • výzvy spojené s Hadoop
  • hardwar / software
  • laboratoř: první pohled na Hadoop

Sekce 2: HDFS

  • Návrh a architektura
  • koncepty (horizontální škálování, replikace, lokality dat, povědomost o zásobníku)
  • Démoni: Namenode, Secondary namenode, Data node
  • kommunikace / heartbeat
  • integrita dat
  • čtení/zápis cesta
  • Namenode High Availability (HA), Federace
  • Laboratoře: Interakce s HDFS

Sekce 3 : Map Reduce

  • koncepty a architektura
  • démoni (MRV1): jobtracker / tasktracker
  • fáze: driver, mapper, shuffle/sort, reducer
  • Map Reduce Verze 1 a Verze 2 (YARN)
  • Vnitrnosti Map Reduce
  • Úvod do Java Map Reduce programu
  • Laboratoře: Spuštění ukázkového MapReduce programu

Sekce 4 : Pig

  • pig vs java map reduce
  • průběh pig úlohy
  • jazyk pig latin
  • ETL s Pigem
  • Přetváření & Joiny
  • Vlastní definované funkce (UDF)
  • Laboratoře: psaní Pig skriptů pro analýzu dat

Sekce 5: Hive

  • architektura a návrh
  • datové typy
  • podpora SQL v Hive
  • Vytváření tabulek Hive a dotazování
  • partitce
  • joiny
  • zpracování textu
  • Laboratoře: různé laboratorní cvičení s zpracováním dat pomocí Hive

Sekce 6: HBase

  • koncepty a architektura
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • Časově se posouvající data v HBase
  • Návrh schématu
  • Laboratoře: Interakce s HBase pomocí shell; programování ve HBase Java API ; Cvičení návrhu schématu

Požadavky

  • pohodlně se vypořádá s programovacím jazykem Java (většina programovacích cvičení je v Java)
  • pohodlně se orientuje v prostředí Linux (schopnost navigovat v příkazovém řádku Linux, editovat soubory pomocí vi / nano)

Laboratorní prostředí

Nula instalací: Není třeba instalovat software Hadoop na stroje studentů! Budou k dispozici fungující cluster Hadoop pro studenty.

Studenti budou potřebovat následující

  • SSH klient (Linux a Mac již mají SSH klienta, pro Windows se doporučuje Putty)
  • prohlížeč na přístup k clusteru, doporučuje se Firefox
 28 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie