Návrh Školení

Část 1: Úvod do Hadoop

  • historie a koncepty Hadoop
  • ekosystém
  • distribuce
  • vysokorozvrstvená architektura
  • mýty o Hadoop
  • výzvy související s Hadoop
  • hardwarové / softwarové aspekty
  • laboratoř: první pohled na Hadoop

Část 2: HDFS

  • návrh a architektura
  • koncepty (horizontální škálování, replikace, lokalita dat, povědomost o racku)
  • démoni: Namenode, Secondary namenode, Data node
  • kommunikace / heartbeat
  • integrita dat
  • čtení/zápis cesta
  • Namenode High Availability (HA), Federace
  • laboratoře: Interakce s HDFS

Část 3: Map Reduce

  • koncepty a architektura
  • démoni (MRV1): jobtracker / tasktracker
  • fáze: driver, mapper, shuffle/sort, reduktor
  • Map Reduce verze 1 a verze 2 (YARN)
  • Vnitřní části Map Reduce
  • Úvod do programu Java Map Reduce
  • labs : Spuštění ukázkového programu MapReduce

Sekce 4: Prase

  • prase vs mapa java snížit
  • tok prasečí práce
  • prasečí latinský jazyk
  • ETL s prasetem
  • Transformace a spojení
  • Uživatelsky definované funkce (UDF)
  • laboratoře: psaní prasečích skriptů pro analýzu dat

Část 5: Hive

  • architektura a design
  • datové typy
  • SQL podpora v Hive
  • Vytváření Hive tabulek a dotazování
  • oddíly
  • se připojí
  • zpracování textu
  • laboratoře : různé laboratoře na zpracování dat pomocí Hive

Oddíl 6: HBase

  • koncepty a architektura
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • Casové řady dat v HBase
  • návrh schématu
  • laboratoře: Interakce s HBase pomocí shell; programování v HBase Java API ; cvičení návrhu schématu

Požadavky

  • vyhovuje programovacímu jazyku Java (většina programovacích cvičení je v jazyce Java)
  • pohodlné v Linux prostředí (umět procházet Linux příkazový řádek, upravovat soubory pomocí vi / nano)

Laboratorní prostředí

Zero Install : Není třeba instalovat software Hadoop na stroje studentů! Bude poskytnut funkční cluster Hadoop pro studenty.

Studenti budou potřebovat následující

  • SSH klient (Linux a Mac již mají SSH klienta, pro Windows se doporučuje Putty)
  • prohlížeč k přístupu ke clusteru, doporučuje se Firefox
 28 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie