Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Sekce 1: Úvod do Hadoopu
- Historie Hadoopu, koncepty
- Ekosystém
- Distribuce
- Vysokourovová architektura
- Mýty o Hadoopu
- Výzvy při použití Hadoopu
- Hardware a software
- Laboratoř: První pohled na Hadoop
Sekce 2: HDFS
- Návrh a architektura
- Koncepty (horizontální škálování, replikace, lokálnost dat, vědomí racku)
- Démoni: Namenode, Secondary namenode, Data node
- Komunikace a srdcové impulzy
- Celostatnost dat
- Cesta pro čtení a zápis
- Namenode High Availability (HA), Federace
- Laboratoře: Interakce s HDFS
Sekce 3: MapReduce
- Koncepty a architektura
- Démoni (MRV1): jobtracker, tasktracker
- Fáze: driver, mapper, shuffle/sort, reducer
- Map Reduce verze 1 a verze 2 (YARN)
- Vnitřní fungování MapReduce
- Úvod do Java MapReduce programu
- Laboratoře: Spouštění ukázkového programu MapReduce
Sekce 4: Pig
- Pig vs Java MapReduce
- Průběh úlohy Pig
- Jazyk Pig Latin
- ETL s Pigem
- Transformace a spojení (joins)
- Uživatelsky definované funkce (UDF)
- Laboratoře: Psaní skriptů Pig pro analýzu dat
Sekce 5: Hive
- Architektura a návrh
- Datové typy
- Podpora SQL v Hive
- Vytváření tabulek Hive a dotazování na ně
- Rozdělení (partitions)
- Spojení (joins)
- Zpracování textu
- Laboratoře: Různé laboratoře pro zpracování dat pomocí Hive
Sekce 6: HBase
- Koncepty a architektura
- HBase vs RDBMS vs Cassandra
- Java API pro HBase
- Casové řady dat v HBase
- Návrh schématu
- Laboratoře: Interakce s HBase pomocí shell; Programování v Java API pro HBase; Úkol na návrh schématu
Požadavky
- pohodlně se vyzná v jazyce Java (většina programovacích cvičení je ve Java)
- pohodlně se pohybuje v prostředí Linux (umí navigovat v příkazové řádce Linux, upravovat soubory pomocí vi / nano)
Laboratorní prostředí
Není třeba instalaci: Nepotřebují studenti instalovat Hadoop software na svých počítačích! Bude jim poskytnut pracovní cluster Hadoop.
Studenti budou potřebovat:
- SSH klient (Linux a Mac již disponují ssh klienty, pro Windows je doporučen Putty)
- webový prohlížeč k přístupu ke clusteru, doporučen Firefox
28 Hodiny
Reference (1)
Praktické cvičení. Třída by měla trvat 5 dní, ale i tři dny pomohly rozjasnit spoustu otázek, které jsem měl z práce s NiFi.
James - BHG Financial
Kurz - Apache NiFi for Administrators
Přeloženo strojem