Návrh Školení
Sekce 1: Úvod do Hadoop
- historie a koncepty Hadoop
- eco systém
- distribuce
- vysokorozvinutá architektura
- mythologie o Hadoop
- výzvy spojené s Hadoop
- hardwar / software
- laboratoř: první pohled na Hadoop
Sekce 2: HDFS
- Návrh a architektura
- koncepty (horizontální škálování, replikace, lokality dat, povědomost o zásobníku)
- Démoni: Namenode, Secondary namenode, Data node
- kommunikace / heartbeat
- integrita dat
- čtení/zápis cesta
- Namenode High Availability (HA), Federace
- Laboratoře: Interakce s HDFS
Sekce 3 : Map Reduce
- koncepty a architektura
- démoni (MRV1): jobtracker / tasktracker
- fáze: driver, mapper, shuffle/sort, reducer
- Map Reduce Verze 1 a Verze 2 (YARN)
- Vnitrnosti Map Reduce
- Úvod do Java Map Reduce programu
- Laboratoře: Spuštění ukázkového MapReduce programu
Sekce 4 : Pig
- pig vs java map reduce
- průběh pig úlohy
- jazyk pig latin
- ETL s Pigem
- Přetváření & Joiny
- Vlastní definované funkce (UDF)
- Laboratoře: psaní Pig skriptů pro analýzu dat
Sekce 5: Hive
- architektura a návrh
- datové typy
- podpora SQL v Hive
- Vytváření tabulek Hive a dotazování
- partitce
- joiny
- zpracování textu
- Laboratoře: různé laboratorní cvičení s zpracováním dat pomocí Hive
Sekce 6: HBase
- koncepty a architektura
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Časově se posouvající data v HBase
- Návrh schématu
- Laboratoře: Interakce s HBase pomocí shell; programování ve HBase Java API ; Cvičení návrhu schématu
Požadavky
- pohodlně se vypořádá s programovacím jazykem Java (většina programovacích cvičení je v Java)
- pohodlně se orientuje v prostředí Linux (schopnost navigovat v příkazovém řádku Linux, editovat soubory pomocí vi / nano)
Laboratorní prostředí
Nula instalací: Není třeba instalovat software Hadoop na stroje studentů! Budou k dispozici fungující cluster Hadoop pro studenty.
Studenti budou potřebovat následující
- SSH klient (Linux a Mac již mají SSH klienta, pro Windows se doporučuje Putty)
- prohlížeč na přístup k clusteru, doporučuje se Firefox
Reference (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Kurz - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurz - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Kurz - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay