Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Část 1: Úvod do Hadoop
- historie hadoopu, koncepty distribuce ekologických systémů architektura na vysoké úrovni mýty hadoop hadoop výzvy hardware/software laboratoř: první pohled na Hadoop
Část 2: HDFS
- Koncepce designu a architektury (horizontální škálování, replikace, datová lokalita, povědomí o racku) Démoni : Namenode, Sekundární jmenný uzel, komunikace datového uzlu / srdeční tepová cesta pro čtení / zápis integrity dat Namenode High Availability (HA), Laboratoře federace: Interakce s HDFS
Část 3: Map Reduce
- koncepty a démoni architektury (MRV1): fáze jobtracker / tasktracker: ovladač, mapovač, shuffle/sort, reduktor Map Reduce verze 1 a verze 2 (YARN) Internals of Map Reduce Úvod do Java Laboratoře programu Map Reduce : Spuštění ukázky MapReduce program
Sekce 4: Prase
- prase vs java mapa redukuje tok prasat prasečí latinský jazyk ETL s prasečími transformacemi a spojeními Laboratoře uživatelem definovaných funkcí (UDF): psaní prasečích skriptů pro analýzu dat
Část 5: Hive
- architektura a návrh datových typů SQL podpora v Hive Vytváření tabulek Hive a dotazování oddílů spojuje laboratoře zpracování textu : různé laboratoře zpracování dat pomocí Hive
Oddíl 6: HBase
- koncepty a architektura hbase vs RDBMS vs cassandra HBase Java API Data časových řad v laboratořích návrhu schémat HBase: Interakce s HBase pomocí shellu; programování v HBase Java API ; Cvičení návrhu schématu
Požadavky
- pohodlné s programovacím jazykem Java (většina programovacích cvičení je v jazyce Java)
- pohodlné v Linux prostředí (umět procházet Linux příkazový řádek, upravovat soubory pomocí vi / nano)
Laboratorní prostředí
Zero Install: Není potřeba instalovat hadoop software na studentské počítače! Pro studenty bude k dispozici funkční hadoop cluster.
Studenti budou potřebovat následující
- klient SSH (Linux a Mac již mají klienty ssh, pro Windows se doporučuje Putty)
- prohlížeč pro přístup ke clusteru. Doporučujeme prohlížeč Firefox
28 hodiny
Reference (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurz - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Kurz - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay