Návrh Školení
Část 1: Datový management v HDFS
- Různé formáty dat (JSON / Avro / Parquet)
- Kompresní schémata
- Masování dat
- Laboratoře: analýza různých formátů dat; povolení komprese
Část 2: Pokročilá Pig
- Uživatelsky definované funkce
- Zavedení knihoven Pig (ElephantBird / Data-Fu)
- Nahrávání komplexních strukturovaných dat pomocí Pig
- Fine-tuning Pig
- Laboratoře: pokročilé skriptování v Pig, parsování komplexních datových typů
Část 3: Pokročilá Hive
- Uživatelsky definované funkce
- Kompresní tabulky
- Fine-tuning výkonu Hive
- Laboratoře: vytváření kompresních tabulek, hodnocení formátů a konfigurace tabulek
Část 4: Pokročilá HBase
- Pokročilé modelování schémat
- Komprese
- Masový vstup dat
- Srovnavání širokých a hlubokých tabulek
- HBase a Pig
- HBase a Hive
- Fine-tuning výkonu HBase
- Laboratoře: fine-tuning HBase; přístup k datům HBase z Pig & Hive; Použití Phoenix pro modelování dat
Požadavky
- pohodlný v jazyce Java (většina programovacích cvičení je v Javě)
- pohodlný v prostředí Linux (schopnost navigovat v příkazové řádce Linux, úpravy souborů pomocí vi / nano)
- pracovní znalosti Hadoop.
Laboratorní prostředí
Nula instalace: Není třeba instalovat hadoop software na počítače studentů! Pro studenty bude k dispozici pracující hadoop cluster.
Studenti budou potřebovat následující
Reference (5)
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
Během cvičení mi James každý krok vysvětlil podrobněji tam, kde jsem se zasekl, protože jsem byl úplně nový u NIFI. Vysvětlil mi skutečné účely NIFI, dokonce i základy jako například open source. Přehlédl všechny koncepty Nifi od začátečnické úrovně až po úroveň vývojáře.
Firdous Hashim Ali - MOD A BLOCK
Kurz - Apache NiFi for Administrators
Přeloženo strojem
Že jsem to měl od samého počátku.
Peter Scales - CACI Ltd
Kurz - Apache NiFi for Developers
Přeloženo strojem
Praktické věci se dělaly, ale teorie byla také dobře prezentována Ajayem.
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurz - Hadoop Administration on MapR
Přeloženo strojem
Velmi jsem si oblíbil tuto virtuální mašinu. Vyučující měl k tématu i dalším oblastem velkou znalost a byl velmi příjemný a přátelský. Obdivoval jsem zařízení v Dubaji.
Safar Alqahtani - Elm Information Security
Kurz - Big Data Analytics in Health
Přeloženo strojem