Návrh Školení
Úvod
- Proč a jak projektové týmy adoptují Hadoop Jak to všechno začalo Role projektového manažera v projektech Hadoop
Pochopení architektury a klíčových konceptů Hadoop
- HDFS MapReduce Další části Hadoop ekosystému
Co tvoří Big Data?
Různé přístupy k ukládání Big Data
HDFS (Hadoop Distribuovaný systém souborů) jako základ
Jak se zpracovává Big Data
- Síla distribuovaného zpracování
Zpracování dat pomocí MapReduce
- Jak se data rozebírají krok za krokem
Role shlukování v distribuovaném zpracování ve velkém měřítku
- Architektonický přehled Clusteringové přístupy
Seskupování vašich dat a procesů pomocí YARN
Role nerelačního Database v ukládání velkých dat
Práce s nerelační databází Hadoop: HBase
Přehled architektury datových skladů
Správa vašeho datového skladu pomocí Hive
Spuštění Hadoop z Shell-Scripts
Práce s Hadoop Streaming
Ostatní Hadoop Nástroje a utility
Začínáme s Hadoop projektem
- Demystifikační složitost
Migrace existujícího projektu na Hadoop
- Aspekty infrastruktury Škálování nad rámec vašich přidělených zdrojů
Hadoop Zúčastněné strany projektu a jejich soubory nástrojů
- Vývojáři, datoví vědci, obchodní analytici a projektoví manažeři
Hadoop jako základ pro nové technologie a přístupy
Závěrečné poznámky
Požadavky
- Obecná znalost programování
- Pochopení databází
- Základní znalost Linux
Reference (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurz - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Kurz - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay