Thank you for sending your enquiry! One of our team member will contact you shortly.
Thank you for sending your booking! One of our team member will contact you shortly.
Návrh Školení
1.1Hadoop Pojmy
1.1.1 HDFS
- Návrh rozhraní příkazového řádku HDFS Hadoop Systém souborů
1.1.2 Shluky
- Anatomie klastru Mater Node / Slave uzel Název Node / Data Node
1.2 Manipulace s daty
1.2.1 MapReduce podrobně
- Fáze mapy Snížení fáze Náhodně
1.2.2Analytika s funkcí Map Reduce
- Group-By s MapReduce Distribuce frekvence a řazení pomocí MapReduce Plotování výsledků (GNU Plot) Histogramy s MapReduce Bodové grafy s MapReduce Analýza komplexních datových sad Počítání pomocí MapReduce a Combiners Sestavování sestav
1.2.3 Čištění dat
- Čištění dokumentů Hledání fuzzy řetězců Propojení záznamů / deduplikace dat Transformace a třídění dat událostí Ověření spolehlivosti zdroje Oříznutí odlehlých hodnot
1.2.4Extrakce a transformace dat
- Transformace protokolů Použití Apache Pig k filtrování Použití Apache Pig k řazení Použití Apache Pig k sessionize
1.2.5 Pokročilá spojení
- Spojení dat v Mapperu pomocí MapReduce Spojení dat pomocí replikovaného spojení Apache Pig Spojení seřazených dat pomocí spojení Apache Pig Spojení zkreslených dat pomocí zkoseného spojení Apache Pig Použití spojení na straně mapy v Apache Hive Použití optimalizovaných úplných vnějších spojení v Apache [1 ] Spojení dat pomocí externího úložiště klíčových hodnot
1.3 Diagnostika výkonu a techniky optimalizace
- Mapa Zkoumání špiček ve vstupních datech Identifikace problémů se zkreslením dat na straně mapy Propustnost mapové úlohy Malé soubory Nerozdělitelné soubory
Požadavky
Účastníci nemusí mít žádné specifické dovednosti, protože školení je zaměřeno na dovednosti koncových uživatelů jak pro správu, tak pro manipulaci s daty pod Apache Hadoop
21 hodiny
Reference (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurz - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Kurz - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay