Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod
- Úvod do cloud computingu a řešení velkých dat
- Přehled funkcí a architektury Apache Hadoop
Nastavení Hadoopu
- Plánování Hadoop clusteru (místní, cloudu apod.)
- Výběr operačního systému a distribuce Hadoopu
- Zřizování prostředků (hardwaru, sítí atd.)
- Stažení a instalace softwaru
- Nastavení clusteru pro flexibilitu
Práce s HDFS
- Pochopení Hadoop Distributed File System (HDFS)
- Přehled referenčních příkazů HDFS
- Přístup k HDFS
- Provedení základních souborových operací v HDFS
- Použití S3 jako doplňku k HDFS
Přehled MapReduce
- Pochopení toku dat v rámci MapReduce Frameworku
- Map, Shuffle, Sort a Reduce
- Demo: Výpočet nejvyšších platů
Práce s YARN
- Pochopení správy prostředků v Hadoopu
- Práce s ResourceManager, NodeManager a Application Master
- Plánování úloh pod YARN
- Plánování pro velké počty uzlů a clusterů
- Demo: Plánování úloh
Integrace Hadoopu s Sparkem
- Nastavení úložiště pro Spark (HDFS, Amazon S3, NoSQL apod.)
- Pochopení Resilient Distributed Datasets (RDDs)
- Vytvoření RDD
- Implementace transformací RDD
- Demo: Implementace programu pro vyhledávání textu ve filmech
Správa Hadoop clusteru
- Monitorování Hadoopu
- Zabezpečení Hadoop clusteru
- Přidávání a odebírání uzlů
- Běh výkonnostního benchmarku
- Optimalizace výkonu Hadoop clusteru
- Zálohování, obnovení a plánování pro kontinuitu podnikání
- Zajištění vysoké dostupnosti (HA)
Upgradování a migrování Hadoop clusteru
- Oceňování požadavků na pracovní zátěž
- Upgrade Hadoopu
- Přesun z místního nasazení do cloudu a naopak
- Obnovení po selháních
Řešení potíží
Závěr a shrnutí
Požadavky
- Zkušenosti se správou systémů
- Zkušenosti s příkazovým řádkem Linuxu
- Pochopení konceptů velkých dat
Cílová skupina
- Správci systémů
- DBA (Správci databází)
35 Hodiny
Reference (3)
Líbilo se mi, že to bylo praktické. Miloval jsem aplikovat teoretické znalosti na praktické příklady.
Aurelia-Adriana - Allianz Services Romania
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem
Skutečnost, že jsme mohli s sebou vzít většinu informací, kurzů, prezentací a cvičení, které jsme absolvovali, takže si je můžeme prohlédnout a možná opakovat to, co jsme poprvé nepochopili, nebo vylepšit to, co jsme již udělali.
Raul Mihail Rat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem