Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Přehled: Big Data
- Co je Big Data
- Proč se Big Data stává populární
- Příklady užití Big Data
- Charakteristiky Big Data
- Řešení k práci s Big Data.
Co je Hadoop a jeho složky:
- Co je Hadoop a co jsou jeho složky.
- Architektura Hadoop a charakteristiky dat, která může zpracovat/procitit.
- Stručný přehled historie Hadoop, společností ji používajících a proč začaly s jejím využitím.
- Rámec Hadoop & jeho složky - detailně vysvětlené.
- Co je HDFS a čtení-zápis do distribuovaného souborového systému Hadoop.
- Jak nastavit cluster Hadoop v různých režimech - Standalone/Pseudo/Multi Node cluster.
(Tohle zahrnuje nastavení clusteru Hadoop ve VirtualBox/KVM/VMware, potřebné konfigurace sítě, spouštění démonů Hadoop a testování clusteru).
- Co je rámec Map Reduce a jak funguje.
- Spouštění úloh Map Reduce na clusteru Hadoop.
- Pochopení replikace, zrcadlového záznamu a povědomí o šuplích ve vztahu k clustrem Hadoop.
Plánování clusteru Hadoop:
- Jak naplánovat svůj hadoop cluster.
- Pochopení hardwaru a softwaru pro plánování hadoop clusteru.
- Pochopení zátěží a plánování clusteru, aby se vyhnul poruchám a prováděl optimalizovaně.
Co je MapR a proč MapR:
- Přehled o MapR a jeho architektuře.
- Pochopení a práce s MapR Control System, MapR Volumes, snímky & zrcadlové záznamy.
- Plánování clusteru ve vztahu k MapR.
- Srovnání MapR s jinými distribucemi a Apache Hadoop.
- Instalace MapR a nasazení clusteru.
Nastavení a správa clusteru:
- Správa služeb, uzlů, snímků, zrcadlových svazků a vzdálených clusterů.
- Pochopení a správa uzlů.
- Přehled o komponentách Hadoop, Instalace komponent Hadoop vedle MapR služeb.
- Skládání dat do clusteru včetně prostřednictvím NFS Správa služeb & uzlů.
- Správa dat pomocí svazků, správa uživatelů a skupin, správa & přiřazení rolí pro uzly, komisařství dekomisačních uzlů, správa clusteru a sledování výkonu, konfigurace/analyza a monitorování metrik pro sledování výkonu, konfigurace a správa MapR zabezpečení.
- Pochopení a práce s M7 - nativním úložištěm pro tabulky MapR.
- Konfigurace clusteru a jeho optimalizace pro nejlepší výkon.
Aktualizace clusteru a integrace s dalšími nastaveními:
- Aktualizace verze software MapR a typy aktualizací.
- Konfigurace clusteru Mapr pro přístup k HDFS clusteru.
- Nastavení clusteru MapR na Amazon Elastic Mapreduce.
Všechny uvedené téma zahrnují demonstrace a cvičné seze pro uživatele, aby měly praxi s technologií.
Požadavky
- Základní znalosti Linux FS
- Základy Java
- Znalost Apache Hadoop (doporučeno)
28 hodiny
Reference (1)
practical things of doing, also theory was served good by Ajay