Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Přehled: Big Data
- Co je Big Data
- Proč se Big Data stává populární
- Příklady užití Big Data
- Charakteristiky Big Data
- Řešení k práci s Big Data.
Co je Hadoop a jeho složky:
- Co je Hadoop a co jsou jeho složky.
- Architektura Hadoop a charakteristiky dat, která může zpracovat/procitit.
- Stručný přehled historie Hadoop, společností ji používajících a proč začaly s jejím využitím.
- Rámec Hadoop & jeho složky - detailně vysvětlené.
- Co je HDFS a čtení-zápis do distribuovaného souborového systému Hadoop.
- Jak nastavit cluster Hadoop v různých režimech - Standalone/Pseudo/Multi Node cluster.
(Tohle zahrnuje nastavení clusteru Hadoop ve VirtualBox/KVM/VMware, potřebné konfigurace sítě, spouštění démonů Hadoop a testování clusteru).
- Co je rámec Map Reduce a jak funguje.
- Spouštění úloh Map Reduce na clusteru Hadoop.
- Pochopení replikace, zrcadlového záznamu a povědomí o šuplích ve vztahu k clustrem Hadoop.
Plánování clusteru Hadoop:
- Jak naplánovat svůj hadoop cluster.
- Pochopení hardwaru a softwaru pro plánování hadoop clusteru.
- Pochopení zátěží a plánování clusteru, aby se vyhnul poruchám a prováděl optimalizovaně.
Co je MapR a proč MapR:
- Přehled o MapR a jeho architektuře.
- Pochopení a práce s MapR Control System, MapR Volumes, snímky & zrcadlové záznamy.
- Plánování clusteru ve vztahu k MapR.
- Srovnání MapR s jinými distribucemi a Apache Hadoop.
- Instalace MapR a nasazení clusteru.
Nastavení a správa clusteru:
- Správa služeb, uzlů, snímků, zrcadlových svazků a vzdálených clusterů.
- Pochopení a správa uzlů.
- Přehled o komponentách Hadoop, Instalace komponent Hadoop vedle MapR služeb.
- Skládání dat do clusteru včetně prostřednictvím NFS Správa služeb & uzlů.
- Správa dat pomocí svazků, správa uživatelů a skupin, správa & přiřazení rolí pro uzly, komisařství dekomisačních uzlů, správa clusteru a sledování výkonu, konfigurace/analyza a monitorování metrik pro sledování výkonu, konfigurace a správa MapR zabezpečení.
- Pochopení a práce s M7 - nativním úložištěm pro tabulky MapR.
- Konfigurace clusteru a jeho optimalizace pro nejlepší výkon.
Aktualizace clusteru a integrace s dalšími nastaveními:
- Aktualizace verze software MapR a typy aktualizací.
- Konfigurace clusteru Mapr pro přístup k HDFS clusteru.
- Nastavení clusteru MapR na Amazon Elastic Mapreduce.
Všechny uvedené téma zahrnují demonstrace a cvičné seze pro uživatele, aby měly praxi s technologií.
Požadavky
- Základní znalosti Linux FS
- Základy Java
- Znalost Apache Hadoop (doporučeno)
28 hodiny
Reference (1)
practical things of doing, also theory was served good by Ajay