Návrh Školení

Přehled: Big Data

  • Co je Big Data
  • Proč se Big Data stává populární
  • Příklady užití Big Data
  • Charakteristiky Big Data
  • Řešení k práci s Big Data.

Co je Hadoop a jeho složky:

  • Co je Hadoop a co jsou jeho složky.
  • Architektura Hadoop a charakteristiky dat, která může zpracovat/procitit.
  • Stručný přehled historie Hadoop, společností ji používajících a proč začaly s jejím využitím.
  • Rámec Hadoop & jeho složky - detailně vysvětlené.
  • Co je HDFS a čtení-zápis do distribuovaného souborového systému Hadoop.
  • Jak nastavit cluster Hadoop v různých režimech - Standalone/Pseudo/Multi Node cluster.

(Tohle zahrnuje nastavení clusteru Hadoop ve VirtualBox/KVM/VMware, potřebné konfigurace sítě, spouštění démonů Hadoop a testování clusteru).

  • Co je rámec Map Reduce a jak funguje.
  • Spouštění úloh Map Reduce na clusteru Hadoop.
  • Pochopení replikace, zrcadlového záznamu a povědomí o šuplích ve vztahu k clustrem Hadoop.

Plánování clusteru Hadoop:

  • Jak naplánovat svůj hadoop cluster.
  • Pochopení hardwaru a softwaru pro plánování hadoop clusteru.
  • Pochopení zátěží a plánování clusteru, aby se vyhnul poruchám a prováděl optimalizovaně.

Co je MapR a proč MapR:

  • Přehled o MapR a jeho architektuře.
  • Pochopení a práce s MapR Control System, MapR Volumes, snímky & zrcadlové záznamy.
  • Plánování clusteru ve vztahu k MapR.
  • Srovnání MapR s jinými distribucemi a Apache Hadoop.
  • Instalace MapR a nasazení clusteru.

Nastavení a správa clusteru:

  • Správa služeb, uzlů, snímků, zrcadlových svazků a vzdálených clusterů.
  • Pochopení a správa uzlů.
  • Přehled o komponentách Hadoop, Instalace komponent Hadoop vedle MapR služeb.
  • Skládání dat do clusteru včetně prostřednictvím NFS Správa služeb & uzlů.
  • Správa dat pomocí svazků, správa uživatelů a skupin, správa & přiřazení rolí pro uzly, komisařství dekomisačních uzlů, správa clusteru a sledování výkonu, konfigurace/analyza a monitorování metrik pro sledování výkonu, konfigurace a správa MapR zabezpečení.
  • Pochopení a práce s M7 - nativním úložištěm pro tabulky MapR.
  • Konfigurace clusteru a jeho optimalizace pro nejlepší výkon.

Aktualizace clusteru a integrace s dalšími nastaveními:

  • Aktualizace verze software MapR a typy aktualizací.
  • Konfigurace clusteru Mapr pro přístup k HDFS clusteru.
  • Nastavení clusteru MapR na Amazon Elastic Mapreduce.

Všechny uvedené téma zahrnují demonstrace a cvičné seze pro uživatele, aby měly praxi s technologií.

Požadavky

  • Základní znalosti Linux FS
  • Základy Java
  • Znalost Apache Hadoop (doporučeno)
 28 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie