Návrh Školení

Přehled velkých dat:

    Co je Big Data Proč Big Data získává na popularitě Big Data Případové studie Big Data Charakteristiky Řešení, na kterých je třeba pracovat Big Data.

Hadoop a jeho součásti:

    Co je Hadoop a jaké jsou jeho součásti. Hadoop Architektura a její charakteristiky dat, která dokáže zpracovat / Zpracovat. Stručně o Hadoop Historie, společnosti, které jej používají a proč jej začaly používat. Hadoop Rám a jeho součásti - podrobně vysvětleno. Co je HDFS a čte - Zapisuje do Hadoop distribuovaného systému souborů. Jak nastavit Hadoop Cluster v různých režimech – Stand-alone/Pseudo/Multi Node cluster.

(To zahrnuje nastavení Hadoop clusteru ve VirtualBox/KVM/VMware, síťové konfigurace, které je třeba pečlivě prozkoumat, spouštění Hadoop Daemons a testování clusteru).

    Co je to Map Reduce frame work a jak to funguje. Spuštění mapy Snížit úlohy na Hadoop clusteru. Pochopení replikace, zrcadlení a povědomí o racku v kontextu Hadoop klastrů.

Hadoop Plánování klastrů:

    Jak naplánovat svůj hadoop cluster. Pochopení hardwaru a softwaru pro plánování clusteru hadoop. Porozumění pracovní zátěži a plánování clusteru, abyste se vyhnuli selhání a dosáhli optimálního výkonu.

Co je MapR a proč MapR:

    Přehled MapR a jeho architektury. Pochopení a fungování ovládacího systému MapR, svazků MapR, snímků a zrcadel. Plánování clusteru v kontextu MapR. Porovnání MapR s jinými distribucemi a Apache Hadoop. Instalace MapR a nasazení clusteru.

Nastavení a správa klastru:

    Správa služeb, uzlů, snímků, zrcadlových svazků a vzdálených clusterů. Pochopení a správa uzlů. Pochopení komponent Hadoop, Instalace komponent Hadoop vedle služeb MapR. Přístup k datům v clusteru, včetně prostřednictvím NFS Správa služeb a uzlů. Správa dat pomocí svazků, správa uživatelů a skupin, správa a přidělování rolí uzlům, uvádění do provozu vyřazování uzlů z provozu, správa clusteru a monitorování výkonu, konfigurace/analýza a monitorování metrik pro sledování výkonu, konfigurace a správa zabezpečení MapR. Pochopení a práce s M7- Nativní úložiště pro tabulky MapR. Konfigurace a ladění clusteru pro optimální výkon.

Upgrade klastru a integrace s dalšími nastaveními:

    Aktualizace verze softwaru MapR a typy upgradu. Konfigurace clusteru Mapr pro přístup ke clusteru HDFS. Nastavení clusteru MapR na Amazon Elastic Mapreduce.

Všechna výše uvedená témata zahrnují ukázky a cvičné sezení pro studenty, aby měli praktické zkušenosti s technologií.

Požadavky

  • Základní znalost Linux FS
  • Základní Java
  • Znalost Apache Hadoop (doporučeno)
 28 hodiny

Počet účastníků



Price per participant

Reference (1)

Související kurzy

Související kategorie