Návrh Školení

  1. Základy big data
    • Big Data a jeho role v podnikovém světě
    • Fáze rozvoje strategie Big Data v rámci korporace
    • Vysvětlení logiky stojící za komplexním přístupem k Big Data
    • Komponenty potřebné v platformě pro Big Data
    • Řešení pro úložiště big data
    • Omezení tradičních technologií
    • Přehled typů databází
    • Čtyři dimenze Big Data
  2. Dopad big data na podnikání
    • Význam Big Data pro podnikání
    • Výzvy spojené s extrakcí užitečných dat
    • Integrace Big Data s tradičními daty
  3. Technologie úložišť big data
    • Přehled technologií big data
      • Modely úložišť dat
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Výběr vhodné technologie big data
  4. Zpracování big data
    • Připojení a extrakce dat z databáze
    • Transformace a příprava dat pro zpracování
    • Použití Hadoop MapReduce pro zpracování distribuovaných dat
    • Sledování a provádění úloh Hadoop MapReduce
    • Bloky systému distribuovaného souborového systému Hadoop
    • MapReduce a YARN
    • Zpracování streamovacích dat pomocí Spark
  5. Nástroje a technologie pro analýzu big data
    • Programování Hadoop s jazykem Pig Latin
    • Dotazování na Big Data s Hive
    • Těžba dat pomocí Mahout
    • Nástroje pro vizualizaci a vytváření reportů
  6. Big data ve firemním prostředí
    • Správa a stanovení potřeb Big Data
    • Význam Big Data pro podnikání
    • Výběr správných nástrojů big data k řešení problémů

Koncepce datového skladu

  • Co je datový sklad?
  • Rozdíly mezi OLTP a datovým skladem
  • Získání dat
  • Extrakce dat
  • Transformace dat.
  • Nahrávání dat
  • Datové misky
  • Závislé vs. nezávislé datové misky
  • Návrh databáze

Koncepce testování ETL:

  • Úvod.
  • Životní cyklus vývoje softwaru.
  • Testovací metodologie.
  • Pracovní postup testování ETL.
  • Odpovědnosti při testování ETL v Data stage.

Základy big data

  • Big Data a jeho role v podnikovém světě
  • Fáze rozvoje strategie Big Data v rámci korporace
  • Vysvětlení logiky stojící za komplexním přístupem k Big Data
  • Komponenty potřebné v platformě pro Big Data
  • Řešení pro úložiště big data
  • Omezení tradičních technologií
  • Přehled typů databází

NoSQL databáze

Hadoop

MapReduce

Apache Spark

Požadavky

Delegáti by měli mít povědomí a určité zkušenosti s nástroji pro ukládání dat a měli by mít znalosti o práci s velkými soubory dat

 14 hodiny

Počet účastníků


Cena za účastníka

Reference (1)

Nadcházející kurzy

Související kategorie