Domů
Návrh Školení
Návrh Školení
Hadoop pro administrátory Počítačový Kurz

Hadoop pro administrátory Počítačový Kurz

Apache Hadoop je nejpopulárnější rámec pro zpracování Big Data na shluky serverů. Tento třídenní kurz (volitelně čtyřdenní) se zaměřuje na obchodní výhody a případy použití Hadoop a jeho ekosystému, jak plánovat nasazení a růst clusteru, jak nainstalovat, udržovat, monitorovat, diagnostikovat problémy a optimalizovat Hadoop. Zúčastnění se také naučí zátěžový nahrávání dat do clusteru, budou obeznámeni s různými distribucemi Hadoop a budou mít praxi instalace a správy nástrojů ekosystému Hadoop. Kurz se uzavře diskuzí o zabezpečení clusteru pomocí Kerberos.

“… Materiál byl velmi dobře připraven a zahrnoval úplnou krytí. Laboratoř byla velmi užitečná a dobře organizovaná”
— Andrew Nguyen, hlavní integrační DW inženýr, Microsoft Online Advertising

Audience

Hadoop administrátory

Formát

Přednášky a praktické laboratoře, přibližný poměr 60% přednášek, 40% laboratoří.

Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.

Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.

Návrh Školení

Úvod
- Hadoop historie, koncepty
- Ekosystém
- Distribuce
- Vysokorozpočtová architektura
- Hadoop mýty
- Hadoop výzvy (hardwar / softwar)
- Laboratoře: diskuse o vašich Big Data projektech a problémech
Plánování a instalace
- Výběr softwaru, Hadoop distribuce
- Rozměry clusteru, plánování pro rozvoj
- Výběr hardwaru a sítě
- Topologie stojanů
- Instalace
- Multitenancy
- Struktura adresáře, protokoly
- Benchmarkování
- Laboratoře: instalace clusteru, spuštění výkonnostních benchmarků
Operace s HDFS
- Koncepty (horizontální škálování, replikace, místnost dat, vědomí stojanu)
- Uzly a démony (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Monitorování zdravotního stavu
- Administrace příkazovým řádkem a prostřednictvím webového prohlížeče
- Přidávání úložiště, náhrady vadných jednotek
- Laboratoře: způsob jak se seznámit s příkazovými řádky HDFS
Zpracování dat
- Flume pro záznamy a jiné data do HDFS
- Sqoop pro import ze SQL databází do HDFS, stejně tak export zpět do SQL
- Hadoop datová warehousing s Hive
- Kopírování dat mezi clustery (distcp)
- Použití S3 jako doplňku k HDFS
- Nejlepší postupy a architektury pro zpracování dat
- Laboratoře: nastavení a používání Flume, stejně tak pro Sqoop
Operace a administrace MapReduce
- Paralelní výpočetní před mapreduce: srovnávání HPC vs Hadoop administrace
- Náklady clusteru MapReduce
- Uzly a démony (JobTracker, TaskTracker)
- Procházka rozhraní uživatelů MapReduce
- Konfigurace MapReduce
- Konfigurace úloh
- Optimalizace MapReduce
- Zabezpečení MR: co říct vašim programátorům
- Laboratoře: spuštění příkladů MapReduce
YARN: nová architektura a nové funkce
- Cíle návrhu YARN a implementační architektura
- Noví aktéři: ResourceManager, NodeManager, Application Master
- Instalace YARN
- Plánování úloh v rámci YARN
- Laboratoře: prozkoumání plánování úloh
Pokročilé téma
- Monitorování hardwaru
- Monitorování clusteru
- Přidávání a odstraňování serverů, aktualizace Hadoop
- Zálohování, obnovení a plánování pokračujícího podnikového provozu
- Oozie job pracovní postupy
- Hadoop vysoká dostupnost (HA)
- Hadoop Federace
- Zabezpečení clusteru pomocí Kerberosu
- Laboratoře: nastavení monitorování
Alternativní kurzy
- Cloudera Manager pro správu clusterů, monitorování a rutinní úlohy; instalace, použití. V tomto kurzu se všechny cvičení a laboratoře provádějí v prostředí distribuce Cloudera (CDH5)
- Ambari pro správu clusterů, monitorování a rutinní úlohy; instalace, použití. V tomto kurzu se všechny cvičení a laboratoře provádějí pomocí manažera clustrového systému Ambari a platformy datových nástrojů Hortonworks (HDP 2.0)

Požadavky

pohodlní s základní správou systému Linux
základní skriptovací dovednosti

znalost Hadoop a distribuovaného výpočetnictví není vyžadována, ale budou představeny a vysvětleny během kurzu.

Labová prostředí

Zero Install : Není třeba instalovat hadoop software na studentovy počítače! Studentům bude poskytnut funkční hadoop cluster.

Studenti budou potřebovat následující

SSH klient (Linux a Mac již mají ssh klienty, pro Windows se doporučuje Putty)
prohlížeč k přístupu do clusteru. Doporučujeme Firefox s nainstalovanou rozšířkou FoxyProxy

21 Hodiny

Počet účastníků

(Online)

Klasická učebna

Vyberte umístění

Prosím vyberte místo konání.

Cena za účastníka

Veřejné školení vyžaduje minimálně 5 účastníků.

Hadoop pro administrátory Počítačový Kurz - Rezervace

Jméno a příjmení *

Partnerství a certifikace *

Telefon *

Pozice

Název společnosti

Adresa 1 *

Město *

Kraj / Provincie

Kontaktujte NobleProg *

PSČ *

Datum zahájení

Daňové číslo

Datumy jsou předmětem dostupnosti a probíhají mezi 09:30 a 16:30.

Platba *

Bankovní převod (Faktura, PO)

Debitní / Kreditní karta

Komentáře

Pravidla a podmínky *

Jsem oprávněný zástupce uvedeného klienta a přejíci rezervovat uvedené kurzy nebo služby v souladu s podmínkami NobleProg a ochranou osobních údajů.

Informujte mě o slevách a akcích

Prosím, přečtěte si naše Zásady ochrany osobních údajů a zjistěte, jak používáme vaše data.

Hadoop pro administrátory Počítačový Kurz - Dotaz

Jméno a příjmení *

Partnerství a certifikace *

Telefon *

Počet účastníků

Název společnosti

Adresa společnosti

Jaký typ kurzu si přejete?

Předávací prostory klienta

Online

Učebna

Komentáře

Informujte mě o slevách a akcích

Prosím, přečtěte si naše Zásady ochrany osobních údajů a zjistěte, jak používáme vaše data.

Hadoop pro administrátory - Dotaz ohledně konzultace

Jméno a příjmení *

Telefon *

Partnerství a certifikace *

Název společnosti

Téma konzultace *

Cíl konzultace

S kým bude konzultant pracovat?

Naléhavost konzultace *

Komentáře

Informujte mě o slevách a akcích

Prosím, přečtěte si naše Zásady ochrany osobních údajů a zjistěte, jak používáme vaše data.

Reference (1)

Praktické cvičení. Třída by měla trvat 5 dní, ale i tři dny pomohly rozjasnit spoustu otázek, které jsem měl z práce s NiFi.

James - BHG Financial

Kurz - Apache NiFi for Administrators

Přeloženo strojem

Nadcházející kurzy

Hadoop pro administrátory

2026-06-12 09:30

21 hodiny

Praha, Pražský hrad

4500 EUR (Online)

5100 EUR (Učebna)

Hadoop pro administrátory

2026-06-26 09:30

21 hodiny

Brno

4500 EUR (Online)

4500 EUR (Učebna)

Hadoop pro administrátory

2026-07-10 09:30

21 hodiny

Ostrava

4500 EUR (Online)

4500 EUR (Učebna)

Hadoop pro administrátory

2026-07-24 09:30

21 hodiny

Praha, Pražský hrad

4500 EUR (Online)

5100 EUR (Učebna)

Související kurzy

Školení administrátorů pro Apache Hadoop

35 Hodiny

Publikum:

Kurz je určen pro IT odborníky hledající řešení pro uchovávání a zpracování velkých datových souborů v prostředí distribuovaného systému.

Gopožadavky:

Profilovaná znalost správy clusterů Hadoop.

Přečtěte si více...

Analýza velkých dat v zdravotnictví

21 Hodiny

Analýza velkých dat se týká procesu zkoumání velkého množství různorodých datových sad s cílem odhalit korelace, skryté vzory a další užitečné zjištění.

Zdravotnictví disponuje obrovským množstvím komplexních heterogenních lékařských a klinických dat. Aplikace analýzy velkých dat na data v zdravotnictví nabízí ohromné potenciály pro odvození poznatků, které mohou přispět ke zlepšení poskytování zdravotních služeb. Nicméně rozsah těchto datových sad představuje výzvu v analýze a praktickém využití ve klinickém prostředí.

V tomto instruktorem vedeném, živé tréninku (vzdáleném) se účastníci naučí provádět analýzu velkých dat v zdravotnictví během série praktických cvičení.

Koncem tohoto školení budou účastníci schopni:

Nainstalovat a nakonfigurovat nástroje pro analýzu velkých dat, jako je Hadoop MapReduce a Spark
Pochopit charakteristiku lékařských dat
Aplikovat techniky velkých dat na zpracování lékařských dat
Studovat systémy a algoritmy velkých dat v kontextu aplikací ve zdravotnictví

Cílová skupina

Vývojáři
Analitici dat

Formát kurzu

Část přednášky, část diskuze, cvičení a intenzivní praktické procvičování.

Poznámka

Pro požadavek na přizpůsobené školení pro tento kurz nás prosím kontaktujte s cílem sjednotit datum a čas.

Přečtěte si více...

Hadoop pro vývojáře (4 dny)

28 Hodiny

Apache Hadoop je nejoblíbenější framework pro zpracování Big Data na clusterech serverů. Tento kurz představí vývojáři různé komponenty (HDFS, MapReduce, Pig, Hive a HBase) ekosystému Hadoop.

Přečtěte si více...

Pokročilé Hadoop pro vývojáře

21 Hodiny

Apache Hadoop je jedním z nejoblíbenějších rámeců pro zpracování Big Data na clusterech serverů. Tento kurz se zabývá datovým managementem v HDFS, pokročilou Pig, Hive a HBase. Tyto pokročilé programovací techniky budou užitečné pro zkušené Hadoop vývojáře.

Cílová skupina: vývojáři

Délka: tři dny

Formát: přednášky (50%) a praktické cvičení (50%).

Přečtěte si více...

Administrace Hadoop na MapR

28 Hodiny

Cílová skupina:

Tento kurz je určen k tomu, aby demystifikoval technologie velkých dat a Hadoopu a ukázal, že jsou porozumitelné.

Přečtěte si více...

Hadoop a Spark pro správce

35 Hodiny

Toto školení vedené instruktorem (online nebo na místě) je určeno správcům systémů, kteří chtějí naučit se nastavovat, nasazovat a spravovat Hadoop clustery ve své organizaci.

Na konci tohoto školení budou účastníci schopni:

Nainstalovat a nakonfigurovat Apache Hadoop.
Pochopit čtyři hlavní komponenty v ekosystému Hadoop: HDFS, MapReduce, YARN a Hadoop Common.
Použít Hadoop Distributed File System (HDFS) k škálování clusteru na stovky nebo tisíce uzlů.
Nastavit HDFS jako úložiště pro místní nasazení Spark.
Nastavit Spark k připojení ke střídavým úložišťům, jako je Amazon S3 a NoSQL databázové systémy, např. Redis, Elasticsearch, Couchbase, Aerospike atd.
Provádět správcovské úkoly, jako jsou zřizování, správa, monitorování a bezpečnost Apache Hadoop clusteru.

Přečtěte si více...

HBase pro vývojáře

21 Hodiny

Tento kurz představuje HBase – NoSQL úložiště nad Hadoopem. Kurz je určený pro vývojáře, kteří budou pomocí HBase vytvářet aplikace, a také pro správce, kteří budou spravovat HBase clustery.

Projdeme architekturu HBase, modelování dat a vývoj aplikací na HBase. Kurz se také zabývá použitím MapReduce s HBase a některými administrativními tématy souvisejícími s optimalizací výkonu. Kurs je velmi praktický, obsahuje mnoho cvičení v laboratoři.

Délka: 3 dny

Cílová skupina: Vývojáři & Správci

Přečtěte si více...

Apache NiFi pro Správce

21 Hodiny

Apache NiFi je open-source platforma pro tokovou integraci dat a zpracování událostí. Umožňuje automatizované, v reálném čase probíhající směrování dat, transformaci a mediatorku systémů mezi různými platformami s webovým uživatelským rozhraním a detailní kontrolou.

Tato školení vedená instruktorem (na místě nebo zdálky) je určená středně pokročilým správcům a inženýrům, kteří chtějí nasadit, spravovat, zabezpečit a optimalizovat NiFi toky dat v produkčních prostředích.

Na konci tohoto školení budou účastníci schopni:

Nainstalovat, nakonfigurovat a udržovat Apache NiFi clustery.
Naprojektovat a spravovat toky dat z různých zdrojů a cílů.
Implementovat automatizaci toku, směrování a transformační logiku.
Optimalizovat výkon, monitorovat operace a řešit problémy.

Formát kurzu

Interaktivní přednáška s diskusí o reálných architekturách.
Praktické cvičení: vytváření, nasazování a správa toků.
Scénáře založená cvičení v prostředí live-labu.

Možnosti přizpůsobení kurzu

Pro požadavek na přizpůsobené školení se prosím obrátěte k nám, abychom to zařídili.

Přečtěte si více...

Apache NiFi pro Vývojáře

7 Hodiny

V tomto živém školení pod vedením instruktora v České republice se účastníci naučí základy programování založeného na toku při vývoji řady demo rozšíření, komponent a procesorů pomocí Apache NiFi.

Na konci tohoto školení budou účastníci schopni:

Pochopte architekturu a koncepty toku dat NiFi.
Vyvíjejte rozšíření pomocí NiFi a API třetích stran.
Vlastní vývoj vlastního procesoru Apache Nifi.
Ingestujte a zpracujte data v reálném čase z různorodých a neobvyklých formátů souborů a zdrojů dat.

Přečtěte si více...

Python, Spark a Hadoop pro Velká Data

21 Hodiny

Toto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí používat a integrovat Spark, Hadoop a Python ke zpracování, analýze a transformaci velkých a komplexních souborů dat.

Na konci tohoto školení budou účastníci schopni:

Nastavte potřebné prostředí pro zahájení zpracování velkých dat pomocí Spark, Hadoop a Python.
Pochopte funkce, základní komponenty a architekturu Spark a Hadoop.
Naučte se, jak integrovat Spark, Hadoop a Python pro zpracování velkých dat.
Prozkoumejte nástroje v ekosystému Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka a Flume).
Vytvářejte systémy doporučení pro společné filtrování podobné jako Netflix, YouTube, Amazon, Spotify a Google.
Použijte Apache Mahout ke škálování algoritmů strojového učení.

Přečtěte si více...

Hadoop pro administrátory Počítačový Kurz

Audience

Formát

Návrh Školení

Požadavky

Labová prostředí

Reference (1)

James - BHG Financial

Kurz - Apache NiFi for Administrators

Nadcházející kurzy

Hadoop pro administrátory

Hadoop pro administrátory

Hadoop pro administrátory

Hadoop pro administrátory

Související kategorie

Tato stránka v jiných zemích/regionech

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites