Apache NiFi for Developers Počítačový Kurz
Apache NiFi (Hortonworks DataFlow) je integrovaná platforma pro logistiku dat a jednoduché zpracování událostí v reálném čase, která umožňuje přesun, sledování a automatizaci dat mezi systémy. Je napsán pomocí programování založeného na toku a poskytuje webové uživatelské rozhraní pro správu toků dat v reálném čase.
V tomto živém školení vedeném instruktorem se účastníci naučí základy programování založeného na toku při vývoji řady demo rozšíření, komponent a procesorů pomocí Apache NiFi.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty toku dat NiFi.
- Vyvíjejte rozšíření pomocí NiFi a API třetích stran.
- Vlastní vývoj vlastního procesoru Apache Nifi.
- Ingestujte a zpracujte data v reálném čase z různorodých a neobvyklých formátů souborů a zdrojů dat.
Formát kurzu
- Interaktivní přednáška a diskuze.
- Spousta cvičení a cvičení.
- Praktická implementace v prostředí živé laboratoře.
Možnosti přizpůsobení kurzu
- Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.
Návrh Školení
Zavedení
- Data v klidu versus data v pohybu
Přehled Big Data Nástroje a technologie
- Hadoop (HDFS a MapReduce) a Spark
Instalace a konfigurace NiFi
Přehled architektury NiFi
Vývojové přístupy
- Nástroje pro vývoj aplikací a způsob myšlení
- Extrahovat, transformovat a načíst (ETL) nástroje a myšlení
Úvahy o designu
Komponenty, události a vzory procesoru
Cvičení: Streamování datových kanálů do HDFS
Zpracování chyb
Služby kontroléru
Cvičení: Zpracování dat ze zařízení IoT pomocí webových rozhraní API
Cvičení: Vývoj vlastního procesoru Apache Nifi pomocí JSON
Testování a odstraňování problémů
Přispívání do Apache NiFi
Shrnutí a závěr
Požadavky
- Java zkušenosti s programováním.
- Zkušenosti s Maven.
Publikum
- Vývojáři
- Datoví inženýři
Open Training Courses require 5+ participants.
Apache NiFi for Developers Počítačový Kurz - Booking
Apache NiFi for Developers Počítačový Kurz - Enquiry
Apache NiFi for Developers - Consultancy Enquiry
Consultancy Enquiry
Reference (7)
instruktor byl jasný a vysvětlil věc dobře. Kurz a cvičení bylo snadné sledovat.
Peter - Army
Kurz - Apache NiFi for Developers
Machine Translated
Povzbuzení trenéra
ODarrius - Army
Kurz - Apache NiFi for Developers
Machine Translated
Miloval jsem ruce a pomoc při cvičení.
Thomas - Army
Kurz - Apache NiFi for Developers
Machine Translated
Líbilo se mi prostředí virtuálních strojů, protože mohl snadno přepínat mezi pohledy a pomáhat, pokud jsme se potýkali s materiálem.
Pedro
Kurz - Apache NiFi for Developers
Machine Translated
Ruce na řízená cvičení.
Randy
Kurz - Apache NiFi for Developers
Machine Translated
Virtual environment working well and trainer positive attitude
Wojciech Lukawski - Orsted Polska sp. z o.o.
Kurz - Apache NiFi for Developers
I liked trainer's attitude and choice of examples. Trainer was very willing to help and answer questions. Trainer tried to go with as many examples as possible, even though we were short on time.
Waldemar Sobiecki - Orsted Polska sp. z o.o.
Kurz - Apache NiFi for Developers
Upcoming Courses
Související kurzy
Administrator Training for Apache Hadoop
35 hodinyPublikum:
Kurz je určen pro IT specialisty, kteří hledají řešení pro ukládání a zpracování velkých datových sad v prostředí distribuovaného systému
Goal:
Hluboké znalosti Hadoop administrace clusteru.
Big Data Analytics in Health
21 hodinyAnalýza velkých dat zahrnuje proces zkoumání velkého množství různých datových sad s cílem odhalit korelace, skryté vzorce a další užitečné poznatky.
Zdravotnický průmysl má obrovské množství komplexních heterogenních lékařských a klinických dat. Použití analýzy velkých dat na zdravotní data představuje obrovský potenciál při získávání poznatků pro zlepšení poskytování zdravotní péče. Obrovské množství těchto datových souborů však představuje velké výzvy v analýzách a praktických aplikacích v klinickém prostředí.
V tomto živém školení (na dálku) vedeném instruktorem se účastníci naučí, jak provádět analýzu velkých dat ve zdraví, když projdou řadou praktických cvičení v laboratoři.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte nástroje pro analýzu velkých objemů dat, jako je Hadoop MapReduce a Spark Pochopte vlastnosti lékařských dat Použití technik velkých dat pro práci s lékařskými daty Studujte systémy a algoritmy velkých dat v kontextu zdravotnických aplikací
Publikum
- Vývojáři Data Scientists
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení.
Poznámka
- Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.
Hadoop Administration
21 hodinyKurz je určen IT specialistům, kteří hledají řešení pro ukládání a zpracování velkých datových sad v prostředí distribuovaného systému
Cíl kurzu:
Získání znalostí o administraci clusteru Hadoop
Hadoop For Administrators
21 hodinyApache Hadoop je nejpopulárnější framework pro zpracování Big Data na clusterech serverů. V tomto třídenním (volitelně čtyřdenním) kurzu se účastníci dozvědí o obchodních výhodách a případech použití pro Hadoop a jeho ekosystém, jak plánovat nasazení a růst clusteru, jak instalovat, udržovat, monitorovat, odstraňovat problémy a optimalizovat [2 ]. Procvičí si také hromadné načítání dat clusteru, seznámí se s různými Hadoop distribucemi a procvičí instalaci a správu Hadoop ekosystémových nástrojů. Kurz je zakončen diskusí o zabezpečení clusteru s Kerberos.
„…Materiály byly velmi dobře připravené a důkladně zakryté. Laboratoř byla velmi nápomocná a dobře organizovaná“
— Andrew Nguyen, hlavní inženýr integrace DW, Microsoft Online Advertising
Publikum
Hadoop správci
Formát
Přednášky a praktické laboratoře, přibližná bilance 60 % přednášek, 40 % laboratoří.
Hadoop for Developers (4 days)
28 hodinyApache Hadoop je nejoblíbenější framework pro zpracování Big Data na klastrech serverů. Tento kurz seznámí vývojáře s různými komponentami (HDFS, MapReduce, Pig, Hive a HBase) Hadoop ekosystém.
Advanced Hadoop for Developers
21 hodinyApache Hadoop je jedním z nejpopulárnějších frameworků pro zpracování Big Data na clusterech serverů. Tento kurz se ponoří do správy dat v HDFS, pokročilém Pig, Hive a HBase. Tyto pokročilé programovací techniky budou přínosem pro zkušené Hadoop vývojáře.
Publikum : vývojáři
Doba trvání: tři dny
Formát: přednášky (50 %) a praktické cvičení (50 %).
Hadoop Administration on MapR
28 hodinyPublikum:
Tento kurz je určen k demystifikaci big data/hadoop technologie a ukázat, že není těžké porozumět.
Hadoop and Spark for Administrators
35 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na systémové administrátory, kteří se chtějí naučit, jak nastavit, nasadit a spravovat Hadoop clustery v rámci své organizace.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apache Hadoop.
- Pochopte čtyři hlavní součásti ekoystému Hadoop: HDFS, MapReduce, YARN a Hadoop Common.
- Použijte Hadoop Distributed File System (HDFS) ke škálování clusteru na stovky nebo tisíce uzlů.
- Nastavte HDFS tak, aby fungoval jako úložný modul pro místní nasazení Spark.
- Nastavte Spark pro přístup k alternativním úložným řešením, jako jsou databázové systémy Amazon S3 a NoSQL, jako jsou Redis, Elasticsearch, Couchbase, Aerospike atd.
- Provádějte administrativní úkoly, jako je poskytování, správa, monitorování a zabezpečení clusteru Apache Hadoop.
HBase for Developers
21 hodinyTento kurz představuje HBase – obchod č.SQL na vrcholu Hadoop. Kurz je určen pro vývojáře, kteří budou používat HBase k vývoji aplikací, a administrátory, kteří budou spravovat clustery HBase.
Provedeme vývojáře architekturou HBase a datovým modelováním a vývojem aplikací na HBase. Bude také diskutovat o používání MapReduce s HBase a některých tématech správy souvisejících s optimalizací výkonu. Kurz je velmi praktický se spoustou laboratorních cvičení.
Doba trvání: 3 dny
Publikum: Vývojáři a správci
Hortonworks Data Platform (HDP) for Administrators
21 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) představuje Hortonworks Data Platform (HDP) a provede účastníky nasazením řešení Spark + Hadoop.
Na konci tohoto školení budou účastníci schopni:
- Použijte Hortonworks ke spolehlivému provozu Hadoop ve velkém měřítku.
- Sjednoťte možnosti zabezpečení, správy a provozu Hadoop s agilními analytickými pracovními postupy Spark.
- Použijte Hortonworks k prozkoumání, ověření, certifikaci a podpoře každé z komponent v projektu Spark.
- Zpracovávejte různé typy dat, včetně strukturovaných, nestrukturovaných, v pohybu a v klidu.
Data Analysis with Hive/HiveQL
7 hodinyTento kurz se zabývá tím, jak používat jazyk Hive SQL (AKA: Hive HQL, SQL on Hive, HiveQL) pro lidi, kteří extrahují data z Hive
Impala for Business Intelligence
21 hodinyCloudera Impala je open source dotazovací stroj s masivním paralelním zpracováním (MPP) SQL pro clustery Apache Hadoop.
Impala umožňuje uživatelům zadávat dotazy s nízkou latencí SQL na data uložená v Hadoop Distributed File System a Apache Hbase bez nutnosti přesunu nebo transformace dat.
Publikum
Tento kurz je zaměřen na analytiky a datové vědce provádějící analýzu dat uložených v Hadoop pomocí nástrojů Business Intelligence nebo SQL.
Po tomto kurzu budou moci delegáti
- Extrahujte smysluplné informace z Hadoop shluků pomocí Impala.
- Napište specifické programy pro usnadnění Business Inteligence v Impala SQL dialektu.
- Odstraňování problémů Impala.
Apache NiFi for Administrators
21 hodinyV tomto živém školení vedeném instruktorem v České republice (na místě nebo na dálku) se účastníci naučí, jak nasadit a spravovat Apache NiFi v živém laboratorním prostředí.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apachi NiFi.
- Zdroj, transformace a správa dat z nesourodých, distribuovaných zdrojů dat, včetně databází a velkých datových jezer.
- Automatizujte datové toky.
- Povolit analýzu streamování.
- Aplikujte různé přístupy ke zpracování dat.
- Transformujte Big Data do obchodních postřehů.
Python, Spark, and Hadoop for Big Data
21 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí používat a integrovat Spark, Hadoop a Python ke zpracování, analýze a transformaci velkých a komplexních souborů dat.
Na konci tohoto školení budou účastníci schopni:
- Nastavte potřebné prostředí pro zahájení zpracování velkých dat pomocí Spark, Hadoop a Python.
- Pochopte funkce, základní komponenty a architekturu Spark a Hadoop.
- Naučte se, jak integrovat Spark, Hadoop a Python pro zpracování velkých dat.
- Prozkoumejte nástroje v ekosystému Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka a Flume).
- Vytvářejte systémy doporučení pro společné filtrování podobné jako Netflix, YouTube, Amazon, Spotify a Google.
- Použijte Apache Mahout ke škálování algoritmů strojového učení.