A Practical Introduction to Stream Processing Training Course
Zpracování toku se týká zpracování „dat v pohybu“ v reálném čase, to znamená provádění výpočtů s daty, jak jsou přijímána. Taková data jsou čtena jako nepřetržité proudy z datových zdrojů, jako jsou události senzorů, aktivita uživatelů webových stránek, finanční obchody, swipy kreditní kartou, proudy kliknutí atd. Rámce pro zpracování datových proudů jsou schopny číst velké objemy příchozích dat a poskytovat cenné poznatky téměř okamžitě.
V tomto živém školení vedeném instruktorem (na místě nebo na dálku) se účastníci naučí, jak nastavit a integrovat různé Stream Processing rámce se stávajícími systémy ukládání velkých dat a souvisejícími softwarovými aplikacemi a mikroslužbami.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte různé Stream Processing frameworky, jako je Spark Streaming a Kafka Streaming. Pochopte a vyberte nejvhodnější rámec pro danou práci. Zpracování dat nepřetržitě, souběžně a záznam po záznamu. Integrujte Stream Processing řešení se stávajícími databázemi, datovými sklady, datovými jezery atd. Integrujte nejvhodnější knihovnu pro zpracování datových proudů s podnikovými aplikacemi a mikroslužbami.
Publikum
- Vývojáři Softwaroví architekti
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení
Poznámky
- Chcete-li požádat o školení na míru pro tento kurz, kontaktujte nás a domluvíme se.
Návrh Školení
Úvod
- Zpracování streamu vs. dávkové zpracování Zpracování streamu zaměřené na analýzu
Přehled rámců a Programming jazyků
- Spark Streaming (Scala) Kafka Streaming (Java) Flink Storm Porovnání funkcí a silných stránek každého rámce
Přehled zdrojů dat
- Živá data jako série událostí v průběhu času Historické zdroje dat
Možnosti nasazení
- V cloudu (AWS atd.) On premise (soukromý cloud atd.)
Začínáme
- Nastavení vývojového prostředí Instalace a konfigurace Vyhodnocení vašich Data Analysis potřeb
Provozování streamovacího rámce
- Integrace rámce pro streamování s nástroji pro velká data Událost Stream Processing (ESP) vs. komplexní zpracování událostí (CEP) Transformace vstupních dat Kontrola výstupních dat Integrace rámce Stream Processing se stávajícími aplikacemi a mikroslužbami
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Programming zkušenosti v jakémkoli jazyce
- Pochopení konceptů velkých dat (Hadoop atd.)
Open Training Courses require 5+ participants.
A Practical Introduction to Stream Processing Training Course - Booking
A Practical Introduction to Stream Processing Training Course - Enquiry
A Practical Introduction to Stream Processing - Consultancy Enquiry
Consultancy Enquiry
Reference (1)
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Upcoming Courses
Související kurzy
Administration of Confluent Apache Kafka
21 hodinyConfluent Apache Kafka je distribuovaná platforma pro streamování událostí navržená pro vysokou propustnost, odolné datové potrubí a reálně časovou analýzi.
Toto instruktorovo vedené živé školení (online nebo na místním místě) je určeno pro středně pokročilé systémové správce a DevOps profesionály, kteří chtějí nainstalovat, nakonfigurovat, monitorovat a diagnostikovat problémy v clusterech Confluent Apache Kafka.
Na konci tohoto školení budou účastníci schopni:
- Pochopit složky a architekturu Confluent Kafka.
- Nasadit a spravovat Kafka brokerů, Zookeeper kvórum a klíčové služby.
- Konfigurovat pokročilé funkce včetně zabezpečení, replikace a optimalizace výkonu.
- Využít správní nástroje pro monitorování a udržování Kafka clusterů.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Hodně cvičení a praxe.
- Ruční implementace v prostředí živé laboratoře.
Vybrané možnosti učebního kurzu
- Pro požadavek na vlastnění školení tohoto kurzu, kontaktujte nás pro domluvu.
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 hodinyTento kurz je určen pro vývojáře a datové vědce, kteří chtějí porozumět umělé inteligenci a implementovat ji do svých aplikací. Zvláštní pozornost je věnována analýze dat, distribuované umělé inteligenci a zpracování přirozeného jazyka.
Unified Batch and Stream Processing with Apache Beam
14 hodinyApache Beam je unifikovaný programovací model s otevřeným zdrojovým kódem pro definování a spouštění paralelních kanálů zpracování dat. Jeho síla spočívá v jeho schopnosti spouštět jak dávkové, tak streamingové kanály, přičemž spouštění je prováděno jedním z podporovaných back-endů distribuovaného zpracování Beam: Apache Apex, Apache Flink, Apache Spark a Google Cloud Dataflow. Apache Beam je užitečný pro úlohy ETL (Extract, Transform, and Load), jako je přesun dat mezi různými paměťovými médii a zdroji dat, transformace dat do vhodnějšího formátu a načítání dat do nového systému.
V tomto živém školení vedeném instruktorem (na místě nebo na dálku) se účastníci naučí, jak implementovat Apache Beam SDK v Java nebo Python aplikaci, která definuje kanál pro zpracování dat pro rozložení velké datové sady na menší kusy. pro nezávislé paralelní zpracování.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apache Beam.
- Použijte jediný programovací model k provádění dávkového i proudového zpracování v rámci jejich Java nebo Python aplikace.
- Spouštějte kanály v různých prostředích.
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení
Poznámka
- Tento kurz bude k dispozici Scala v budoucnu. Pro domluvu nás prosím kontaktujte.
Building Kafka Solutions with Confluent
14 hodinyToto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na inženýry, kteří chtějí používat Confluent (distribuci Kafka) k vybudování a správě platformy pro zpracování dat v reálném čase pro své aplikace.
Na konci tohoto školení budou účastníci schopni:
- Nainstalovat a nakonfigurovat Confluent Platform.
- Používat správní nástroje a služby Confluentu pro jednodušší běh Kafka.
- Ukládat a zpracovávat přicházející datové proudy.
- Optymalizovat a spravovat Kafka cluster.
- Zabezpečit datové proudy.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Mnoho cvičení a praxe.
- Ruční implementace v prostředí live-lab.
Možnosti přizpůsobení kurzu
- Toto školení je založeno na open source verzi Confluent: Confluent Open Source.
- Pro požadavek na individualizované školení tohoto kurz, kontaktujte nás pro uspořádání.
Apache Flink Fundamentals
28 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) představuje principy a přístupy za distribuovaným streamem a dávkovým zpracováním dat a provede účastníky vytvořením aplikace pro streamování dat v reálném čase v Apache Flink.
Na konci tohoto školení budou účastníci schopni:
- Nastavte prostředí pro vývoj aplikací pro analýzu dat.
- Pochopte, jak funguje knihovna pro zpracování grafů (Gelly) Apache Flink.
- Zabalte, spouštějte a monitorujte aplikace pro streamování dat založené na Flink, odolné proti chybám.
- Zvládejte různé pracovní zátěže.
- Provádějte pokročilé analýzy.
- Nastavte víceuzlový cluster Flink.
- Měřte a optimalizujte výkon.
- Integrujte Flink s různými Big Data systémy.
- Porovnejte funkce Flink s funkcemi jiných rámců pro zpracování velkých dat.
Introduction to Graph Computing
28 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci seznámí s nabídkou technologií a implementačními přístupy pro zpracování grafových dat. Cílem je identifikovat objekty reálného světa, jejich charakteristiky a vztahy, poté tyto vztahy modelovat a zpracovat je jako data pomocí přístupu Graph Computing (také známého jako Graph Analytics). Začínáme širokým přehledem a zužujeme se na konkrétní nástroje, když procházíme řadou případových studií, praktických cvičení a živých nasazení.
Na konci tohoto školení budou účastníci schopni:
- Pochopte, jak jsou grafová data uchovávána a procházena.
- Vyberte nejlepší rámec pro daný úkol (od databází grafů po rámce pro dávkové zpracování.)
- Implementujte Hadoop, Spark, GraphX a Pregel k provádění grafových výpočtů na mnoha strojích paralelně.
- Podívejte se na problémy s velkými daty v reálném světě z hlediska grafů, procesů a průchodů.
Apache Kafka for Python Programmers
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové inženýry, datové vědce a programátory, kteří chtějí používat funkce Apache Kafka při streamování dat s Python.
Na konci tohoto školení budou účastníci schopni používat Apache Kafka k monitorování a řízení podmínek v nepřetržitých datových tocích pomocí programování Python.
Stream Processing with Kafka Streams
7 hodinyKafka Streams je knihovna na straně klienta pro vytváření aplikací a mikroslužeb, jejichž data jsou předávána do a ze systému zasílání zpráv Kafka. Tradičně se Apache Kafka při zpracování dat mezi producenty zpráv a spotřebiteli spoléhal na Apache Spark nebo Apache Storm. Voláním Kafka Streams API z aplikace mohou být data zpracována přímo v Kafka, čímž se obejde nutnost odesílání dat ke zpracování do samostatného clusteru.
V tomto živém školení vedeném instruktorem se účastníci naučí, jak integrovat Kafka Streams do sady ukázkových Java aplikací, které předávají data do az Apache Kafka pro zpracování streamů.
Na konci tohoto školení budou účastníci schopni:
- Pochopit vlastnosti a přednosti Kafka Streams ve srovnání s jinými rámci pro zpracování streamů
- Zpracovávat datové streamy přímo uvnitř clusteru Kafka
- Napsat Java nebo Scala aplikaci nebo mikroslužbu, která se integruje s Kafka a Kafka Streams
- Napsat koncizní kód, který transformuje vstupní Kafka témata do výstupních Kafka tématických okén
- Sestavit, zabalit a nasadit aplikaci
Publikum
- Vývojáři
Formát kurzu
- Část přednášky, část diskuse, cvičení a značné množství praktické praxe
Poznámky
- Pro žádost o individualizované školení tohoto kurzu nás kontaktujte pro dohodu
Confluent KSQL
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí implementovat zpracování Apache Kafka streamu bez psaní kódu.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Confluence KSQL.
- Nastavte kanál zpracování datového proudu pouze pomocí příkazů SQL (bez kódování Java nebo Python).
- Provádějte filtrování dat, transformace, agregace, spojení, okna a sessionization zcela v SQL.
- Navrhněte a nasaďte interaktivní, nepřetržité dotazy pro streamování ETL a analýzy v reálném čase.
Apache NiFi for Administrators
21 hodinyV tomto živém školení vedeném instruktorem v České republice (na místě nebo na dálku) se účastníci naučí, jak nasadit a spravovat Apache NiFi v živém laboratorním prostředí.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apachi NiFi.
- Zdroj, transformace a správa dat z nesourodých, distribuovaných zdrojů dat, včetně databází a velkých datových jezer.
- Automatizujte datové toky.
- Povolit analýzu streamování.
- Aplikujte různé přístupy ke zpracování dat.
- Transformujte Big Data do obchodních postřehů.
Apache NiFi for Developers
7 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí základy programování založeného na toku při vývoji řady demo rozšíření, komponent a procesorů pomocí Apache NiFi.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty toku dat NiFi.
- Vyvíjejte rozšíření pomocí NiFi a API třetích stran.
- Vlastní vývoj vlastního procesoru Apache Nifi.
- Ingestujte a zpracujte data v reálném čase z různorodých a neobvyklých formátů souborů a zdrojů dat.
Python and Spark for Big Data (PySpark)
21 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí, jak používat Python a Spark společně k analýze velkých dat při práci na praktických cvičeních.
Na konci tohoto školení budou účastníci schopni:
- Naučte se používat Spark s Python k analýze Big Data.
- Pracujte na cvičeních, která napodobují případy ze skutečného světa.
- Použijte různé nástroje a techniky pro analýzu velkých dat pomocí PySpark.
Spark Streaming with Python and Kafka
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové inženýry, datové vědce a programátory, kteří chtějí používat funkce Spark Streaming při zpracování a analýze dat v reálném čase.
Na konci tohoto školení budou účastníci schopni používat Spark Streaming ke zpracování živých datových toků pro použití v databázích, souborových systémech a živých řídicích panelech.
Apache Spark MLlib
35 hodinyMLlib je knihovna Spark pro strojové učení (ML). Jeho cílem je učinit praktické strojové učení škálovatelné a snadné. Skládá se z běžných výukových algoritmů a utilit, včetně klasifikace, regrese, shlukování, kolaborativního filtrování, redukce rozměrů, stejně jako optimalizačních primitiv nižší úrovně a rozhraní API na vyšší úrovni.
Dělí se na dva balíčky:
- spark.mllib obsahuje původní API postavené na RDD. spark.ml poskytuje API vyšší úrovně postavené na DataFrames pro vytváření kanálů ML.
Publikum
Tento kurz je zaměřen na inženýry a vývojáře, kteří chtějí využít vestavěnou knihovnu strojů pro Apache Spark
Stratio: Rocket and Intelligence Modules with PySpark
14 hodinyStratio je datová platforma, která integruje big data, AI a správu do jediného řešení. Moduly Rocket a Intelligence umožňují rychlou datovou procházkou, transformaci a pokročilý analytický výkon ve firemních prostředích.
Tato instruktor-provedená živá školení (online nebo na místě) je určeno středně pokročilým datovým profesionálům, kteří chtějí efektivně používat moduly Rocket a Intelligence v Stratio s PySpark, zaměřením na smyčkové struktury, uživatelsky definované funkce a pokročilou datovou logiku.
Po ukončení tohoto školení budou účastníci schopni:
- Navigovat a pracovat ve Stratio platformě s využitím modulů Rocket a Intelligence.
- Používat PySpark ve kontextu nahrávání dat, transformace a analýzy.
- Používat smyčky a podmíněnou logiku pro ovládání datových pracovních toků a úkolů inženýrství funkcí.
- Vytvářet a spravovat uživatelsky definované funkce (UDF) pro opakovatelné datové operace v PySpark.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Mnoho cvičení a praxe.
- Praktické realizace v živém laboratorním prostředí.
Možnosti personalizace kurzu
- Pro požadavek na personalizované školení tohoto kurzu, kontaktujte nás pro uspořádání.