From Data to Decision with Big Data and Predictive Analytics Počítačový Kurz
Publikum
Pokud se snažíte dát smysl datům, ke kterým máte přístup, nebo chcete analyzovat nestrukturovaná data dostupná na internetu (jako Twitter, Linked in atd...), tento kurz je pro vás.
Většinou se zaměřuje na osoby s rozhodovací pravomocí a lidi, kteří si potřebují vybrat, jaká data stojí za shromažďování a která stojí za to analyzovat.
Není zaměřen na lidi, kteří konfigurují řešení, tito lidé však budou mít prospěch z celkového obrazu.
Režim doručení
V průběhu kurzu budou delegátům prezentovány pracovní příklady převážně open source technologií.
Po krátkých přednáškách bude následovat prezentace a jednoduchá cvičení účastníků
Obsah a použitý software
Veškerý používaný software je aktualizován při každém spuštění kurzu, takže kontrolujeme nejnovější možné verze.
Pokrývá proces od získávání, formátování, zpracování a analýzy dat, aby vysvětlil, jak automatizovat proces rozhodování pomocí strojového učení.
Návrh Školení
Rychlý přehled
- Data Sources Minding Data Recommender systems Cíl Marketing
Typy dat
- Strukturovaná vs. nestrukturovaná Statická vs. streamovaná Postojová, behaviorální a demografická data Platnost analytických dat řízená daty vs. uživateli řízená Objem, rychlost a rozmanitost dat
Modelky
- Budování modelů Statistické modely Strojové učení
Klasifikace dat
- Seskupení kGroups, k-prostředí, nejbližší sousedé mravenčí kolonie, hejna ptáků
Prediktivní modely
- Rozhodovací stromy Support vector machine Naivní Bayesova klasifikace Neuronové sítě Markovův model Metody regresního souboru
ROI
- Poměr přínos/náklady Náklady na software Náklady na vývoj Potenciální přínosy
Modely budov
- Příprava dat (MapReduce) Čištění dat Výběr metod Vývoj modelu Testování modelu Hodnocení modelu Nasazení a integrace modelu
Přehled Open Source a komerčního softwaru
- Výběr balíčku R-projektů Python knihovny Hadoop a Mahout Vybrané projekty Apache související s Big Data a Analytics Vybrané komerční řešení Integrace se stávajícím softwarem a datovými zdroji
Požadavky
Pochopení tradičních metod správy a analýzy dat jako SQL, datové sklady, business intelligence, OLAP atd... Pochopení základních statistik a pravděpodobnosti (střední hodnota, rozptyl, pravděpodobnost, podmíněná pravděpodobnost atd...)
Open Training Courses require 5+ participants.
From Data to Decision with Big Data and Predictive Analytics Počítačový Kurz - Booking
From Data to Decision with Big Data and Predictive Analytics Počítačový Kurz - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Consultancy Enquiry
Consultancy Enquiry
Reference (2)
Obsah, protože mi přišel velmi zajímavý a myslím, že by mi pomohl v posledním ročníku na univerzitě.
Krishan - NBrown Group
Kurz - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Kurz - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Související kurzy
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 hodinyTento kurz je určen pro vývojáře a datové vědce, kteří chtějí porozumět umělé inteligenci a implementovat ji do svých aplikací. Zvláštní pozornost je věnována analýze dat, distribuované umělé inteligenci a zpracování přirozeného jazyka.
Unified Batch and Stream Processing with Apache Beam
14 hodinyApache Beam je unifikovaný programovací model s otevřeným zdrojovým kódem pro definování a spouštění paralelních kanálů zpracování dat. Jeho síla spočívá v jeho schopnosti spouštět jak dávkové, tak streamingové kanály, přičemž spouštění je prováděno jedním z podporovaných back-endů distribuovaného zpracování Beam: Apache Apex, Apache Flink, Apache Spark a Google Cloud Dataflow. Apache Beam je užitečný pro úlohy ETL (Extract, Transform, and Load), jako je přesun dat mezi různými paměťovými médii a zdroji dat, transformace dat do vhodnějšího formátu a načítání dat do nového systému.
V tomto živém školení vedeném instruktorem (na místě nebo na dálku) se účastníci naučí, jak implementovat Apache Beam SDK v Java nebo Python aplikaci, která definuje kanál pro zpracování dat pro rozložení velké datové sady na menší kusy. pro nezávislé paralelní zpracování.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apache Beam.
- Použijte jediný programovací model k provádění dávkového i proudového zpracování v rámci jejich Java nebo Python aplikace.
- Spouštějte kanály v různých prostředích.
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení
Poznámka
- Tento kurz bude k dispozici Scala v budoucnu. Pro domluvu nás prosím kontaktujte.
Data Vault: Building a Scalable Data Warehouse
28 hodinyV tomto živém školení vedeném instruktorem v České republice se účastníci naučí, jak vytvořit Data Vault.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty designu za Data Vault 2.0 a její interakci s Big Data, NoSQL a AI.
- Použijte techniky ukládání dat k umožnění auditování, trasování a kontroly historických dat v datovém skladu.
- Vyvinout konzistentní a opakovatelný proces ETL (Extract, Transform, Load).
- Vybudujte a nasaďte vysoce škálovatelné a opakovatelné sklady.
Apache Flink Fundamentals
28 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) představuje principy a přístupy za distribuovaným streamem a dávkovým zpracováním dat a provede účastníky vytvořením aplikace pro streamování dat v reálném čase v Apache Flink.
Na konci tohoto školení budou účastníci schopni:
- Nastavte prostředí pro vývoj aplikací pro analýzu dat.
- Pochopte, jak funguje knihovna pro zpracování grafů (Gelly) Apache Flink.
- Zabalte, spouštějte a monitorujte aplikace pro streamování dat založené na Flink, odolné proti chybám.
- Zvládejte různé pracovní zátěže.
- Provádějte pokročilé analýzy.
- Nastavte víceuzlový cluster Flink.
- Měřte a optimalizujte výkon.
- Integrujte Flink s různými Big Data systémy.
- Porovnejte funkce Flink s funkcemi jiných rámců pro zpracování velkých dat.
Generative & Predictive AI for Developers
21 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na středně pokročilé vývojáře, kteří chtějí vytvářet aplikace založené na umělé inteligenci pomocí prediktivní analýzy a generativních modelů.
Na konci tohoto školení budou účastníci schopni:
- Pochopte základy prediktivní umělé inteligence a generativních modelů.
- Využijte nástroje založené na umělé inteligenci pro prediktivní kódování, prognózování a automatizaci.
- Implementujte LLM (Large Language Models) a transformátory pro generování textu a kódu.
- Použijte prognózy časových řad a doporučení založená na umělé inteligenci.
- Vyvíjejte a vylaďujte modely umělé inteligence pro aplikace v reálném světě.
- Vyhodnoťte etické úvahy a osvědčené postupy při zavádění AI.
Introduction to Graph Computing
28 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci seznámí s nabídkou technologií a implementačními přístupy pro zpracování grafových dat. Cílem je identifikovat objekty reálného světa, jejich charakteristiky a vztahy, poté tyto vztahy modelovat a zpracovat je jako data pomocí přístupu Graph Computing (také známého jako Graph Analytics). Začínáme širokým přehledem a zužujeme se na konkrétní nástroje, když procházíme řadou případových studií, praktických cvičení a živých nasazení.
Na konci tohoto školení budou účastníci schopni:
- Pochopte, jak jsou grafová data uchovávána a procházena.
- Vyberte nejlepší rámec pro daný úkol (od databází grafů po rámce pro dávkové zpracování.)
- Implementujte Hadoop, Spark, GraphX a Pregel k provádění grafových výpočtů na mnoha strojích paralelně.
- Podívejte se na problémy s velkými daty v reálném světě z hlediska grafů, procesů a průchodů.
Hortonworks Data Platform (HDP) for Administrators
21 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) představuje Hortonworks Data Platform (HDP) a provede účastníky nasazením řešení Spark + Hadoop.
Na konci tohoto školení budou účastníci schopni:
- Použijte Hortonworks ke spolehlivému provozu Hadoop ve velkém měřítku.
- Sjednoťte možnosti zabezpečení, správy a provozu Hadoop s agilními analytickými pracovními postupy Spark.
- Použijte Hortonworks k prozkoumání, ověření, certifikaci a podpoře každé z komponent v projektu Spark.
- Zpracovávejte různé typy dat, včetně strukturovaných, nestrukturovaných, v pohybu a v klidu.
Introduction to Predictive AI
21 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na začínající IT profesionály, kteří chtějí pochopit základy prediktivní umělé inteligence.
Na konci tohoto školení budou účastníci schopni:
- Pochopte základní koncepty prediktivní umělé inteligence a jejích aplikací.
- Sbírejte, čistěte a předzpracujte data pro prediktivní analýzu.
- Prozkoumejte a vizualizujte data a odhalte statistiky.
- Sestavte základní statistické modely pro předpovědi.
- Vyhodnoťte výkon prediktivních modelů.
- Aplikujte koncepty prediktivní AI na scénáře reálného světa.
Confluent KSQL
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na vývojáře, kteří chtějí implementovat zpracování Apache Kafka streamu bez psaní kódu.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Confluence KSQL.
- Nastavte kanál zpracování datového proudu pouze pomocí příkazů SQL (bez kódování Java nebo Python).
- Provádějte filtrování dat, transformace, agregace, spojení, okna a sessionization zcela v SQL.
- Navrhněte a nasaďte interaktivní, nepřetržité dotazy pro streamování ETL a analýzy v reálném čase.
Apache NiFi for Administrators
21 hodinyV tomto živém školení vedeném instruktorem v České republice (na místě nebo na dálku) se účastníci naučí, jak nasadit a spravovat Apache NiFi v živém laboratorním prostředí.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Apachi NiFi.
- Zdroj, transformace a správa dat z nesourodých, distribuovaných zdrojů dat, včetně databází a velkých datových jezer.
- Automatizujte datové toky.
- Povolit analýzu streamování.
- Aplikujte různé přístupy ke zpracování dat.
- Transformujte Big Data do obchodních postřehů.
Apache NiFi for Developers
7 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí základy programování založeného na toku při vývoji řady demo rozšíření, komponent a procesorů pomocí Apache NiFi.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty toku dat NiFi.
- Vyvíjejte rozšíření pomocí NiFi a API třetích stran.
- Vlastní vývoj vlastního procesoru Apache Nifi.
- Ingestujte a zpracujte data v reálném čase z různorodých a neobvyklých formátů souborů a zdrojů dat.
Predictive AI in DevOps: Enhancing Software Delivery
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na středně pokročilé DevOps profesionály, kteří chtějí začlenit prediktivní AI do svých DevOps postupů.
Na konci tohoto školení budou účastníci schopni:
- Implementujte modely prediktivní analýzy k předpovídání a řešení problémů v DevOps kanálu.
- Využijte nástroje řízené umělou inteligencí pro lepší monitorování a operace.
- Aplikujte techniky strojového učení ke zlepšení pracovních postupů dodávání softwaru.
- Navrhněte strategie umělé inteligence pro proaktivní řešení problémů a optimalizaci.
- Procházejte etickými úvahami o používání umělé inteligence v DevOps.
Python and Spark for Big Data (PySpark)
21 hodinyV tomto živém školení pod vedením instruktora v České republice se účastníci naučí, jak používat Python a Spark společně k analýze velkých dat při práci na praktických cvičeních.
Na konci tohoto školení budou účastníci schopni:
- Naučte se používat Spark s Python k analýze Big Data.
- Pracujte na cvičeních, která napodobují případy ze skutečného světa.
- Použijte různé nástroje a techniky pro analýzu velkých dat pomocí PySpark.
Spark Streaming with Python and Kafka
7 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové inženýry, datové vědce a programátory, kteří chtějí používat funkce Spark Streaming při zpracování a analýze dat v reálném čase.
Na konci tohoto školení budou účastníci schopni používat Spark Streaming ke zpracování živých datových toků pro použití v databázích, souborových systémech a živých řídicích panelech.
Apache Spark MLlib
35 hodinyMLlib je knihovna Spark pro strojové učení (ML). Jeho cílem je učinit praktické strojové učení škálovatelné a snadné. Skládá se z běžných výukových algoritmů a utilit, včetně klasifikace, regrese, shlukování, kolaborativního filtrování, redukce rozměrů, stejně jako optimalizačních primitiv nižší úrovně a rozhraní API na vyšší úrovni.
Dělí se na dva balíčky:
- spark.mllib obsahuje původní API postavené na RDD. spark.ml poskytuje API vyšší úrovně postavené na DataFrames pro vytváření kanálů ML.
Publikum
Tento kurz je zaměřen na inženýry a vývojáře, kteří chtějí využít vestavěnou knihovnu strojů pro Apache Spark