Data Vault: Building a Scalable Data Warehouse Počítačový Kurz
Data Vault Modelování je technika databázového modelování, která poskytuje dlouhodobé historické ukládání dat pocházejících z více zdrojů. Datový trezor ukládá jednu verzi faktů, neboli „všechna data, po celou dobu“. Jeho flexibilní, škálovatelný, konzistentní a adaptabilní design zahrnuje nejlepší aspekty 3. normální formy (3NF) a hvězdného schématu.
V tomto živém školení vedeném instruktorem se účastníci naučí, jak postavit Data Vault.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty designu za Data Vault 2.0 a její interakci s Big Data, NoSQL a AI.
- Použijte techniky ukládání dat k umožnění auditování, trasování a kontroly historických dat v datovém skladu.
- Vytvořte konzistentní a opakovatelný proces ETL (Extract, Transform, Load).
- Vybudujte a nasaďte vysoce škálovatelné a opakovatelné sklady.
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení
Návrh Školení
Zavedení
- Nedostatky existujících architektur datového modelování datových skladů
- Výhody Data Vault modelování
Přehled Data Vault architektury a principů designu
- SEI / CMM / Soulad
Data Vault aplikace
- Dynamické datové sklady
- Průzkumné sklady
- V Database Data Mining
- Rychlé propojení externích informací
Data Vault komponenty
- Huby, odkazy, satelity
Stavba Data Vault
Modelovací rozbočovače, spoje a satelity
Data Vault referenční pravidla
Jak se komponenty vzájemně ovlivňují
Modelování a vyplnění Data Vault
Převod 3NF OLTP na Data Vault Enterprise Data Warehouse (EDW)
Porozumění datům načtení, datům ukončení a operacím spojení
Business klíče, vztahy, tabulky propojení a techniky spojení
Dotazovací techniky
Zpracování zátěže a zpracování dotazů
Přehled metodiky Matrix
Získávání dat do datových entit
Načítání entit centra
Načítání odkazových entit
Načítání satelitů
Použití šablon SEI/CMM úrovně 5 k získání opakovatelných, spolehlivých a kvantifikovatelných výsledků
Vývoj konzistentního a opakovatelného procesu ETL (Extract, Transform, Load).
Budování a nasazení vysoce škálovatelných a opakovatelných skladů
Závěrečné poznámky
Požadavky
- Pochopení konceptů datových skladů
- Pochopení databází a konceptů datového modelování
Publikum
- Datoví modeláři
- Specialista na datové sklady
- Business Specialisté na zpravodajství
- datoví inženýři
- Database správci
Open Training Courses require 5+ participants.
Data Vault: Building a Scalable Data Warehouse Počítačový Kurz - Booking
Data Vault: Building a Scalable Data Warehouse Počítačový Kurz - Enquiry
Data Vault: Building a Scalable Data Warehouse - Consultancy Enquiry
Consultancy Enquiry
Reference (1)
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurz - Data Vault: Building a Scalable Data Warehouse
Upcoming Courses
Související kurzy
Cluster Analysis with R and SAS
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové analytiky, kteří chtějí programovat s R v SAS pro shlukovou analýzu.
Na konci tohoto školení budou účastníci schopni:
- Použijte shlukovou analýzu pro dolování dat
- Hlavní syntaxe R pro řešení shlukování.
- Implementujte hierarchické a nehierarchické shlukování.
- Čiňte rozhodnutí na základě dat, která pomohou zlepšit obchodní operace.
From Data to Decision with Big Data and Predictive Analytics
21 hodinyPublikum
Pokud se snažíte dát smysl datům, ke kterým máte přístup, nebo chcete analyzovat nestrukturovaná data dostupná na internetu (jako Twitter, Linked in atd...), tento kurz je pro vás.
Většinou se zaměřuje na osoby s rozhodovací pravomocí a lidi, kteří si potřebují vybrat, jaká data stojí za shromažďování a která stojí za to analyzovat.
Není zaměřen na lidi, kteří konfigurují řešení, tito lidé však budou mít prospěch z celkového obrazu.
Režim doručení
V průběhu kurzu budou delegátům prezentovány pracovní příklady převážně open source technologií.
Po krátkých přednáškách bude následovat prezentace a jednoduchá cvičení účastníků
Obsah a použitý software
Veškerý používaný software je aktualizován při každém spuštění kurzu, takže kontrolujeme nejnovější možné verze.
Pokrývá proces od získávání, formátování, zpracování a analýzy dat, aby vysvětlil, jak automatizovat proces rozhodování pomocí strojového učení.
Data Mining and Analysis
28 hodinyObjektivní:
Delegáti budou schopni analyzovat velké soubory dat, extrahovat vzory, vybrat správnou proměnnou ovlivňující výsledky, aby byl nový model předpovídán s prediktivními výsledky.
Data Mining
21 hodinyKurz lze poskytnout s libovolnými nástroji, včetně bezplatného softwaru a aplikací pro dolování dat s otevřeným zdrojovým kódem
Data Mining with Python
14 hodinyToto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na datové analytiky a datové vědce, kteří chtějí implementovat pokročilejší techniky analýzy dat pro dolování dat pomocí Python.
Na konci tohoto školení budou účastníci schopni:
- Pochopit důležité oblasti dolování dat, včetně dolování asociačních pravidel, analýzy sentimentu textu, automatického shrnutí textu a detekce anomálií dat.
- Porovnat a implementovat různé strategie pro řešení reálných problémů dolování dat.
- Pochopit a interpretovat výsledky.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Spousta cvičení a praxe.
- Praktická implementace v živém laboratorním prostředí.
Možnosti přizpůsobení kurzu
- Pro požadavek na přizpůsobené školení pro tento kurz nás prosím kontaktujte a domluvte si schůzku.
Data Mining with R
14 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Data Visualization
28 hodinyTento kurz je určen pro inženýry a osoby s rozhodovací pravomocí pracující v oblasti dolování dat a získávání znalostí.
Naučíte se vytvářet efektivní grafy a způsoby, jak prezentovat a reprezentovat svá data způsobem, který osloví osoby s rozhodovací pravomocí a pomůže jim porozumět skrytým informacím.
Data Mining with Excel
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové vědce, kteří chtějí používat Excel pro dolování dat.
- Na konci tohoto školení budou účastníci schopni:
- Prozkoumejte data pomocí Excelu a provádějte dolování a analýzu dat.
- Použijte Microsoft algoritmy pro dolování dat.
- Porozumět konceptům dolování dat v Excelu.
Data Mining with Weka
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na začátečníky až středně pokročilé datové analytiky a datové vědce, kteří chtějí používat Weka k provádění úloh dolování dat.
Na konci tohoto školení budou účastníci schopni:
- Nainstalujte a nakonfigurujte Weka.
- Pochopte Weka prostředí a pracovní plochu.
- Provádějte úlohy dolování dat pomocí Weka.
Data Mining & Machine Learning with R
14 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Data Science for Big Data Analytics
35 hodinyVelká data jsou datové soubory, které jsou tak objemné a složité, že tradiční aplikační software pro zpracování dat je pro ně nedostatečný. Velké problémy s daty zahrnují sběr dat, ukládání dat, analýzu dat, vyhledávání, sdílení, přenos, vizualizaci, dotazování, aktualizaci a ochranu osobních údajů.
Foundation R
7 hodinyTento instruktážní živý trénink v České republice (online nebo na místě) je určen pro začínající odborníky, kteří chtějí získat hluboké znalosti základů R a práce s daty.
Koncem tohoto tréninku budou účastníci schopni:
- Pochopit prostředí pro programování v R a rozhraní RStudio.
- Importovat, manipulovat a zkoumání datových sad pomocí příkazů a balíčků v R.
- Provádět základní statistické analýzy a shrnout data.
- Vytvářet vizualizace pomocí bázového R a ggplot2.
- Efektivně spravovat pracovní prostory, skripty a balíčky.
KNIME Analytics Platform for BI
21 hodinyKNIME Analytics Platform je přední open source možnost pro inovace založené na datech, která vám pomůže objevit potenciál skrytý ve vašich datech, získat nové poznatky nebo předvídat nové budoucnosti. S více než 1 000 moduly, stovkami připravených příkladů, komplexní řadou integrovaných nástrojů a nejširším výběrem dostupných pokročilých algoritmů je platforma KNIME Analytics dokonalou sadou nástrojů pro každého datového vědce a obchodního analytika.
Tento kurz pro platformu KNIME Analytics je ideální příležitostí pro začátečníky, pokročilé uživatele a experty KNIME seznámit se s KNIME, naučit se, jak ji efektivněji používat a jak vytvářet jasné, komplexní přehledy založené na [ 0] pracovní postupy
Platforma analityczna KNIME - szkolenie kompleksowe
35 hodinyŠkolení "Analytics Platform KNIME" nabízí komplexní přehled této bezplatné platformy pro analýzu dat. Program obsahuje úvod do zpracování a analýzy dat, instalace a konfigurace KNIME, stavební workflow, metodika tvorby obchodních modelů a datové modelování. Kurz také pokrývá pokročilé nástroje pro analýzu dat, import a export workflow, integraci nástrojů, ETL procesy, data mining, vizualizaci, rozšíření a integrace s nástroji jako R, Java, Python, Gephi, Neo4j. Závěr obsahuje přehled reportingu, integrace s BIRT a KNIME WebPortal.
Oracle SQL Intermediate - Data Extraction
14 hodinyCílem kurzu je umožnit účastníkům osvojit si práci s jazykem SQL v databázi Oracle pro extrakci dat na středně pokročilé úrovni.