Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Základy datových skladů
- Cíl, složky a architektura skladu
- Datové martiny, podnikové skladu a vzory lakehouse
- Fundamenty OLTP vs OLAP a oddělení pracovních zátěží
Dimenzionální modelování
- Fakta, dimenze a granularita
- Válcové schémata vs sněhových krystalů schémata
- Typy pomalu se měnících dimenzí a jejich zpracování
Procesy ETL a ELT
- Strategie extrakce ze systému OLTP a API
- Přeměny, čištění dat a konformita
- Vzory nahrávání, orchestrace a správa závislostí
Kvalita dat a správa metadat
- Profilování dat a pravidla validace
- Zarovnání hlavních a referenčních dat
- Pokračovnost, katalógy a dokumentace
Analýza a výkon
- Koncepty kubů, agregáty a materiální zobrazení
- Partitioning, shlukování a indexování pro analýzu
- Správa pracovních zátěží, mezipaměť a optimalizace dotazů
Bezpečnost a správnost
- Ovládání přístupu, role a bezpečnost řádkové úrovně
- Považovatelnost pro soulad a audit
- Praktiky zálohování, obnovení a spolehlivosti
Současné architektury
- Cloudové datové skladu a elastickost
- Přijímání proudů dat a analýza v reálném čase
- Optymalizace nákladů a monitorování
Kapstone: Od zdroje k válcovému schématu
- Modelování obchodního procesu do fakt a dimenzí
- Vytvoření end-to-end pracovního postupu ETL nebo ELT
- Publikace nástěnek a ověření metrik
Souhrn a další kroky
Požadavky
- Požadavky na znalosti relačních databází a SQL
- Zkušenosti s analýzou dat nebo reportingem
- Základní seznámení s cloudovými nebo místně nasazenými datovými platformami
Cílová skupina
- Analysté dat přecházející na data warehousing
- Vývojáři BI a inženýři ETL
- Akceptoři dat a vedoucí týmů
35 hodiny
Reference (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
practice tasks