Návrh Školení
Úvod do Apache Icebergu
- Přehled Apache Icebergu
- Revize základních konceptů
Detailní představení architektury Icebergu
- Podrobná analýza formátu tabulek Icebergu
- Detailní přehled architektury, včetně metadat a rozvržení souborů
- Interní funkce schémat a evoluce oddílů
Pokročilá instalace a konfigurace
- Konfigurace Icebergu pro optimální výkon v různých prostředích
- Integrace s různými datovými zpracovacími enginami
- Pokročilé nastavení: bezpečnost, šifrování a řízení přístupu
- Nastavení Icebergu v distribuovaném prostředí
Pokročilé operace a údržba
- Správa velkých Iceberg tabulek
- Implementace a správa komplexních změn schématu
- Zpracování evoluce oddílů a skrytého rozdělení na oddíly
- Pokročilé CRUD operace s změnami schématu a oddílů
Techniky optimalizace dotazů
- Techniky pro snížení latence dotazů
- Ořezání oddílů a souborů
- Cachování metadat a optimalizační strategie
- Implementace a testování technik optimalizace dotazů
Optimalizace výkonu pro velké datové soubory
- Optimalizace výkonu pro velké množství dat
- Použití vestavěných funkcí Icebergu pro optimalizaci výkonu
- Studie případů optimalizace výkonu ve skutečných situacích
- Optimalizace výkonu pro velké množství dat
Pokročilá migrace a integrace dat
- Migrace komplexních datových struktur z jiných systémů
- Integrace Icebergu s real-time datovými proudy
- Migrace komplexních datových sad a integrace real-time datových proudů
Spolehlivost a konzistence
- Zajištění souladu a integrity dat v distribuovaných prostředích
- Implementace a správa transakčních záruk
- Zpracování selhání a mechanismy obnovení dat
- Implementace funkcí spolehlivosti a konzistence
Pokročilé funkce a přizpůsobení
- Vlastní implementace katalogu
- Rozšíření Icebergu vlastními funkcemi
- Implementace vlastního katalogu a rozšíření funkcionalit Icebergu
Správa dat a dodržování předpisů
- Implementace politik správy dat
- Dodržování datových předpisů
- Správa auditních tras a linie dat
- Implementace funkcí správy dat a dodržování předpisů
Shrnutí a další kroky
Požadavky
- Ovládání základních konceptů, operací a správy tabulek Iceberg
Cílová skupina
- Data inženýři
- Architekti dat
- Anal tiči dat
- Softwaroví vývojáři
Reference (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurz - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
practice tasks
