Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Architektura Greenplumu
- Paralelní zpracování a symetrické vícepříčné zpracování (SMP)
- Role segmentů a konfigurace clusteru
- Škálovatelnost a pohyb dat
- Architektura Greenplum Data Warehouse
Struktury tabulek v Greenplumu
- Distribuované vs. náhodně přiřazené tabulky
- Tabulky s haldovým ukládáním (heap) vs. s pouze doplňováním (append-only)
- Formáty ukládání řádků vs. sloupců
- Rozdělené a skupinové tabulky (partitioned and clustered tables)
Distribuce dat a hashení
- Logika hashe a distribuční klíče
- Řešení nezváženosti (skew) a vliv na výkon
- Hash mapy a strategie umístění řádků
Indexy a optimalizace výkonu
- Skupinové (clustered) a neskupinové (non-clustered) indexy
- Použití B-stromů (B-tree) a bitmapových indexů (bitmap)
- Skenování indexu a chování ukládání
Fyzický návrh databáze
- Normalizace a návrh logického modelu
- Strategie přístupu uživatelů a analýza distribuce dat
- Demografie dat a rozhodnutí týkající se indexování
Techniky de-normalizace
- Odvozená data, shrnovací tabulky a předem spojené datové sady (pre-joins)
- Sloupcové tabulky jako vertikální dělení (vertical partitioning)
- Datové skladiště (data marts) a materializované zobrazení (materialized views)
Pokročilý SQL a vykonání dotazů
- Strategie spojování (join strategies) a redistribuce dat
- OLAP a okenní funkce (window functions)
- Dočasné tabulky, poddotazy a odvozené tabulky (derived tables)
Plány EXPLAIN a optimalizace dotazů
- Čtení a interpretace výstupu EXPLAIN
- Analýza nákladů (cost analysis) a optimalizace plánů vykonání (plan optimization)
- Pohyby spojování (join movement) a lokální operace v segmentech (segment-local operations)
Nástroje Greenplumu a osvědčené postupy
- ANALYZE a VACUUM
- Načítání a pohyb dat s Nexusem
- Bezpečnost, oprávnění a tipy k optimalizaci výkonu
Shrnutí a další kroky
Požadavky
- Znalost relačních databází a SQL
- Zkušenosti s datovými skladovami nebo analytickými systémy
- Ovládání operací v příkazovém řádku Linuxu
Cílová skupina
- Architekti a inženýři dat
- Správci databází a techničtí vedoucí
- BI vývojáři a analytičtí specialisti pracující s Greenplumem
21 hodiny
Reference (1)
praxe
Liliana Padilla - Hipodromo de Agua Caliente
Kurz - Greenplum Architecture and Data Modeling
Přeloženo strojem