Návrh Školení

Architektura Greenplumu

  • Paralelní zpracování a symetrické vícepříčné zpracování (SMP)
  • Role segmentů a konfigurace clusteru
  • Škálovatelnost a pohyb dat
  • Architektura Greenplum Data Warehouse

Struktury tabulek v Greenplumu

  • Distribuované vs. náhodně přiřazené tabulky
  • Tabulky s haldovým ukládáním (heap) vs. s pouze doplňováním (append-only)
  • Formáty ukládání řádků vs. sloupců
  • Rozdělené a skupinové tabulky (partitioned and clustered tables)

Distribuce dat a hashení

  • Logika hashe a distribuční klíče
  • Řešení nezváženosti (skew) a vliv na výkon
  • Hash mapy a strategie umístění řádků

Indexy a optimalizace výkonu

  • Skupinové (clustered) a neskupinové (non-clustered) indexy
  • Použití B-stromů (B-tree) a bitmapových indexů (bitmap)
  • Skenování indexu a chování ukládání

Fyzický návrh databáze

  • Normalizace a návrh logického modelu
  • Strategie přístupu uživatelů a analýza distribuce dat
  • Demografie dat a rozhodnutí týkající se indexování

Techniky de-normalizace

  • Odvozená data, shrnovací tabulky a předem spojené datové sady (pre-joins)
  • Sloupcové tabulky jako vertikální dělení (vertical partitioning)
  • Datové skladiště (data marts) a materializované zobrazení (materialized views)

Pokročilý SQL a vykonání dotazů

  • Strategie spojování (join strategies) a redistribuce dat
  • OLAP a okenní funkce (window functions)
  • Dočasné tabulky, poddotazy a odvozené tabulky (derived tables)

Plány EXPLAIN a optimalizace dotazů

  • Čtení a interpretace výstupu EXPLAIN
  • Analýza nákladů (cost analysis) a optimalizace plánů vykonání (plan optimization)
  • Pohyby spojování (join movement) a lokální operace v segmentech (segment-local operations)

Nástroje Greenplumu a osvědčené postupy

  • ANALYZE a VACUUM
  • Načítání a pohyb dat s Nexusem
  • Bezpečnost, oprávnění a tipy k optimalizaci výkonu

Shrnutí a další kroky

Požadavky

  • Znalost relačních databází a SQL
  • Zkušenosti s datovými skladovami nebo analytickými systémy
  • Ovládání operací v příkazovém řádku Linuxu

Cílová skupina

  • Architekti a inženýři dat
  • Správci databází a techničtí vedoucí
  • BI vývojáři a analytičtí specialisti pracující s Greenplumem
 21 hodiny

Počet účastníků


Cena za účastníka

Reference (1)

Nadcházející kurzy

Související kategorie