Návrh Školení

Architektura Greenplum

  • Paralelní zpracování a symetrické multiprozessing
  • Roly segmentů a konfigurace clusteru
  • Škálabilita a pohyb dat
  • Achitektura Greenplum Data Warehouse

Struktury tabulek Greenplum

  • Distribuované vs. náhodně přiřazené tabulky
  • Haldové vs. pouze pro přidávání tabulky
  • Úložné formáty řádků a sloupců
  • Rozdělené a klastrované tabulky

Distribuce dat a hashing

  • Hashing logika a distribuční klíče
  • Zvládání šikmosti a dopad na výkon
  • Hashovací mapy a strategie umístění řádků

Indexy a optimalizace výkonu

  • Klastrované a neklastrované indexy
  • Použití B-stromových a bitmapových indexů
  • Chování prohledávání a úložiště indexů

Fyzický Database návrh

  • Normalizace a návrh logického modelu
  • Strategie přístupu uživatelů a analýzy distribuce
  • Demografie dat a rozhodnutí o indexování

Techniky denormalizace

  • Vedlejší data, sestavné tabulky a předspojuvání
  • Sloupcové tabulky jako vertikální dělení
  • Data marts a materializované zobrazení

Pokročilé SQL a provádění dotazů

  • Strategie spojování a redistribuce
  • OLAP a okenní funkce
  • Dočasné tabulky, poddotazy a derivované tabulky

Plány EXPLAIN a optimalizace dotazů

  • Přečtení a interpretování výstupu EXPLAIN
  • Analyza nákladů a optimalizace plánů
  • Pohyby spojení a operace lokálních segmentů

Greenplum nástroje a nejlepší postupy

  • ANALYZE a VACUUM
  • Nahrávání dat a pohyb s Nexus
  • Zabezpečení, oprávnění a tipy pro výkon

Souhrn a další kroky

Požadavky

  • Přehled relačních databází a SQL
  • Zkušenosti s úložištěm dat nebo analytickými systémy
  • Širší znalosti Linux operací z příkazového řádku

Cílová skupina

  • Aktivní architekti a inženýři dat
  • Database správci a technickí vedoucí
  • Vývojáři BI a analytických odborníci pracující s Greenplum
 21 hodiny

Počet účastníků


Price per participant

Reference (3)

Upcoming Courses

Související kategorie