Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Architektura Greenplum
- Paralelní zpracování a symetrické multiprozessing
- Roly segmentů a konfigurace clusteru
- Škálabilita a pohyb dat
- Achitektura Greenplum Data Warehouse
Struktury tabulek Greenplum
- Distribuované vs. náhodně přiřazené tabulky
- Haldové vs. pouze pro přidávání tabulky
- Úložné formáty řádků a sloupců
- Rozdělené a klastrované tabulky
Distribuce dat a hashing
- Hashing logika a distribuční klíče
- Zvládání šikmosti a dopad na výkon
- Hashovací mapy a strategie umístění řádků
Indexy a optimalizace výkonu
- Klastrované a neklastrované indexy
- Použití B-stromových a bitmapových indexů
- Chování prohledávání a úložiště indexů
Fyzický Database návrh
- Normalizace a návrh logického modelu
- Strategie přístupu uživatelů a analýzy distribuce
- Demografie dat a rozhodnutí o indexování
Techniky denormalizace
- Vedlejší data, sestavné tabulky a předspojuvání
- Sloupcové tabulky jako vertikální dělení
- Data marts a materializované zobrazení
Pokročilé SQL a provádění dotazů
- Strategie spojování a redistribuce
- OLAP a okenní funkce
- Dočasné tabulky, poddotazy a derivované tabulky
Plány EXPLAIN a optimalizace dotazů
- Přečtení a interpretování výstupu EXPLAIN
- Analyza nákladů a optimalizace plánů
- Pohyby spojení a operace lokálních segmentů
Greenplum nástroje a nejlepší postupy
- ANALYZE a VACUUM
- Nahrávání dat a pohyb s Nexus
- Zabezpečení, oprávnění a tipy pro výkon
Souhrn a další kroky
Požadavky
- Přehled relačních databází a SQL
- Zkušenosti s úložištěm dat nebo analytickými systémy
- Širší znalosti Linux operací z příkazového řádku
Cílová skupina
- Aktivní architekti a inženýři dat
- Database správci a technickí vedoucí
- Vývojáři BI a analytických odborníci pracující s Greenplum
21 hodiny
Reference (1)
the practices