Návrh Školení

Úvod do Teradata

Modul 1: Základy a architektura Teradata

  • Co je Teradata a k čemu se používá?
  • Paralelní architektura: AMPs, PEs, BYNET
  • Rozdělení dat a hashing
  • Klíčové koncepty: relace, spool, zámky
  • Připojení k systému: Teradata Studio / BTEQ / SQL Assistant

Modul 2: Úvod do SQL v prostředí Teradata

  • Základní SELECT, WHERE, ORDER BY
  • Datové typy a přetypování
  • Matematické a data funkce
  • Použití ALIAS, CASE výrazů
  • Specifické operátory pro Teradata (TOP, QUALIFY, SAMPLE)
  • Vedená praxe: dotazy na skutečné tabulky

Modul 3: Joiny, poddotazy a množinové operátory

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joiny bez ON klauzule (kartézský součin)
  • Skalární a korelované poddotazy
  • UNION, INTERSECT, MINUS
  • Praktické cvičení na integrační úkoly s daty

Modul 4: Analytické a OLAP funkce

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Rozdělení dat pomocí PARTITION BY
  • Okně s OVER() a ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Případové studie: KPI, trendy, kumulativní hodnoty

Modul 5: Úpravy a tabulek Management

  • Typy tabulek: trvalé, volatility, globálně dočasné
  • Vytváření a používání sekundárních a join indexů
  • Úlohy vkládání, aktualizace a odstraňování
  • MERGE, UPSERT a kontrola duplicit
  • Transakce a zásuvky pro kontrolu zámek

Modul 6: Optimalizace a úpravy výkonu

  • Optimizátor Teradata: jak vybírá plány provedení
  • Použití EXPLAIN a COLLECT STATISTICS
  • Skenění a způsoby jeho vyhýbání se
  • Nejlepší praktiky pro návrh dotazů
  • Identifikace ohrožení (spool, zámky, redistribuce)
  • Praxe: srovnání optimalizovaných a neoptimalizovaných dotazů

Modul 7: Rozdělení dat a komprese

  • Typy rozdělení: Range, Case, Multi-Level
  • Výhody a praktické využití při velkých dotazech
  • Bloková komprese (BLC) a sloupcová komprese
  • Výhody a omezení

Modul 8: Načítání a extrahování dat

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Masové načítání vs. dávkové vložení
  • Řešení chyb a opakování pokusů
  • Export výsledků do souborů nebo externích systémů
  • Základní automatizace s skripty a nástroji

Modul 9: Základní správa pro technické uživatele

  • Role a oprávnění
  • Řízení zdrojů (Query Bands, Priority Scheduler)
  • Monitorování pomocí DBQLOGTBL, DBC.Tables, ResUsage
  • Nejlepší praktiky pro sdílené prostředí

Modul 10: Konečné integrátorové laboratorní cvičení

  • Celkový praktický případ od začátku do konce:
  • Načítání dat
  • Transformace a agregace
  • Vytváření KPI s funkcemi OLAP
  • Optimalizace a EXPLAIN
  • Konečný export
  • Diskuse o nejlepších praktikách a běžných chybách

Přehled a další kroky

Požadavky

  • Přehled relačních databází a konceptů SQL
  • Zkušenosti s dotazováním velkých datových souborů nebo právě v datových prostředích
  • Znalost cílů business intelligence nebo analýzy

Publikum

  • Analysté dat a odborníci na business intelligence
  • Vývojáři SQL a datoví inženýři
  • Techničtí uživatelé spravující nebo optimalizující data v prostředích od základních po pokročilé úrovně
 35 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie