Návrh Školení
Úvod do DataStage
- Přehled procesu ETL
- Pochopení architektury DataStage
- Klíčové komponenty DataStage
Správa DataStage
- Instalace a konfigurace
- Správa uživatelů a bezpečnosti
- Nastavení projektu a správa prostředí
- Řazení a správa úloh
- Postupy zálohování a obnovení
Techniky extrakce dat
- Připojení k různým zdrojům dat
- Extrahování dat z databází, plochých souborů a externích zdrojů
- Osobní doporučení k extrakci dat
Transformace dat pomocí DataStage
- Pochopení návrháře DataStage
- Práce s různými typy etap
- Implementace obchodní logiky v transformacích
- Pokročilé techniky transformace dat
Načítání a integrace dat
- Načítání dat do cílových systémů
- Zajištění kvality a integrity dat
- Obsluha chyb a záznamy
Optimalizace výkonu
- Osobní doporučení pro optimalizaci výkonu
- Správa zdrojů
- Řazení úloh a paralelnost
Pokročilé témata
- Práce s DataStage director
- Ladačení a řešení problémů
Shrnutí a další kroky
Požadavky
- Základní znalosti konceptů databází
- Odborné znalosti SQL a principů datových skladů
Cílová skupina
- IT profissionálové
- Správci databází
- Vývojáři
Reference (5)
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem
Dostatečně praktické, odborník je dobře informovaný
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Přeloženo strojem
Při této školení se naučíte Spark Streaming, Databricks a AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
Přeloženo strojem
cvičné úkoly
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem