Návrh Školení
Úvod
Přehled funkcí a architektury „Open Studio for Big Data“
Nastavení Open Studio pro big data
Navigace v uživatelském rozhraní
Porozumění komponentám a připojením big data
Připojení k Hadoop clusteru
Čtení a zápis dat
Zpracování dat pomocí Hive a MapReduce
Analýza výsledků
Zlepšení kvality big data
Vytvoření big data kanálu
Správa uživatelů, skupin, rolí a projektů
Nasazení Open Studio do produkce
Monitorování Open Studio
Řešení potíží
Shrnutí a závěr
Požadavky
- Pochopení vztahových databází
- Pochopení datových skladů
- Pochopení konceptů ETL (Extract, Transform, Load)
Cílová skupina
- Odborníci na business intelligence
- Odborníci na databáze
- SQL vývojáři
- ETL vývojáři
- Řešení architektů
- Data architekti
- Odborníci na datové skladovy
- Správci systémů a integrátoři
Reference (5)
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem
Dostatečně praktické, odborník je dobře informovaný
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Přeloženo strojem
Při této školení se naučíte Spark Streaming, Databricks a AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
Přeloženo strojem
cvičné úkoly
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem