Návrh Školení
Úvod do Azure Data Lake Storage Gen2
- Přehled Azure Data Lake Storage Gen2
- Klíčové funkce a výhody
- Srovnání Azure Data Lake Storage Gen1 s Azure Blob Storage
Nastavení Azure Data Lake Storage Gen2
- Vytvoření a konfigurace účtu
- Pochopení hierarchického názvového prostoru
- Strategie importu a exportu dat
Zabezpečení a řízení přístupu
- Implementace ověřování a autorizace
- Správa přístupu pomocí Azure Active Directory (Azure AD)
- Metody šifrování dat a osvědčené postupy
Správa dat a optimalizace nákladů
- Správa životního cyklu dat pomocí úrovní úložiště
- Optimalizace výkonu a tuning
- Strategie správy a optimalizace nákladů
Integrace s analitickými službami
- Úvod do analitických rámčích kompatibilních s Azure Data Lake Storage Gen2
- Použití případů s Azure Databricks, Azure HDInsight a Azure Synapse Analytics
- Vytváření ETL kanálů pomocí Azure Data Factory
Nástroje pro vývoj a API
- Přehled dostupných API a SDK
- Vývoj aplikací pomocí Azure Data Lake Storage Gen2 API
- Automatizace a orchestrace úkolů
Monitorování, odstraňování potíží a osvědčené postupy
- Nástroje a techniky pro monitorování úložiště a vzorů přístupu
- Odstraňování běžných problémů
- Osvědčené postupy pro správu a škálování Azure Data Lake Storage Gen2
Shrnutí a další kroky
Požadavky
- Základní pochopení principů cloudového výpočetnictví
- Základní znalosti řešení pro ukládání dat a databází
Účastníci
- Data inženýři
- Cloudoví specialisté
- Data vědci
Reference (5)
Živé příklady
Ahmet Bolat - Accenture Industrial SS
Kurz - Python, Spark, and Hadoop for Big Data
Přeloženo strojem
velmi interaktivní...
Richard Langford
Kurz - SMACK Stack for Data Science
Přeloženo strojem
Dostatečně praktické, odborník je dobře informovaný
Chris Tan
Kurz - A Practical Introduction to Stream Processing
Přeloženo strojem
Při této školení se naučíte Spark Streaming, Databricks a AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurz - Apache Spark in the Cloud
Přeloženo strojem
cvičné úkoly
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurz - Python and Spark for Big Data (PySpark)
Přeloženo strojem