Návrh Školení
Vstup do Google Colab a Apache Spark
- Přehled o Google Colab
- Úvod do Apache Spark
- Nastavení Sparku v Google Colab
Zpracování dat s použitím Apache Spark
- Práce s RDDs a DataFramey
- Načítání a zpracování velkých datových sad
- Použití Sparku SQL pro dotazování strukturovaných dat
Pokročilá analýza s použitím Sparku
- Strojové učení pomocí Spark MLlib
- Provádění reálně časové analýzy dat
- Distribuované výpočty s použitím Sparku
Vizualizace a Collaboration v Google Colab
- Integrace Colabu s populárními vizualizačními knihovnami
- Kolaborativní pracovní postupy pomocí Colab notebooků
- Sdílení a export výsledků
Optimalizace Big Data pracovních postupů
- Tuning Sparku pro výkon
- Optimalizace použití paměti a úložiště
- Škálování pracovních postupů pro velké datové sady
Big Data v cloudu
- Integrace Google Colab s nástroji založenými na cloudu
- Použití cloudového úložiště pro velká data
- Práce s Sparkem v distribuovaných prostředích cloudu
Případové studie a nejlepší praktiky
- Rezignace reálných aplikací velkých dat
- Případové studie pomocí Apache Spark a Colabu
- Nejlepší praktiky pro analýzu velkých dat
Závěr a další kroky
Požadavky
- Základní znalosti konceptů datové vědy
- Farnost s Apache Spark
- Znalosti programování v Python
Cílová skupina
- Datoví vědci
- Datoví inženýři
- Výzkumníci pracující s velkými daty
Reference (4)
Praktické příklady nám umožnily skutečně pochopit, jak program funguje. Dobré vysvětlení a integrace teoretických konceptů a jejich souvislost s praktickými aplikacemi.
Ian - Archeoworks Inc.
Kurz - ArcGIS Fundamentals
Přeloženo strojem
Všechny témata, která zahrnul včetně příkladů. A také vysvětlil, jak nám pomáhají ve každodenní práci.
madduri madduri - Boskalis Singapore Pte Ltd
Kurz - QGIS for Geographic Information System
Přeloženo strojem
Opravdu jsem si užil školení. Našel jsem všechny moduly relevantní pro problémy, kterými se zabývám na práci. Integrace školení s poznámkovými bloky Jupyter byla opravdu impresivní.
Mark Firmin - Environment and Climate Change Canada
Kurz - Python for Geographic Information System (GIS)
Přeloženo strojem
Nejvíc se mi na školení líbila organizace a místo konání.
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Kurz - ArcGIS for Spatial Analysis
Přeloženo strojem