Návrh Školení

Pokročilá analýza s použitím Sparku

Big Data v cloudu

Případové studie a nejlepší postupy

Zpracování dat pomocí Apache Spark

Úvod do Google Colab a Apache Spark

Optimalizace pracovních postupů Big Data

Shrnutí a další kroky

Visualizace a Collaboration v Google Colab

  • Integrace Colabu s populárními knihovnami pro vizualizaci
  • Spolupráce při práci se zápisky Colabu
  • Sdílení a export výsledků
  • Integrace Google Colab s nástroji založenými na cloudu
  • Použití cloudového úložiště pro velká data
  • Práce s Sparkem v distribuovaných prostředích cloudu
  • Školení strojového učení pomocí Spark MLlib
  • Provedení analýzy dat v reálném čase
  • Distribuované počítání s použitím Sparku
  • Přehled Google Colab
  • Úvod do Apache Spark
  • Nastavení Sparku v Google Colab
  • Přehled skutečných aplikací velkých dat
  • Případové studie s použitím Apache Spark a Colabu
  • Nejlepší postupy pro analýzu velkých dat
  • Tuning Sparku pro výkon
  • Optimalizace využití paměti a úložiště
  • škálování pracovních postupů pro velké sady dat
  • Práce se záznamy RDD a DataFrame
  • Načítání a zpracování velkých sad dat
  • Použití Spark SQL pro dotazování strukturovaných dat

Požadavky

Audience

  • Základní znalosti konceptů datové vědy
  • Příznaky seznámení s Apache Spark
  • Znalosti programování v Python
  • Datoví vědci
  • Inženýři dat
  • Výzkumníci pracující s velkými daty
 14 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie