Návrh Školení

Výklad o Big Data Ecosystems

  • Přehled technologií a architektur velkých dat
  • Hromadné zpracování vs. reálně časové zpracování
  • Strategie úložiště dat pro škálovatelnost

Pokročilé Zpracování Dat s Apache Spark

  • Optimalizace Spark prací pro výkon
  • Pokročilé transformace a akce
  • Práce se strukturovaným streamem dat

Machine Learning na širší měřítko

  • Distribuované techniky trénování modelů
  • Nastavení hyperparametrů pro velká data sestavy
  • Implementace modelu v prostředí velkých dat

Deep Learning pro Big Data

  • Integrace TensorFlow a PyTorch s Spark
  • Distribuované trasy školení hlubokého učení
  • Příklady použití v analýze obrázků, textů a časových řad

Analýza v reálném čase a datové streamy

  • Apache Kafka pro přijetí streamovacích dat
  • Rámcové pracovní techniky pro streamování dat
  • Sledování a upozorňování v systémech v reálném čase

Data Governance, bezpečnost a etika

  • Podmínky ochrany osobních údajů a dodržování právních požadavků
  • Kontrola Access a šifrování v systémech velkých dat
  • Ethické aspekty při analýze na širší měřítko

Integrace Big Data s Business Intelligence

  • Vizualizace a tabule pro velká data
  • Připojení datových kanálů velkých dat k nástrojům BI
  • Zajištění podnikových výsledků za použití pokročilé analýzy dat

Shrnutí a další kroky

Požadavky

  • Silný pochopení konceptů analýzy dat a statistického modelování
  • Zkušenosti s nástroji pro zpracování dat a programovacími jazyky jako je Python, R nebo Scala
  • Poznání distribuovaných výpočetních architektur, jako jsou Hadoop nebo Spark

Cílová skupina

  • Analysté dat zaměření na ovládnutí zpracování velkých množství dat a prediktivní analýzy
  • Pokročilí analytičtí pracovníci hledající design a implementaci pokročilých analytických pracovních toků
  • Profesionálové v oblasti R&D, zaměření na inovativní datově podložené řešení
 42 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie