Návrh Školení

Úvod

  • Pochopení důležitosti přípravy dat pro analýzu a strojové učení
  • Datová přípravná konvence a její role v životním cyklu dat
  • Průzkum běžných výzev ve svých prvních datech a jejich dopadu na analýzu

Sběr a získávání dat

  • Zdroje dat: databáze, API, tabulkové procesory, textové soubory a další
  • Techniky sběru dat a zajištění kvality dat během sběru
  • Sběr dat ze různých zdrojů

Techniky čištění dat

  • Identifikace a řešení chybějících hodnot, odlehlých hodnot a nekonzistenčí
  • Náprava duplikátů a chyb v datové sadě
  • Clenění reálných datových sad

Transformace a standardizace dat

  • Techniky normalizace a standardizace dat
  • Zpracování kategoriálních dat: kódování, třídění do intervalů a feature engineering
  • Převod surových dat na použitelné formáty

Integrace a agregace dat

  • Spojování a kombinování dat z různých zdrojů
  • Řešení konfliktů dat a harmonizace typů dat
  • Techniky pro agregaci a konsolidaci dat

Zajištění kvality dat

  • Metody zajištění kvality dat a integrity po celém procesu
  • Implementace kontrolních a ověřovacích postupů
  • Případové studie a praktické aplikace zajišťování kvality dat

Redukce rozměrnosti a výběr feature

  • Pochopení potřeby redukce rozměrnosti
  • Techniky jako PCA, výběr feature a strategie redukce
  • Implementace technik pro redukci rozměrnosti

Závěr a další kroky

Požadavky

  • Základní pochopení datových konceptů

Cílová skupina

  • Data analytičtí specialisté
  • Správci databází
  • IT profesionálové
 14 hodiny

Počet účastníků


Cena za účastníka

Reference (2)

Nadcházející kurzy

Související kategorie