Návrh Školení

Úvod

  • Pochopení důležitosti předzpracování dat v analýze a strojovém učení
  • Předzpracovávací potrubí a jeho role v životním cyklu dat
  • Prozkoumání běžných problémů s nezpracovanými daty a jejich dopad na analýzu

Sběr a akvizice dat

  • Zdroje dat: databázové systémy, API, tabulkové procesory, textové soubory a další
  • Techniky sběru dat a zajištění kvality dat během sběru
  • Sběr dat ze různých zdrojů

Data Cleaning Techniky

  • Identifikace a řešení problémů s chybějícími hodnotami, odchylkami a nejednoznačnostmi
  • Zvládání duplikátů a chyb v datech
  • Vyčištění skutečných datových sad

Transformace a standardizace dat

  • Techtniky normalizace a standardizace dat
  • Zpracování kategorických dat: kódování, souběžné skupiny a inženýrství funkcí
  • Převod nezpracovaných dat na použitelné formáty

Data Integration a Agregace

  • Spojování a kombinování datových sad z různých zdrojů
  • Řešení konfliktů dat a shody typů dat
  • Techniky agregace a konsolidace dat

Data Quality Ujištění

  • Metody zajištění kvality a integrity dat po celém procesu
  • Implementace kontrol kvality a validacních procedur
  • Případové studie a praktická použití zajišťování kvality dat

Redukce rozměrů a výběr funkcí

  • Pochopení potřeby snížení dimenzionality
  • Techniky jako PCA, výběr funkcí a strategie pro snížení dimenzionality
  • Implementace technik snížení dimenzionality

Shrnutí a další kroky

Požadavky

  • Základní pochopení datových konceptů

Publikum

  • Analytičtí pracovníci dat
  • Database správci
  • IT odborníci
 14 hodiny

Počet účastníků


Price per participant

Reference (2)

Upcoming Courses

Související kategorie