Návrh Školení

Úvod

    Pochopení důležitosti přípravy dat v analýze a strojovém učení Průběh přípravy dat a její role v životním cyklu dat Zkoumání běžných problémů v nezpracovaných datech a dopadu na analýzu

Sběr a akvizice dat

    Zdroje dat: databáze, API, tabulky, textové soubory a další Techniky pro sběr dat a zajištění kvality dat během sběru Sběr dat z různých zdrojů

Data Cleaning Techniky

    Identifikace a zpracování chybějících hodnot, odlehlých hodnot a nekonzistentností Řešení duplikátů a chyb v datové sadě Čištění reálných datových sad

Transformace a standardizace dat

    Techniky normalizace a standardizace dat Manipulace s kategorickými daty: kódování, binning a inženýrství funkcí Transformace nezpracovaných dat do použitelných formátů

Data Integration a Agregace

    Slučování a kombinování datových sad z různých zdrojů Řešení konfliktů dat a sladění datových typů Techniky pro agregaci a konsolidaci dat

Data Quality Ujištění

    Metody pro zajištění kvality a integrity dat v celém procesu Provádění kontrol kvality a validačních postupů Případové studie a praktické aplikace zajištění kvality dat

Redukce rozměrů a výběr funkcí

    Pochopení potřeby redukce rozměrů Techniky jako PCA, výběr prvků a strategie redukce Implementace technik redukce rozměrů

Shrnutí a další kroky

Požadavky

    Základní pochopení datových pojmů

Publikum

    Data analytici Database administrátoři IT profesionálové
 14 hodiny

Počet účastníků



Price per participant

Reference (2)

Související kurzy

Související kategorie