Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Návrh Školení
Úvod
- Pochopení důležitosti předzpracování dat v analýze a strojovém učení
- Předzpracovávací potrubí a jeho role v životním cyklu dat
- Prozkoumání běžných problémů s nezpracovanými daty a jejich dopad na analýzu
Sběr a akvizice dat
- Zdroje dat: databázové systémy, API, tabulkové procesory, textové soubory a další
- Techniky sběru dat a zajištění kvality dat během sběru
- Sběr dat ze různých zdrojů
Data Cleaning Techniky
- Identifikace a řešení problémů s chybějícími hodnotami, odchylkami a nejednoznačnostmi
- Zvládání duplikátů a chyb v datech
- Vyčištění skutečných datových sad
Transformace a standardizace dat
- Techtniky normalizace a standardizace dat
- Zpracování kategorických dat: kódování, souběžné skupiny a inženýrství funkcí
- Převod nezpracovaných dat na použitelné formáty
Data Integration a Agregace
- Spojování a kombinování datových sad z různých zdrojů
- Řešení konfliktů dat a shody typů dat
- Techniky agregace a konsolidace dat
Data Quality Ujištění
- Metody zajištění kvality a integrity dat po celém procesu
- Implementace kontrol kvality a validacních procedur
- Případové studie a praktická použití zajišťování kvality dat
Redukce rozměrů a výběr funkcí
- Pochopení potřeby snížení dimenzionality
- Techniky jako PCA, výběr funkcí a strategie pro snížení dimenzionality
- Implementace technik snížení dimenzionality
Shrnutí a další kroky
Požadavky
- Základní pochopení datových konceptů
Publikum
- Analytičtí pracovníci dat
- Database správci
- IT odborníci
14 hodiny
Reference (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Kurz - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.