Návrh Školení
Úvod
- Vytváření efektivních algoritmů pro rozpoznávání vzorů, klasifikaci a regresi.
- Knihovny Pythonu
- Online vs offline editory
- Vstupní a výstupní proměnné (charakteristiky)
- Výhody a nevýhody feature engineeringu
- Nevyčištěná data, chybějící data atd.
- Řešení problémů s chybějícími daty
- Numerické, kategorické, datum a další.
- Numerické proměnné, kategorické proměnné atd.
Nastavení vývojového prostředí
Přehled Feature Engineering
Typy problémů sestřelovaných při práci se surovými daty
Předzpracování proměnných
Zpracování chybějících hodnot v datech
Práce s kategorickými proměnnými
Převod názvů na čísla
Zpracování názvů v kategorických proměnných
Transformace proměnných pro zlepšení prediktivní síly
Vyčištění datové sady
Strojové učení – modelování
Zpracování odlehlých hodnot v datech
Shrnutí a závěr
Požadavky
- Zkušenosti s programováním v Pythonu.
- Zkušenosti s Numpy, Pandas a scikit-learn.
- Odborné znalosti algoritmů strojového učení.
Cílová skupina
- Vývojáři
- Data scientisti
- Data analytici
Reference (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurz - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.