Návrh Školení
Týden 1 Koncepty Big Data
- VVVV (Velocity, Volume, Variety, Veracity) definice
- Omezení tradičních možností zpracování dat
- Distribuované zpracování
- Statistická analýza
- Typy analýzy strojového učení
- Data visualization
- Distribuované zpracování (např. map-reduce)
- Úvod do používaných jazyků
- Kurz zakladek jazyka R
- Kurz zakladek Pythonu
Týdny 2&3 Provádění analýzy dat
- Statistická analýza
- Deskriptivní statistika ve velkých datech (např. výpočet průměru)
- Inferenční statistika (odhadování)
- Předpověď s modely korelace a regrese
- Analyza časových řad
- Základy strojového učení
- Dozorované vs. nezodpovězené učení
- Klasifikace a shlukování
- Odhad nákladů konkrétních metod
- Filtrace
Týden 4 Zpracování přirozeného jazyka
- Zpracování textu
- Pochopení významu textu
- Automatická generace textu
- Sentimentální a tématrická analýza
- Vidění počítače
Týdny 5&6 Koncepty nástrojů
- Řešení pro úložiště dat (SQL, NoSQL, hierarchické, objektově orientované, dokumentově orientované)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, atd.
- Vybrání správného řešení pro daný problém
- Distribuované zpracování
- Spark
- Strojové učení s Spark (MLLib)
- Spark SQL
- Škálovatelnost
- Veřejný cloud (AWS, Google, atd.)
- Soukromý cloud (OpenStack, Cloud Foundry)
- Automatické škálování
Týden 7 Měkké dovednosti
- Poradenství a vůdčí schopnosti
- Účinnost: vyprávění příběhů na základě dat
- Pochopení svého publikum
- Účinná prezentace dat - prohlášení své zprávy
- Vlivová efektivita a vedení změn
- Zvládání obtížných situací
Zkouška
- Koncová zkouška v rámci ukončení programu
Požadavky
Účastníci musí mít dobré základy v matematice, alespoň na úrovni střední školy.
Přestože nejsou vyžadovány znalosti programování, budou se hodit jakékoli znalosti programování.
Před účastí na tomto školicím programu budou účastníci posouzeni a pohovory.
Reference (5)
Understanding big data beter
Shaune Dennis - Vodacom
Kurz - Big Data Business Intelligence for Telecom and Communication Service Providers
Trainer was accommodative. And actually quite encouraging for me to take up the course.
Grace Goh - DBS Bank Ltd
Kurz - Python in Data Science
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Kurz - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Kurz - Jupyter for Data Science Teams
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback
