Návrh Školení
Úvod do analýzy dat a big data
- Co dělá Big Data „velkým“?
- Rychlost, objem, variabilita, pravdivost (VVVV)
- Omezení tradičního zpracování dat
- Distribuované zpracování
- Statistická analýza
- Druhy analýzy strojového učení
- Data visualization (vizualizace dat)
Roli a odpovědnosti v big data
- Správci
- Vývojáři
- Analýti dat
Jazyky používané pro analýzu dat
- R Jazyk
- Proč R pro analýzu dat?
- Manipulace s daty, výpočty a grafická prezentace
- Python
- Proč Python pro analýzu dat?
- Manipulace, zpracování, čištění a analýza dat
Přístupy k analýze dat
- Statistická analýza
- Analyza časových řad
- Predikce s modely korelace a regrese
- Inferenční statistika (odhad)
- Deskriptivní statistika v velkých datových souborech (např. výpočet průměru)
- Strojové učení
- Dohledávané vs. nedohledávané učení
- Klasifikace a shlukování
- Odhad nákladů specifických metod
- Filtrování
- Zpracování přirozeného jazyka
- Zpracování textu
- Chápání významu textu
- Automatická generace textu
- Sentimentální analýza / tématická analýza
- Počítačové vidění
- Získání, zpracování, analýza a chápání obrazů
- Rekonstrukce, interpretace a chápání 3D scén
- Využití dat obrazu k rozhodování
Infrastruktura big data
- Úložiště dat
- Vztahové databáze (SQL)
- MySQL
- Postgres
- Oracle
- Nevztahové databáze (NoSQL)
- Cassandra
- MongoDB
- Neo4js
- Pochopení nuancí
- Hierarchické databáze
- Objektově orientované databáze
- Dokumentově orientované databáze
- Graficky orientované databáze
- Jiné
- Vztahové databáze (SQL)
- Distribuované zpracování
- Hadoop
- HDFS jako distribuovaný souborový systém
- MapReduce pro distribuované zpracování
- Spark
- Celkový rámec v paměti pro cluster computing při velkých datových souborech
- Strukturovaná streamování
- Spark SQL
- Bibliotéky strojového učení: MLlib
- Grafické zpracování s GraphX
- Hadoop
- Škálovatelnost
- Veřejné cloudu
- AWS, Google, Aliyun atd.
- Soukromé cloudu
- OpenStack, Cloud Foundry atd.
- Automatická škálovatelnost
- Veřejné cloudu
Výběr správného řešení pro problém
Budoucnost big data
Souhrn a další kroky
Požadavky
- Základní znalost matematiky
- Základní znalost programování
- Základní znalost databází
Cílová skupina
- Vývojáři / programátoři
- Konzultanti IT
Reference (7)
Jak fungují velká data, datové programy, větší znalost toho, jak funguje náš současný svět pomocí dat
Ozayr Hussain - Vodacom
Kurz - A Practical Introduction to Data Analysis and Big Data
Přeloženo strojem
Praktická stránka školení.
Patrick - Vodacom PTy Ltd
Kurz - A Practical Introduction to Data Analysis and Big Data
Přeloženo strojem
Interactive topics and the style used by the lecture to simplified the topics for the students
Miran Saeed - Sulaymaniyah Asayish Agency
Kurz - A Practical Introduction to Data Analysis and Big Data
the trainer and his ability to lecture
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Kurz - A Practical Introduction to Data Analysis and Big Data
Practical exercises
JOEL CHIGADA - University of the Western Cape
Kurz - A Practical Introduction to Data Analysis and Big Data
R programming
Osden Jokonya - University of the Western Cape
Kurz - A Practical Introduction to Data Analysis and Big Data
Overall the Content was good.