Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.
Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.
Návrh Školení
Úvod
- Proces datové vědy
- Úlohy a povinnosti data scientistů
Příprava vývojového prostředí
- Knihovny, frameworky, jazyky a nástroje
- Lokální vývoj
- Spolupracující webové vývoj
Získávání dat
-
Různé typy dat
-
Strukturovaná data
- Lokální databáze
- Připojení k databázím
- Běžné formáty: xlxs, XML, Json, csv, ...
-
Nestrukturovaná data
- Klikání, senzory, chytré telefony
- API
- Internet věcí (IoT)
- Dokumenty, obrázky, videa, zvuky
-
Strukturovaná data
- Případová studie: Neustálé shromažďování velkých objemů nestrukturovaných dat
Úložiště dat
- Relační databáze
- Ne-relační databáze
- Hadoop: Distribuovaný souborový systém (HDFS)
- Spark: Resilient Distributed Dataset (RDD)
- Cloudové úložiště
Příprava dat
- Ingestion, výběr, čištění a transformace
- Zajištění kvality dat - správnost, relevantnost a bezpečnost
- Sestavy výjimek
Jazyky používané pro přípravu, zpracování a analýzu dat
-
Jazyk R
- Úvod do jazyka R
- Manipulace s daty, výpočty a grafické zobrazování
-
Python
- Úvod do Pythonu
- Manipulace, zpracování, čištění a analýza dat
Analýza dat
-
Explorativní analýza
- Základní statistiky
- Návrhy vizualizací
- Porozumění datům
- Kauzalita
- Vlastnosti a transformace
-
Strojové učení
- Supervizované vs. nesupervizované
- Kdy použít který model
- Zpracování přirozeného jazyka (NLP)
Vizualizace dat
- Osborné praktiky
- Výběr správného grafu pro správná data
- Palety barev
-
Pokročilé vizualizace
- Řídicí panely
- Interaktivní vizualizace
- Příběhové vyprávění s daty
Shrnutí a závěr
Požadavky
- Obecná znalost konceptů databází
- Základní znalost statistiky
35 hodiny
Reference (1)
Real world knowledge from someone in the industry