Návrh Školení

Zavedení

  • Proces Data Science
  • Role a odpovědnosti datového vědce

Příprava vývojového prostředí

  • Knihovny, frameworky, jazyky a nástroje
  • Místní rozvoj
  • Kolaborativní webový vývoj

Sběr dat

  • Různé typy dat
    • Strukturovaný
      • Lokální databáze
      • Database konektory
      • Běžné formáty: xlxs, XML, Json, csv, ...
    • Nestrukturované
      • Kliky, cenzoři, chytré telefony
      • API
      • Internet of Things (IoT)
      • Dokumenty, obrázky, videa, zvuky
  • Případová studie: Průběžné shromažďování velkého množství nestrukturovaných dat

Ukládání dat

  • Relační databáze
  • Nerelační databáze
  • Hadoop: Distribuovaný systém souborů (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Cloudové úložiště

Příprava dat

  • Požití, výběr, čištění a transformace
  • Zajištění kvality dat – správnost, smysluplnost a bezpečnost
  • Zprávy o výjimkách

Languages použito pro přípravu, zpracování a analýzu

  • jazyk R
    • Úvod do R
    • Manipulace s daty, výpočty a grafické zobrazení
  • Python
    • Úvod do Python
    • Manipulace, zpracování, čištění a drcení dat

Analýza dat

  • Průzkumná analýza
    • Základní statistiky
    • Návrhy vizualizací
    • Porozumět datům
  • Kauzalita
  • Vlastnosti a transformace
  • Machine Learning
    • Pod dohledem vs
    • Kdy použít jaký model
  • Natural Language Processing (NLP)

Data Visualization

  • Nejlepší postupy
  • Výběr správného grafu pro správná data
  • Barevné palety
  • Posunout to na další úroveň
    • Řídicí panely
    • Interaktivní vizualizace
  • Vyprávění s daty

Shrnutí a závěr

Požadavky

  • Obecná znalost databázových konceptů
  • Základní pochopení statistiky
 35 hodiny

Počet účastníků


Price per participant

Reference (2)

Upcoming Courses

Související kategorie