Návrh Školení

Úvod

  • Proces datové vědy
  • Úlohy a povinnosti data scientistů

Příprava vývojového prostředí

  • Knihovny, frameworky, jazyky a nástroje
  • Lokální vývoj
  • Spolupracující webové vývoj

Získávání dat

  • Různé typy dat
    • Strukturovaná data
      • Lokální databáze
      • Připojení k databázím
      • Běžné formáty: xlxs, XML, Json, csv, ...
    • Nestrukturovaná data
      • Klikání, senzory, chytré telefony
      • API
      • Internet věcí (IoT)
      • Dokumenty, obrázky, videa, zvuky
  • Případová studie: Neustálé shromažďování velkých objemů nestrukturovaných dat

Úložiště dat

  • Relační databáze
  • Ne-relační databáze
  • Hadoop: Distribuovaný souborový systém (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Cloudové úložiště

Příprava dat

  • Ingestion, výběr, čištění a transformace
  • Zajištění kvality dat - správnost, relevantnost a bezpečnost
  • Sestavy výjimek

Jazyky používané pro přípravu, zpracování a analýzu dat

  • Jazyk R
    • Úvod do jazyka R
    • Manipulace s daty, výpočty a grafické zobrazování
  • Python
    • Úvod do Pythonu
    • Manipulace, zpracování, čištění a analýza dat

Analýza dat

  • Explorativní analýza
    • Základní statistiky
    • Návrhy vizualizací
    • Porozumění datům
  • Kauzalita
  • Vlastnosti a transformace
  • Strojové učení
    • Supervizované vs. nesupervizované
    • Kdy použít který model
  • Zpracování přirozeného jazyka (NLP)

Vizualizace dat

  • Osborné praktiky
  • Výběr správného grafu pro správná data
  • Palety barev
  • Pokročilé vizualizace
    • Řídicí panely
    • Interaktivní vizualizace
  • Příběhové vyprávění s daty

Shrnutí a závěr

Požadavky

  • Obecná znalost konceptů databází
  • Základní znalost statistiky
 35 hodiny

Počet účastníků


Cena za účastníka

Reference (1)

Nadcházející kurzy

Související kategorie