Návrh Školení

Úvod

    Proces Data Science Role a odpovědnosti datového vědce

Příprava vývojového prostředí

    Knihovny, rámce, jazyky a nástroje Místní vývoj Vývoj založený na spolupráci na webu

Sběr dat

    Různé typy strukturovaných dat Lokální databáze Databázové konektory Běžné formáty: xlxs, XML, Json, csv, ...
Nestrukturovaná kliknutí, cenzoři, chytré telefony
  • API
  • Internet of Things (IoT)
  • Dokumenty, obrázky, videa, zvuky
  • Případová studie: Průběžné shromažďování velkého množství nestrukturovaných dat
  • Datové úložištěRelační databáze Nerelační databáze Hadoop: Distribuovaný systém souborů (HDFS) Spark: Resilient Distributed Dataset (RDD) Cloudové úložiště
  • Příprava dat
  • Příjem, výběr, čištění a transformace Zajištění kvality dat – správnost, smysluplnost a bezpečnost Zprávy o výjimkách

      Languages používané pro přípravu, zpracování a analýzu

    Jazyk R Úvod do R Manipulace s daty, výpočty a grafické zobrazení

      Python Úvod do Python

    Manipulace, zpracování, čištění a drcení dat

      Analýza dat
    Průzkumná analýza Základní statistiky Návrh vizualizací Porozumět datům
  • Kauzalita
  • Vlastnosti a transformace
  • Machine Learning Pod dohledem vs

      Kdy použít jaký model
    Natural Language Processing (NLP)
  • Data Visualization
  • Osvědčené postupy Výběr správného grafu pro správná data Barevné palety Posun na další úroveň Řídicí panely Interaktivní vizualizace
  • Vyprávění s daty
  • Shrnutí a závěr
  • Požadavky

    • Obecná znalost databázových konceptů
    • Základní pochopení statistiky
     35 hodiny

    Počet účastníků



    Price per participant

    Reference (2)

    Související kategorie