Návrh Školení

Úvod do Data Analysis a Big Data

    Co dělá Big Data "velkým"? Rychlost, objem, rozmanitost, pravdivost (VVVV)
Omezení tradičního zpracování dat
  • Distribuované zpracování
  • Statistická analýza
  • Typy Machine Learning analýzy
  • Data Visualization
  • Big Data Role a odpovědnosti
  • Administrátoři Vývojáři Data Analytici

      Languages Používá se pro analýzu dat

    R Language Proč R pro analýzu dat? Manipulace s daty, výpočty a grafické zobrazení

      Python Proč Python pro analýzu dat?
    Manipulace, zpracování, čištění a drcení dat
  • Přístupy k Data Analysis
  • Statistická analýza Analýza časových řad Prognózování pomocí korelačních a regresních modelů Inferenční Statistics (odhad) Popisné Statistics v souborech velkých dat (např. výpočet průměru)
  • Machine Learning Učení pod dohledem vs

      Klasifikace a shlukování
    Odhad nákladů na konkrétní metody
  • Filtrování
  • Zpracování přirozeného jazyka Zpracování textu
  • Pochopení významu textu
  • Automatické generování textu
  • Analýza sentimentu / analýza tématu
  • Computer Vision Získávání, zpracování, analýza a pochopení obrázků
  • Rekonstrukce, interpretace a pochopení 3D scén
  • Využití obrazových dat k rozhodování
  • Big Data Infrastruktura
  • Úložiště dat Relační databáze (SQL) MojeSQL Postgres Oracle
  • Nerelační databáze (č.SQL) Cassandra
  • MongoDB
  • Neo4j s
  • Pochopení nuancí Hierarchické databáze

      Objektově orientované databáze
    Dokumentově orientované databáze
  • Grafově orientované databáze
  • jiný
  • Distribuované zpracování Hadoop HDFS jako distribuovaný souborový systém
  • MapReduce pro distribuované zpracování
  • Spark All-in-one in-memory cluster computing framework pro rozsáhlé zpracování dat
  • Strukturované streamování
  • Jiskra SQL
  • Machine Learning knihovny: MLlib
  • Zpracování grafu pomocí GraphX
  • Scalability Veřejný cloud AWS, Google, Aliyun atd.Privátní cloud OpenStack, Cloud Foundry atd.
  • Automatická škálovatelnost
  • Výběr správného řešení problému
  • Budoucnost Big Data
  • Shrnutí a závěr
  • Požadavky

    • Obecná znalost matematiky.
    • Obecná znalost programování.
    • Obecná znalost databází.

    Publikum

    • Vývojáři / programátoři
    • IT konzultanti
     35 hodiny

    Počet účastníků



    Price per participant

    Reference (2)

    Související kurzy

    Související kategorie