Návrh Školení

První den: Základy jazyka

  • Úvod do kurzu
  • O Data Science
    • Definice Data Science
    • Proces provedení Data Science.
  • Úvod do R Language
  • Proměnné a typy
  • Řídicí struktury (Smyčky / Podmínky)
  • R skaláře, vektory a matice
    • Definování R vektorů
    • Matice
  • Řetězce a zpracování textu
    • Datový typ znakových dat
    • Vstup-výstup souborů
  • Seznamy
  • Funkce
    • Úvod do funkcí
    • Closures
    • Funkce lapply/sapply
  • DataFrames
  • Práce v laboratoři pro všechny části

Druhý den: Střední úrovně R Programming

  • DataFrames a Vstup-výstup souborů
  • Čtení dat ze souborů
  • Příprava dat
  • Vložené datasetsy
  • Visualizace
    • Grafická knihovna
    • plot() / barplot() / hist() / boxplot() / rozptylový graf
    • Heat Map
    • Balíček ggplot2 (qplot(), ggplot())
  • Práce s Dplyr
  • Práce v laboratoři pro všechny části

Třetí den: Pokročilé Programming s R

  • Statistické modelování pomocí R
    • Statistické funkce
    • Zpracování NA hodnot
    • Rozdělení (Binomický, Poissonovo, Normální)
  • Regrese
    • Úvod do lineárních regresí
  • Doporučení
  • Zpracování textu (balíček tm / Word cloudu)
  • Klastrovaní
    • Úvod do klastrování
    • KMeans
  • Klasifikace
    • Úvod do klasifikace
    • Naive Bayes
    • Stromy rozhodování
    • Trénink pomocí balíčku caret
    • Vyhodnocení algoritmů
  • R a Big Data
    • Připojení R ke databázím
    • Ekosystém Big Data
  • Práce v laboratoři pro všechny části

Požadavky

  • Preferovaná základní znalost programování

Nastavení

  • Moderní notebook
  • Instalace nejnovější R studio a prostředí R
 21 hodiny

Počet účastníků


Price per participant

Reference (7)

Upcoming Courses

Související kategorie