Návrh Školení

První den: Základy jazyka

  • Úvod do kurzu
  • O data science
    • Definice data science
    • Proces realizace datové analýzy.
  • Představení jazyka R
  • Proměnné a typy dat
  • Ovládací struktury (cykly, podmínky)
  • Skaláry, vektory a matice v R
    • Definování vektorů v R
    • Matice
  • Manipulace s řetězci a textem
    • Datový typ znaků
    • Čtení a zápis souborů
  • Seznamy (lists)
  • Funkce
    • Představení funkcí
    • Closures
    • Funkce lapply/sapply
  • DataFrames
  • Laboratorní cvičení pro všechny sekce

Druhý den: Středně pokročilé programování v R

  • DataFrames a čtení souborů
  • Čtení dat ze souborů
  • Příprava dat
  • Vstavěné data sets
  • Visualizace
    • Balíček Graphics
    • Funkce plot() / barplot() / hist() / boxplot() / scatter plot
    • Heat Map (teplotová mapa)
    • Balíček ggplot2 (qplot(), ggplot())
  • Průzkum s balíčkem Dplyr
  • Laboratorní cvičení pro všechny sekce

Třetí den: Pokročilé programování s R

  • Statistické modely v R
    • Statistické funkce
    • Zpracování chybějících hodnot (NA)
    • Rozdělení dat (Binomické, Poissonovo, Normální)
  • Regrese
    • Úvod do lineárních regresí
  • Doporučení
  • Zpracování textu (balíček tm, Wordclouds)
  • Klastrování
    • Úvod do klastrování
    • KMeans
  • Klasifikace
    • Úvod do klasifikace
    • Naive Bayes
    • Decision Trees (rozhodové stromy)
    • Trenink s balíčkem caret
    • Hodnocení algoritmů
  • R a Big Data
    • Připojení R k databázím
    • Ekosystém Big Data
  • Laboratorní cvičení pro všechny sekce

Požadavky

  • Preferuje se základní znalost programování

Nastavení

  • Moderní notebook
  • Nejnovější R studio a prostředí R nainstalováno
 21 hodiny

Počet účastníků


Cena za účastníka

Reference (7)

Nadcházející kurzy

Související kategorie