Návrh Školení

První den

  1. Úvod do R & Rstudio (2 hodiny)
    • Zjednodušení práce s R, dostupné GUI
    • Rstudio
    • Skriptování v Rstudio
    • Navigace, sekce a zkládání kódu
    • Řešení problémů a ladění kódu v RStudio
    • Související software a dokumentace
    • Získávání pomoci s funkcemi a funkcionalitami
    • Projekty v RStudio
    • Vytváření analytických zpráv pomocí RStudio
    • Klávesové zkratky a užitečné funkce
  2. Import a export dat (1 hodina)
    • Ploché soubory – txt, csv
    • Soubory tabulkových procesorů – xls, xlsx
    • SPSS, SAS a jiné formáty dat
    • Import dat z SQL datových zdrojů
    • Připojení k databázím v SQL a operace s nimi
  3. Organizace dat (2 hodiny)
    • Datové typy a třídy
    • Ukládání dat v R – formát Rdata
    • Struktura objektů
    • Čísla a vektory
    • Matrix a tabulky
    • Faktory
    • Seznamy
    • Data Frames
    • Datum a čas
  4. Tabulkové zobrazení (3 hodiny)
    • Přehled balíčků pro datové tabulky – dplyr, tidyr, data.table
    • Indexy a podrobnosti
    • Výběr, filtrování pozorování a proměnných
    • Filtrace, skupinové souběžnosti
    • Transformace překódovaní
    • Formátování dat
    • Sloučení dat
    • Manipulace s řetězci, balíček stringr
    • Regulární výrazy

Druhý den

  1. Související software a dokumentace (1 hodina)
    • Rstudio a GIT - verziční správa
    • Markdown
    • Zprávy a prezentace pomocí LaTeX
    • Webové aplikace Shiny
  2. R a Statistics (2 hodiny)
    • Pravděpodobnost a normální distribuce
    • Náhodné čísla
    • Popisná Statistics
    • Normalizace a standarizace
    • Konfidence intervaly
    • Testování hypotéz
    • ANOVA
    • Analýza kvalitativních dat
  3. Lineární regrese (2 hodiny)
    • Korelační koeficient a jeho interpretace
    • Jednoduché a násobné lineární regresy
    • Metody odhadů – nejmenší čtverce
    • Validace modelu – testy pro porušení předpokladů
    • Výběr proměnných – různé přístupy
    • Regulárisace – ridge a lasso regrese
    • Generalizované nejmenší čtverce – nelinearita
    • Logistická regrese
  4. Grafické postupy (2 hodiny)
    • Základní grafy pro 1 proměnnou
    • Vizuální reprezentace pro 2 a více proměnných
    • Grafické parametry
    • Speciální grafy
    • Export grafů do souborů png, pdf a jpeg
    • Rozšíření grafických schopností R pomocí ggplot2
  5. Pomoc v R (1 hodina)
    • Hledání v dokumentaci R
    • Balíčky a dokumentace v R
    • R Cran Task View – hledání řešení problému

Požadavky

Nejsou žádné specifické požadavky potřebné k účasti na tomto kurzu.

 14 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie