Návrh Školení
I. Úvod a přípravná utkání
1. Přehled
- Učinit R přátelštější, R a dostupná GUI
- Rstudio
- Související software a dokumentace
- R a statistika
- Interaktivní používání R
- Úvodní sezení
- Získání nápovědy s funkcemi a vlastnostmi
- R příkazy, rozlišování malých a velkých písmen atd.
- Vyvolání a oprava předchozích příkazů
- Provádění příkazů ze souboru nebo přesměrování výstupu do souboru
- Stálost dat a odstraňování objektů
- Goodborná praxe programování: Samostatné skripty, dobrá čitelnost např. strukturované skripty, dokumentace, markdown
- instalace balíčků; CRAN a Biovodič
2. Čtení dat
- Soubory txt (read.delim)
- CSV soubory
3. Jednoduché manipulace; čísla a vektory + pole
- Vektory a zadání
- Vektorová aritmetika
- Generování pravidelných sekvencí
- Logické vektory
- Chybějící hodnoty
- Znakové vektory
- Indexové vektory; výběr a úprava podmnožin datové sady
- Pole
- Indexování pole. Podsekce pole
- Indexové matice
- Funkce pole() + jednoduché operace s poli např. násobení, transpozice
- Jiné typy objektů
4. Seznamy a datové rámce
- Seznamy
- Vytváření a úpravy seznamů
- Zřetězení seznamů
- Datové rámce
- Vytváření datových rámců
- Práce s datovými rámci
- Připojování libovolných seznamů
- Správa vyhledávací cesty
5. Manipulace s daty
- Výběr, podmnožiny pozorování a proměnných
- Filtrování, seskupování
- Překódování, transformace
- Agregace, kombinování datových souborů
- Vytváření rozdělených matic, cbind() a rbind()
- Funkce zřetězení, (), s poli
- Manipulace se znaky, balíček stringr
- krátký úvod do grep a regexpr
6. Více o Čtení dat
- Soubory XLS, XLSX
- balíčky readr a readxl
- SPSS, SAS, Stata,… a další formáty dat
- Export dat do txt, csv a dalších formátů
6. Seskupování, smyčky a podmíněné provádění
- Seskupené výrazy
- Kontrolní výkazy
- Podmíněné provedení: příkazy if
- Opakované provádění: pro smyčky, opakování a při
- intro do aplikovat, lapply, saapply, tapply
7. Funkce
- Vytváření funkcí
- Volitelné argumenty a výchozí hodnoty
- Variabilní počet argumentů
- Rozsah a jeho důsledky
8. Jednoduchá grafika v R
- Vytvoření grafu
- Grafy hustoty
- Dot Plots
- Barové pozemky
- Spojnicové grafy
- Koláčové grafy
- Boxplots
- Rozptylové pozemky
- Kombinace pozemků
II. Statistická analýza v R
1. Rozdělení pravděpodobnosti
- R jako soubor statistických tabulek
- Zkoumání distribuce množiny dat
2. Testování hypotéz
- Testy o populačním průměru
- Test poměru pravděpodobnosti
- Jedno- a dvouvýběrové testy
- Chí-kvadrát GoTest neshody
- Jednovzorová statistika Kolmogorov-Smirnov
- Wilcoxon Signed-Rank Test
- Test se dvěma vzorky
- Wilcoxonův test hodnosti součtu
- Mann-Whitney test
- Kolmogorov-Smirnovův test
3. Vícenásobné testování hypotéz
- Chyba typu I a FDR
- ROC křivky a AUC
- Více testovacích postupů (BH, Bonferroni atd.)
4. Lineární regresní modely
- Obecné funkce pro extrakci informací o modelu
- Aktualizace osazených modelů
- Zobecněné lineární modely
- Rodiny
- Funkce glm().
- Klasifikace
- Logistická regrese
- Lineární diskriminační analýza
- Učení bez dozoru
- Analýza hlavních komponent
- Metody shlukování (k-průměry, hierarchické shlukování, k-medoidy)
5. Analýza přežití (balíček přežití)
- Předměty přežití v r
- Kaplan-Meierův odhad, log-rank test, parametrická regrese
- Pásy sebevědomí
- Cenzurovaná (intervalová cenzurovaná) analýza dat
- Coxovy PH modely, konstantní kovariáty
- Coxovy PH modely, časově závislé kovariáty
- Simulace: Porovnání modelů (Porovnání regresních modelů)
6. Analýza rozptylu
- Jednosměrná ANOVA
- Dvoucestná klasifikace ANOVA
- MANOVA
III. Zpracované problémy v bioinformatice
- Krátký úvod k balíčku limma
- Pracovní postup analýzy dat Microarray
- Stažení dat z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Zpracování dat (QC, normalizace, diferenciální vyjádření)
- Zápletka sopky
- Custering příklady + heatmaps
Reference (5)
První a druhý den byly pro mě skutečně jednoduché a opravdu jsem si to užil.
Mareca Sithole - Africa Health Research Institute
Kurz - R Fundamentals
Přeloženo strojem
Opravdu jsem si užil ty praktické cvičení.
Yunfa Zhu - Environmental and Climate Change Canada
Kurz - Foundation R
Přeloženo strojem
Tempo bylo právě tak správné a uvolněná atmosféra umožnila kandidátům klidně klaskat otázky.
Rhian Hughes - Public Health Wales NHS Trust
Kurz - Introduction to Data Visualization with Tidyverse and R
Přeloženo strojem
záležitost byla dobře prezentována a v uspořádané formě.
Marylin Houle - Ivanhoe Cambridge
Kurz - Introduction to R with Time Series Analysis
Přeloženo strojem
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Kurz - Programming with Big Data in R
Přeloženo strojem