Návrh Školení
I. Úvod a přípravná utkání
1. Přehled
- Přívětivější, R a dostupnější GUI Rstudio Související software a dokumentace R a statistiky Interaktivní používání R Úvodní sezení Získání nápovědy k funkcím a vlastnostem R příkazy, rozlišování malých a velkých písmen atd. Vyvolání a oprava předchozích příkazů Provádění příkazů z nebo přesměrování výstupu do soubor Datová stálost a odstraňování objektů Good programátorské praxe: Samostatné skripty, dobrá čitelnost např. strukturované skripty, dokumentace, markdown instalační balíčky; CRAN a Bioconductor
2. Čtení dat
- Soubory Txt (read.delim) soubory CSV
3. Jednoduché manipulace; čísla a vektory + pole
- Vektory a přiřazení Vektorová aritmetika Generování pravidelných sekvencí Logické vektory Chybějící hodnoty Znakové vektory Indexové vektory; výběr a úprava podmnožin datové sady Pole
Seznamy Vytváření a úpravy seznamů Zřetězení seznamů
- Datové rámce Vytváření datových rámců
6. Více o Čtení dat
- Čtečka souborů XLS, XLSX a balíčky readxl SPSS, SAS, Stata,… a další formáty dat Export dat do txt, csv a dalších formátů
6. Seskupování, smyčky a podmíněné provádění
- Seskupené výrazy Řídicí příkazy Podmíněné provádění: příkazy if Opakované provádění: pro smyčky opakujte a během úvodu do aplikujte, laply, saply, tapply
7. Funkce
- Vytváření funkcí Volitelné argumenty a výchozí hodnoty Proměnný počet argumentů Rozsah a jeho důsledky
8. Jednoduchá grafika v R
- Vytvoření grafu Grafy hustoty Bodové grafy Pruhové grafy Čárové grafy Koláčové grafy Boxplots Bodové grafy Kombinování grafů
II. Statistická analýza v R
- 1. Rozdělení pravděpodobnosti
R jako soubor statistických tabulek Zkoumání rozložení souboru dat
2. Testování hypotéz
- Testy o populačním testu průměrné pravděpodobnosti Test Jedno a dvouvzorkové testy Chí-kvadrát GoTest neshody Kolmogorov-Smirnov Jednovzorková statistika Wilcoxonův znaménkový test Dvouvzorkový test Wilcoxon Rank Sum Test Mann-Whitney Test Kolmogorov-Smirnov Test
3. Vícenásobné testování hypotéz
- Chyba typu I a křivky ROC FDR a postupy vícenásobného testování AUC (BH, Bonferroni atd.)
4. Lineární regresní modely
- Obecné funkce pro extrakci informací o modelu Aktualizace přizpůsobených modelů Zobecněné lineární modely Rodiny Funkce glm().
Klasifikace Logistická regrese
- Lineární diskriminační analýza
III. Zpracované problémy v bioinformatice
- Krátký úvod do balíčku limma Pracovní postup analýzy dat Microarray Stažení dat z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397 Zpracování dat (QC, normalizace, diferenciální vyjádření) Graf sopky Custering příklady + teplotní mapy
Reference (8)
The pace was just right and the relaxed atmosphere made candidates feel at ease to ask questions.
Rhian Hughes - Public Health Wales NHS Trust
Kurz - Introduction to Data Visualization with Tidyverse and R
Obsah, protože mi přišel velmi zajímavý a myslím, že by mi pomohl v posledním ročníku na univerzitě.
Krishan - NBrown Group
Kurz - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
very tailored to needs
Yashan Wang
Kurz - Data Mining with R
The trainer was so knowledgeable and included areas I was interested in
Mohamed Salama
Kurz - Data Mining & Machine Learning with R
Good real world examples, reviews of existing reports
Ronald Parrish
Kurz - Data Visualization
Intensity, Training materials and expertise, Clarity, Excellent communication with Alessandra
Marija Hornis Dmitrovic - Marija Hornis
Kurz - Data Science for Big Data Analytics
I learned a lot - not only in theoretical knowledge but I also applied that knowledge during the training and therefore I really understood what process mining is and how it works. Thanks a lot!
Julia Dörre - Techniker Krankenkasse
Kurz - Process Mining
how the trainor shows his knowledge in the subject he's teachign