Data Mining & Machine Learning with R Počítačový Kurz
R je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Návrh Školení
Úvod do dolování dat a Machine Learning
- Statistické učení vs. strojové učení
- Iterace a hodnocení
- Kompromis zkreslení a odchylky
Regrese
- Lineární regrese
- Zobecnění a nelinearita
- Cvičení
Klasifikace
- Bayesovské osvěžení
- Naivní Bayes
- Dikriminační analýza
- Logistická regrese
- K-Nejbližší sousedé
- Podpora vektorových strojů
- Neuronové sítě
- Rozhodovací stromy
- Cvičení
Křížová validace a převzorkování
- Přístupy křížové validace
- Bootstrap
- Cvičení
Učení bez dozoru
- K-znamená shlukování
- Příklady
- Výzvy učení bez dozoru a za hranicemi K-středů
Pokročilá témata
- Modely souborů
- Smíšené modely
- Posílení
- Příklady
Vícerozměrná redukce
- Faktorová analýza
- Analýza hlavních komponent
- Příklady
Požadavky
Tento kurz je součástí sady dovedností Data Scientist (doména: Analytické techniky a metody)
Open Training Courses require 5+ participants.
Data Mining & Machine Learning with R Počítačový Kurz - Booking
Data Mining & Machine Learning with R Počítačový Kurz - Enquiry
Data Mining & Machine Learning with R - Consultancy Enquiry
Consultancy Enquiry
Reference (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
Kurz - Data Mining & Machine Learning with R
Upcoming Courses
Související kurzy
From Data to Decision with Big Data and Predictive Analytics
21 hodinyPublikum
Pokud se snažíte dát smysl datům, ke kterým máte přístup, nebo chcete analyzovat nestrukturovaná data dostupná na internetu (jako Twitter, Linked in atd...), tento kurz je pro vás.
Většinou se zaměřuje na osoby s rozhodovací pravomocí a lidi, kteří si potřebují vybrat, jaká data stojí za shromažďování a která stojí za to analyzovat.
Není zaměřen na lidi, kteří konfigurují řešení, tito lidé však budou mít prospěch z celkového obrazu.
Režim doručení
V průběhu kurzu budou delegátům prezentovány pracovní příklady převážně open source technologií.
Po krátkých přednáškách bude následovat prezentace a jednoduchá cvičení účastníků
Obsah a použitý software
Veškerý používaný software je aktualizován při každém spuštění kurzu, takže kontrolujeme nejnovější možné verze.
Pokrývá proces od získávání, formátování, zpracování a analýzy dat, aby vysvětlil, jak automatizovat proces rozhodování pomocí strojového učení.
Data Mining and Analysis
28 hodinyObjektivní:
Delegáti budou schopni analyzovat velké soubory dat, extrahovat vzory, vybrat správnou proměnnou ovlivňující výsledky, aby byl nový model předpovídán s prediktivními výsledky.
Data Mining
21 hodinyKurz lze poskytnout s libovolnými nástroji, včetně bezplatného softwaru a aplikací pro dolování dat s otevřeným zdrojovým kódem
Data Mining with Python
14 hodinyToto živé školení vedené instruktorem (online nebo na místě) je zaměřeno na datové analytiky a datové vědce, kteří chtějí implementovat pokročilejší techniky analýzy dat pro dolování dat pomocí Python.
Na konci tohoto školení budou účastníci schopni:
- Pochopit důležité oblasti dolování dat, včetně dolování asociačních pravidel, analýzy sentimentu textu, automatického shrnutí textu a detekce anomálií dat.
- Porovnat a implementovat různé strategie pro řešení reálných problémů dolování dat.
- Pochopit a interpretovat výsledky.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Spousta cvičení a praxe.
- Praktická implementace v živém laboratorním prostředí.
Možnosti přizpůsobení kurzu
- Pro požadavek na přizpůsobené školení pro tento kurz nás prosím kontaktujte a domluvte si schůzku.
Data Mining with R
14 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Data Vault: Building a Scalable Data Warehouse
28 hodinyV tomto živém školení vedeném instruktorem v České republice se účastníci naučí, jak vytvořit Data Vault.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty designu za Data Vault 2.0 a její interakci s Big Data, NoSQL a AI.
- Použijte techniky ukládání dat k umožnění auditování, trasování a kontroly historických dat v datovém skladu.
- Vyvinout konzistentní a opakovatelný proces ETL (Extract, Transform, Load).
- Vybudujte a nasaďte vysoce škálovatelné a opakovatelné sklady.
Data Visualization
28 hodinyTento kurz je určen pro inženýry a osoby s rozhodovací pravomocí pracující v oblasti dolování dat a získávání znalostí.
Naučíte se vytvářet efektivní grafy a způsoby, jak prezentovat a reprezentovat svá data způsobem, který osloví osoby s rozhodovací pravomocí a pomůže jim porozumět skrytým informacím.
Data Science for Big Data Analytics
35 hodinyVelká data jsou datové soubory, které jsou tak objemné a složité, že tradiční aplikační software pro zpracování dat je pro ně nedostatečný. Velké problémy s daty zahrnují sběr dat, ukládání dat, analýzu dat, vyhledávání, sdílení, přenos, vizualizaci, dotazování, aktualizaci a ochranu osobních údajů.
Foundation R
7 hodinyTento instruktážní živý trénink v České republice (online nebo na místě) je určen pro začínající odborníky, kteří chtějí získat hluboké znalosti základů R a práce s daty.
Koncem tohoto tréninku budou účastníci schopni:
- Pochopit prostředí pro programování v R a rozhraní RStudio.
- Importovat, manipulovat a zkoumání datových sad pomocí příkazů a balíčků v R.
- Provádět základní statistické analýzy a shrnout data.
- Vytvářet vizualizace pomocí bázového R a ggplot2.
- Efektivně spravovat pracovní prostory, skripty a balíčky.
KNIME Analytics Platform for BI
21 hodinyKNIME Analytics Platform je přední open source možnost pro inovace založené na datech, která vám pomůže objevit potenciál skrytý ve vašich datech, získat nové poznatky nebo předvídat nové budoucnosti. S více než 1 000 moduly, stovkami připravených příkladů, komplexní řadou integrovaných nástrojů a nejširším výběrem dostupných pokročilých algoritmů je platforma KNIME Analytics dokonalou sadou nástrojů pro každého datového vědce a obchodního analytika.
Tento kurz pro platformu KNIME Analytics je ideální příležitostí pro začátečníky, pokročilé uživatele a experty KNIME seznámit se s KNIME, naučit se, jak ji efektivněji používat a jak vytvářet jasné, komplexní přehledy založené na [ 0] pracovní postupy
Oracle SQL Intermediate - Data Extraction
14 hodinyCílem kurzu je umožnit účastníkům osvojit si práci s jazykem SQL v databázi Oracle pro extrakci dat na středně pokročilé úrovni.
Process Mining
21 hodinyProcess mining neboli Automated Business Process Discovery (ABPD) je technika, která aplikuje algoritmy na protokoly událostí za účelem analýzy obchodních procesů. Procesní dolování přesahuje ukládání dat a analýzu dat; spojuje data s procesy a poskytuje pohled na trendy a vzorce, které ovlivňují efektivitu procesů.
Formát kurzu
- Kurz začíná přehledem nejpoužívanějších technik pro procesní těžbu. Diskutujeme o různých algoritmech a nástrojích zjišťování procesů používaných pro zjišťování a modelování procesů na základě nezpracovaných dat událostí. Zkoumají se případové studie z reálného života a analyzují se soubory dat pomocí open-source frameworku ProM.
Introductory R for Biologists
28 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R používá rostoucí počet manažerů a datových analytiků v korporacích a akademické obci. R také našel své následovníky mezi statistiky, inženýry a vědci bez znalostí počítačového programování, pro které je jeho použití snadné. Jeho popularita je způsobena stále větším využíváním data miningu pro různé cíle, jako je nastavení cen reklam, rychlejší nalezení nových léků nebo vyladění finančních modelů. R má širokou škálu balíčků pro dolování dat.
Statistics with SPSS Predictive Analytics Software
14 hodinyGoal:
Naučit se pracovat s SPSS na úrovni samostatnosti
Adresáti:
Analytici, výzkumníci, vědci, studenti a všichni, kdo chtějí získat schopnost používat balíček SPSS a naučit se populární techniky dolování dat.
Introduction to Data Visualization with Tidyverse and R
7 hodinyTidyverse je kolekce všestranných R balíčků pro čištění, zpracování, modelování a vizualizaci dat. Některé z obsažených balíčků jsou: ggplot2, dplyr, tidyr, readr, purrr a tibble.
V tomto živém školení vedeném instruktorem se účastníci naučí, jak manipulovat a vizualizovat data pomocí nástrojů obsažených v Tidyverse.
Na konci tohoto školení budou účastníci schopni:
- Provádějte analýzu dat a vytvářejte přitažlivé vizualizace Vyvozujte užitečné závěry z různých datových sad vzorových dat Filtrujte, seřaďte a sumarizujte data pro zodpovězení průzkumných otázek Přeměňte zpracovaná data na informativní čárové grafy, sloupcové grafy, histogramy Importujte a filtrujte data z různých zdrojů dat, včetně [0 ], CSV a SPSS soubory
Publikum
- Začátečníci s jazykem R Začátečníci s analýzou dat a vizualizací dat
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení