Cluster Analysis with R and SAS Počítačový Kurz
R je programovací jazyk a softwarové prostředí pro statistické výpočty. SAS je statistická softwarová platforma pro prediktivní analýzu, správu dat, pokročilou analýzu a další. S R v SAS, uživatelé mohou najít přirozené skupiny dat pro klastrní analýzu, které jsou nezbytné pro data těžby.
Tento instruktor vedený, živý trénink (online nebo on-site) je zaměřen na analytiky údajů, kteří chtějí programovat s R v SAS pro klastrovou analýzu.
Po ukončení tohoto tréninku budou účastníci schopni:
- Analýza klastru pro data mining
- Master R syntax pro klastrování řešení.
- Využití hierarchického a nehierarchického klastrování.
- Vykonávání datových rozhodnutí, které pomohou zlepšit podnikatelské operace.
Formát kurzu
- Interaktivní přednáška a diskuse.
- Mnoho cvičení a praxe.
- Hands-on implementace v živém laboratoři prostředí.
Možnosti personalizace kurzu
- Chcete-li požádat o přizpůsobené školení pro tento kurz, kontaktujte nás, abyste uspořádali.
Návrh Školení
Úvod
Shluková analýza
- Co je shluková analýza? Typy typů clusterů
Shluková analýza pokračovala
- Clusterová analýza vs. segmentace objektů Hierarchické vs nehierarchické shlukování
Příprava vývojového prostředí
- Instalace a konfigurace SAS Instalace a konfigurace R
Shluková analýza s SAS
- Import dat Standardizace dat Implementace hierarchického shlukování Interpretace výstupu Práce s K znamená shlukování pro nehierarchický výstup Interpretace
Shluková analýza s R
- Použití funkcí hierarchického shlukování Práce s nehierarchickými funkcemi shlukování
Shrnutí a závěr
Požadavky
- Zkušenosti s programováním R
- SAS zkušenost
Publikum
- Analytici dat
Open Training Courses require 5+ participants.
Cluster Analysis with R and SAS Počítačový Kurz - Booking
Cluster Analysis with R and SAS Počítačový Kurz - Enquiry
Cluster Analysis with R and SAS - Consultancy Enquiry
Consultancy Enquiry
Reference (5)
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurz - Data Vault: Building a Scalable Data Warehouse
Open discussion with trainer
Tomek Danowski - GE Medical Systems Polska Sp. Z O.O.
Kurz - Process Mining
I genuinely enjoyed the hands passed exercises.
Yunfa Zhu - Environmental and Climate Change Canada
Kurz - Foundation R
The pace was just right and the relaxed atmosphere made candidates feel at ease to ask questions.
Rhian Hughes - Public Health Wales NHS Trust
Kurz - Introduction to Data Visualization with Tidyverse and R
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Kurz - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Související kurzy
From Data to Decision with Big Data and Predictive Analytics
21 hodinyPublikum
Pokud se snažíte dát smysl datům, ke kterým máte přístup, nebo chcete analyzovat nestrukturovaná data dostupná na internetu (jako Twitter, Linked in atd...), tento kurz je pro vás.
Většinou se zaměřuje na osoby s rozhodovací pravomocí a lidi, kteří si potřebují vybrat, jaká data stojí za shromažďování a která stojí za to analyzovat.
Není zaměřen na lidi, kteří konfigurují řešení, tito lidé však budou mít prospěch z celkového obrazu.
Režim doručení
V průběhu kurzu budou delegátům prezentovány pracovní příklady převážně open source technologií.
Po krátkých přednáškách bude následovat prezentace a jednoduchá cvičení účastníků
Obsah a použitý software
Veškerý používaný software je aktualizován při každém spuštění kurzu, takže kontrolujeme nejnovější možné verze.
Pokrývá proces od získávání, formátování, zpracování a analýzy dat, aby vysvětlil, jak automatizovat proces rozhodování pomocí strojového učení.
Data Mining and Analysis
28 hodinyObjektivní:
Delegáti budou schopni analyzovat velké soubory dat, extrahovat vzory, vybrat správnou proměnnou ovlivňující výsledky, aby byl nový model předpovídán s prediktivními výsledky.
Data Mining
21 hodinyKurz lze poskytnout s libovolnými nástroji, včetně bezplatného softwaru a aplikací pro dolování dat s otevřeným zdrojovým kódem
Data Mining with R
14 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Data Vault: Building a Scalable Data Warehouse
28 hodinyV tomto živém školení vedeném instruktorem v České republice se účastníci naučí, jak vytvořit Data Vault.
Na konci tohoto školení budou účastníci schopni:
- Pochopte architekturu a koncepty designu za Data Vault 2.0 a její interakci s Big Data, NoSQL a AI.
- Použijte techniky ukládání dat k umožnění auditování, trasování a kontroly historických dat v datovém skladu.
- Vyvinout konzistentní a opakovatelný proces ETL (Extract, Transform, Load).
- Vybudujte a nasaďte vysoce škálovatelné a opakovatelné sklady.
Data Visualization
28 hodinyTento kurz je určen pro inženýry a osoby s rozhodovací pravomocí pracující v oblasti dolování dat a získávání znalostí.
Naučíte se vytvářet efektivní grafy a způsoby, jak prezentovat a reprezentovat svá data způsobem, který osloví osoby s rozhodovací pravomocí a pomůže jim porozumět skrytým informacím.
Data Mining & Machine Learning with R
14 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R je používán rostoucím počtem manažerů a datových analytiků v korporacích a na akademické půdě. R má širokou škálu balíčků pro dolování dat.
Data Science for Big Data Analytics
35 hodinyVelká data jsou datové soubory, které jsou tak objemné a složité, že tradiční aplikační software pro zpracování dat je pro ně nedostatečný. Velké problémy s daty zahrnují sběr dat, ukládání dat, analýzu dat, vyhledávání, sdílení, přenos, vizualizaci, dotazování, aktualizaci a ochranu osobních údajů.
Foundation R
7 hodinyTento instruktážní živý trénink v České republice (online nebo na místě) je určen pro začínající odborníky, kteří chtějí získat hluboké znalosti základů R a práce s daty.
Koncem tohoto tréninku budou účastníci schopni:
- Pochopit prostředí pro programování v R a rozhraní RStudio.
- Importovat, manipulovat a zkoumání datových sad pomocí příkazů a balíčků v R.
- Provádět základní statistické analýzy a shrnout data.
- Vytvářet vizualizace pomocí bázového R a ggplot2.
- Efektivně spravovat pracovní prostory, skripty a balíčky.
Oracle SQL Intermediate - Data Extraction
14 hodinyCílem kurzu je umožnit účastníkům osvojit si práci s jazykem SQL v databázi Oracle pro extrakci dat na středně pokročilé úrovni.
Process Mining
21 hodinyProcess mining neboli Automated Business Process Discovery (ABPD) je technika, která aplikuje algoritmy na protokoly událostí za účelem analýzy obchodních procesů. Procesní dolování přesahuje ukládání dat a analýzu dat; spojuje data s procesy a poskytuje pohled na trendy a vzorce, které ovlivňují efektivitu procesů.
Formát kurzu
- Kurz začíná přehledem nejpoužívanějších technik pro procesní těžbu. Diskutujeme o různých algoritmech a nástrojích zjišťování procesů používaných pro zjišťování a modelování procesů na základě nezpracovaných dat událostí. Zkoumají se případové studie z reálného života a analyzují se soubory dat pomocí open-source frameworku ProM.
Introductory R for Biologists
28 hodinyR je bezplatný programovací jazyk s otevřeným zdrojovým kódem pro statistické výpočty, analýzu dat a grafiku. R používá rostoucí počet manažerů a datových analytiků v korporacích a akademické obci. R také našel své následovníky mezi statistiky, inženýry a vědci bez znalostí počítačového programování, pro které je jeho použití snadné. Jeho popularita je způsobena stále větším využíváním data miningu pro různé cíle, jako je nastavení cen reklam, rychlejší nalezení nových léků nebo vyladění finančních modelů. R má širokou škálu balíčků pro dolování dat.
SAS Programming
14 hodinyToto živé školení vedené instruktorem v České republice (online nebo na místě) je zaměřeno na datové analytiky, kteří chtějí programovat v SAS pro pokročilou správu dat, analýzu dat a další.
Na konci tohoto školení budou účastníci schopni:
- Zvládněte makra pro psaní efektivních SAS programů.
- Trénujte model a provádějte předpovědi na neviditelných datech pomocí prediktivního modelování.
- Vytvářejte grafy a grafy pro vizualizaci dat.
Statistics with SPSS Predictive Analytics Software
14 hodinyGoal:
Naučit se pracovat s SPSS na úrovni samostatnosti
Adresáti:
Analytici, výzkumníci, vědci, studenti a všichni, kdo chtějí získat schopnost používat balíček SPSS a naučit se populární techniky dolování dat.
Introduction to Data Visualization with Tidyverse and R
7 hodinyTidyverse je kolekce všestranných R balíčků pro čištění, zpracování, modelování a vizualizaci dat. Některé z obsažených balíčků jsou: ggplot2, dplyr, tidyr, readr, purrr a tibble.
V tomto živém školení vedeném instruktorem se účastníci naučí, jak manipulovat a vizualizovat data pomocí nástrojů obsažených v Tidyverse.
Na konci tohoto školení budou účastníci schopni:
- Provádějte analýzu dat a vytvářejte přitažlivé vizualizace Vyvozujte užitečné závěry z různých datových sad vzorových dat Filtrujte, seřaďte a sumarizujte data pro zodpovězení průzkumných otázek Přeměňte zpracovaná data na informativní čárové grafy, sloupcové grafy, histogramy Importujte a filtrujte data z různých zdrojů dat, včetně [0 ], CSV a SPSS soubory
Publikum
- Začátečníci s jazykem R Začátečníci s analýzou dat a vizualizací dat
Formát kurzu
- Část přednáška, část diskuse, cvičení a těžké praktické cvičení