Návrh Školení

Statistika a probabilistické programování v Julia

Základní statistika

  • Statistika
    • Shrnutí statistik s balíčkem statistics
  • Rozdělení a balíček StatsBase
    • Univariantní a multivariantní
    • Momenty
    • Pravděpodobnostní funkce
    • Vzorkování a generátor náhodných čísel (RNG)
    • Histogramy
    • Odhad maximum věrohodnosti
    • Produkt, truncace a cenzurované rozdělení
    • Robustní statistika
    • Korelace a kovariance

DataFrames

(Balíček DataFrames)

  • Vstup a výstup dat
  • Vytváření datových rámců
  • Datové typy, včetně kategorických a chybějících dat
  • Třídění a spojování
  • Reshape a transpozice dat

Testování hypotéz

(Balíček HypothesisTests)

  • Základy testování hypotéz
  • Chi-squared test
  • z-test a t-test
  • F-test
  • Fisherův exaktní test
  • ANOVA
  • Testy normálnosti
  • Kolmogorov-Smirnovův test
  • Hotellingův T-test

Regrese a analýza přežití

(Balíčky GLM a Survival)

  • Základy lineární regrese a exponenciální rodiny
  • Lineární regrese
  • Generalizované lineární modely
    • Logistická regrese
    • Poissonovská regrese
    • Gamma regrese
    • Ostatní GLM modely
  • Analýza přežití
    • Události
    • Kaplan-Meierovský odhad
    • Nelson-Aalenův odhad
    • Coxův model proporcionálního rizika

Vzdálenosti

(Balíček Distances)

  • Co je vzdálenost?
  • Eukleidovská
  • Cityblock (Manhattan)
  • Kosinová
  • Korelační
  • Mahalanobisova
  • Hammingova
  • MAD (Median Absolute Deviation)
  • RMS (Root Mean Squared)
  • Střední čtvercová odchylka

Multivariantní statistika

(Balíčky MultivariateStats, Lasso a Loess)

  • Ridge regrese
  • Lasso regrese
  • Loess
  • Lineární diskriminační analýza
  • Hlavní komponentová analýza (PCA)
    • Lineární PCA
    • Kernel PCA
    • Probabilistická PCA
    • Nezávislá komponentová analýza (ICA)
  • Regrese hlavními komponentami (PCR)
  • Faktorová analýza
  • Kanonická korelační analýza
  • Multidimensionální škálování

Clustering

(Balíček Clustering)

  • K-means
  • K-medoids
  • DBSCAN
  • Hierarchické klastrování
  • Markovův klasterový algoritmus
  • Fuzzy C-means klastrování

Bayesovská statistika a probabilistické programování

(Balíček Turing)

  • Markov Chain Monte Carlo (MCMC)
  • Hamiltoniánský Monte Carlo
  • Míchání Gaussovských modelů
  • Bayesovská lineární regrese
  • Bayesovská exponenciální rodina regrese
  • Bayesovské neuronové sítě
  • Skryté Markovovy modely
  • Particlové filtrace
  • Variacioní inference

Požadavky

Toto školení je určeno pro osoby, které již mají zázemí z datových věd a statistiky.

 21 Hodiny

Počet účastníků


Cena za účastníka

Reference (5)

Nadcházející kurzy

Související kategorie