Návrh Školení

spark.mllib: datové typy, algoritmy a nástroje

    Datové typy Základní statistika souhrnná statistika korelace stratifikované výběrové testování hypotéz testování streamování testování významnosti náhodné generování dat
Klasifikace a regresní lineární modely (SVM, logistická regrese, lineární regrese)
  • naivní Bayes
  • rozhodovací stromy
  • soubory stromů (Random Forests a Gradient-Boosted Trees)
  • izotonická regrese
  • Kolaborativní filtrování se střídáním nejmenších čtverců (ALS)
  • Shlukování k-means
  • Gaussova směs
  • clustering power iteration (PIC)
  • latentní Dirichletova alokace (LDA)
  • půlící k-průměr
  • streaming k-means
  • Snížení rozměrů rozklad singulární hodnoty (SVD)
  • analýza hlavních komponent (PCA)
  • Extrakce a transformace rysů
  • Častá vzorová těžba FP-růst
  • asociační pravidla
  • PrefixSpan
  • Metriky hodnocení
  • Export modelu PMML
  • Optimalizace (vývojář) stochastický sestup gradientu
  • BFGS s omezenou pamětí (L-BFGS)
  • spark.ml: API na vysoké úrovni pro ML potrubí
  • Přehled: odhady, transformátory a potrubí Extrahování, transformace a výběr prvků Klasifikace a regrese Klastrování Pokročilá témata

    Požadavky

    Znalost jednoho z následujících:

    • Jáva
    • Scala
    • Krajta
    • SparkR.
      35 hodiny
     

    Počet účastníků


    Začátek

    Konec


    Dates are subject to availability and take place between 09:30 and 16:30.
    Open Training Courses require 5+ participants.

    Reference (8)

    Související kurzy

    Související kategorie