Návrh Školení

spark.mllib: datové typy, algoritmy a nástroje

    Datové typy Základní statistika souhrnná statistika korelace stratifikované výběrové testování hypotéz testování streamování testování významnosti náhodné generování dat
Klasifikace a regresní lineární modely (SVM, logistická regrese, lineární regrese)
  • naivní Bayes
  • rozhodovací stromy
  • soubory stromů (Random Forests a Gradient-Boosted Trees)
  • izotonická regrese
  • Kolaborativní filtrování se střídáním nejmenších čtverců (ALS)
  • Shlukování k-means
  • Gaussova směs
  • clustering power iteration (PIC)
  • latentní Dirichletova alokace (LDA)
  • půlící k-průměr
  • streaming k-means
  • Snížení rozměrů rozklad singulární hodnoty (SVD)
  • analýza hlavních komponent (PCA)
  • Extrakce a transformace rysů
  • Častá vzorová těžba FP-růst
  • asociační pravidla
  • PrefixSpan
  • Metriky hodnocení
  • Export modelu PMML
  • Optimalizace (vývojář) stochastický sestup gradientu
  • BFGS s omezenou pamětí (L-BFGS)
  • spark.ml: API na vysoké úrovni pro ML potrubí
  • Přehled: odhady, transformátory a potrubí Extrahování, transformace a výběr prvků Klasifikace a regrese Klastrování Pokročilá témata

    Požadavky

    Znalost jednoho z následujících:

    • Jáva
    • Scala
    • Krajta
    • SparkR.
     35 hodiny

    Počet účastníků



    Price per participant

    Reference (1)

    Související kurzy

    Související kategorie