Návrh Školení

Úvod

  • Definování „Průmyslově zdatného zpracování přirozeného jazyka“

Instalace spaCy

spaCy Komponenty

  • Část řeči označovač (Part-of-speech tagger)
  • Rozpoznávač pojmenovaných entit (Named entity recognizer)
  • Parsér závislostí (Dependency parser)

Přehled funkcí a syntaxe spaCy

Pochopení prostorového modelování

  • Statistické modelování a predikce

Použití rozhraní příkazového řádku SpaCy (CLI)

  • Základní příkazy

Vytvoření jednoduché aplikace pro predikci chování

Školení nového statistického modelu

  • Data (pro školení)
  • Štítky (tagy, pojmenované entity, atd.)

Načítání modelu

  • Zamíchání a cyklení

Uložení modelu

Poskytování zpětné vazby modelu

  • Gradient chyby

Aktualizace modelu

  • Aktualizace rozpoznávače entit
  • Extrakce tokenů pomocí matcheru založeného na pravidlech

Vypracování zobecněné teorie očekávaných výsledků

Případová studie

  • Rozlišování názvů produktů od názvů společností

Zpřesnění tréninkových dat

  • Výběr reprezentativních dat
  • Nastavení míry dropoutu

Jiné tréninkové styly

  • Předávání surových textů
  • Předávání slovníků anotací

Použití spaCy k předběžnému zpracování textu pro Deep Learning

Integrace spaCy se staršími aplikacemi

Testování a ladění modelu spaCy

  • Důležitost iterace

Nasazení modelu do výroby

Monitorování a seřizování modelu

Odstraňování problémů

Shrnutí a závěr

Požadavky

  • Python zkušenosti s programováním.
  • Základní znalost statistiky
  • Zkušenosti s příkazovým řádkem

Publikum

  • Vývojáři
  • Datoví vědci
 14 hodiny

Počet účastníků


Price per participant

Reference (5)

Upcoming Courses

Související kategorie