Návrh Školení
Úvod
- Definování „Průmyslově zdatného zpracování přirozeného jazyka“
Instalace spaCy
spaCy Komponenty
- Část řeči označovač (Part-of-speech tagger)
- Rozpoznávač pojmenovaných entit (Named entity recognizer)
- Parsér závislostí (Dependency parser)
Přehled funkcí a syntaxe spaCy
Pochopení prostorového modelování
- Statistické modelování a predikce
Použití rozhraní příkazového řádku SpaCy (CLI)
- Základní příkazy
Vytvoření jednoduché aplikace pro predikci chování
Školení nového statistického modelu
- Data (pro školení)
- Štítky (tagy, pojmenované entity, atd.)
Načítání modelu
- Zamíchání a cyklení
Uložení modelu
Poskytování zpětné vazby modelu
- Gradient chyby
Aktualizace modelu
- Aktualizace rozpoznávače entit
- Extrakce tokenů pomocí matcheru založeného na pravidlech
Vypracování zobecněné teorie očekávaných výsledků
Případová studie
- Rozlišování názvů produktů od názvů společností
Zpřesnění tréninkových dat
- Výběr reprezentativních dat
- Nastavení míry dropoutu
Jiné tréninkové styly
- Předávání surových textů
- Předávání slovníků anotací
Použití spaCy k předběžnému zpracování textu pro Deep Learning
Integrace spaCy se staršími aplikacemi
Testování a ladění modelu spaCy
- Důležitost iterace
Nasazení modelu do výroby
Monitorování a seřizování modelu
Odstraňování problémů
Shrnutí a závěr
Požadavky
- Python zkušenosti s programováním.
- Základní znalost statistiky
- Zkušenosti s příkazovým řádkem
Publikum
- Vývojáři
- Datoví vědci
Reference (3)
Skutečnost, že máme více praktických cvičení s více podobnými daty, jaké používáme v našich projektech (satelitní snímky v rastrovém formátu)
Matthieu - CS Group
Kurz - Scaling Data Analysis with Python and Dask
Machine Translated
Very good preparation and expertise of a trainer, perfect communication in English. The course was practical (exercises + sharing examples of use cases)
Monika - Procter & Gamble Polska Sp. z o.o.
Kurz - Developing APIs with Python and FastAPI
Trainer develops training based on participant's pace