Děkujeme za vaši dotaz! Jeden z našich pracovníků vás brzy kontaktuje.        
        
        
            Děkujeme za rezervaci! Jeden z našich pracovníků vás brzy kontaktuje.        
    Návrh Školení
Detailední tréninkový přehled
- Základy zpracování přirozeného jazyka (NLP)- Porozumění NLP
- NLP frameworky
- Obchodní aplikace NLP
- Stahování dat z webu
- Práce s různými API pro získání textových dat
- Práce a ukládání textových korpusů, ukládání obsahu a relevantních metadat
- Výhody použití Pythonu a NLTK crash course
 
- Praktické pojetí korpusu a datové sady- Proč potřebujeme korpus?
- Analýza korpusu
- Typy atributů dat
- Různé formáty souborů pro korpusy
- Příprava datové sady pro aplikace NLP
 
- Porozumění struktuře vět- Komponenty NLP
- Zpracování přirozeného jazyka
- Morfologická analýza - kořen, slovo, token, část řeči
- Syntaxická analýza
- Sémantická analýza
- Zpracování ambiguit
 
- Předzpracování textových dat- Korpus - surový text- Tokinizace vět
- Stemming pro surový text
- Lemmizace surového textu
- Odebrání stop slov
 
- Korpus - surové věty- Tokinizace slov
- Lemmizace slov
 
- Práce s matricemi Term-Document/Document-Term
- Tokinizace textu na n-gramy a věty
- Praktické a přizpůsobené předzpracování
 
- Korpus - surový text
- Analýza textových dat- Základní funkce NLP- Parsery a parsování
- TAGOVÁNÍ ČÁSTI ŘEČI (POS) a taggery
- Rozpoznávání jmenových entit
- N-gramy
- Pytlík slov (bag of words)
 
- Statistické funkce NLP- Koncepce lineární algebry pro NLP
- Pravděpodobnostní teorie pro NLP
- TF-IDF
- Vektorizace
- Kódery a dekódery
- Noramalizace
- Pravděpodobnostní modely
 
- Pokročilé techniky inženýrství funkcí a NLP- Základy word2vec
- Komponenty modelu word2vec
- Logika modelu word2vec
- Rozšíření konceptu word2vec
- Aplikace modelu word2vec
 
- Případová studie: Aplikace pytlíku slov (bag of words): automatické shrnutí textu pomocí zjednodušených a skutečných algoritmů Luhnova metody
 
- Základní funkce NLP
- Uskupování, klasifikace a modelování tématických oblastí dokumentů- Uskupování dokumentů a hledání vzorů (hierarchické uskupování, k-means, atd.)
- Porovnávání a klasifikace dokumentů pomocí TFIDF, Jaccardova a kosinového míry vzdálenosti
- Klasifikace dokumentů pomocí Naivního Bayesovského algoritmu a Maximální entropie
 
- Identifikace důležitých textových prvků- Redukce dimenzionality: hlavní komponentní analýza, singulární rozklad, nezáporný maticový rozklad
- Tématické modelování a získávání informací pomocí latentní sémantické analýzy
 
- Extrakce entit, analýza názoru a pokročilé tématické modelování- Pozitivní vs. negativní: stupeň názoru
- Theorie odpovědí položek (Item Response Theory)
- TAGOVÁNÍ ČÁSTI ŘEČI (POS) a její aplikace: hledání zmíněných osob, míst a organizací v textu
- Pokročilé tématické modelování: Latentní Dirichletova alokace
 
- Případové studie- Těžba nestrukturovaných uživatelských recenzí
- Klasifikace a vizualizace dat o hodnocení produktů
- Těžba logů vyhledávání pro zjišťování vzorů použití
- Klasifikace textu
- Tématické modelování
 
Požadavky
Znalost a povědomí o principech NLP a ocenění aplikace umělé inteligence v podnikání
             21 hodiny
        
        
Reference (1)
I feel I get the core skills I need to understand how the ROS fits together, and how to structure projects in it.
 
                    