Návrh Školení
Přehled Python balíčků souvisejících s NLP
Úvod do NLP (příklady v Python samozřejmě)
Jednoduchá manipulace s textem Vyhledávání Text Počítání Words Rozdělení textů na Words Lexikální disperze
Zpracování složitých struktur Reprezentace textu v seznamech
Indexační seznamyKolokaceBigramyRozdělení frekvencíPodmínky s WordsPorovnání Words (začíná, končí, je nižší, isalfa atd...)Pochopení přirozeného jazyka Word Sense DisambiguationRozlišení zájmen
Strojové překlady (statistické, založené na pravidlech, doslovné, atd...)CvičeníNLP v Python v příkladech
Přístup k textovým korpusům a lexikálním zdrojům Společné zdroje pro korpusy Podmíněné frekvenční distribuce Počítání Words podle žánru Vytváření vlastního korpusu Slovník pro vyslovování Shoebox a Toolbox Lexikony Smysly a synonyma Hierarchie Lexikální vztahy: Meronyma, Holonyma Sémantická podobnostZpracování tisku surového textuStrunování
Vytahování částí provázku
Accessjednotlivé postavy
Searchvkládání, nahrazování, rozdělování, spojování, indexování atd...Použití regulárních výrazůDetekce slovních vzorůOdvozováníTokenizaceNormalizace textuWord Segmentace (zejména v čínštině)Kategorizace a označování Words Tagged CorporaOznačené tokenyPart-of-Speech TagsetPython SlovníkyWords na mapování vlastností
Automatické značkováníUrčení kategorie Word (morfologická, syntaktická, sémantická)Klasifikace textu (Machine Learning) Kontrolovaná klasifikaceSegmentace větKřížové ověřeníRozhodovací stromyExtrahování informací z dělení textucinkání
Tagy vs stromyAnalýza struktury vět bez kontextové gramatikyAnalyzátoryVytváření gramatických prvků založených na rysechZpracování struktur
Analýza významu sémantiky a logiky větVýroková logikaLogika prvního řáduSémantika diskurzu
Správa datových formátů jazykových dat (lexikon vs text)Metadata