Návrh Školení

Přehled Python balíčků souvisejících s NLP

Úvod do NLP (příklady v Python samozřejmě)

  1. Jednoduchá manipulace s textem
    1. Hledání textu
    2. Počítání Words
    3. Rozdělení textů na Words
    4. Lexikální disperze
  2. Zpracování složitých struktur
    1. Reprezentace textu v seznamech
    2. Indexační seznamy
    3. Kolokace
    4. Bigramy
    5. Rozdělení frekvencí
    6. Podmínky s Words
    7. Porovnání Words (začíná, končí, je nižší, isalfa, atd...)
  3. Pochopení přirozeného jazyka
    1. Word Smyslová disambiguace
    2. Rozlišení zájmen
  4. Strojové překlady (statistické, založené na pravidlech, doslovné, atd...)
  5. Cvičení

NLP v Python v příkladech

  1. Accessing textových korpusů a lexikálních zdrojů
    1. Společné zdroje pro korpusy
    2. Podmíněné rozdělení frekvencí
    3. Počítání Words podle žánru
    4. Vytvoření vlastního korpusu
    5. Vyslovovací slovník
    6. Lexikony krabice od bot a krabice na nářadí
    7. Smysly a synonyma
    8. Hierarchie
    9. Lexikální vztahy: Meronyma, Holonyma
    10. Sémantická podobnost
  2. Zpracování surového textu
    1. Tisk
    2. Strunování
    3. Vytahování částí provázku
    4. Accesssdílení jednotlivých postav
    5. Vyhledávání, nahrazování, rozdělování, spojování, indexování atd...
    6. Použití regulárních výrazů
    7. Detekce slovních vzorů
    8. Odvozování
    9. Tokenizace
    10. Normalizace textu
    11. Word Segmentace (zejména v čínštině)
  3. Kategorizace a označování Words
    1. Označené Corpora
    2. Označené tokeny
    3. Part-of-Speech Tagset
    4. Python Slovníky
    5. Words k mapování vlastností
    6. Automatické značkování
    7. Určení kategorie Word (morfologická, syntaktická, sémantická)
  4. Klasifikace textu (Machine Learning)
    1. Kontrolovaná klasifikace
    2. Segmentace vět
    3. Křížové ověření
    4. Rozhodovací stromy
  5. Extrahování informací z textu
    1. Chunking
    2. cinkání
    3. Tagy vs stromy
  6. Analýza struktury věty
    1. Bezkontextová gramatika
    2. Analyzátory
  7. Budování gramatiky založené na rysech
    1. Gramatické vlastnosti
    2. Zpracování struktur
  8. Analýza významu vět
    1. Sémantika a logika
    2. Výroková logika
    3. Logika prvního řádu
    4. Sémantika diskurzu
  9. Správa lingvistických dat
    1. Datové formáty (lexikon vs text)
    2. Metadata

Požadavky

Základní znalost Python

 28 hodiny

Počet účastníků


Price per participant

Reference (1)

Upcoming Courses

Související kategorie