Návrh Školení

Úvod do Mistral Multimodálních Modelů

  • Přehled Mistral Medium a multimodálních schopností
  • OCR/document modely a jejich využití
  • Integrace s open-source ekosystémy

OCR a vizuální potrubí (pipelines)

  • Základy OCR s Mistral modely
  • Předzpracování obrázků a naskenovaných dokumentů
  • Vyhledávání strukturovaného textu v obrázcích

Porozumění dokumentům

  • Návrh NLP potrubí pro dokumenty
  • Rozpoznávání entit, shrnutí a klasifikace
  • Křížové propojení textu a vizuálních dat

Hledání a aplikace znalostí

  • Soustavy pro hledání textu a obrázků
  • Vytváření semantického vyhledávání pomocí výstupů OCR
  • Podnikové repozitáře dokumentů

Nápovědné a interaktivní aplikace

  • Návrh uživatelských rozhraní pro multimodální asistenty
  • Aplikace pro přístupnost (např. vizuální-to-textové)
  • Praktické nástroje v reálném světě

Výkon a optimalizace

  • Škálování multimodálních potrubí
  • Fine-tuning úloh běhu (inference)
  • Hodnocení kompromisů mezi přesností a efektivitou

Případové studie a budoucí směry

  • Využití multimodální AI v průmyslu
  • Trendy ve výzkumu OCR a document AI
  • Odpovědnost AI v úlohách text-viditel

Závěr a další kroky

Požadavky

  • Pochopení konceptů zpracování přirozeného jazyka
  • Zkušenosti s Pythonem a ML frameworky
  • Odoměná se základy počítačového vidění

Cílová skupina

  • Produktové týmy
  • Výzkumníci ML
  • Aplikovaní inženýři ML
 14 hodiny

Počet účastníků


Cena za účastníka

Nadcházející kurzy

Související kategorie