Návrh Školení
Celkový cíl
Poskytnout zkušeným vývojářům webových aplikací a technickému personálu komplexní představu o platformě pro vyhledávání Solr. Učit hluboké dovednosti týkající se vytváření řešení vyhledávání.
I. Základy
- Přehled Solr
- Instalace a spuštění Solr
- Přidání obsahu do Solr
- Čtení odpovědi v Solr XML formátu
- Změna parametrů v URL
- Použití prohlížečského rozhraní
- Cvičení: instalace Solr, spouštění dotazů
II. Vyhledávání
- Třídění výsledků
- Parsování dotazů
- Další dotazy
- Pevné nastavení parametrů požadavků
- Přidávání polí do výchozího vyhledávání
- Agregace (faceting)
- Seskupování výsledků
- Cvičení: pokročilé dotazy, experimenty s agregací (faceted search)
III. Indexace
- Přidávání vlastního obsahu do Solr
- Odstraňování dat z Solr
- Vytváření vyhledávání pro knihkupectví
- Přidávání dat o knihách
- Prozkoumávání dat o knihách
- Dedupe update processor (odstranění duplicit)
- Cvičení: indexace různých sbírek dokumentů
IV. Aktualizace schématu
- Přidávání polí do schématu
- Analyzování textu
- Cvičení: přizpůsobení schématu Solr
V. Relevantnost
- Hmotnost (váha) polí
- Frazové dotazy
- Funkční dotazy
- Nejistější vyhledávání
- Vyhledávání podobných termínů (sounds-like)
- Cvičení: implementace dotazů pro relevantnost
VI. Rozšířené funkce
- Vyhledávání podobného obsahu (more-like-this)
- Geoprostorové vyhledávání
- Kontrola pravopisu
- Návrhy
- Zvýrazňování
- Pseudo-pole
- Pseudo-spoje
- Vícejazyčné vyhledávání
- Cvičení: implementace kontroly pravopisu a návrhů
VII. Multicore
- Přidávání různých druhů dat
- Cvičení: vytváření a správa core
VIII. SolrCloud
- Úvod
- Funkce SolrCloud
- Strategie potvrzování (commit)
- ZooKeeper
- Správa konfiguračních souborů Solr
- Cvičení: správa SolrCloud
IX. Vývoj pomocí Solr API
- Komunikace s Solr prostřednictvím REST
- Konfigurace
- Indexace a vyhledávání
- Solr a Spring
- Cvičení: kód pro čtení a zápis indexu Solr, cvičení s Solr v Spring
X. Vývoj pomocí Lucene API
- Vytváření indexu Lucene
- Vyhledávání, zobrazení a ladění
- Extrakce textu s Tika
- Masové škálování indexů Lucene na clusterech
- Jemná optimalizace výkonu Lucene
- Cvičení: kódování pomocí Lucene
XI. Závěr
- Další přístupy k vyhledávání
- ElasticSearch
- DataStax Enterprise: Solr+Cassandra
- Cloudera integrace s Solr
- Blur
- Budoucí směry
Požadavky
Všichni účastníci by měli být zkušeným technickým personálem s předchozím zážitkem v provozování a, pokud možno, vývoji webových aplikací.
Provozní prostředí:
Americké servery Amazon EC2 budou k dispozici studentům pro instalaci, správu a cvičení. Studenti potřebují SSH klienta a webového prohlížeče ke komunikaci s clustery.
Nulová instalace: Není třeba nainstalovat software Solr na počítače studentů! (ačkoli to je možné)
Reference (5)
very to the point and hands on. No "powerpoint-training" but real scenarios and demos
Michael Sperber - WUR/ Computrain
Kurz - Solr for Developers
Industry problems and solutions. Practice knowledge.
Wojciech Walczyszyn - SAP
Kurz - Solr for Developers
It was broad, it was precise and nicely explained
Wojciech Drzewiecki - SAP
Kurz - Solr for Developers
He is provided great example for each topic.
Onoriode Ikede
Kurz - Solr for Developers
The lectures were fine.