TheaterEncyclopedie:Verbeteren zoekfuncties TE (2022)

Uit TheaterEncyclopedie
Ga naar: navigatie, zoeken
Heb je vragen, opmerkingen of ideeën over deze pagina? Plaats ze op de Overlegpagina! (Wel eerst even inloggen...)


WERK IN UITVOERING


Deze pagina beschrijft het project om de zoekfunctie van de TE te verbeteren, zoals dat in de gebruikerswensen (zie: 2017-01 en 2019-03) is opgenomen.

Deze projectpagina is het vervolg op de voorgaande (deels gerealiseerde en deels onvoltooide) projecten:


Inleiding

Het is al lange tijd (2017...) de wens om de effectiviteit en gebruiksvriendelijk van het zoeken op de TE te verbeteren. Rond 2017-2018 zijn de eerste verbeteringen doorgevoerd op basis van het gebruik van externe zoekmachines zoals Google en DuckDuckGo en het eenvoudiger toegankelijk maken van de alternatieve zoekingangen via het Portaal Zoeken & Vinden. Hoewel dit verbeteringen zijn t.o.v. de standaard zoekfunctie, schiet het portaal tekort op "toegankelijkheid" (de zoekfunctie zou op iedere pagina eenvoudig te gebruiken moeten zijn).

Tijdens de meest recente upgrade van de TE ( Upgrade TE (2021)) had onder andere tot doel om de standaard zoekfunctie van MediaWiki ("Lucene") te vervangen door "Elastic Search". Dit onderdeel van de upgrade is destijds om (technische/organisatorische/financiële) redenen uitgesteld. Dit project pakt de draad weer op en brengt de mogelijkheden en consequenties in beeld t.b.v. verdere besluitvorming en realisatie.


Doelstelling

  1. Onderzoeken & in beeld brengen van (technische) mogelijkheden (scenario's) om de gebruikerswensen te realiseren
  2. Vaststellen van de financiële consequenties (met name de externe kosten voor implementatie en beheer door Professional Wiki)
  3. Uitbrengen van advies voor besluitvorming


Verkenning mogelijkheden

Er is een aantal (technische) implementaties/opties beschikbaar voor de implementatie van "Elastic Search":

  • Extensie:ExtendedSearch
  • Extensie:CirrusSearch
  • Extensie:Elastica
  • Extensie:AdvancedSearch
  • ElasticStore

De gebruiksaspecten van de diverse oplossingen zijn het best te beoordelen door naar voorbeelden van implementaties te kijken; zie hieronder

Voorbeeld 1: "ExtendedSearch" door BlueSpice

  • Implementatie op de website van BlueSpice: https://en.wiki.bluespice.com/wiki/Main_Page
    • Voorbeeld gebruik: type “layout” in het zoekvenster en je krijgt direct suggesties van pagina’s uit diverse naamruimten waarin het woord “layout” voorkomt (niet alleen aan het begin) en de optie om een "full text search" te doen (linkt door naar zoekresultaten-pagina)
      • Merk op: Suggesties worden met thumbnail getoond
      • Verdere suggesties (“you might be looking for…”)
      • Optie voor “full-text search” om de volledige inhoud van pagina’s te doorzoeken (niet alleen titels)
  • De "oude" zoekpagina blijft beschikbaar (ter vergelijk, zie: https://en.wiki.bluespice.com/wiki/Special:Search )
  • De nieuwe zoekpagina staat hier: https://en.wiki.bluespice.com/wiki/Special:SearchCenter
    • typ bijv. “actual” in het zoekvenster en je krijgt “on the fly” een lijst me suggesties, die wordt aangepast wanneer je verder typt
      • Merk op: Er wordt niet alleen in pagina’s maar ook in attached files gezocht (!!)
    • Er is mogelijkheid om “Meer resultaten” weer te geven
    • Er zijn filtermogelijkheden op Categorie en Namespace
    • Er kunnen extra filtermogelijkheden toegevoegd worden
  • NB: BlueSpice gebruikt een eigen ontwikkelde versie van ElasticSearch (zie: Speciale Pagina's - https://en.wiki.bluespice.com/wiki/Special:Version)

Voorbeeld 2: CirrusSearch/AdvancedSearch

  • Gebruik op de website van MediaWiki zelf, maar ook Wikipedia.nl en de Engelstalige Wikipedia.
    • Geeft onder het zoekvenster alleen suggesties voor wat betreft de paginatitel
    • Geeft wel suggesties in zoekresultaat indien er spellingsfouten zijn (typ bijv. harasment ipv harassment)
  • “Oude” search pagina, maar met “Advanced Search” mogelijkheden: https://www.mediawiki.org/wiki/Special:Search
    • Klik op het blok "Advances search" om de nieuwe zoekfunctionaliteit zichtbaar te maken
  • Gebruikt drie extensies (bron: Special:Version)

Extra uitbreiding "Elastic Store"

ElasticStore is een uitbreiding van Semantic MediaWiki, die bedoeld is om de zoekmachine van ElasticSearch ook te gebruiken voor semantische queries. Dit kan voordelen bieden op het gebied van schaalbaarheid en performance (snelheid). In hoeverre dit ook voor de TE relevant kan zijn, moet nog worden nagegaan. Op dit moment zijn er weinig tot geen problemen met de snelheid van uitvoering van queries (alleen enkele grotere plaatspagina's).

ElasticSearch kan zonder deze extra uitbreiding worden gebruikt.

Zie ook documentatie:

Scenario's

De volgende scenario's zijn denkbaar:

  1. ExtendedSearch
  2. AdvancedSearch
  3. ExtendeSearch + SemanticStore
  4. AdvancedSearch + SemanticStore

In zijn e-mail d.d. 8-6-2021 geeft Kasper van Professional Wiki het volgende aan:

"I have nothing against getting back to Elasticsearch as a search backend for Semantic MediaWiki. Do not get me wrong here. Once we tried a switchover to Elasticsearch we will be able to see if existing hardware and available time can also handle the size of your wiki. At this point it is not easy to predict what will happen and will be required here."

Wanneer er geen zwaarwegende/belangrijke voordelen zijn aan ElasticStore, lijken scenario 3 en 4 opties die later overwogen kunnen worden.

Er is reeds aangegeven door PW dat Elastic Search een groot beslag kan gaan leggen op de servercapaciteit en de benodigde support-uren (plus implementatiekosten), waardoor een upgrade kostbaar kan gaan worden. Het is dus goed om ook alternatieven in beeld te houden, al zijn die er niet veel.

  • SphinxSearch - momenteel niet onderhouden
  • Google Custom Wiki Search - Gebruik van Google Search Engine naast - of in plaats van - de bestaande MW-zoekmachine - dit kan een "goedkope" oplossing zijn! - demo nog niet kunnen vinden...
    • GCWS is geïnstalleerd op de Test-TE (e-mail Karsten Hoffmeyer d.d. 18-7-2022), maar laat nog geen resultaten zien: test:Special:Search
    • Begin september geïnstalleerd op de Productie-TE; zie hieronder voor de resultaten.


De volgende (voorkeur)scenario's zullen verder bekeken worden:

  1. ExtendedSearch van BlueSpice - met name de inspanning en kosten (bij Professional.Wiki) inzichtelijk maken
  2. Google Custom Wiki Search - De extensie ter evaluatie op de Test-TE installeren, configureren en testen.

Ervaring met GCWS

De GCWS-extensie is (september 2022) geïnstalleerd op de Productie TE en bereikbaar via Speciaal:Zoeken.

  • De zoekresultaten zijn na het invoeren van een zoekopdracht zichtbaar via een pop-up op die pagina.
    • De pop-up verbergt de "eigen zoekresultaten van de wiki zoekmachine"; dit ziet er niet erg fraai uit.
    • De zoekresultaten zijn vergelijkbaar zoals die met het eigen Google Custom Search widget werden weergegeven.
  • Nog te testen:
    • Up to date zijn van zoekresultaten (hoe snel wordt nieuwe content zichtbaar via de GCSE?)
    • Compleetheid van de zoekresultaten (indexeert Google alle content?)

Financieel

Nader te bepalen.

Advies

Nader te bepalen.