De TheaterEncyclopedie is vernieuwd!

TheaterEncyclopedie: Gegevens delen met Wikimedia

Uit TheaterEncyclopedie
Ga naar: navigatie, zoeken

WERK IN UITVOERING

Pilotproject WikiPodia: Ontwikkelen van Procedures en Scripts

Doelstelling
"Het ontwikkelen en testen van procedures en scripts (o.a. queries) om gegevens uit de TheaterEncyclopedie te kunnen delen met de Wikimediaprojecten "Wikipedia" en "Wikidata" en vervolgens wederzijds te verrijken."
Uitgangspunt
Als beginpunt is gekozen voor een lijst van 10 Vlaamse (co-)producenten van producties die een Nederlandse premiere hebben beleefd.

Eerste analyse van beschikbare gegevens - Adlib-export

Eerste bevindingen van data-analyse:

  • Uitgangselectie: 10 Vlaamse gezelschappen
  • Deze 10 gezelschappen zijn betrokken geweest bij 723 in Adlib geregistreerde Producties
  • Deze producties zijn 2015 premiere-data en locaties geregistreerd
  • Deze producties zijn op 717 locaties in premiere gegaan
  • Bij deze producties zijn xxxx (honderden) uitvoerende personen betrokken

Procedure

De te volgen procedure kan in vier stappen worden ingedeeld:

Stap 1
Selecteer 10 Vlaamse gezelschappen die als Co-producent hebben meegewerkt aan producties die in premiere zijn gegaan in Nederland. Vervolgens: Vergelijk & Verrijk deze gezelschappen onderling tussen TE en Wikipedia / Wikidata
Stap 2
Selecteer de Producties waarvan deze gezelschappen (Co-)producent zijn geweest. En vervolgens: Vergelijk & Verrijk.
Stap 3
Selecteer de (Top 15) van locaties ("venues") waarin deze producties in première zijn gegaan. En wederom: Vergelijk & Verrijk.
Stap 4
Selecteer de aan de Gezelschappen, Producties en Locaties gerelateerd Uitvoerenden. En ook hier: Vergelijk & Verrijk. NB: het aantal lemma's zal hier sterk toenemen (en vereist dus wellicht filtering).

Het Vergelijk & Verrijk proces kan uit verschillende onderdelen bestaan, waarvan sommige automatisch kunnen, maar voor andere handmatige acties nodig zijn. Enkele voorbeelden:

  • Onderlinge referenties toevoegen (bijv. bronverwijzingen, Adlib-referentie en Q-nummers)
  • Gestructureerde informatie uitwisselen (TE: Semantische gegevens & Wikimedia: Wikidata)
  • Inhoudelijke (tekstuele) informatie uitwisselen
  • Media (afbeeldingen) uitwisselen

Voor alle (en zeker de laatste) zijn afspraken over auteursrechten essentieel. Wikimedia vereist dat gegevens onder de CC-BY-SA (??) licentie beschikbaar zijn.

N.B. Inmiddels is de licentie aangepast: Het gebruik van data en teksten die op de Theaterencyclopedie staan hebben een CC BY_SA licentie. Zie: TheaterEncyclopedie:Algemeen voorbehoud. De tekst die automatisch verschijnt als je een pagina gaat bewerken (onderaan), maakt nog melding van de CC BY-NC-4.0 licentie. Dit moet ook worden aangepast conform bovenstaande licentie - kunnen de wikiwerkers dit doen? Tuja van den Berg (overleg) 13 mrt 2018 13:35 (CET)

Scripts, overzichten en lijsten

Ten behoeve van elke stap is een (1) of meer scripts (queries, processen) om de voor Vergelijking & Verrijking benodigde informatie te selecteren en uit te wisselen. De informatie staat op de volgende vier (sub)pagina's:

Q-nummers

Het Q-nummer speelt een centrale rol in de uitwisseling tussen de TheaterEncyclopedie en Wikimedia-projecten. Hier een korte uitleg.

Wat is een Q-nummer

Q-nummers zijn unieke referenties naar objecten (denk aan pagina's of lemma's) in Wikidata (en daarmee Wikipedia). Met behulp van het Q-nummer is gestructureerde informatie vanuit Wikidata.org op te vragen, vergelijkbaar zoals dat in de TheaterEncyclopedie gebeurt met Semantische queries.

Een vergelijkbare constructie is de Adlib-referentie waarmee op unieke wijze objecten (mensen, producties, ...) in het Adlib-systeem geïdentificeerd kunnen worden.

Toepassing van Q-nummers

Het opnemen van Q-nummers in de TheaterEncyclopedie, maakt het bijvoorbeeld mogelijk om:

  1. Een unieke verwijzing naar Wikipedia (in alle talen) te maken (denk aan een weblink of bronvermelding)
  2. Gegevens uit Wikidata.org te gebruiken voor verrijking van de TheaterEncyclopedie
  3. Met behulp van het Q-nummer ket relevante lemma op de TE worden gevonden

Daarnaast kan het Q-nummer wellicht als unieke identifier gebruikt worden om gegevens met andere archiefbeheerders uit te wisselen.