TheaterEncyclopedie: Gegevens delen met Wikimedia
Inhoud
WERK IN UITVOERING
Pilotproject WikiPodia: Ontwikkelen van Procedures en Scripts
- Doelstelling
- "Het ontwikkelen en testen van procedures en scripts (o.a. queries) om gegevens uit de TheaterEncyclopedie te kunnen delen met de Wikimediaprojecten "Wikipedia" en "Wikidata" en vervolgens wederzijds te verrijken."
- Uitgangspunt
- Als beginpunt is gekozen voor een lijst van 10 Vlaamse (co-)producenten van producties die een Nederlandse premiere hebben beleefd.
Eerste analyse van beschikbare gegevens - Adlib-export
Eerste bevindingen van data-analyse:
- Uitgangselectie: 10 Vlaamse gezelschappen
- Deze 10 gezelschappen zijn betrokken geweest bij 723 in Adlib geregistreerde Producties
- Deze producties zijn 2015 premiere-data en locaties geregistreerd
- Deze producties zijn op 717 locaties in premiere gegaan
- Bij deze producties zijn xxxx (honderden) uitvoerende personen betrokken
Procedure
De te volgen procedure kan in vier stappen worden ingedeeld:
- Stap 1
- Selecteer 10 Vlaamse gezelschappen die als Co-producent hebben meegewerkt aan producties die in premiere zijn gegaan in Nederland. Vervolgens: Vergelijk & Verrijk deze gezelschappen onderling tussen TE en Wikipedia / Wikidata
- Stap 2
- Selecteer de Producties waarvan deze gezelschappen (Co-)producent zijn geweest. En vervolgens: Vergelijk & Verrijk.
- Stap 3
- Selecteer de (Top 15) van locaties ("venues") waarin deze producties in première zijn gegaan. En wederom: Vergelijk & Verrijk.
- Stap 4
- Selecteer de aan de Gezelschappen, Producties en Locaties gerelateerd Uitvoerenden. En ook hier: Vergelijk & Verrijk. NB: het aantal lemma's zal hier sterk toenemen (en vereist dus wellicht filtering).
Het Vergelijk & Verrijk proces kan uit verschillende onderdelen bestaan, waarvan sommige automatisch kunnen, maar voor andere handmatige acties nodig zijn. Enkele voorbeelden:
- Onderlinge referenties toevoegen (bijv. bronverwijzingen, Adlib-referentie en Q-nummers)
- Gestructureerde informatie uitwisselen (TE: Semantische gegevens & Wikimedia: Wikidata)
- Inhoudelijke (tekstuele) informatie uitwisselen
- Media (afbeeldingen) uitwisselen
Voor alle (en zeker de laatste) zijn afspraken over auteursrechten essentieel. Wikimedia vereist dat gegevens onder de CC-BY-SA (??) licentie beschikbaar zijn.
N.B. Inmiddels is de licentie aangepast: Het gebruik van data en teksten die op de Theaterencyclopedie staan hebben een CC BY_SA licentie. Zie: TheaterEncyclopedie:Algemeen voorbehoud. De tekst die automatisch verschijnt als je een pagina gaat bewerken (onderaan), maakt nog melding van de CC BY-NC-4.0 licentie. Dit moet ook worden aangepast conform bovenstaande licentie - kunnen de wikiwerkers dit doen? Tuja van den Berg (overleg) 13 mrt 2018 13:35 (CET)
Scripts, overzichten en lijsten
Ten behoeve van elke stap is een (1) of meer scripts (queries, processen) om de voor Vergelijking & Verrijking benodigde informatie te selecteren en uit te wisselen. De informatie staat op de volgende vier (sub)pagina's:
- Stap 1 - 10 Vlaamse gezelschappen
- Stap 2 - Producties van deze gezelschappen
- Stap 3 - Top 15 van Theaters voor deze producties
- Stap 4 - Uitvoerenden en betrokkenen
Q-nummers
Het Q-nummer speelt een centrale rol in de uitwisseling tussen de TheaterEncyclopedie en Wikimedia-projecten. Hier een korte uitleg.
Wat is een Q-nummer
Q-nummers zijn unieke referenties naar objecten (denk aan pagina's of lemma's) in Wikidata (en daarmee Wikipedia). Met behulp van het Q-nummer is gestructureerde informatie vanuit Wikidata.org op te vragen, vergelijkbaar zoals dat in de TheaterEncyclopedie gebeurt met Semantische queries.
Een vergelijkbare constructie is de Adlib-referentie waarmee op unieke wijze objecten (mensen, producties, ...) in het Adlib-systeem geïdentificeerd kunnen worden.
Toepassing van Q-nummers
Het opnemen van Q-nummers in de TheaterEncyclopedie, maakt het bijvoorbeeld mogelijk om:
- Een unieke verwijzing naar Wikipedia (in alle talen) te maken (denk aan een weblink of bronvermelding)
- Gegevens uit Wikidata.org te gebruiken voor verrijking van de TheaterEncyclopedie
- Met behulp van het Q-nummer ket relevante lemma op de TE worden gevonden
Daarnaast kan het Q-nummer wellicht als unieke identifier gebruikt worden om gegevens met andere archiefbeheerders uit te wisselen.
Externe link
- zie ook verslag van dit project en mogelijkheden om data uit de Te te delen op Wikipedia op Wikipedia