TheaterEncyclopedie:Verbetering koppeling TheaterEncyclopedie en TheaterCollectie (2023)/Startnotitie

Uit TheaterEncyclopedie
Ga naar: navigatie, zoeken

Project verbetering uitwisseling informatie Theaterencyclopedie <-> data Theatercollectie: Allard Pierson/Stichting TiN

6 juli 2023 – Milco Feijnenbuik (hoofdredacteur Theaterencyclopedie), Bart Mulckhuijse (WikiWerkers, technische ondersteuning Theaterencyclopedie), Bianca de Waal (specialist Datakwaliteit Uitvoerende Kunsten Allard Pierson)

Huidige stand van zaken

De Theatercollectie van het Allard Pierson gebruikt het programma Axiell Collections (op het moment van schrijven nog Adlib) om de collectieregistratie te doen. Naast databases rondom objecten, personen/instellingen, etc., is de premièredatabase een belangrijk onderdeel. In deze database worden alle professionele voorstellingen met een Nederlandse première ingevoerd, met onder meer de titel, producent, premièredatum en -locatie, genre en alle betrokkenen.

De Theaterencyclopedie is een website over de Nederlandse theatergeschiedenis. De website hanteert het Wikipediaprincipe: iedereen met een account kan zelf informatie toevoegen en verbeteren, en nieuwe pagina’s aanmaken. Veel informatie komt via deze weg op de website terecht, zoals biografische informatie over personen.

De gegevens met betrekking tot de voorstellingspagina’s in de website kennen echter een koppeling met de premièredatabase van Axiell Collections. De koppeling vindt plaats door middel van een bot (Tinbot), die controleert of de gegevens in de database en op de website tot op zekere hoogte overeenkomen.

Zodra er in de premièredatabase een nieuwe voorstelling is ingevoerd, worden de bijbehorende gegevens via Tinbot gekopieerd naar de Theaterencyclopedie, waar deze voorstelling een eigen pagina krijgt. In de informatiebox bovenaan de pagina staan gegevens als de titel, producent, discipline, premièredatum en -locatie, het seizoen en annotaties, evenals de mogelijkheid om een affiche te laten zien. Onder de informatiebox worden automatisch de medewerkers aan de voorstelling ingevuld in verschillende velden, overeenkomstig met de functie.

Zodra een pagina is aangemaakt, kunnen gebruikers van de website tot op zekere hoogte zelf gegevens aanpassen en aanvullen. Denk hierbij aan het toevoegen van een inleidende tekst, een samenvatting van waar de voorstelling over gaat, contextuele informatie en afbeeldingen en ander audiovisueel materiaal. Ook binnen het gedeelte van de medewerkers zijn wijzigingen door te voeren door websitegebruikers. De reguliere gebruikers kunnen geen wijzigingen doorvoeren in de informatiebox.

Zodra een nieuwe voorstellingspagina in de Theaterencyclopedie door Tinbot is aangemaakt, en deze niet door een andere gebruiker is bewerkt, blijft alle informatie op de pagina gecontroleerd worden door Tinbot. Zodra er iets in de premièredatabase wordt aangepast, komt deze aanpassing ook door naar de Theaterencyclopedie.

Zodra een pagina wel is bewerkt, blijft alleen de informatiebox nog via Tinbot gekoppeld. Concreet betekent dit dat:

  • als er op de Theaterencyclopedie wijzigingen moeten plaatsvinden in de informatiebox, dat dit éérst in de premièredatabase moet worden verwerkt. Verwerking op alleen de Theaterencyclopedie heeft als resultaat dat Tinbot de gegevens op een later moment weer kan terugdraaien.
  • Als er in de premièredatabase op een later moment wijzigingen worden doorgevoerd in de medewerkenden, deze niet meer doorkomen naar de Theaterencyclopedie.

De koppeling tussen de premièredatabase en de Theaterencyclopedie is eenzijdig: gegevens uit de premièredatabase worden alleen doorgezet naar de Theaterencyclopedie. Andersom is er geen doorvoer van informatie.

Knelpunten

De huidige situatie zorgt voor een aantal punten waar de collectiedatabase en de Theaterencyclopedie elkaar tegenwerken:

  • De invoerregels van de premièredatabase hebben soms een onhandige uitwerking op de weergave in de Theaterencyclopedie.1 Een aantal voorbeelden:
    • Verduidelijkingen bij personen en instellingen. In de premièredatabase ligt de voorkeur voor invoer in de schrijfwijze bijvoorbeeld bij Brink, Cor van den (lichtontwerper). De huidige koppeling maakt hiervan op de Theaterencyclopedie Cor van den (lichtontwerper) Brink. Voor personen is dit in de Theaterencyclopedie aan te passen. Soortgelijke voorbeelden bij producenten en locaties moet echter via de premièredatabase.
    • Voor de premièredatabase is het minder relevant wie de hoofdproducent en wie de co-producent van een voorstelling is.2 Vanuit efficiëntie wordt vaak gekozen om de producent die al een eigen producentcode heeft, als eerste te noemen. Op de Theaterencyclopedie is dit onderscheid wel relevant, omdat de hoofdproducent in de paginatitel moet staan. Dit is echter – vanwege de permanente koppeling van de informatiebox met de premièredatabase – niet mogelijk zonder aanpassing in de database.
  • Doordat – na bewerking op de Theaterencyclopedie – de koppeling met de premièredatabase deels is verdwenen, komen latere aanvullingen in de premièredatabase niet altijd door naar de website. Omgekeerd geldt sowieso hetzelfde: als gebruikers op de Theaterencyclopedie gegevens aanvullen of verbeteren, vinden deze wijzigingen geen weg terug naar de premièredatabase, waardoor er daar foutieve of onvolledige informatie blijft staan.
  • De informatie van de voorstellingspagina’s in de Theaterencyclopedie is zowel afkomstig van de premièredatabase als door invoer van gebruikers. Het onderscheid welke informatie waar vandaan komt, is op het eerste gezicht niet helder. Dit is alleen terug te zien door in de bewerkingsgeschiedenis van de pagina te zoeken naar welke informatie door Tinbot is toegevoegd, en welke informatie door andere gebruikers.
  • De inhoud van het veld rol wordt vanuit de database niet meegenomen naar de Theaterencyclopedie, maar geeft wel relevante en meer specifieke informatie dan alleen het veld functie. Voorbeeld: functie =- audiovisueel ontwerp en de rol = video.

Doel project

Het doel van het project is om de koppeling en informatie-uitwisseling tussen de premièredatabase van Axiell Collections en de Theaterencyclopedie, en de techniek achter de Theaterencyclopedie, te verbeteren en toekomstbestendig te maken, ook voor de koppeling naar andere platforms. In het ideale geval bereiken we de volgende doelen:

  1. Op de Theaterencyclopedie wordt het helderder welke informatie uit de premièredatabase afkomstig is, en welke informatie is toegevoegd door gebruikers van de website (bronvermelding).
  2. Informatie-uitwisseling kan tweezijdig plaatsvinden: vanuit de premièredatabase naar de Theaterencyclopedie en vice versa. De mogelijkheden met betrekking tot de terugstroom van informatie vanuit de Theaterencyclopedie naar de premièredatabase (welke op dit moment niet aan de orde is) moet hiervoor eerst worden onderzocht.
  3. Er moeten daarbij afspraken komen over de oorspronkelijke bron van informatie: voor welke informatie is de premièredatabase leidend ten opzichte van de Theaterencyclopedie, en vice versa?
  4. De premièredatabase en de Theaterencyclopedie kunnen beide gegevens aanpassen volgens eigen invoerregels, waarbij de regels of wensen vanuit het ene platform niet in de weg zit voor het andere platform, of technisch opgelost moeten worden.


Technische doelstellingen

De technische doelstellingen zijn gericht op het faciliteren van de gebruiksdoelstellingen in combinatie met de ontwikkeling naar Linked Open Data (LOD) zoals die (ook) binnen Netwerk Digitaal Erfgoed en Podiumkunsten wordt nagestreefd.

Ontwikkelingen richting Linked Open Data:

  1. Ontwikkeling naar een koppeling op basis van een URI en/of PID, oftewel een unieke identifier
  2. Ontwikkeling naar een API-koppeling met (bijna) real-time uitwisseling (importeren) van informatie
  3. De informatiebron van de productiedatabase wordt ‘real-time’ gekopieerd/geïmporteerd, maar biedt tevens de mogelijkheid om op de Theaterencyclopedie flexibel te corrigeren en aan te vullen. De koppeling gaat hierbij niet verloren.


Er zitten enkele voordelen aan deze technische doelen:

  • Het maakt de realisatie van de doelen 1, 2 en 4 (onder kopje “Doel project”) mogelijk c.q. verhelpt de genoemde knelpunten.
  • Het maakt het mogelijk om vrij informatie toe te voegen aan de Theaterencyclopedie (volgens eigen definitie en/of invoerregels), die niet is opgenomen in de productiedatabase (maar daar wel aan gerelateerd kan worden - dus zonder dat de koppeling verloren gaat).
  • Informatie kan worden ontdubbeld, omdat het slechts op één plek opgeslagen hoeft te worden. Bovendien is het vervolgens mogelijk om te bepalen of deze informatie wel of niet zichtbaar wordt weergegeven, of alleen ‘aan de achterkant’ opgeslagen staat.
  • De data in de premièredatabase kan verrijkt en verbeterd worden aan de hand van de input van de gebruikers op de TE
  • De data op de TE en de premièredatabase zijn beter en makkelijker toegankelijk voor andere platforms

Het project

Ondergetekenden zouden de projectgroep graag uitbreiden met enkele mensen vanuit de afdeling Digitale Diensten, te weten Hennie Dolfsma en Derk-Jan Feil. Met het oog op Linked Open Data zijn ook Heidi Brebels en Hadewijch Dekker (coördinator LOD) gewenst om mee te denken.

De looptijd van het project is op voorhand ingeschat op anderhalf jaar, met een start in begin 2024 tot medio 2025. De inzet van de mensen zal kunnen worden bepaald tijdens de ontwikkeling van het definitieve projectplan.

De ontwikkeling kan worden betaald uit de middelen van de collecties Uitvoerende Kunsten van het Allard Pierson.

Voetnoten

1 Belangrijk is om in het achterhoofd te houden dat de invoer in de premièredatabase gebeurt volgens standaarden die zijn vastgesteld. Als gegevens hieruit worden gebruikt voor externe bronnen, zoals de Theaterencyclopedie, dienen eventuele problemen daar opgelost te worden.

2 De hoofdproducent is niet altijd gemakkelijk te bepalen. De Theaterencyclopedie gaat in principe uit van de eerstgenoemde producent in PR-uitingen rondom de voorstelling.