TheaterEncyclopedie:Documentatie TINbot
De Tinbot is een PHP-script, dat is ontwikkeld door de UvA om gegevens uit het collectie beheersysteem Adlib in de TheaterEncyclopedie te importeren. Elke nacht leest het script via de API van Adlib de voorstellingen uit de Adlib productiedatabase en werkt het de TheaterEncyclopedie bij.
Beschrijving
Korte beschrijving
(bron Documentatie#TINbot)
Alle voorstellingen die worden ingevoerd in Adlib productiedatabase worden geïmporteerd (gekopieerd) naar de Theaterencyclopedie. Tenminste, als zij over de drie vereiste datavelden beschikken, namelijk: titel-producent-premièredatum. Dit is de unieke code waarmee elke voorstelling een aparte pagina krijgt in de Theaterencyclopedie, de titel van een pagina bestaat namelijk uit deze drie elementen. Voor dit systeem is gekozen vanwege drie argumenten: 1. Uniek, 2. Doorzoekbaar, 3. Leesbaar
In de productiedatabase worden ook voorstellingen ingevoerd waarvan de premièredatum op dat moment onbekend is (die wordt dan hopelijk later aangevuld), deze voorstellingen verschijnen niet in de Theaterencyclopedie. TINbot vergelijkt dus elke nacht de inhoud van de database (Adlib) met de inhoud van de Theaterencyclopedie, daarbij kijkt TINbot 5 dagen terug in de tijd. Alle voorstellingen die zijn aangevuld in de productiedatabase krijgen automatisch een nieuwe pagina in de Theaterencyclopedie.
Een nieuwe pagina bestaat uit: Titel: Titel van de voorstelling-producent-premieredatum 1. Invulformulier met data (ook wel infobox genoemd) 2. Vrije tekst Informatie Team Rolverdeling Bronnen 3. Categorieën
N.B.: een datum wordt in de Theaterencyclopedie altijd op Amerikaanse wijze ingevoerd: jaar-mm-dd, omdat dit de enige interpretatie van een datum is die niet aan discussie onderhevig is.
Beschrijving proces
Op hoofdlijnen wordt het volgende proces doorlopen:
- Selecteer recentelijk bewerkte of nieuwe records uit Adlib
- Controleer op wijzigingen in de TE en stel nieuwe paginatekst samen, edit zonodig* de TE
(*Zonodig = nieuwe pagina OF wijziging in Adlib) - Controleer op dubbelingen priref* en verwijderd zonodig dubbeling
(*Priref = primaire referentienummer in Adlib)
Het proces is in detail inzichtelijk gemaakt in Bestand:TE tinbot overview V2.pdf, opgesteld door H. Brebels.
Beschrijving verwerking per record
De verwerking van informatie per record verloopt in hoofdlijnen als volgt:
- Inlezen gegevens uit Adlib
- Controleren copyrights en zo mogelijk uploaden van afbeelding affiche en onderschrift naar TE
- Update van alle Infobox gegevens met de Adlib gegevens
- Update van categoriegegevens met met de Adlib gegevens
NB: Zowel categorietoewijzingen als samenstelling van een wikitext lijst met deze zelfde categorie-informatie... - Indien de vrij tekst niet is gewijzigd door een co-creator (mens) update van de vrije tekst
- Samenvoegen tot "wikitext" en update via de API van de TE.
De verwerking per record is in detail inzichtelijk gemaakt in Bestand:TE tinbot processrecord V2.pdf
Infoboxgegevens
- Paginatitel = wikipaginatitel
- Titel = titel
- Oorspronkelijke titel = original_title
- Afbeelding= repro
- Onderschrift afbeelding = reprosub
- Ondertitel = subtitel
- Producent = firstproducent
- Co-producent = producentlist
- Discipline = discipline
- Premieredatum = date
- Seizoen = seizoenlist
- Onderwerp = subjectlist
- Locatie = venue
- Opmerkingen = notes
- Adlib = perform/” + priref
Categoriegegevens
|
|
Enkele "dubbelingen" met Infoboxgegevens:
- Productie (in wikipaginatitel - niet echt dubbel)
- Producties "singleproducent" ( = "firstproducent"?)
- Premieres "venue"
Alle "functies" uit de bovenstaande lijst als categorie:
- "functie" "character"