Overleg TheaterEncyclopedie:Ontologie van de TheaterEncyclopedie

Uit TheaterEncyclopedie
Ga naar: navigatie, zoeken

<< Terug naar de projectpagina Ontologie

Deze pagina bevat vragen, opmerkingen en ideeën over de pagina TheaterEncyclopedie:Ontologie van de TheaterEncyclopedie.

NIEUW ONDERWERP TOEVOEGEN

Vergeet niet je bericht te onderteken met vier "tilden": ~. Je bericht wordt dan automatisch met jouw gebruikersnaam ondertekend (inclusief tijd en datum - timestamp), zodat duidelijk is dat jij de afzender bent!

Meer hulp voor het gebruik van overlegpagina's vind je hier (alleen in het Engels).

Overleg Ontologie 25 september 2019

Entiteit-Relatie-Diagram

In tekstvorm wordt een ontologie al gauw erg onoverzichtelijk daarom is er een ERD (Entiteit-Relatie-Diagram) gemaakt. Dit diagram is een eerste opzet voor een overzicht betreffende de Ontologie. Dit model moet in ieder geval voor de TE duidelijk zijn zodat er zinvolle semantische queries gemaakt kunnen worden. Welke Entiteiten en Eigenschappen (relaties) zijn hiervoor nodig, wat is de relatie waarop gefilterd wordt en wat is er nodig als er koppelingen met andere databases worden gemaakt. ERD v01.PNG

Kleur blauw zit in TE
Kleur groen is onzeker of dit is opgenomen in TE
Kleur rood is een discussie onderdeel
Semantische triple; Een semantische triple bestaat uit drie onderdelen: Een subject (onderwerp), een object (lijdend voorwerp) en een eigenschap (relatie tussen het subject en het onderwerp). Zie voor voorbeelden De MediaWikiGids! Dit is anders dan een database model waarbij de eigenschap (relatie) wegvalt.
Entiteit = subject/object

In Adlib is er een veld voor:

Producent/gezelschap; Je kan in Adlib zelf invullen of het een producent of gezelschap is. Maar een producent hoeft geen gezelschap te zijn en een gezelschap hoeft geen producent te zijn.
Plaats; In Adlib is er een veld voor plaats. Plaats heeft echter meerdere betekenissen, namelijk:
Persoon is geboren in plaats = geboorteplaats
Persoon is overleden in plaats = overlijdingsplaats
Première heeft plaatsgevonden in plaats = premièreplaats

Als eigenschap alleen plaats wordt genoemd dan kan je dit nooit uit elkaar houden. In een database worden te korte benamingen gebruikt. Een veld voor plaats betekent zowel geboorteplaats als overlijdensplaats. De relatie is hetzelfde maar de betekenis is toch echt anders.

Niet meteen alle eigenschappen gaan verbeteren, maar afspraken maken over de betekenissen van de velden in Adlib en welke oplossingen in de wiki hiervoor gevonden kunnen worden. Bijvoorbeeld het veld producent/gezelschap in Adlib; dit kan je oplossen door in de TE wiki gebruik te maken van categorieën, subcategorieën en eigenschappen. Subcategorie: Gezelschap en Eigenschap: Producent. Hiervoor is het ook nodig dat er een aantal categorieën omgezet gaan worden naar eigenschappen.
Personen; In Adlib wordt eerst peroon ingevoerd, daarna de functie:
Persoon heeft functie uitvoerende, heeft functie regie, heeft functie auteur.
Welke velden zijn er in adlibl, welke relatie, welke functie, meerdere functies?
Een aantal voorbeelden:
Affiche gaat over die productie.
Deze producent was producer van deze productie.
Categorie seizoen bestaat nog niet. Eigenschap Seizoen wel, premiereseizoen is een type.
Plaats is een categorie met beschrijving geworden, hetzelfde kan voor jaar gedaan worden; Jaar, wie is er geboren, welke theaters zijn er geopend, welke premieres hebben er plaatsgevonden, 50 jaar geleden … Dit is een snel en eenvoudig in te voeren.
Uitvoering (voorstelling) zitten niet in de database, wel premières, dat is de voorstelling maar dat is er een. Een première zit in een seizoen, is gerelateerd aan een productie, hoe link je het, kenmerken, organiseren. Er zijn producties met premieredatum maar er zijn ook producties zonder premieredatum.
Titels van de voorstellingen beschreven worden, dat is een werk. Het is mogelijk om te linken naar andere databases. Het is belangrijk om dit wel in je informatiemodel te stoppen want binnenhalen is verwijzen. Bij productie kan bijvoorbeeld een link opgenomen worden naar onstage database. Nieuwe voorstellingen krijgen vanuit de producent een uniek nummer vergelijkbaar met isbn nummer. Alle grote toneelstukken hebben een pagina op wikipedia. Nederlandse dbnl, volledige inhoud. Hans geeft de voorkeur aan een korte beschrijving van de inhoud.
Beroep is nu een soort vrij veld bij personen, waarden die ingevuld mogen worden beperken tot een categorie theaterberoepen. Handleiding welke functies je mag kiezen en welke rollen. Haal de waardes uit Adlib thesaurus en maak daar een categorie beroepen van. Behalve theaterberoep mag je ook nog andere beroepen toekennen. Nieuwe personen komen via productie database binnen en beroep moet je zelf invullen. Handiger om een infobox van personen te hebben waarbij een dropdown is van de theaterberoepen waaruit gekozen kan worden.
Er is een personenscript in de TE maar deze staat al een aantal jaren uit.
Via query kijken wat er in adlib staat en die informatie (Bart heeft een vb met via wikidata gemaakt) te tonen in de TE, dit kan dus ook via API adlib.
Thesaurus kan worden opgeschoond bv via google refine.
Discipline adlib bij productie 6 vormen; Mime, dans, poppenspel, muziektheater, amusementsvorm, toneel.
Voor persoon beroepen definieren en geen discipline! Discipline hoort bij productie.
Meerdere trefwoorden; welke zijn er allemaal?
Alle producties hebben trefwoorden, bij trefwoord moet seizoen ingevuld worden.
Muziektheater en amusementsvorm, 1 bij discipline en 1 bij trefwoord.
Rollen; Stel dat je wilt weten wie er allemaal een bepaalde rol hebben gespeeld. Nu kan je dat in de TE niet achterhalen. Rollen kunnen aan productie worden toegekend en aan die rollen kunnen personen worden gekoppeld. Zo kan je een querie schrijven en achterhalen wie er bijvoorbeeld allemaal Hamlet gespeeld. Rollen is geen entiteit in de wiki. Ensemble als rol invullen.
Er is een Sjabloon: Overzicht titel. Hiermee kan je achterhalen welke producties er zijn met bijvoorbeeld Hamlet in de titel. Er zijn echter ook producties die gebaseerd zijn op het oorspronkelijke werk Hamlet maar waarvan de titel van de uitvoering geen Hamlet meer bevat.

Naslag

To do

  • Ideaal datamodel, combinatie maken met een grafisch overzicht en eigenschappen en categorieën goed beschrijven. Volgende stap data inrichten naar dat model.
  • Definitie van Productie en Producent. Als eigenschap kan je invoeren wat je wilt in SMW, maar wel belangrijk wat voor type.
  • Er zijn Eigenschappen die al gebruikt worden maar nog geen eigenschap zijn
  • Heidi moet af en toe maintainance script laten lopen om alles bij te werken
  • Als je waarschuwing krijgt over aantal wijzigingen even wachten en Bart op de hoogte stellen
  • Via subpagina's verwijzen naar andere ontologieën

Besluiten

  1. Besluit de entiteit (categorie) werk te gaan gebruiken
  2. relatie met productie leggen
  3. we onderzoeken of een infobox titel waardevol is
  4. titel moet altijd gerelateerd zijn aan een auteur
  5. eigenschap oorspronkelijke titel beschrijven hoe deze term gebruikt wordt
  6. tabje discussie kunnen we gebruiken om onze overwegingen te noteren
Manon en Gonneke maken een voorzet met de beschrijving van de begrippen

Definitie en benaming voor een Werk

Om Werken in de TE op te nemen is het nodig een goede definitie aan te houden. Dat geldt voor de volgende onderwerpen:

  • Paginatitel in de hoofdnaamruimte - Deze moet “logisch” zijn voor de gebruiker (begrijpelijk, leesbaar en vindbaar), maar ook UNIEK in de TE
  • Categorie-titel (paginatitel in de categorie-naamruimte), idem en aansluitend bij bestaande cat’s als “Productie”, “Persoon”, etc.
  • Eigenschappen (paginatitel in de Eigenschap-naamruimte)

Verder is natuurlijk van belang aansluiting te vinden bij het taalgebruik in Adlib, de theaterwereld en daarbuiten.

Tijdens de (bovenstaande) bespreking is een aantal benamingen besproken:

  • Werk, Theaterwerk, Theaterstuk
  • Stuk, Toneelstuk
  • Titel, Theatertitel

Bestaande eigenschap: Eigenschap:Oorspronkelijke titel. Deze eigenschap verwijst naar het het oorspronkelijke stuk / de oorspronkelijke titel / etc. waarop de betreffende Productie is gebaseerd.

Voorstel definitie WERK

  • Een Werk (in de TE) is een theaterstuk zoals dat (oorspronkelijk) door een auteur is geschreven voor uitvoering als theater, toneel etc..
    • Dit werk (theaterstuk) kan zijn gebaseerd op een eerder/ander werk
    • Dit werk (theaterstuk) kan zijn gebaseerd op een boek(titel), film(titel) etc. van een (andere) auteur.
    • Een Productie is gebaseerd op een Werk (NB: dus niet op een TITEL)
  • Dus:
    • Een pagina over een WERK heeft —> verwijzing naar pagina uit de categorie:werk (of geen verwijzing).
    • Een pagina over een PRODUCTIE heeft --> verwijzing naar pagina uit de categorie:werk

Bronnen

Geraadpleegde bronnen komen uit het publieke domein en kunnen (dus) afwijken van het professionele taalgebruik:

Voorstel benamingen en definitie TITEL

  • Definitie: Een (theater)werk is een <Theatertitel> van een bepaalde <auteur>
  • Een paginatitel voor een Werk bestaat is als volgt opgebouwd: <Theatertitel> - <Auteur>
  • Deze paginatitels behoren tot de entiteit <Werk> c.q. de Categorie:Werk (voorkeur boven: Categorie:Theaterwerk - sluit beter aan bij bestaande)
  • Een <Auteur> behoort tot de entiteit <Persoon> (met beroep : auteur??)


  • Past de bestaande eigenschap:Oorspronkelijke titel binnen dit voorstel?
    • Vraag: waar verwijst die eigenlijk naar?? Het lijkt de bedoeling (...) geweest te zijn om te verwijzen naar een "Oorspronkelijk werk"...
    • Is “Oorspronkelijk werk” logischer, en kan dit aangepast worden?? Nog uit te zoeken.
    • Is er een alternatief denkbaar om "(Oorspronkelijke) Titel" te laten doorverwijzen naar op die titel gebaseerde Werken? (Nog uit te zoeken).
      • Dit kan evt. later kan ook nog uitgewerkt worden:
      • Pagina’s voor Theatertitels —> Doorverwijzingen naar Theaterwerken
      • Categorie:Titel
    • Is er een alternatief denkbaar op basis van sub-properties van een eigenschap:IsGebaseerdOp
      • Sub: Oorspronkelijke Titel (IsGebaseerdOpOorspronkelijkWerk / IsGebaseerdOpOorspronkelijkeTitel)
      • Sub: IsGebaseerdOpWerk

Voorbeeld:

  • Pagina (Productie): Hamlet - De Theatergroep - 1980 --> IsGebaseerOpWerk --> Hamlet - Shakespeare
  • Pagina (Werk): Hamlet - Shakespeare --> IsGebaseerOpTitel --> Hamlet, en behoort tot Categorie:Werk
  • Pagina (Titel): Hamlet --> Hamlet IsGeschrevenDoorAuteur --> Shakespeare; Hamlet --> IsGeschrevenDoorAuteur --> AuteurB; ...; en behoort tot Categorie:Titel

ERD

Diagram van de uitbreiding - optie 1 - concept



Alternatief voorstel definitie WERK / TITEL

Basis:

  • Geen onderscheid maken tussen Werk en/of Titel (een enkele Categorie:Werk/Titel).
  • Eén hoofdeigenschap toevoegen: Eigenschap:IsGebaseerdOp
  • Onderscheid maken in twee (sub-)eigenschappen:
    • IsGebaseerdOpWerk
    • IsGebaseerdOpOorspronkelijkeTitel (of de "oude" eigenschap:Oorspronkelijke titel handhaven)
Diagram van de uitbreiding - optie 2 - concept


Voorbeeld:

Pagina (Productie): Hamlet - De Theatergroep - 1980 --> IsGebaseerOpWerk --> Hamlet - Nederlandsche Opera - 1890-11-01 en behoort tot Categorie:Productie Pagina (Productie): Hamlet - Nederlandsche Opera - 1890-11-01 --> IsGebaseerdOpOorspronkelijkeTitel --> Hamlet( - Shakespeare) (en behoort ook tot Categorie:Productie) Pagina (Werk / Titel): Hamlet - Shakespeare --> IsGeschrevenDoorAuteur --> Shakespeare; Hamlet - Shakespeare --> IsGeschrevenDoorAuteur --> AuteurB; ...; en behoort tot Categorie:Werk/Titel

To do

  • Check: Aansluiting op Adlib en informatie uit Adlib-script
  • Check: Aansluiting op "internationale theater-ontology"
  • Uitwerking beschrijving Werk / Titel
  • Uitwerking alternatieve oplossingen, bijv.: gebruik van sub-properties:
    • IsGebaseerdOp
      • IsGebaseerdOp(Oorspronkelijke)Titel
      • IsGebaseerdOpWerk
  • Consequenties implementatie; (behoort eigenlijk niet in "Definitie-fase"...)
    • bestaande informatie "Oorspronkelijke titel"?
    • Aanpassingen aan formulieren, sjablonen en vormgeving
    • Vullen van de informatie in de nieuwe velden
    • ...