TheaterEncyclopedie:Zoekmachineoptimalisatie (SEO)

Uit TheaterEncyclopedie
Ga naar: navigatie, zoeken
Heb je vragen, opmerkingen of ideeën over deze pagina? Plaats ze op de Overlegpagina! (Wel eerst even inloggen...)

Deze pagina geeft een overzicht van de activiteiten (vanaf ca. 2018) op het gebied van zoekmachineoptimalisatie. Het doel is dat de inhoud van de TE goed gevonden kan worden via zoekmachine's (met name Google).

Advies / acties ter verbetering van de ranking (2018)

Bron: e-mail van Bart aan Tuja d.d. 26-11-2018.

Voor SEO van belang zijnde punten op een rij gezet (naar - min of meer - aflopend belang/urgentie):

  1. Er is voldoende originele en kwalitatief goede inhoud aanwezig, al zijn de cijfers op de statistiek-pagina wat verontrustend: ca. 10.000 inhoudelijke pagina’s op een totaal van bijna 500.000 (!!!!). Ik heb zo niet direct een idee wat het grote aantal ‘bijna lege’ pagina’s veroorzaakt; zie ook hieronder!
  2. Backlinks … (links vanaf andere websites)
  3. De taal is Nederlands, dat is jammer voor Google, maar dat gaan we niet veranderen...
  4. SEO-friendly urls zijn ingesteld (het webpagina-adres is duidelijk “leesbaar” - theaterencyclopedie.nl/wiki/Pagina)
  5. Er is een bestand robots.txt aanwezig; daar staan een paar bijzondere regels in, maar daar heeft Google verder geen last van.
  6. Er is geen sitemap aanwezig (sitemap.xml); dat is wel een groot gemis
  7. Waarschijnlijk is de site (dus) ook niet aangemeld bij bijv. Google voor indexering
  8. Er zijn geen SEO-extensies actief op de TE, er wordt dus niets “extra’s” gedaan aan optimalisatie

Status per oktober 2020:

  • Het aantal inhoudelijke pagina's is ca. verdubbeld, maar met 21.000 nog steeds (te) laag; zie Speciaal:Statistieken.
    • Via Google gezocht op Site:theaterencyclopedie.nl en gaf ongeveer 54.200 resultaten. (Milcof (overleg) 8 dec 2020 14:21 (CET))
  • Het actiepunt m.b.t. back-links is wel gestart maar niet opgevolgd
    • Actie: Plaatsen van referenties / bronverwijzingen vanaf Wikipedia (NL) naar de TE.
      • Discussie met de WP-community over het plaatsen van (externe) links van WP naar TE afgerond
      • Resultaat is positief, maar wel gecontroleerd ter voorkoming van cirkelverwijzingen.
    • Er zijn nog weinig tot geen verwijzingen / links geplaatst
    • Linking vanaf Social Media: in uitvoering
    • Onderzoek naar andere websites voor back-links: open
  • Actiepunt betreffende sitemap is afgerond - zie TE:Configuratie sitemap (2018)
    • Vervolgactie nodig
  • TE is aangemeld bij Google Search Console
  • Er is nog geen SEO-extensie actief op de TE (actiepunt staat open)

Problematiek "onvoldoende gevulde pagina"

T.a.v. het eerste punt (maar 10.000 pagina's met content t.o.v. 500.000 beschikbare pagina's) is er een veel voorkomende fenomeen:

Je kunt dit zelf proberen via de link: Speciaal:WillekeurigePagina.

Er is een flink aantal van “dit soort” pagina’s, waarop alleen een naam van een persoon staat! Dat zou een verklaring kunnen zijn voor het grote aantal pagina’s “zonder inhoud”, dat MediaWiki rapporteert.

Het probleem is:

  • Deze pagina's voor bezoekers weinig zinvol zijn
    • Pagina's hebben ook geen uitgaande links...
  • Google deze pagina's niet indexeert
    • Google mogelijk de website aanmerkt als een website met automatisch gegenereerde content

NB: Na het uitvoeren van TE:Ontologie_van_de_TheaterEncyclopedie/Realisatie wordt het eenvoudig(er) om de Persoon-pagina's (automatisch) te voorzien van lijsten (content + links) op basis van semantische informatie uit Adlib. Zie voor het ontwerp van de vormgeving TE:Persoonspagina's.

Meta tags

Mediawiki geeft standaard een beperkt aantal meta tags mee aan iedere pagina.

Voorbeeld:

...
<head>
    <meta charset="UTF-8"/>
    <title>Cristina Deutekom - TheaterEncyclopedie</title>
    <script>
...

Het toevoegen van meer tags (naast een - aangepaste - title-tag) kan zinvol zijn voor (Google) SEO:

  • De meta description; wordt weergegeven in zoekresultaten van bijv. Google
  • De metatag ‘robots’; no-index / no-follow op sommige pagina's (inloggen, ... ??); afstemmen met robots.txt
  • De title tag; wellicht aanpassen ("wiki")
  • Meta keywords; wordt over het algemeen als nutteloos voor SEO gezien
<meta name=’description’ content=’ ... twee regels beschrijving ... '>
<meta name=”robots” content=”noindex, nofollow” /> <!-- op te selecteren pagina's -->

NB: Wanneer er geen meta description aanwezig is kiest Google automatisch het begin van de (leesbare) tekst. Het is dus niet zo dat er nu geen beschrijving wordt weergegeven!

Technische oplossing

Extensies:

Structured data

Het toevoegen van open graph/meta-data/semantics:

  • Facebook Open Graph,
  • Google+
  • Twitter Card Tags

Toegevoegde waarde onderzoeken. (Semantic) MediaWiki / TE geeft standaard RDF mee:

<link rel="alternate" type="application/rdf+xml" title="Cristina Deutekom" href="/w/index.php?title=Speciaal:RDFExporteren/Cristina_Deutekom&xmlmime=rdf"/>


Snelheid van de website

De laadsnelheid van de website bepaalt voor een deel de ranking in zoekmachines. Er zijn verschillende onderdelen van de TE, die in aanmerking komen om te "versnellen"; dit zijn de belangrijkste:

  1. Het CMS MediaWiki - zie hiervoor de documentatie over Performance tuning
    • Object caching (standaard configuratie)
    • Bytecode caching voor PHP
    • Pageview caching (helpt specifiek voor niet ingelogde gebruikers)
    • Diverse mogelijkheden voor caching van webserver en database server
  2. Semantic MediaWiki - zie hiervoor de documentatie over Speeding up Semantic MediaWiki
    • Gebruiken van "Concepts" voor het versnellen van de uitvoering van queries op grote datasets
    • Vormgeving (formattering) van gegevens t.b.v. de weergave
  3. Overigen (?)

Het is natuurlijk altijd goed om de snelheid van MediaWiki te optimaliseren, maar de in de gebruikservaring is momenteel (2021) vooral een verlengde laadtijd merkbaar bij pagina's met veel Semantische queries. Het gaat hier bijvoorbeeld om plaats-pagina's en jaarpagina's e.d. Vermoedelijk zullen ook personen-pagina's met een (semantische query voor de) biografie een merkbaar langere laadtijd krijgen. Hetzelfde geldt voor premiere overzichten op locatie-pagina's.

Omdat de TE een aantal grote dataset's (dwz. "categorieën", zoals producties en personen) bevat, kan het gebruik van "concepts" en "concept caching" een grote verbetering van de laadsnelheid betekenen. Zie hiervoor TE:Concepten.

Rode links / HTTP 404

De vele rode links (ontbrekende pagina's) veroorzaken (soft?) HTTP-404 errors ("Page not found"). Dit is mogelijk nadelig voor de page ranking door een zoekmachine als Google.

Oorzaak:

Oplossingen:

  • Pagina's aanvullen
  • Andere definitie van semantische eigenschap (niet als pagina maar als text)
  • Gebruik van parserfunctie (alleen link weergeven indien de pagina bestaat)