Een aan Wikidata gekoppelde thesaurus voor audiovisuele archieven

Content

""

Beeld en Geluid beheert sinds jaar en dag een eigen thesaurus om de eigen collectie van audiovisueel erfgoed te beschrijven. Deze Gemeenschappelijke Thesaurus voor Audio - visuele Archieven (GTAA) wordt ook door andere collectiebeherende instellingen gebruikt.

Voor het publieke domein

In de GTAA komen ruim 130.000 persoonsnamen voor. Door deze persoonsnamen te koppelen aan andere data - bronnen worden er heel nieuwe toepassingen mogelijk. Zo wordt de auteursrechtelijke status van een audiovisueel werk duidelijk als de sterfdatum van de auteur bekend is. Zeventig jaar na het overlijden van een maker komt materiaal in het publieke domein. Jaarlijks worden de medewerkers van Beeld en Geluid erop gewezen voor welke werken de auteursrechten op deze manier verlopen.

Hoe werkt het?

Om dit te bereiken koppelde Beeld en Geluid de GTAA aan Wikidata (wikidata.org) met Linked Data-technieken. In Wikidata bevatten personen naast namen vaak aan - vullende informatie die niet, of in ieder geval niet gestructureerd beschikbaar is binnen de bronnen van Beeld en Geluid. Denk daarbij bijvoorbeeld aan geboorte- en sterftedata, beroepen, geslacht en lidmaatschap van politieke partijen. Behalve uitgebreider, is de informatie op Wikidata over personen ook actueler doordat een grote community van vrijwilligers de data continu bijhoudt.

Door zoektechnologie van Spinque heeft Beeld en Geluid zoveel mogelijk geautomatiseerde overeenkomsten gemaakt tussen personen in de GTAA en Wikidata. Daarbij werd gebruik gemaakt van de zogenaamde ‘scope notes’ uit de thesaurus, die zeer beknopte informatie bevatten over personen. Maar ook werd informatie uit de catalogus gehaald: woorden die vaak voorkwamen in combinatie met de betreffende persoon, of rollen die de persoon speelde in diverse producties.

Dankzij Linked Data kan je in audiovisueel erfgoed gedetailleerd en up-to-date zoeken op personen.

Deze overeenkomsten werden aan de Wikidata-community aangeboden die er binnen enkele maanden ruim 30.000 heeft goedgekeurd. Dit aantal groeit nog dagelijks. Met deze verrijkte data kan Beeld en Geluid nu heel nieuwe dingen doen zoals het afleiden van het auteursrecht uit de sterfdatum van de maker.

Ook biedt de gekoppelde data geavanceerde zoek - mogelijkheden. Door middel van SPARQL-queries kan op Wikidata bijvoorbeeld een lijst uitgevraagd wor - den van vrouwen die lid van de VVD zijn, als beroep ‘politica’ hebben en geboren zijn in de jaren 80. Dergelijke zoekvragen kunnen onderzoekers helpen bij het vinden van het juiste materiaal voor hun onderzoek

Tenslotte vereenvoudigt de koppeling ook het onder - houd aan de GTAA. Het invoeren en beheren van de eerdergenoemde ‘scope notes’ is arbeidsintensief en foutgevoelig. Door te linken naar Wikidata heeft Beeld en Geluid deze werkdruk kunnen verlagen.

De toekomst

De komende jaren verwacht Beeld en Geluid ook eigen datadonaties aan Wikidata te kunnen maken van veel voorkomende personen uit haar media-archief. Ook zal worden gekeken naar de mogelijkheid van het koppelen van andere aspecten van de GTAA. Wikidata bevat in veel gevallen meerdere thesauri of databases bij personen. Wikidata kan dus als tussenlaag dienen om de collectie van Beeld en Geluid met nog weer andere databronnen te verbinden

Parels van Linked Data Toepassingen

Dit verhaal is geschreven in samenwerking met Platform Linked Data Nederland

""

Documentatie-type