Slutfas för Användbara auktoriteter för datadriven samlingsforskning

Skrivet av Linnéa Lundin

Snart har tre år av FoU-projektet Användbara auktoriteter för datadriven samlingsforskning gått. Samtidigt som vi fortsätter arbeta med att matcha auktoritetsposter till Wikidata börjar vi också så smått sammanställa, paketera och utvärdera projektets resultat.

I det här inlägget tänkte jag backa tillbaka till de ursprungliga mål vi satte upp för projektet redan i ansökan, och titta på hur det har gått att uppfylla målen hittills.

Om det här är första gången du hör talas om projektet rekommenderar jag de tidigare inläggen.

Metod, infrastruktur & avgränsning

Mål 1: Utveckla en dokumenterad, testad, och till olika museers behov anpassningsbar metod för att länka samman personauktoriteter från olika museisystem.

Metoden som vi har använt oss av och förfinat i projektet är mycket anpassningsbar och kan med små förändringar passa många kulturarvsinstitutioner som vill använda Wikidata för att koppla sina auktoritetslistor till ett större sammanhang och påbörja arbetet med länkade öppna data

Eftersom SHM:s och Nationalmuseums infrastrukturer för digitala samlingar ser väldigt olika ut har vi kunnat säkerställa att den metod som använts och utvecklats i projektet fungerar för två vitt skilda typer av system.

I projektet har vi använt oss av OpenRefine för att matcha de egna auktoritetsposterna med entiteter i Wikidata. OpenRefine är ett fritt verktyg i öppen källkod skapat för att arbeta med datamängder. Med hjälp av OpenRefine kan man bland annat städa data, transformera data till andra format och koppla data till externa webbtjänster som t ex Wikidata.

Planen för de kommande sista månaderna av projektet är att steg för steg, så detaljerat som möjligt, dokumentera metoden och de olika anpassningar som gjorts för de båda deltagande institutionerna. Den slutgiltiga produkten blir ett antal fritt tillgängliga filmer som kan följas av den som vill testa projektets metod. När filmerna är klara och tillgängliga får ni såklart läsa om det här på bloggen.

Mål 2: Tillgängliggöra hela SHM:s personauktoritet på webben, med persistenta identifierare för varje persondataobjekt.

Det krävs inte mycket för att en institution ska kunna komma igång med att koppla sina auktoritetsposter till Wikidata. Det egentliga kravet är att auktoritetsposterna finns fritt publicerade på internet med unika länkar till varje post/sida där konceptet/auktoriteten beskrivs.

Vi lanserade SHM:s personauktoriteter tidigt i projektet och följde sedan upp med att publicera alla andra typer av auktoriteter som SHM håller i sin databas.

Utöver att auktoritetsposterna är publicerade på internet är det såklart önskvärt att institutionen kan garantera länkarnas persistens, och har en plan för att förvalta de länkar som används vid kopplingen till Wikidata även vid ett eventuellt framtida systembyte på institutionen. Detta gör vi genom att förvalta alla nuvarande och gamla länkar i vårt samlingsförvaltningssystem och se till att omdirigera alla länkar från våra äldre system.

En stor del av arbetet i projektet har också handlat om att se till att auktoritetsdatabaserna hos de båda deltagande institutionerna är städade och fria från t ex dubbletter innan vi kopplar till Wikidata. För att inte av misstag skapa döda länkar när vi städar dubbletter, dvs att en auktoritetspost som varit publicerad på internet ”tas bort” om det visar sig att posten i fråga var en dubblett, så raderar vi aldrig några auktoritetsposter. Istället kopplar vi ihop dubblett-posten med den ”föredragna” posten och gör en omdirigering så att den användare som försöker nå dubblettposten automatiskt hamnar på den ”föredragna” posten.

Mål 3: Via Wikidata länka samman alla Nationalmuseums och Statens historiska museers auktoritetsposter för personer födda 1500 – 1800.

När vi skrev ansökan för projektet och satte dessa mål ville vi ha en tydlig avgränsning för vilka auktoritetsposter vi skulle arbeta med, både för att vi var oroliga för att inte hinna matcha allt om vi lovade för mycket, och för att vi kände att vi ville göra en avgränsning där vi redan innan projektets start förstod att det skulle finnas mycket överlappningar, samband och kopplingar mellan de båda deltagande institutionernas samlingar.

Det visade sig ganska snabbt att det inte skulle vara några som helst problem vare sig med att hinna genomföra matchningar eller att hitta intressanta samband mellan samlingarna.  Vi utvidgade vårt matchningsarbete till att framför allt inkludera personer oavsett levnadstid samt geografiska platser. Men vi har utöver det även hunnit matcha en hel del institutioner, historiska händelser och föremål.

Tack vare att vi kunde utöka vår avgränsning avsevärt fick vi också en av projektets mest glädjande insikter – överlappningar, samband och kopplingar mellan de båda institutionernas samlingar fanns på oväntade ställen, även där vi inte hade förutsett att de båda samlingarna skulle ha gemensamma nämnare. Att till och med vi, som redan innan projektets start var övertygade om fördelarna med ett sammanlänkat kulturarv, blev överraskade av vilka samband vi kunde se mellan de båda institutionernas datamängder, tycker jag talar sitt tydliga språk.

Visualiseringar

Mål 4: Producera och dokumentera minst 5 visualiseringar av datamängden och som visar på möjligheterna med länkade öppna persondata.

I projektet har vi hittills skapat 14 olika visualiseringar och vi planerar ytterligare ett par stycken innan projektet är slut. Visualiseringarnas främsta syfte är att visa på vilka möjligheter som skapas när man kopplar sina auktoriteter till Wikidata. Vi har velat visa både på fördelarna för institutionen själv och för de användare som vill bearbeta och analysera institutionens information. Alla visualiseringar har producerats av Albin Larsson och de fungerar som exempel på vad användare, forskare och utvecklare kan göra med institutionernas information när den finns tillgänglig på Wikidata, och vilka mervärden det kan skapa för användarna och även för institutionerna själva.

→ Utforska alla visualiseringar här.

Interoperabilitet mellan samlingarna

I visualiseringen Föremålsjämförelse kan vi på ett enkelt sätt visa på den typ av interoperabilitet mellan museisamlingar som uppstår när institutioner kopplar sina auktoritetsposter till Wikidata. Visualiseringen exemplifierar med möjligheten att utgå från tre personer som finns i såväl Nationalmuseums som Statens historiska museers personauktoritetslistor. I visualiseringen ser vi föremål från de båda samlingarna – hur olika eller lika de är, och hur museernas olika samlingstyper kompletterar varandra för att ge en helhetsbild av den valda personens liv och verksamhet.

Wikidataeffekten – berikning för institutionen

Visualiseringen Wikidataeffekten ger oss ett exempel på hur mycket mer information och kunskap om en auktoritetspost som kan genereras genom att koppla sig till Wikidata. Institutionerna har oftast inte som sitt huvudsakliga uppdrag att registrera och förvalta kunskap om person- eller platsposter, utan dessa informationstyper är till för att komplettera och öka kunskapen om samlingarna i sig. Ett museum kanske bara har ett fåtal informationspunkter om en person i den egna databasen, men vi kopplingen till Wikidata kan institutionen ta del av och erbjuda sina användare tusentals statements från Wikidata och vidare till alla andra institutioner som också kopplat sig till samma auktoritet.

Kartor

Projektet har producerat flera olika kartvisualiseringar. Genom visualiseringen Konstnärsliv kan vi utforska konstnärer i samlingarna och upptäcka att de ofta föddes i en mindre stad, men dog i en storstad. Vi kan bland annat se hur konstnärer samlats i storstäder som Paris eller München under sin karriär och utbildning. Dessa datakopplingar ger oss kunskap om vilka geografiska punkter som knyter dem samman under deras levnadsår.

I visualiseringen Konstnärskartor har projektet plockat in såväl person- som platsauktoriteter. På en karta kan vi se var en viss konstnär verkat, i vilka samlingar verken finns representerade, var konstnären utbildats samt vilka platser olika verk avbildar. Det ger oss möjlighet att följa en konstnärs avtryck i Sverige och runt om i världen. Vi kan även koppla ihop avbildade platser med konstverken. Kopplingarna ger oss kunskap om platser där konstnärer arbetat, avbildat och vart i världen de finns att se.

Resultat & kommunikation

Mål 5: Producera en kvalitativ undersökning om huruvida sammanlänkning av auktoritetsdata i projektet är hjälpsam för forskning.

Förutom att producera ett antal utbildningsfilmer där den som intresserad kan följa med i projektets arbetsmetod ska vi de kommande avslutande månaderna av projektet sammanställa resultatet av den enkät som vi just nu har ute. Vi önskar att alla som är minsta intresserade av vårt projekt, av länkade öppna data, kulturarvsdata, digital humaniora och forskning på området svarar på enkäten. Det tar 5-10 minuter att svara och du är anonym. Vi hoppas att resultatet av enkäten kan hjälpa oss att se vilka tendenser som finns hos användare, forskare och andra intressenter där ute, och på så sätt hjälpa oss att anpassa vårt fortsatta arbete med länkad kulturarvsdata så att det blir så värdefullt som möjligt för så många som möjligt.

→ Svara på enkäten här.

Mål 6: Genomföra föreläsningar, workshops och andra kommunikationsinsatser för att öka förståelsen i museibranschen och forskarsamhället för fördelarna med att använda länkade data-kompatibla auktoriteter och vokabulärer samt samarbeta med Wikidata.

Projektgruppens medlemmar har deltagit vid ett antal olika konferenser, seminarier och workshops och presenterat projektets arbete. Vi har också själva arrangerat några välbesökta och uppskattade seminarier och workshops.

CC BY Erik Lernestål

Vår senaste i raden av kommunikationsinsatser är dels att Nationalmuseum på sina sociala media-plattformar (LinkedIn, Facebook och Instagram) förmedlar en inläggsserie om projektet, dels att två av projektmedlemmarna deltog i MuseumNext Digital Collections Summit 2023 och visade en förinspelad presentationsfilm om projektet för en stor, internationell publik. Projektet blev mycket väl emottaget på MuseumNext och delegaterna från de olika kulturarvsinstitutionerna runt om i världen var engagerade i den frågesession som följde efter presentationen.

→ Titta på MuseumNext-filmen på YouTube.

Projektet har fått stort genomslag hos våra ”digitala” kollegor på kulturarvsinstitutioner runt om i landet, och vi är så tacksamma för alla glada tillrop vi får, och allt intresse ni visar för vårt arbete – det gör jobbet så mycket enklare och roligare – tack!

Användning

Aktivitet: Skapa och dokumentera komplexa sökningar baserat på konkreta forskningsfrågor.

Slutligen vill jag prata om en sak som visserligen inte var en konkret målformulering i ansökan, men som ändå passar in bra här i samband med målen. En aktivitet som vi utlovade att vi skulle genomföra i projektet var att skapa och dokumentera komplexa sökningar baserat på konkreta forskningsfrågor. Detta har vi oundvikligen gjort under hela projektets gång, och jag tänkte länka till några av mina favoriter när det gäller personauktoriteter här i inlägget.

Visualiseringarna som vi pratade om tidigare är exempel på hur användare och utvecklare kan tillgängliggöra, visualisera och bearbeta kulturarvsinstitutionernas data när den finns tillgänglig via Wikidata. Men man behöver såklart inte utveckla egna visualiseringar för att ta del av, söka i och även enkelt visualisera informationen i Wikidata. Wikidatas egen frågetjänst erbjuder flera inbyggda funktioner för att utforska data.

I Wikidatas frågetjänst kan du skapa såväl enkla som komplexa sökningar. När institutionernas auktoritetsposter finns kopplade till Wikidata kan användare genom en enskild plattform söka tvärs igenom olika institutioners data.

Färdiga SPARQL-frågor

Här presenteras ett antal exempel på frågor som nu kan ställas till Nationalmuseums och Statens historiska museers samlingar via Wikidatas frågetjänst. Frågorna ställs på frågespråket Sparql och kan anpassas och utvecklas efter användarens önskemål. Tryck på länkarna för att komma till frågetjänsten och den färdiga sökningen. Tryck på ”play-ikonen” för att utföra frågan och se resultatet.

Alla personauktoriteter i SHM:s samlingar som kopplats till Wikidata.

Alla personauktoriteter i NM:s samlingar som kopplats till Wikidata.

Alla personauktoriteter som överlappar, dvs finns i båda institutionernas samlingar, i ett bildgalleri.

Personauktoriteter i antingen NM:s eller SHM:s samlingar uppdelade efter kön i cirkeldiagram.

Personauktoriteter i antingen NM:s eller SHM:s samlingar uppdelade efter yrke i cirkeldiagram.

Födelseplatserna för personauktoriteter i antingen NM:s eller SHM:s samlingar, utpekade på karta.

Födelseplatserna för personauktoriteter som överlappar, dvs finns i båda institutionernas samlingar, utpekade på karta.

Personauktoriteter som överlappar, dvs finns i båda institutionernas samlingar, uppdelade efter födelseland i cirkeldiagram.

Lista över alla gravörer och tryckare som överlappar, dvs finns i båda institutionernas samlingar.