Museisamlingar som länkade öppna data

Skrivet av Linnéa Lundin

Det här är det fjärde blogginlägget i en serie om digitalisering på museer – med exempel från oss på SHM. Det första inlägget var en introduktion till digitalisering på museer, det andra handlade om digital förmedling av museisamlingar och det tredje om digitalisering av text och arkiv på museer. Idag ska jag berätta om hur vi på SHM jobbar med länkade öppna data, för det är det enklaste sättet du kan tänka dig.

Fördelarna med länkade öppna kulturarvsdata

Att länkade öppna kulturarvsdata är en bra grej som underlättar användbarheten för institutionernas digitaliserade material är ingen nyhet. Många har redan sagt det, och bättre än mig. I Digisams Vägledning till ett sammanlänkat kulturarv finns följande stycke att läsa:

[Länkade öppna kulturarvsdata gör det] möjligt att bygga digitala tjänster som baseras på data från en mängd olika aktörer, exempelvis kulturarvsinstitutioner. Det innebär också att användarna inte behöver leta runt på olika kulturarvsinstitutioners webbplatser för att hitta information om en specifik företeelse. Istället kan de söka fritt i och ställa frågor till den totala mängden publicerade data utan att behöva veta vad som förvaltas hos vilken institution. Då blir det till exempel möjligt att skapa specifika sökingångar för personer, platser eller tidsperioder som hittar information från våra olika datakällor. Dessutom kan användarna få information presenterad för sig som de inte visste fanns men som relaterar till den företeelse de inledningsvis sökte efter. I förlängningen innebär det att kulturarvsinstitutionernas information kan få större räckvidd och ökad synlighet, samt bidra till en ännu bättre helhetsbild av vårt gemensamma kulturarv genom att kopplas till hela det nätverk av information och data som internet består av. (s. 2-3).

Beständiga URI:er, maskinläsbarhet och kopplingar till andra

Kuriosakabinett på Skoklosters slott med dödskalle, uppstoppad fågel, snäckor, burkar med innehåll och spelkort.

Kuriosakabinett på Skoklosters slott. CC BY Erik Lernestål.

Under de senaste åren har vi efter databasbyte utvecklat en ny hemvist på internet för myndighetens samlingar – Sök i samlingarna. Vi publicerar löpande nya dataset och termlistor kopplade till dessa dataset på Sök i samlingarna. Hittills har vi publicerat Media, Föremål, Personer och institutioner, Geografisk thesaurus, Fältinsamlingar/Undersökningar, Arkeologiska kontexter och Förvärv. Alla dessa olika ”typer” av data har en egen form av beständiga identifierare. Identifierarna är uppbyggda av varje dataobjekts globalt unika ID, med ett förled som talar om vilken typ av dataobjekt det är. Detta är objektets URI.

Än så länge är dataobjekten som vi publicerat inte maskinläsbara via Sök i samlingarna. Förhoppningsvis kan vi inom kort erbjuda tillgång till ett öppet API med samma information som publiceras i Sök i samlingarna, men maskinläsbar.

Trots detta kan vi ändå erbjuda våra användare mycket av den information som relaterar till SHM:s samlingar i maskinläsbart och användbart format, och sammanlänkat med annan för användaren relevant information. Det gör vi genom att se till att informationen som vi förvaltar finns på andra, redan existerande, välkända och välanvända plattformar.

Wikidata

Jag har tidigare skrivit om vårt arbete med Wikidata som vi genomför i samarbete med Nationalmuseum och Wikimedia Sverige. En introduktion till projektet finns här och en uppdatering under arbetet med personkopplingar här. Idag har vi 16 476 person- och platsobjekt i vår databas matchade med, och publicerade på, Wikidata. Det enda vi har behövt för att åstadkomma detta är URI:erna till våra dataobjekt publicerade på internet samt tid till själva matchningsarbetet (ca en 75%-tjänst under 1,5 år).

Med denna relativt ringa insats har vi alltså skapat oöverträffade möjligheter för användare intresserade av personer, institutioner eller platser relaterade till våra museers samlingar att analysera, beräkna, visualisera och berika vår data.

Detalj ur utställning på Historiska museet. Runskrift och oskarpt guldblänk i bakgrunden.

Detalj ur utställning på Historiska museet. CC BY Ola Myrin.

De drygt 16 000 dataobjekt som är kopplade mellan oss och Wikidata sätter våra museers samlingar i ett sammanhang där hela världens kunskap finns. En användare kan, helt fritt och utan kunskap om att våra museer ens existerar, och på nästan vilket språk som helst, tillgodogöra sig information om dessa dataobjekt.

En användare intresserad av personen Gustav II Adolf kan med hjälp av Wikidata hitta samlad och strukturerad information om denna person, från en mängd olika användare och institutioner runt om i världen. Användaren kan också, istället för att på egen hand lista ut vilka institutioner världen över som har data som rör Gustav II Adolf, se listan över de 109 databaser på internet som meddelat att de har någon information om Gustav II Adolf genom att göra just sådana matchningar som vi har gjort. Och eftersom datat är strukturerat finns information och länkar till andra personer som har med Gustav II Adolf att göra, platser, bilder, händelser, föremål – ja, allt möjligt.

Denna oöverträffade användbarhet kan du åstadkomma med någorlunda beständiga länkar till dina dataobjekt på internet och tid till matchningsarbete mot Wikidata i OpenRefine. Du behöver inte bygga egna dyra plattformar som kräver förvaltning och underhåll, som genererar lagrings- och serverkostnader, som kräver kontinuerlig utveckling och som är utdaterade inom tre år och som ändå aldrig kan tävla mot öppna och redan väletablerade plattformar.

Det digitala kulturarvet ställt på sin spets

Detalj ur utställning på Livrustkammaren. CC BY Jens Mohr.

Utvecklingen av det digitalt tillgängliga kulturarvet har kommit långt (i alla fall i teorin, även om många av oss inte är 100% där i praktiken ännu). Vi kan äntligen göra det som vår profession länge har drömt om – se sambanden mellan kulturarv världen över, sudda ut institutionsgränser och språkbarriärer och låta användare ta del av och lära av historien oavsett vem av oss som förvaltar specifika objekt.

Det är inga nyheter att digitalt tillgängligt kulturarv i form av sammanlänkade data på öppna plattformar är ”the way to go”. Detta kan ju knappast anses vara kontroversiellt längre. Och ändå blir det på något sätt kontroversiellt eftersom själva grunden i öppna länkade kulturarvsdata dekonstruerar bilden av vad ett museum är. Museet i sig blir oviktigt i sammanhanget och användaren hamnar istället helt i fokus.

Jag tror att många institutioner redan har, eller enkelt kan skaffa sig, praktisk kompetens att genomföra denna typ av projekt. Vi som arbetar med matchningar och uppladdningar till Wikidata på SHM är helt vanliga museitjänstepersoner av typen ”databasadministratörer” och ”digitaliseringssamordnare” som redan finns på många institutioner. Det som krävs är att institutionerna prioriterar detta arbete.

Vill du testa att gör samma sak som vi har gjort på ditt museums datamängder? Kom då till vårt seminarium den 11 november 2022, kl 9-12, på Historiska museet. Vi börjar med att presentera vad vi gjort hittills i projektet och visa visualiseringar och analyser av våra matchade datamängder. Sedan avslutar vi med en workshop i OpenRefine där du kan testa samma metod på dina egna datamängder. Mer info och anmälan HÄR.