Samlarna - Sjöhistoriskas blogg

Bakom kulisserna på Sjöhistoriska

Nu är skanningen av skeppslistor i full gång

13-dec-2019.jpg

Skeppslistorna är en guldgruva för de intresserade av vårt maritima arv samt släktforskare. På nätet kan man i dag söka i listorna för årgångarna 1837 till 1885. Sedan en tid arbetar vi med ett projekt där dessa skall kompletteras med de närmast efterföljande årgångarna och ett stycke in på 1900-talet. Till det har vi hjälp av Järnvägsmuseivänner att skanna med ekonomiskt stöd från Sjöhistoriska museets vänförening. 

Årgångarna kommer i ett första steg att vara sökbara på museets hemsida i PDF-format där man redan idag hittar Stockholms skeppslista från åren 1818, 1819, 1821, 1825, 1826, 1831 och 1835. Materialet behandlas sedan vidare för leverans till Landsarkivet i Lund som fyller på databasen Skeppslista 1837-1885 som sedan många år är sökbar på nätet.

Denna Nobeldag tog jag tåget upp till Gävle genom ett soligt snölandskap för att hämta listor som skannats in och leverera nya. Varmt välkomnad av Lennart, Annelie och Daniel (Björn som också arbetar i projektet var i dag tyvärr inte med) blev jag rundvisad bland skanningsutrustningen. Jag som bara brinner för att tillgängliggöra innehållet i skeppslistorna har verkligt liten kunskap i arbetet bakom tillgängliggörandet. Det visade sig vara betydligt fler moment och innebära mycket mer handpåläggning än jag hade kunnat föreställa mig. Listorna har biblioteksbundits och blivit lite för tätt bundna vilket innebär mycket arbete med att få sidorna skanningsbara på ett sätt så att allt kommer med. Vi är också rädda om böckerna, bl.a. därför levereras och hämtas de personligen. Vid skanningen läggs de på en fluffig kudde för att ryggen inte skall brytas. Det blir lite instabilt, för att ligga rakt på alla håll och kanter krävs mycket justering. Horisontellt skall det också vara åt alla håll för att kolumnerna skall bli raka och läsbara för programmet. Vattenpass är oundgängligt. Med hjälp av programmet ABBYY FineReader OCR-behandlas PDF-er så man sedan skall kunna söka i dem.

Skeppslistorna är på lite drygt 300 sidor så det är ett tålamodsprövande arbete. Nu är redan sju årgångar skannade. Några är färdiga OCR-behandlade PDF, men innan de kan sägas vara färdiga krävs det mycket korrläsning! Nedflyttningstecken är t.ex. meningslösa för att dokumenten skall vara sökbara och måste bytas ut till det de har ersatt i listorna. Tolkningen av de olika typsnitten kan också bli lite tokig. Men tänk programmet förstår bindestreck och läser i de fallen ihop orden. Vi jobbar delvis med artificiell intelligens!

I ett nästa steg konverteras PDF-erna till Exceltabeller vilket kräver ytterligare behandling i form av separering av olika slags information som nu ligger i samma kolumn vilket man hoppas kunna göra ett skript för, för automatisk separering. Det är en hel del teknik och det behärskar våra kolleger anställda av Järnvägsmuseivänner!

Vart efter PDF-erna blir klara kommer de att hittas på samma ställe som Stockholms skeppslistor i dag finns: https://www.sjohistoriska.se/samlingar/bibliotek/skeppslistor (extern länk)

Så småningom skall också databasen Skeppslista 1837-1885 fyllas på med uppgifterna från dessa senare årgångar:

 http://ddss.nu/ships/shipsSearch  (extern länk)