Aktuellt

Digitaliseringen av STM

Digitaliseringen av STM är ett samarbetsprojekt mellan Samfundet och Statens musiksamlingar och sker med bidrag från Helge Ax:son Johnsons Stiftelse. Målet är att göra artiklar och annat innehåll tillgängligt i ett arkiv för forskare och allmänhet. På grund av det arkivaliska syftet tillämpas en rullande gräns vid tre senaste utgivningsåren. För innehållet i löpande årgångar hänvisas till Svensk musikhistorisk bibliografi (se söktips) och referat i RILM abstracts.

Lena Forsgren vid Svenskt visarkiv har överinseendet över skanningen. Arbetet har utförts av henne, Hannah Öhrman samt Klara och Olle Lundberg. De inskannade bilderna överensstämmer inte till 100% med trycksidorna - om detta är väsentligt bör man alltså gå till den tryckta tidskriften. Tidigare årgångar tillbaka till 1919 liksom annat innehåll än artiklar och recensioner är under arbete.

Teknisk information

De artiklar som r skannade r bearbetade i ett s.k. OCR-program som knner igen bokstverna och p s stt terskapar den ursprungliga texten. Det r drfr som PDF:erna verhuvudtaget r skbara.

Som skanner har anvnts en Canon CanoScan 9900 F och upplsningen varierar mellan 400 och 600 dpi beroende p tryckkvalitet. Ju mindre och/eller otydligare tryck desto hgre upplsning krvdes fr att OCR-programmet skulle uppfatta texten utan alltfr mnga fel.

OCR-programmet som har anvnts heter Adobe Acrobat Capture. Till skillnad frn den mesta OCR-mjukvaran kan man med detta program vlja att bevara den skannade bilden som den r, i stllet fr att bygga upp en helt ny textfil. Den skbara texten ligger i ett lager bakom bilden, skulle man kunna sga.

Fr att underltta fr OCR-programmet och samtidigt hlla filstorleken nere har de skannade sidorna omvandlats till helt svartvita bilder (i stllet fr grskaliga). Detta gller inte sidor dr illustrationer och fotografier frekommer. I de fallen har texten gjorts svartvit men den skannade sidan som helhet har ftt behlla grskaligheten. Detta frklarar varfr somliga PDF:er (de med bilder) r mycket strre n andra.

Bildfiler tar ju visserligen mycket strre plats n textfiler, men en av de strsta frdelarna med denna teknik r att det inte gr lika mycket om det smyger sig in korrekturfel, eftersom dessa inte syns p skrmen.

Vi r vl medvetna om att det frekommer korrekturfel i den underliggande texten. Endast de ord som programmet har uppfattat som "misstnkta fel" har rttats. Ytterligare korrektur skulle dessvrre ha varit alltfr tidskrvande. Detta drabbar naturligtvis skbarheten, som allts inte r hundraprocentig. Vnligen ha det i tanke nr ni lser dessa artiklar! Vi r naturligtvis tacksamma fr alla tips om ev. felaktigheter.

Lena Forsgren
2006-08-15