Základem je kvalitní digitální kopie
Městská knihovna v Praze (MKP) už rok provozuje Oddělení digitalizace. Jedná se o vlastní digitalizační pracoviště, které pokryje proces digitalizace dokumentů od A do Z: od naskenování originálu, přes úpravy skenů, zpracování metadat a vyčtení OCR až po export dat pro zpřístupnění v digitální knihovně. Digitální knihovna, využívající aplikaci Kramerius, je ve zkušebním provozu spuštěna od 1. prosince 2008. Přístup do ní je přes webové stránky MKP, konkrétně prostřednictvím adresy http://www.mlp.cz/digi.
Samotné pracoviště a projekt HISPRA, v jehož rámci bylo vybudováno, je zhruba představeno na webových stránkách MKP na téže adrese, tj. http://www.mlp.cz/digi. Na tomto místě bych se chtěla podělit o naše zkušenosti se skenery, které pro svou práci používáme. Jedná se především o postřehy z provozu, nikoliv o důslednou analýzu. Tímto příspěvkem „na okraj“ tématu bych ráda podpořila kolegyně a kolegy, kteří uvažují o nákupu knižního skeneru.
Základní rozhodnutí
Přiznávám, že rozhodnutí a postupy MKP se budou v některých směrech jevit možná neobvykle a nestandardně, leč všem rozhodnutím předcházelo testování, dlouhé diskuze a vyhodnocování zkušeností z jiných institucí a projektů. Naše základní paradigmata zní:
- Vstupní – archivní snímek je pořizován na 600 dpi do formátu JPG na minimální kompresi;
- výstupním formátem po zpracování metadat je rovněž JPG konvertovaný na velikost 2048 x 1536 pxl;
- většinu předloh skenujeme jako osmibitový obraz v 256 odstínech šedi;
- snímky stránek jsou pořizovány s několikamilimetrovým vnějším okrajem, aby byla zachována autentičnost stránky;
- sken je pořizován tak, aby nebyla nutná grafická korekce, vyjma případného vyrovnávání řádek pro potřeby vyčítání textu (OCR).
Tyto základní požadavky lze splnit pravděpodobně na všech běžných a knižních skenerech. Jak jsme se ale přesvědčili, ve hře je samozřejmě daleko více parametrů a veličin, které výsledný obrázek ovlivňují.
Zkušenosti z prvního roku skenování
V prvním roce (2008) projektu HISPRA jsme pro skenování používali dva skenery koupené na základě výsledků výběrového řízení na podzim 2007. Jednalo se o skenery značky Minolta a Zeutschel.
Zeutschel OS5000 TT umožňuje skenování ve škálách šedi, a to formátů do velikosti A2. Kniha se vkládá do ručně ovládané kolébky a vyrovnává se manuálně nebo automaticky ovládaným přítlačným sklem. V závislosti na velikosti předlohy se nastavuje výška skenovací hlavy nad předlohou, zaostření a podle světlosti skenovaného dokumentu také clona. Skenování je umožněno do příslušného SW Omniscan 11 (OS 11). Přístroj bezvadně skenuje textové předlohy a běžné ilustrace. U ostatních předloh – zejména fotografií – je zapotřebí důsledná příprava a nastavení skeneru, aby elektronická kopie byla optimální.
Skener Minolta PS 5000 C byl zpočátku favoritem našeho oddělení. Především díky své jednoduchosti v ovládání a možností skenovat přes twain do běžných grafických programů. V obecné charakteristice se jedná o plnobarevný skener s automatickým ovládáním kamery a ručním nastavováním kolébky i přítlačného skla. Během pár měsíců užívání se objevily dva hlavní problémy:
- Nutnost časté kalibrace ve vztahu k barevné věrnosti,
- Neostrost textu jevící se především při zvětšených náhledech.
Druhý problém nebyl bohužel vůbec odstraněn a po konstatování dodavatele, že se jedná o charakteristickou vlastnost tohoto typu skeneru, který není svou konstrukcí určen pro pořizování snímků archivní kvality, jsme se rozhodli pro projekt HISPRA pořídit skener nový tak, aby nevyhovující Minoltu nahradil a předčil.
Výměna skenovacího zařízení
Vzhledem k tomu, že pracoviště a jeho provoz je dotované z Finančních mechanismů Evropského hospodářského prostoru a Norska, bylo nutné plánovanou změnu projednat na příslušných místech. Během těchto jednání již probíhalo testování přístrojů, které připadaly pro náš záměr v úvahu.
Protože naše zkušenosti se skenerem Zeutschel byly pozitivní, rozhodli jsme se vyzkoušet novější a plnobarevný model. Zároveň nás na Inforu oslovil skener značky BookEye, proto jsme i ten přidali do testovací dvojice.
Oba přístroje jsme díky ochotě dodavatelů měli možnost vyzkoušet přímo na našem pracovišti, což bylo velice příjemné a přínosné. Po naskenování několika stovek stránek a vzájemném porovnávání strojů Minolta, Zeutschel a BookEye jsme se přiklonili k posledně zmiňovanému přístroji. Bylo to mimo jiné i proto, aby naše vybavení bylo různorodé a my jsme tak mohli využívat jak výhod stávajícího Zeutschelu pořízeného na počátku projektu, tak výhod nového zařízení jiné značky.
Volba pro BookEye
Skener BookEye 3 A2 je barevný skener určený pro skenování dokumentů o velikosti do rozměrů A2. Pro manipulaci s knihou je k dispozici automaticky ovládaná kolébka a přítlačné sklo. Osvitové lampy jsou charakteru studeného LED osvětlení. Světelný paprsek se pohybuje po předloze spolu s procesem snímání. Skener lze ovládat přímo z přístroje, nožním pedálem nebo softwarově. Skener je zapojen síťově a příslušenstvím je vlastní skenovací SW BCS-2. Mezi operátory Oddělení digitalizace MKP se BookEye stal oblíbeným z několika důvodů:
- kolébka je ke knihám velice šetrná díky přesnému ovládání a možnostem přizpůsobit se tvaru a charakteru knihy, polohu lze upravovat i po spuštění přítlačného skla, což je obzvlášť u silných svazků výhodné;
- množství ovládacích prvků na samotném skeneru (včetně korekce jasu), díky kterým není až na výjimky nutné během skenovaní se skenerem komunikovat prostřednictvím obslužného SW;
- zajímavé možnosti „masek“, tzn. ploch z předlohy, které budou po naskenování uloženy jako výsledné obrázky;
- neoslňující světla, což je dáno charakterem lamp a faktem, že pracují pouze při aktivním snímání a pouze na omezeném, právě snímaném prostoru;
- věrné a čisté kopie předloh bez manuálního zásahu, tomu mimo jiné napomáhá automatická detekce vzdálenosti předlohy od skenovací hlavy.
Výběrové řízení, které jsme byli povinni vyhlásit, muselo být samozřejmě definováno anonymně ve vztahu k výrobku. Na naše požadavky byl však nabídnut právě skener BookEye 3 A2.
Závěrem bych ráda doporučila všem, kteří uvažují o pořízení vlastního skenovacího zařízení, důkladnou rozvahu, co od skeneru očekávají. Je důležité nepodcenit přípravu, zjistit si reference, poradit se s odborníky a pokud možno skener vyzkoušet a otestovat.
Práce se skenerem BookEye (autorem fotografií je Václav Jiroušek)
Ukázky skenů pořízených na skeneru BookEye:
PATERA, Jaroslav. Reklama v prostoru. Praha : Občanská knihtiskárna, 1934, s. 117
PATERA, Jaroslav. Reklama v prostoru. Praha : Občanská knihtiskárna, 1934, s. 170.
Sto let práce. Díl 1 a 2. Praha : Výkonný výbor zemské jubilejní výstavy, [1891- 1893], s. 35. Dostupné také online: <http://kramerius.mlp.cz/kramerius/MShowPageDoc.do?id=122409&mcp=&idpi=226650&author=>.