Databáze rukopisů Memoria
Digitalizace rukopisů a starých tisků v projektu VISK 6 se blíží ke konci dalšího roku a blíží se i příprava dalších projektů. Účinné zpřístupnění dat vzniklých v souvislosti s projektem "Memoriae mundi series Bohemica" (MMSB) je nezbytným pokračování dosavadního vývoje. Dokud bylo digitalizováno několik desítek rukopisů, byl význam dat spojených s obrazy nízký. Nyní, když je již digitálně zpřístupněno více než 700 rukopisů, představují tyto vesměs dosti podrobné popisy významný objem dat a zajímavý zdroj informací. Bez rešeršních nástrojů by byl tento zdroj jen obtížně použitelný.
Jsme mimo jiné producentem bibliografických databází. Bylo proto logické využít prostředky, které jsme vyvinuli a jimiž disponujeme ve prospěch tohoto projektu. Tak se na internetu objevila na adrese www.memoria.cz databáze přestavující dosud dosažené výsledky.
Zdroj dat pro databázi
Vstupem pro tuto databázi jsou hotové digitální dokumenty na CD-R disku s kompletním digitálním obrazem a popisem originálních dokumentů. Informace jsou soustředěny především v bibliografickém popisu. Takové disky jsou "nabídnuty" systému k importu a po jejich automatizovaném zpracování a individuální kontrole importu se obsah disku zařadí do této databáze.
Struktura dat
Databáze vzniklá z bibliografických popisů digitalizovaných rukopisů má svá specifika. Společným jmenovatelem vzniku těchto digitálních dat je primárně poskytnutí nezbytného základu pro vznik digitální knihy, obrazu originálů - vzácných rukopisů a starých tisků.
Nezbytnost pravidel vedla před časem k definici DOBM (Digitisation of Old Book Materials), stanovující základní popisné položky digitálního obrazu staré knihy a dovolující spojit digitální obrazy v použitelný elektronický dokument. Důležitější než stanovení struktury byla volba koncepce nezávislosti na SW a HW. Na konci minulého století, v době vzniku projektu byla jedinou možnou a jak se ukázalo i jedinou správnou volbou orientace na SGML. Nynější počátek využívání XML je logickým posunem a vývojem, který jen potvrzuje správnost a existenční nezbytnost využívání dat v tagované, na nástrojích (tj. systémech, programech, platformách, nosičích) nezávislé formě. Tyto vlastnosti produkovaných dokumentů dovolily bezproblémový vznik databáze Memoria.
Práce s databází
Prostředí dovoluje vyhledávat třemi způsoby podle náročnosti a potřeb. Každé vyhledání vygeneruje seznam, z něhož lze u vybraného dokumentu přejít do detailních informací a k náhledům na vybrané stránky. Bez zadání podmínek vznikne vyhledáním seznam všech dosud digitalizovaných dokumentů.
Pro formulaci dotazu jsou k disposici veškeré myslitelné abecedně seřazené indexy, obvykle v heslové i slovní formě.
Základní vyhledávání dovoluje jednoduchou volbu uložení dokumentu a majitele, případně vyhledání podle signatury, autora, titulu a fulltextově ve všech dostupných informacích. Pro zápis signatury je příjemná tolerance k formě zápisu signatury.
Kombinované vyhledání dovoluje formulovat složitější dotaz a plně využít rozdělení zaznamenaných informací do 27 položek.
Expertní vyhledání je určeno ke zcela volné formulaci dotazu, který navíc může být dotaz zachován jako text pro další pozdější použití.
Pro kombinované a expertní vyhledávání je k dispozici možnost povolení určité tolerance - naleznou se kromě přesně zadaných slov i slova lišící se jedním znakem. Zajímavá je volba varianty. Ta zadaný dotazu automaticky rozšíří o možné varianty dotazu vyplývající z různých způsobů zápisu skupin nebo i jednoduchých znaků ve středověkých textech (příklad ABAKUK*, živ*)
Autorská práva k popisům
Často zajistí bibliografický popis zadavatel digitalizace. Pokud zadavatel digitalizace nemůže popis zajistit, pocházejí popisná data od odborníků spolupracujících přímo s námi.
Ve vyhlášení projektu VISK 6 je deklarován záměr data vzniklá a použitá v projektu MMSB zpřístupnit pro nekomerční využití. Účastí v projektu VISK 6 přijímají zadavatelé digitalizace tento záměr a garantují použitelnost poskytnutých i vzniklých dat v tomto smyslu.
Přístup k digitálním dokumentům
Pro každý rukopis zanesený do této databáze existuje kompletní digitální obraz originálu, který je pro badatele dostupný v Národní knihovně České republiky a v instituci, která zadala digitalizaci, což je obvykle shodné s institucí uvedenou v databázi v položce "Místo uložení".
V současnosti je v databázi Memoria k textové informaci připojeno ke každému záznamu jen několik náhledů obrazů, vybraných podle určitých pravidel z odkazů, vyskytujících se v popisu dokumentu. Pracujeme na vytvořením on-line přístupu z této databáze ke kompletnímu digitálnímu obrazu vzácného dokumentu, který je kromě uložení na pevném mediu (CD-R, DVD) importován také do datového úložiště v Národní knihovně ČR a také formulaci pravidel využívání táto služby.