Sorry, you need to enable JavaScript to visit this website.

Rosetta – cesta k dlouhodobému uložení digitálních objektů

Čas nutný k přečtení
8 minut
Již přečteno

Rosetta – cesta k dlouhodobému uložení digitálních objektů

6 comments
Anglicky
English abstract: 
The article is focused on digital preservation and ExLibris system Rosetta. Rosetta is a solution for large spectrum of institutions (from national level to small institutions) developed in cooperation with National Library of New Zealand. It is based on OAIS reference model and PREMIS data model.

Dlouhodobá ochrana digitálních objektů

V souvislosti s digitalizací i s nárůstem počtu dokumentů vznikajících pouze v digitální podobě se stále častěji mluví o nutnosti zabezpečit použitelnost a přístupnost digitálních objektů v dlouhodobé perspektivě. Nejedná se pouze o potřebu bezpečného uložení objektů, ale i o uchování tzv. reprezentační informace, která by měla zajistit, že dokument bude možné jednoduchým způsobem zobrazit třeba i v případě, že formát, ve kterém byl dokument původně uložen, zastará a nebude již běžně využíván. Ani to samo o sobě nestačí – objekt je třeba neustále sledovat a kontrolovat, zda není poškozen. Stejně tak musí být kontrolována i cílová skupina uživatelů objektu – mají stále patřičné vybavení, které jim umožní objekt zobrazit? V neposlední řadě je třeba myslet i na nejrůznější katastrofické scénáře. Co když bude médium, na kterém jsou data uložena, poškozeno nebo dokonce zničeno? A co v případě nutnosti přechodu na jiný software? Větší část těchto otázek je – po prostudování odborné literatury a možná po návštěvě několika málo konferencí – možné zodpovědět. Ale jak tyto odpovědi převést do praxe?

Knihovny se mnohdy soustředí pouze na digitalizaci a v lepších případech i na tvorbu metadat, ale opomínají nutnost preventivních akcí směřujících k ochraně digitálních objektů. Přitom zrovna prevence může mnohdy z dlouhodobého hlediska ušetřit velké množství práce a samozřejmě i finančních nákladů, které s sebou nese zpětná reindexace, migrace či dokonce redigitalizace fondu.
S velikostí té které instituce samozřejmě stoupají i finanční a personální náklady na dlouhodobé zabezpečení digitální sbírky. Preventivní opatření i neustálou kontrolu vyžadují samozřejmě sbírky jakékoli velikosti a i v rámci malé kolekce je třeba věnovat pozornost i maximální možné automatizaci všech činností spojených s dlouhodobou ochranou digitálních objektů – ať už se jedná o vstupní zpracování (např. generování technických metadat), tak o průběžné aktivity (např. sledování neměnnosti kontrolního součtu pro daný soubor). Neúnosnému nárůstu časové náročnosti administrace úložiště je možné zabránit pouze využitím robustních a specializovaných systémů.

Rosetta

Jedním z nemnoha systémů, které tyto požadavky splňují, je produkt Rosetta společnosti ExLibris. Jak již bylo předesláno, Rosetta je systémem určeným pro široké velikostní spektrum institucí, počínaje národními knihovnami a konče malými institucemi (např. muzei). První institucí, kde byla Rosetta implementována, je Národní knihovna Nového Zélandu. Tato knihovna je s projektem Rosetta provázána velmi úzce. Byla totiž přímým partnerem ExLibris při vývoji samotného systému. Spolupráce byla (a stále je) výhodná pro obě strany – knihovna získala produkt odpovídající jejím představám a navíc podporovaný společností dlouhodobě úspěšně působící v oblasti knihovnictví. Oproti tomu pro ExLibris byla spolupráce s knihovnou neocenitelným zdrojem inspirace přímo z praxe. Navíc poskytla možnost ověřit si, že navrhované funkce systému skutečně odpovídají reálným uživatelským potřebám. První verze systému Rosetta byla na Novém Zélandě uvedena do provozu na podzim roku 2008 a od té doby je knihovnou úspěšně využívána. Samozřejmostí jsou i pravidelné upgrady systému – aktuálně je zde v provozu již druhá verze Rosetty.

Ale Rosetta samozřejmě není produktem šitým na míru pouze jedné knihovně. Důkazem toho může být i skutečnost, že respektuje zavedené standardy pro oblast dlouhodobé ochrany digitálních objektů – jedná se zejména o referenční model OAIS (Open Archival Information System)[1] a o datový model PREMIS [2]. V současné době je Rosetta již využívána i dalšími zákazníky společnosti ExLibris.

Rosetta a OAIS

Model OAIS vymezuje několik základních entit, ze kterých se archiv skládá, a definuje také vztahy mezi nimi. Byl vyvinut v souvislosti s vesmírným výzkumem a získal si velké uznání odborné veřejnosti. Softwarové nástroje určené k dlouhodobé archivaci digitálních dat tento model obvykle ve většině významných bodů kopírují. Rosetta není výjimkou. Obsahuje moduly pro vkládání dat, jejich správu, pro administraci celého systému, dále publikační modul pro zapracování výstupů ze systému a samozřejmě i modul pro permanentní uložení dat. Výše uvedené moduly doplňuje modul pro plánování ochrany, který je určen jak k tvorbě a testování možných strategií ochrany, tak i k uchovávání informací o jednotlivých formátech. Tzv. knihovna formátů je založena na mezinárodních registrech a kromě možnosti ukládání informací nabízí i prostředky ke sdílení těchto vědomostí (které jsou mnohdy klíčové) v rámci uživatelské komunity.

Obr. 1 - model OAIS

Obr. 1 – model OAIS (Consultative Committee, 2002)

Rosetta a PREMIS

Datový model PREMIS se spíše než na procesy probíhající v systému soustředí na samotné uložené objekty. Definuje jejich strukturu a vazby mezi jednotlivými objekty. Příkladem může být digitalizovaná historická mapa, která se skládá ze dvou datových listů, z nichž každý je uchováván dvakrát – jednou jako archivní kopie ve formátu tiff a podruhé jako kopie pro zobrazení ve formátu jpeg2000. Společně tyto soubory tvoří tzv. intelektuální entitu (viz obrázek 2).

Obr. 2 - intelektuální entita dle modelu PREMIS

Obr. 2 – Intelektuální entita dle modelu PREMIS

Datový model PREMIS popisuje, jak jsou mezi sebou tyto objekty provázány a stanoví základní terminologii pro jejich popis. Výhodou tohoto modelu je jeho jednoduchost a přehlednost, která snižuje náročnost případné rekonstrukce objektu. Datová struktura digitálního objektu v systému Rosetta plně respektuje tuto filozofii.

V čem je Rosetta výjimečná?

V první řadě není možné Rosettu srovnávat s komerčními ani s open sourcovými softwary pro digitální repozitáře (DSpace, Kramerius nebo i DigiTool společnosti ExLibris). Ne snad proto, že by tyto systémy byly horší, ale jsou určeny k jinému účelu. S digitálním objektem je v nich zacházeno méně opatrně, neudržují jednotlivé verze objektu, ne vždy obsahují informace o životním cyklu objektu a prakticky zcela chybí nástroje pro plánování ochrany. Tyto funkce je sice možné částečně nahradit externími nástroji, ale vždy se bude jednat o polovičaté řešení vhodné maximálně pro malé instituce.

Obr. 3 - Rosetta, uživatelské rozhraní pro správu systému

Obr. 3 – Rosetta, uživatelské rozhraní pro správu systému

V rámci své kategorie je Rosetta výlučná zejména svým původem. Společnost ExLibris má dlouholetou zkušenost s vývojem i provozem knihovních a informačních softwarů, ze které mohla při vývoji Rosetty čerpat. Rosetta je také připravena na úzkou spolupráci s ostatními produkty společnosti ExLibris. Za všechny je třeba jmenovat zejména Primo (viz článek “Chcete mít spokojené uživatele?”), které zajišťuje front end – uživatelské rozhraní pro řadu informačních systémů včetně Rosetty (prostřednictvím protokolu OAI-PHM), a dále také knihovní software Aleph, který umožňuje synchronizaci katalogizačních záznamů s metadatovými záznamy v Rosettě.

Závěrem

Rosetta je komplexní systém vycházející z praktických zkušeností i z nejnovějších teoretických poznatků. Jejím účelem je uložit digitální objekty v podobě, která je optimální pro jejich dlouhodobou ochranu, a zároveň i průběžně zajišťovat jejich přístupnost a použitelnost. S její pomocí bude možné stejně snadno si prohlédnout digitalizovanou knihu dnes, za rok, za deset i za sto let.

Poznámky:
  1. Consultative Committee for Space Data Systems. Reference Model for an Open Archival Information System (OAIS) [online]. Washington (D.C.): CCSDS, January 2002. Dostupný z WWW: <http://public.ccsds.org/publications/archive/650x0b1.pdf >.
  2. PREMIS Data Dictionary for Preservation Metadata version 2.0. PREMIS Editorial Committee, March 2008. 224 s. Dostupné z WWW: <http://www.loc.gov/standards/premis/v2/premis-2-0.pdf>..

Poznámka redakce: Text je placenou inzercí společnosti MULTIDATA Praha s.r.o.

Hodnocení: 
Zatím žádné hodnocení
PAVLÁSKOVÁ, Eliška. Rosetta – cesta k dlouhodobému uložení digitálních objektů. Ikaros [online]. 2011, ročník 15, číslo 2 [cit. 2024-11-11]. urn:nbn:cz:ik-13595. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/13595

automaticky generované reklamy

Jsou zde 6 komentáře

Takhle publikuje reklamni sdeleni bulvar: -)))
- reklamni sdeleni by podle me mela byt vyrazne oznacena, a nemela by se tvarit jako normalni clanky.

Autorka clanku Rosetta... v abstraktu pise:

The article is focused on digital preservation and ExLibris system Rosetta. Rosetta is a solution for large spectrum of institutions (from national level to small institutions) developed in cooperation with National Library of New Zealand. It is based on OAIS reference model and PREMIS data model.

Tim je jasne clanek charakterizovan. Nachazi snad autor/autorka pripominky - Anonym (predmet Bulvar), v clanku neco jineho? Ma namitky proti odborne urovni, jsou v clanku nepravdy, polopravdy, neco autorka zamlcela?

Reakce uverejnovane bulvaru maji nektere spolecne rysy - jednim z nich je anonymita reagujiciho.

Autorkou druhe pripominky je B. Sevcikova (mozna, ze je to B. Sevcikova ze spolecnosti Cosmotron, nevim). Pro ni mam tuto odpoved: Ano, autorka clanku Rosetta... pracuje pro spolecnost, ktera distribuuje Rosettu. Pokud jde o instalace Rosetty v malych knihovnach, je odpoved slozitejsi. Roseta je system pro DLOUHODOBOU archivaci, prezervaci a zpristupneni digitalnich dokumentu. Dlouhodoba prezervace a zpristupneni dokumentu je ukol, kteremu se v soucasnosti zacinaji venovat predevsim velke knihovny - ale v blizke budoucnosti se s touto vyzvou budou muset vyrovnat i vyznamne knihovny stredni a male. Pokud je pani B. Sevcikova z Cosmotronu, tak tohle samozrejme vi.

Pavel Krbec, MULTIDATA Praha

Take mam par potrehu. Predne by me zajimalo, zda jde autorka zamestnancem distribucni firmy pro Rosettu a jak za tento clanek byla ohodnocena :-) Pak bych rada, kdyby autorka uvedla aspon jeden priklad male knihovny, kde Rosetta funguje a jak ji tato zvladla ufinancovat. Ikaros v kazdem pripade publikaci takovychto propagacnich clanku vyrazne snizuje svuj kredit. B.Sevcikova

Ikaros taky potrebuje penize na svuj provoz... pokud je clanek oznacen jako komercni prezentace (placena inzerce), pak nevidim problem.

K vašemu prvnímu dotazu - ověřila jsem si v redakci Ikara, že upozornění o placené inzerci bylo u článku přítomno ve standardní formě již od zveřejnění. Protože však je umístěno, stejně jako u všech ostatních inzertních článků, až za citacemi pramenů, je asi možné ho přehlédnout. Vzniklé nedorozumění mě nicméně velice mrzí, ale doufám, že se už dostatečně vysvětlilo.
K druhé otázce - máte pravdu, že Rosetta je v současné chvíli implementována pouze ve velkých národních nebo státních institucích (v článku je zařazen odkaz na aktuální seznam zákazníků). Důvodů je několik. V první řadě vysoká finanční náročnost vývoje systému, který se musí zaplatit z prvních implementací. Navíc dlouhodobá ochrana je v současné době stále spíše doménou velkých institucí, na kterých primárně leží zodpovědnost za uchování digitálních objektů. Nicméně předpokládáme, že zájem o tuto problematiku se bude zvyšovat i u menších institucí. Společnost ExLibris v tomto smyslu nyní upravila svou cenovou politiku tak, aby Rosetta byla přístupnější i menším institucím. Proto jsem také tuto možnost v článku zmínila.
Můj osobní názor je, že vývoj půjde spíše směrem ke sdíleným úložištím digitálního obsahu, které bude využívat vice institucí s obdobnými požadavky. Předpokládám, že důvodem budou v první řadě finance, a to nejen cena systému (kterým samozřejmě vůbec nemusí být Rosetta), ale i možnost ušetření personálních nákladů a nákladů na HW. Náklady na provoz a pořízení jednoho (byť většího) úložiště jsou logicky nižší než v případě několika menších úložišť.

E. Pavlásková

Pokud máte problém s placenou inzercí, tak redakci Ikaros.cz pošlete nějaké peníze na provoz. Pak bude mít vaše kritika placených článků nějaký smysl. Jinak ale ne.