Sorry, you need to enable JavaScript to visit this website.

Manuscriptorium: příprava dat a využívání informace

Čas nutný k přečtení
6 minut
Již přečteno

Manuscriptorium: příprava dat a využívání informace

0 comments
Autoři: 

23. května 2005 se v Zasedací místnosti Národní knihovny ČR v rámci konference Inforum 2005 uskutečnil workshop s názvem Manuscriptorium: příprava dat a využívání informace. Workshop byl uspořádán ve spolupráci s NK ČR. Účastníky nejprve přivítal S. Psohlavec z AiP Beroun s.r.o. Uvedl rovněž základní informace o Manuscriptoriu, o jeho složkách, o problematice importu dat do tohoto prostředí a o rozvíjející se spolupráci s domácími i zahraničními institucemi. Následně předal slovo Z. Uhlířovi z NK ČR, který nejprve teoreticky vysvětlil a poté prakticky ukázal způsob přípravy dat pro vytváření plných textů v rámci Manuscriptoria. Značná část workshopu byla pak věnována diskusi.

Hlavní složky Manuscriptoria tvoří katalog a digitální knihovna. Manuscriptorium se však snaží stát se navíc virtuálním badatelským prostředí pro práci s historickými fondy. Nyní je v provozu již přes dva roky. Je vybaveno konektivitou Z39.50 a OAI (Open Archives Initiative). Pozornost je v současnosti věnována převodu dat mezi formáty UNIMARC a MASTER.

Proběhl také import dat z digitální podoby Knihopisu, rovněž se začala rozvíjet spolupráce se zahraničím (mj. s Rakouskem, s Maďarskem či Litvou). S. Psohlavec v tomto ohledu upozornil na omezení týkající se otázek kompatibility v heterogenním prostředí. Je totiž nutno počítat s tím, že data z jiných projektů nejsou nikdy plně kompatibilní a dochází vždy k určité ztrátě informací.

Pokud databáze má sehrát jednotící roli, je nutno věnovat pozornost vytváření modulu zajišťujícím kompatibilitu dat. Místo omezování množiny dat se jako vhodnější jeví z každého zdroje importovat do databáze maximum použitelných dat. Importem dat přitom není míněn jen import dat do katalogu, ale také do digitální knihovny, jejíž součástí jsou obrázky či plné texty, využíváno je rovněž vzdálených úložišť.

Daty může být Manuscriptorium v zásadě plněno dvěma způsoby – jednak mohou být data přímo poskytnuta a importována, jednak mohou být získávána prostřednictvím harvestingu. Doposud je využíván první způsob, harvestingem se budou tvůrci Manuscriptoria pravděpodobně také zabývat.

Podle Z.Uhlíře hraje pro Manuscriptorium významnou úlohu fakt, že ICT dnes vedou ke změně významu slov dokument a text. Pojetí dokumentu jako záznamu na nosiči, který je dokončený a uzavřený, není v elektronickém prostředí již udržitelné. Totéž se týká textu jako složky dokumentu. Text se v elektronickém prostředí stává virtuálním, což je lze chápat tak, že každé jednotlivé znění je jenom jednou dílčí reprezentací textu.

Není bez zajímavosti, že texty v rukopisném prostředí jsou právě tohoto typu. Příkladem může být fenomén kazatelství ve středověku, kdy vyvstává otázka, co je vlastně textem – příprava kazatele, ústní forma kázání, zápis pořízený posluchačem, text zapsaný kazatelem po samotném kázání nebo například redakčně upravený text? Z období středověku se pochopitelně vše nedochovalo, odhaduje se, že nyní je k dispozici cca jedno až dvě procenta původně existujících rukopisů.

Zmiňovanou kazatelovu přípravu je nutno vnímat jako schéma, které je pak pro různé publikum podáno různým způsobem. Podobnou roli v dnešní role hrají prezentace připravené např. v PowerPointu, které jsou doprovázeny výkladem přednášejícího. Ten následně může článek „petrifikovat“ například formou článku. Všechny zmiňované součásti je přitom potřeba chápat jako text.

Při zpřístupňování historických textů byla v minulosti upřednostňována představa archetypu (ne nejstaršího dochovaného textu, ale textu od původního autora) na základě shromáždění všech dochovaných textů, poté začal nabývat na důležitosti názor autora na text, na přelomu 19. a 20. století se pak objevovala zejména představa nejlepšího textu, respektive zjišťování, který z dostupných textů se této představě nejvíce blíží.

Dnes je někdy uplatňováno ideální až idealistické hledisko, kdy každý zápis jednoho textu by měl mít separátní reprezentaci, přičemž jednotlivé reprezentace by byly vzájemně propojeny. Tímto náročným způsobem jsou ve Velké Británii již od počátku 90. let zpracovávány Chaucerovy Canterburské povídky (dosud nedokončeno). Aplikace metod z jiných oborů může napomoci zpracování vztahů mezi texty v čase.

Z pragmatických důvodů je spíše preferován druhý způsob zpřístupnění textu, kdy je z různých zápisů dochovaných textů zvolen text pokládaný odborníky za konzistentní. Ten je pak edičně zpřístupněn, tj. zpracován tak, aby byl srozumitelnější dnešnímu uživateli (např. je změněna interpunkce, jsou opraveny zjevné chyby, je rozšířen o obsahové poznámky týkající se jiných textů).

Ke zpřístupňování textů je nutno využívat metajazyka, který umožňuje texty po formální a věcné stránce alespoň částečně strukturovat. Pro testování metajazyka v Manuscriptoriu je využíváno TEI; tento metajazyk umožňuje strukturovat texty i v sémiotickém smyslu.

Z. Uhlíř se při praktických ukázkách doprovázejících teoretický výklad zaměřil na tři volně dostupné editory. Jedním z nich byl NoteTab Light, který mj. umožňuje validaci textových souborů (tj. kontrolu vzhledem k definici typu dokumentu), ale pro vytváření plnotextových dat se nejeví jako příliš vhodný. Následovala ukázka práce s editorem GNU Emacs, který vznikl již koncem 70. let a jehož dosavadní existenci lze považovat za známku kvality. Jeho značnou nevýhodou je však využívání jiných klávesových zkratek než ve Windows. Nejvíce pozornosti bylo věnováno složitějšímu editoru jEdit. Problém však zde představuje kódování znesnadňující orientaci v textu. Proto je ještě před vytvořením reprezentace pro konečného uživatele potřeba reprezentace pro účely korektur. Bylo zdůrazněno, že předvedené postupy nevyžadují zvláštní technické znalosti. Je však pochopitelně potřeba rozumět rukopisům a umět je popisovat.

Z. Uhlíř prezentoval v uvedeném editoru jEdit texty v různém stupni utváření, mj. také text zlomku Dalimilovy kroniky nedávno získaného NK ČR. Byl rovněž názorně předveden a komentován proces přípravy textu pro Manuscriptorium ze zdrojového ve formátu MS Word.

Využitím programu MEdit vznikají prostřednictvím vyplňování tabulky záznamy přímo kompatibilní s Manuscriptoriem.

Specifikem Manuscriptoria oproti knihovním softwarům je možnost existence více digitálních reprezentací k jednomu evidenčnímu záznamu a více popisných záznamů k jednomu fyzickému objektu z důvodů rozdílných názorů jednotlivých odborníků (z jednoho oboru nebo z různých oborů).

V rámci workshopu bylo zdůrazněno, že smyslem Manuscriptoria není shromáždit velké množství informací (toto lze považovat pouze za vedlejší produkt), nýbrž uvést je do vzájemné souvislosti a vytvořit možnost s nimi pracovat a výsledky své práce sdělit. Zároveň je tak vytvářeno prostředí pro tvorbu informací. Předpokladán je také vznik virtuálních dokumentů (např. při přípravě pedagogů).

S. Psohlavec dále připomněl, že na podzim loňského roku proběhl průzkum mezi uživateli Manuscriptoria, jehož výsledkem bylo mj. zjištění, že nabízený pokročilý vyhledávací formulář není příliš využíván, protože je zaměřen spíše technicky. Jako účelnější se jeví ponechání obecného základního vyhledávacího formuláře a přidání oborově orientovaných základních formulářů (např. pro muzikology či historiky umění). Bylo taktéž konstatováno, že zatím není jasné, jaké požadavky uživatelů badatelského prostředí se v budoucnu objeví. V každém případě je věnována pozornost možnostem transformace dat ve prospěch uživatele a s tím souvisejících různých zobrazení.

V diskusi byla mj. podrobněji objasněna problematika standardizace struktury dokumentů na mezinárodní úrovni, byla nastíněna perspektiva využití OCR při přípravě digitálních textů, dále byla otevřena otázka dlouhodobého uchování získaných dat, související hardwarové a softwarové nezávislosti Manuscriptoria (Z. Uhlíř poukázal na ten fakt, že více než kontinuita nosičů je ovšem ohrožena kontinuita významu) a potřebné kvalifikace editorů textů (zatímco například archiváři jsou vždy také historiky, knihovníci standardně nikoliv, byť v zahraničí jsou často knihovníci rovněž oborovými specialisty). V závěru diskuse byly naznačeny možnosti plnohodnotného publikování edice dokumentu v Manuscriptoriu a autorsko-právní aspekty zpřístupňování dat v Manuscriptoriu.

(ls)

Hodnocení: 
Zatím žádné hodnocení
IKAROS, redakce. Manuscriptorium: příprava dat a využívání informace. Ikaros [online]. 2005, ročník 9, číslo 5/2 [cit. 2024-12-25]. urn:nbn:cz:ik-11819. ISSN 1212-5075. Dostupné z: http://ikaros.cz/node/11819

automaticky generované reklamy
registration login password