Online Information 2001
Online Information je největší světovou akcí informačního průmyslu, která se už 25 let každý rok otvírá několika tisícům návštěvníků. Koná se pravidelně první prosincový týden v Grand Hall známé Olympie v Londýně. Akce se skládá z třídenního odborného semináře a výstavy s bohatým doprovodným programem.
Datum konání Online Information 2001 připadlo na 4. - 6. prosince 2001. Počet vystavovatelů i návštěvníků byl výrazně nižší než v uplynulých letech, což byl pravděpodobně důsledek událostí z 11. září 2001 v New Yorku, Američané zvažovali nezbytnost svých letů do Evropy. Program konference i doprovodných přednášek v rámci výstavy byl natolik zajímavý a bohatý, že bylo velmi obtížné připravit si harmonogram tak, abych slyšela přednášky, o které jsem měla zájem a ještě stihla prohlédnout vytypované stánky na výstavě. Velmi příjemným zpestřením byla návštěva nové budovy Britské knihovny, které jsem dala přednost před původně zvažovanou a jistě také velmi zajímavou přednáškou "XML v akci" Stephena Arnolda z USA.
Nebylo by účelné ani v rámci tohoto příspěvku se snažit obsáhnout vše, co bylo možné na Online Information 2001 vidět a slyšet, příspěvek by měl spíše nalákat k návštěvě uvedených odkazů nebo k zapůjčení sborníku z konference (Online Information 2001. Proceedings. ISBN 1-900871-61-0), který je v klasické podobě k dispozici v Knihovně knihovnické literatury Národní knihovny ČR a v elektronické na stránkách Online Information 2001.
Z přednášejících mě nejvíce zaujal Gary Price z USA, který přes hlasovou indispozici dokázal velmi charismaticky hovořit o nanejvýš zajímavém tématu: neviditelný web.
Jeho přednáška v úvodu konference nazvaná "Vyhledávání míst, kam nedosáhnou vyhledávače", ale také kratší prezentace v rámci doprovodného programu výstavy nazvaná "Jak zpřístupnit data ukrytá v neviditelném webu", byly skutečným zážitkem.
Je mnoho lidí, kteří si neuvědomují, že většina informací zpřístupněných prostřednictvím internetu je neviditelná pro vyhledávače jako Alta Vista, HotBot nebo Google. Tyto nedostupné dokumenty tvoří tzv. "neviditelný web" (vedle termínu invisible web se můžeme setkat také s označením deep web, tj. hluboký web), jehož součástí jsou převážně obsahově bohaté databáze knihoven a univerzit, kulturních společností a obchodních firem, ale také státních institucí po celém světě. Bylo by velmi obtížné změřit velikost neviditelného webu, počet dokumentů však není důležitý, mnohem důležitější je jejich obsah. Žádný vyhledávač není dokonalý, také nejsou všechny stejné, specializují se, a proto je důležité použít ten správný pro to, co hledáme. Gary Price velmi jednoduše definoval neviditelný web jako web neindexovaných dokumentů. Konstatoval, že pokud jednou přijde den, kdy obecné vyhledávače najdou vše, co bude na webu, nastanou skutečné potíže.
Problematice neviditelného webu je ve světě přikládán stále větší význam, o čemž svědčí skutečnost, že tomuto tématu byl věnován ještě samostatný jednodenní seminář před zahájením konference, hlavním řečníkem zde nebyl nikdo jiný než Gary Price. Žádnou z jeho přednášek ve sborníku Online Information 2001 nenajdeme, ale přislíbil v průběhu několika měsíců zpřístupnit kompilace na téma neviditelný web na svém webu (My Weblog).
Vedle Garyho Price je světově uznávaným odborníkem na problematiku neviditelného webu Chris Sherman. Společně vydali knihu s názvem "The Invisible Web. Uncovering Information Sources Search Engines Can´t See", jejímž cílem je nejen objasnit obsah termínu neviditelný web, ale především dát praktické rady a typy k tomu, jak rychle a úspěšně získat informace obsažené v "hloubce" neviditelného webu.
Jedním z prvních stánků na výstavě Online Information 2001, u kterého jsem se zastavila, byl stánek firmy ExLibris, producenta knihovnického systému Aleph. Potěšilo mě setkání se sympatickou Tamar Sadeh, která zde, stejně jako na semináři CASLIN 2001, zájemcům právě vysvětlovala fungování systému MetaLib a služby SFX. V další stáncích byly prezentovány knihovnické systémy Q Series a OLIB, které jsou také implementovány v českých knihovnách.
Zaujal mě systém Atomik firmy Easypress Technologies, který umožňuje extrahovat obsah dokumentů uložených v hojně užívaném systému QuarkXPress do XML, vytvořit pro něj DTD a případně umožnit doplnění chybějících údajů nebo změn. Také další firmy (Innodata, Ixiasoft, apod.) zabývající se publikováním dokumentů nebo jejich archivací nabízely systémy ukládající obsah dokumentů ve formátu XML. Jako knihovnici mě však zaujal spíše knihovnický systém Autolib firmy se stejným názvem, který kromě dalších obvyklých služeb nabízel katalogizaci v XML. Když jsem požádala o ukázku, dozvěděla jsem se, že je tato část systému teprve ve vývoji.
Jednoznačně především pro knihovny jsou určeny produkty firmy Book-Data. Kromě jiného firma nabízí bohatý zdroj bibliografických záznamů ve formátu UKMARC nebo MARC21, záznamy jsou prověřeny Britskou knihovnou, která měla na výstavě pochopitelně také vlastní stánek.
Velmi zajímavá byla prezentace EUCat: Pan-European Union-Catalog (Pan-evropský souborný katalog) ve stánku označeném OCLC Pica. Tento katalog je možno využívat po zaregistrování. Jeho vznik je jedním z výsledků spojení Pica s OCLC koncem roku 1999. Vytvoření EUCat iniciovala společnost Pica na konci minulého století se dvěma základními cíly shodnými pro všechny souborné katalogy od počátku jejich vzniku, tj. od 70. let minulého století v západní Evropě a od 90. let ve střední a východní Evropě:
1. budovat centrální databázi záznamů dokumentů jako základ pro národní meziknihovní výpůjční službu
2. zjednodušit kooperativní katalogizaci a omezit originální katalogizaci v knihovnách sdílením kvalitních záznamů.
Na počátku 21. století roste trend tvorby fyzických souborných katalogů, protože výše uvedené cíle zůstávají a praxe ukázala, že virtuální souborné katalogy nejsou schopné je s dostatečnou kvalitou naplnit. Společnost Pica s využitím know-how OCLC vytváří fyzický nadnárodní evropský souborný katalog, jehož cílem je poskytovat vysoce kvalitní vyhledávací nástroje a zajistit v evropském měřítku meziknihovní výpůjční služby včetně zasílání dokumentů. Všechny procesy, které předcházejí importu záznamů do databáze EUCat, do značné míry eliminují duplicity v datech. V EUCat byla duplicita kontrolována u všech současných 70 miliónu záznamů. Systém PiCarta, tj. vyhledávač pro EUCat je možné srovnávat s internetovými vyhledávači jako Alta Vista, Yahoo nebo Google. Pica v rámci EUCat podporuje různé bibliografické formáty (MARC21, UNIMARC, MAB aj.).
Koncepce EUCat je založena na spolupráci jednotlivých knihoven nebo knihovních konsorcií v Evropě. Účastníci EUCat i nadále vytvářejí záznamy ve svých lokálních bázích nebo souborných katalozích, zároveň poskytují své záznamy také do EUCat. Při vyhledávání s využitím nástroje PiCarta je možné vyhledávací rozhraní nastavit tak, aby se na začátku seznamu knihoven, které vlastní příslušný dokument, zobrazovaly vždy knihovny té země, ze které pochází rešeršér, a teprve pak ty ostatní.
Chce-li uživatel získat dokument, jehož záznam našel v EUCat, objednávku meziknihovní výpůjční služby je možné realizovat automaticky v rámci služby PiCkarta.
V současné době EUCat obsahuje tyto databáze:
- NCC (Nederlandse Centrale Catalogus) - holandský národní souborný katalog
- GBV (Gemeinsamer Bibliotheksverbund) - souborný katalog sedmi spolkových zemí v severním Německu (cca 400 knihoven)
- ZDB (Zeitschriftendatenbank) - německý národní souborný katalog periodik
- Subito (http://e250-039.gbv.de/en/direkt/gbvdirekt.shtml)- document delivery souborného katalogu GBV, tj. 400 německých knihoven
- OLC (OnLine Contents) - Swets Scan databáze obsahů a abstraktů, které lze získat prostřednictvím NCC
- NetFirst OCLC - databáze obsahující metadatové záznamy elektronických zdrojů na internetu.
Odděleně od EUCat služba PiCarta poskytuje přístup do OCLC WorldCat prostřednictvím protokolu Z39.50. Uživatelské rozhraní je podobné jako PiCarta, což je pro uživatele velmi příjemné.
Koncentrace relevantních informací pro informační profesionály je na semináři i výstavě Online Information tak vysoká, že rozhodně stojí za to se této akce světového významu účastnit pravidelně.
Obrazová příloha
stánek...
Britské knihovny
OCLC Pica
firmy ExLibris (SFX)
firmy Innodata
systému QuarkXPress