Sdílená katalogizace a CASLIN
Sdílená katalogizace jako termín
Encyclopaedia of Library and Information Science (Vol. 27, s. 300) uvádí, že sdílená katalogizace je způsob katalogizace, kdy dvě či více knihoven spolupracují na vytváření společné databáze a využívají záznamy vytvořené partnerem. Domnívám se, že chápání významu termínu sdílená katalogizace se v české knihovnické praxi trochu posunul. Podstatou sdílené katalogizace však v každém případě zůstává skutečnost, že knihovna nezpracovává svůj fond pouze prostřednictvím originální katalogizace, ale v maximální míře využívá dostupných zdrojů, tj. souborných katalogů nebo jiných bází k tomu určených.Pokud knihovna primárně katalogizuje ve své lokální bázi s tím, že upřednostňuje možnost kopírování již vytvořených záznamů z jiných zdrojů, hovoříme o kopírování záznamů (copy cataloguing). Pokud knihovna primárně katalogizuje ve společné bázi (v souborném katalogu) a následně kopíruje záznamy do své lokální báze, hovoříme o on-line sdílené katalogizaci (shared cataloguing). Jedna instituce může ke katalogizaci využívat buď jen jeden z uvedených způsobů nebo oba.
Na semináři CASLIN `99 Ole Husby z norského BIBSYS ve svém příspěvku Reálné a virtuální souborné katalogy hovořil o typologii reálných souborných katalogů, která se opírá právě o způsob katalogizace v rámci souborných katalogů. Rozlišuje tyto čtyři způsoby:
- katalogizace probíhá primárně v lokální databázi a záznamy jsou následně dodávány do souborného katalogu - pravděpodobně nejčastější model souborného katalogu (CASLIN)
- katalogizace probíhá primárně v souborném katalogu a po té jsou záznamy kopírovány do lokální databáze - model umožňující kvalitnější sdílenou katalogizaci
- katalogizace probíhá simultánně v lokální i v centrální databázi (v souborném katalogu) - model náročný na moderní technologii správy souborného katalogu a katalogizačního modulu knihovny; neprovádí se sekundární přenos záznamů do ani ze souborného katalogu do lokálních databází
- plně centralizovaná databáze - souborný katalog v tomto případě funguje také jako katalogizační modul pro spolupracující knihovny; knihovny nebudují lokální katalogy (na tomto principu funguje BIBSYS)
Česká národní bibliografie (ČNB) a souborný katalog
V roce 1997 zahájila Národní knihovna ČR (dále jen NK ČR) projekt Kooperativního zpracování souběžné české knižní produkce, kterého se účastní kromě NK ČR, MZK Brno a všechny státní vědecké knihovny. Cílem projektu je rychlé a co nejúplnější zachycení souběžné české knižní produkce formou kvalitních bibliografických záznamů a jejich široké zpřístupnění uživatelům i pracovníkům knihoven prostřednictvím internetu a CD-ROM.
Od ledna 1998 jsou aktuální záznamy pro potřeby souběžné ČNB exportovány ze souborného katalogu, jehož aktivními účastníky jsou všechny kooperující knihovny. Záznamy ČNB nejsou zatím natolik aktuální, aby mohly být pro většinu knihovny zdrojem záznamů ke zpracování nových přírůstků, avšak lze doufat, že tomu tak v budoucnu bude. V každém případě je ČNB snadno dostupným zdrojem kvalitních záznamů české produkce.
Kvantitativní růst souborného katalogu
V základních rysech se souborný katalog drží původní koncepce formulované v rámci projektu CASLIN a jeho účastníci jsou povinni dodržovat standardy, které CASLIN stanovil jako povinné:primárním výměnným formátem je UNIMARC, sekundárním je Výměnný formát základním standardem pro jmenné zpracování je ISBD(G) závaznými pravidly pro jmenné zpracování jsou AACR2 pro věcné zpracování je povinné uvedení notace MDT povinný rozsah záznamů pro jednotlivé druhy dokumentů je určen instrukcemi Záznam pro souborný katalog, které vznikly ve spolupráci s knihovnami celé České republiky. NK ČR vydala následující instrukce: v květnu 1996 pro tištěné monografie v květnu 1999 pro speciální dokumenty v červnu 1999 pro tištěné seriály CASLIN - Souborný katalog ČR je reálný souborný katalog: záznamy účastnických knihoven jsou fyzicky shromažďovány do jedné databáze, což dává předpoklad k rozvoji on-line sdílené katalogizace. Souborný katalog je heterogenní, což znamená, že jeho účastníci používají různé knihovnické systémy.(Poznámka: V 1. polovině 90. let, kdy byla formulována koncepce souborného katalogu, používalo již mnoho českých knihoven různé knihovnické systémy a tuto skutečnost bylo nezbytné respektovat.) V červnu 1995 byly do souborného katalogu importovány první záznamy zahraničních monografií a do konce roku 1995 bylo importováno celkem 25 000 záznamů osmi knihoven. Ověřovací provoz souborného katalogu, kdy byly přijímány záznamy pouze zahraničních monografií bez možnosti kontroly duplicit, probíhal od 1. 1. 1996 do 31. 1. 1997, na konci ověřovacího provozu souborný katalog obsahoval téměř 44 000 záznamů čtrnácti účastníků. V lednu 1997 bylo dokončeno testování programu na kontrolu duplicit pro souborný katalog a všechny záznamy do té doby dodané do souborného katalogu byly porovnány na duplicitu. K 1. 2. 1997 zahájil souborný katalog příjem záznamů nejen zahraničních, ale také českých tištěných monografií a zahájil tak svůj rutinní provoz. Na konci roku 1997 souborný katalog obsahoval téměř 65 000 záznamů (z toho 1 780 duplicitních) devatenácti českých a moravských knihoven. Kvantitativní údaje naplňování souborného katalogu v období za rok 1995 až srpen 2000 ukazuje uvedený graf. K 31. 8. 2000 obsahoval souborný katalog téměř 610 000 záznamů tištěných monografií z fondu čtyřiceti knihoven v celé České republice. Vývoj a testování nového systému pro souborný katalog V průběhu roku 1999 došlo k výraznému růstu počtu záznamů, což byl přímý důsledek využití nové systému pro správu a zpřístupnění souborného katalogu. Souborný katalog byl do poloviny roku 1999 provozován v systému ALEPH, který však neumožňoval provádět import záznamů s kontrolou na duplicity dle potřeb souborného katalogu a dále nedovoloval zásahy do záznamů v bázi jinými než vlastními prostředky. Další modifikace pomocí programů bylo nutné provádět mimo bázi. Správce souborného katalogu používá externě vytvořený program pro řízený import s kontrolou duplicit. Toto řešení však vyžadovalo aktivaci procedury kontroly duplicit mimo bázi v systému ALEPH, a tudíž bylo možné zpracovávat pouze data získaná off-line. Sdílená katalogizace on-line však předpokládá primární katalogizaci v bázi souborného katalogu, a tudíž vstup účastníka přímo do báze souborného katalogu. Za stávajících podmínek tudíž správce nebyl schopen zajistit on-line sdílenou katalogizaci. Vývoj vlastních aplikací pro provoz a správu souborného katalogu v systému ORACLE byl pro správce nezbytný také z důvodu zásadní racionalizace zpracování a celkové správy dat. Zpracování dávky dat jedné knihovny (bez ohledu na to, zda obsahovala 100 či 10 000 záznamů) v systému ALEPH trvalo dva pracovní dny. Během zpracování byl správce nucen použít sedm pomocných programů. S rostoucím počtem záznamů v souborném katalogu probíhal vlastní import jednotlivých dávek stále pomaleji. Racionalizace správy souborného katalogu a tudíž i značné zrychlení importu dat bylo vyřešeno využitím vlastních aplikací pro souborný katalog v systému ORACLE, jejichž vývoj probíhá od března 1998. V září 1999 byla dána k testování omezenému okruhu odborníků beta verze základní aplikace souborného katalogu pro tištěné monografie. Testováno bylo: vyhledávání vytváření tiskových souborů stahování vyhledaných záznamů připisování sigly k záznamům dokumentů, které vlastní editace vlastních záznamů vytváření nových záznamů přímo v souborném katalogu Začátkem listopadu 1999 po instruktážní schůzce získali přístup do souborného katalogu v systému ORACLE všichni členové Pracovní skupiny pro Souborný katalog ČR. Pro účely testování bylo přiděleno celkem 37 přístupových hesel. Připomínky bylo (a stále je) možné zasílat e-mailem ze všech obrazovek souborného katalogu. Na počátku testování byla identifikována chyba v ukládání dat, kterou se ještě během testovacího období podařilo odstranit. Další připomínky a dotazy se týkaly především: práce se schránkou stahování exportních souborů v různých verzích prohlížečů (Netscape a Explorer) problémů s odesíláním připomínek (nefungovalo vždy a ze všech stránek) práce s formulářem pro sdílenou katalogizaci možnosti zalogování do souborného katalogu doplňků k nápovědám (především v katalogizaci) Správce souborného katalogu nemohl vyhovět žádostem o prodloužení testovacího období a k 31. 12. 1999 bylo testování ukončeno. Na každé obrazovce však zůstala aktivní ikona Připomínky, kam je možné uvést své dotazy a připomínky a obracet se tak přímo na správce souborného katalogu. Účastníci testování velmi kladně hodnotili především uživatelskou přívětivost souborného katalogu a jednoduchou možnost přebírání záznamů a jejich importu do vlastních lokálních katalogů. Zpracování dat pro souborný katalog v systému ORACLE V lednu 2000 byla zahájena správa a provoz souborného katalogu s využitím vlastního vyvinutého softwaru (byly zpřístupněny záznamy tištěných monografií). Došlo ke značné automatizaci všech činností spojených se správou báze souborného katalogu, včetně analýzy vstupních dat, a to s maximálním využitím k tomu účelu dosud vytvořených softwarových prostředků. Zpracování záznamů probíhá zcela automaticky: příjem a identifikace souboru dat (včetně konverze) formálně logické kontroly dat import dat statistiky problémy k řešení pro správce Účastník umístí svá data v přiděleném prostoru na ftp serveru (pokud je dodá na disketě, přesune je na ftp server správce). Program v pravidelných intervalech kontroluje, zda na ftp server nepřibyla nová data. Stáhne je a dle názvové konvence zjistí kdo je jejich vlastníkem, v jakém jsou formátu a jaká byla použita znaková sada. Všechny nové i editované záznamy jsou před importem do souborného katalogu testovány. Součástí automatické kontroly je: test na UNIMARC - pomocí vyvinuté aplikace jsou jednotlivé záznamy automaticky testovány na správnost zápisu do polí formátu UNIMARC přidělení kvalitativní váhy - existuje šest kvalitativních vah (4, 9, 10, 11, 12, 20), čím je numerická hodnota vyšší, tím je záznam kvalitnější test na duplicitu záznamů - záznamy jsou automaticky testovány na duplicitu, je-li to nutné, probíhá testování duplicity ve dvou fázích, duplicitní záznamy s vyšší váhou nahradí záznamy s nižší váhou. (Poznámka: Algoritmus testování na UNIMARC, algoritmus přidělování vah a algoritmus primárního i sekundárního klíče pro porovnávání záznamů jsou podrobně popsány v materiálu CASLIN - Souborný katalog ČR. Zadání pro vývoj aplikací v systému ORACLE přístupném na domácích stránkách CASLIN.) V průběhu testování záznamů na duplicitu v aplikacích systému Oracle se každý záznam hned po porovnání naimportuje do báze souborného katalogu a porovnává se s každým dalším záznamem dané dávky. Dochází tudíž ke kontrole také vnitřní duplicity vstupní dávky dat. Informace o nevyhovujících záznamech jsou prostřednictvím e-mailu jako statistika s příslušným komentářem zaslány zpět dodávající knihovně k opravě. Celý proces zpracování záznamů probíhá mnohem rychleji a s lepší kvalitou než v ALEPHU (trvá cca 40 minut). Správce má možnost spustit jej jako celek, takže jednotlivé kroky proběhnou automaticky v návaznosti na sebe, nebo po jednotlivých krocích tak, že má možnost kontroly výstupů z každého kroku. V obou variantách správce může nastavit datum a čas spuštění celého procesu nebo kroků. Sdílená katalogizace v souborném katalogu Základním předpokladem kvalitního zdroje pro sdílenou katalogizaci je kromě technologických nástrojů jeho aktuálnost. Vývojem vlastního softwaru pro souborný katalog vytvořil správce kvalitní technické podmínky k zásadnímu zlepšení aktuálnosti souborného katalogu. V zásadě je možné se s vybranými aktivními účastníky domluvit, aby každý den ke konci pracovní doby zaslali na ftp server záznamy toho dne zpracovaných dokumentů, které je správce schopen během noci importovat do souborného katalogu. Od ledna 2000 mají účastníci souborného katalogu možnost stahovat vybrané záznamy (copy cataloguing) nebo využít možnosti katalogizace přímo v bázi souborného katalogu s následným kopírováním záznamu ve svém lokálním katalogu (shared cataloguing). Kopírování záznamů (copy cataloguing) Uživatel má možnost stahování jednotlivých záznamů nebo dávek záznamů ve zvoleném formátu a znakovém repertoáru, který zadá v menu. Výběr kvalitních záznamů mu usnadní uvedená kvalitativní váha: Váha Kvalita záznamu 4 Nestandardní 9 Záznam splňuje rozsah minimálního záznamu ve jmenném popisu, chybí MDT 10 Záznam splňuje rozsah minimálního záznamu 11 Záznam přesahuje rozsah minimálního záznamu ve jmenném popisu 12 Záznam přesahuje rozsah minimálního záznamu ve jmenném a věcném popisu 20 Záznam Národní knihovny ČR Záznamy ze souborného katalogu přebírají zatím pouze instituce, které dodaly v uplynulých letech do souborného katalogu tisíce až desetitisíce záznamů, proto se počet přebíraných záznamů eviduje, ale neúčtuje. On-line sdílená katalogizace (shared cataloguing) Při tvorbě nového záznamu v souborném katalogu využije katalogizátor dané knihovny nabídnutý vstupní formulář (JAVA applet), který neobsahuje nepovolená pole. Povinná pole dle instrukcí pro souborný katalog jsou rozepsána, avšak katalogizátor má možnost další zvolená pole, která nejsou jednotlivě uvedena ve formuláři, zahrnout do verze vstupního formuláře. Tuto vlastní verzi si pojmenuje, uloží do svého prostoru a kdykoliv znovu použije. Editace záznamu Pro editaci je k dispozici vstupní formulář, který zobrazí kompletní obsah editovaného záznamu. Při editaci má uživatel možnost vložit do svého záznamu identifikační číslo (tag 001), a tím může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Použití tagu 001 umožní plně využít tuto službu také knihovnám, které jsou nuceny provádět konverzi formátu záznamů vlastními prostředky. Závěr Správce souborného katalogu připravil technické podmínky ke sdílení záznamů a bude dále usilovat o aktuálnost, kvalitu i intenzívní naplňování souborného katalogu. Cílem je, aby se souborný katalog stal skutečně žádaným a využívaným zdrojem pro sdílenou katalogizaci. Účastníci projevují zájem především o dávkové přebírání vybraných záznamů; s vývojem nového softwaru pro souborný katalog bylo důležité vytvořit také možnost katalogizace v bázi souborného katalogu s následným zkopírováním záznamu do vlastní lokální báze. Stejně jako ve světě i v České republice je cílem vytvářet katalogizační záznam jen jednou (v ideálním případě) v souborném katalogu a jeho prostřednictvím jej dát k dispozici ostatním knihovnám.