Souborný katalog CASLIN a vztah účastnických knihoven k jeho využívání
CASLIN - Souborný katalog ČR má za sebou už pátý rok své existence, zhruba rok a půl je v plném provozu. Byla jsem u jeho počátků, u diskusí kolem minimálního záznamu a pravidel spolupráce, podílela jsem se na zakládání báze pod systémem Aleph a přípravě mechanismů pro jeho fungování. Provoz byl tehdy limitován mnoha faktory - možnostmi systému Aleph, externími na čas náročnými programy na kontrolu duplicit, velikostí disku i výkonností serveru. Nový, na míru ušitý systém běžící na novém serveru nabídl pro rozvoj katalogu velké možnosti, nejen schopnost plně automatizovaného řízeného importu, také nástroje pro export dat v různých formátech a dokonce možnost sdílené katalogizace online. V té době jsem už rozvoj SK mohla pozorovat jen zvenku, ale ve spojení s ním jsem zůstala i nadále, také proto, že odd. knihovního systému Národní knihovny ČR, kde nyní pracuji, připadl úkol zajišťovat výběr, export a úpravy záznamů z báze NK a jejich dodávání do SK. Rozvoji SK CASLIN bylo věnováno hodně práce a poskočilo o značný kus kupředu, připravuje se napojení na MVS a na bázi autorit, chystá se využití protokolu Z39.50... Přece však nemám pocit, že SK plní dostatečně své základní funkce. Správce SK má na tom vinu jen částečně - technické problémy jsou omluvitelné, ale chtělo by to zlepšit poskytování informací. Značný podíl bych připsala malé aktivitě účastníků (čestným výjimkám se omlouvám). Připadá mi, že většina ze zapojených knihoven pošle čas od času (v lepším případě jednou za měsíc) nějaké záznamy, protože k tomu se knihovny zavázaly, a tím pro ně zájem o SK víceméně končí. CASLIN obsahuje téměř 700 000 záznamů. Je to hodně, nebo málo? Své záznamy má v SK už cca 40 knihoven, zdaleka ne všechny však jsou pravidelnými dodavateli. Proč?
Národní knihovna poslala do SK CASLIN hned po jeho přechodu na plný provoz všechny záznamy knih, které měla k dispozici v přijatelné podobě, včetně těch, které v původní bázi SKK v Alephu již byly, protože v mezičase se naše báze trochu pročistila a také autorská záhlaví byla postupně prověřována vůči bázi autorit. Starší záznamy konvertované z bází ISIS a záznamy z retrokonverze Bibliografického katalogu České knihy dostaly nižší váhu a byly poslány po dohodě se správcem SK bez kontroly na formální správnost polí UNIMARC, protože jsme věděli, že nejsou kapacity na jejich opravu a záznamy bylo žádoucí v SK mít. Záznamy zpracované v Alephu se již importovaly podle všech pravidel. Od té doby přispívá NK novými záznamy, i když ne zcela pravidelně - jisté zpoždění dodávek způsobil přechod na Aleph500, byly tu i určité problémy s přijímáním záznamů a zasíláním statistik ze strany správce SK. Dnes je v SK CASLIN přes 400 000 záznamů se siglou Národní knihovny ABA001, což je cca 60 % z celkového počtu záznamů. V nejbližší době plánujeme poslat i záznamy speciálních dokumentů, protože správce SK dokončil potřebné úpravy pro zpracování statistik. Ale abych se jen nechlubila, NK jako dodavatel má vůči SK i své dluhy. Méně kvalitní retrokonverze (část generálního katalogu) dosud zaslána nebyla, protože jsme chtěli provést alespoň částečnou revizi, na kterou se nějak stále nenachází čas. Nezvládli jsme zatím také opravu záznamů vrácených pro formální chyby nebo chybějící pole. U mnohatisícových dávek to nebyl zanedbatelný počet, protože formální kontroly jsou nastaveny opravdu důkladně, takže již teď víme, že opravit veškeré vrácené záznamy nebude v našich silách; kromě nejnovějších je tedy zamýšlíme poslat do SK znovu s nižší vahou bez kontroly na UNIMARC (zdá se nám to lepší než je "utajit" vůbec). Dalším problémem je nepřítomnost signatur v záznamech NK, na což někteří uživatelé právem poukazují. Signatura se v NK přiděluje až na konci linky zpracování a navíc se neukládá do bibliografického záznamu, ale do jednotky. Protože jsme nechtěli ještě více opožďovat zasílání záznamů do SK, rozhodli jsme se záznamy posílat hned poté, co dostanou věcný popis. Signatury připojíme k záznamům dodatečně, až SK zajistí potřebný importní podprogram.
Očekávala jsem, že se naše oddělení také zapojí do "prošlapávání cesty" pro efektivní stahování záznamů ze SK CASLIN do báze v Alephu, ale pracovníci akvizice ani katalogizace v NK zájem neprojevili (spíše větší či menší odpor). Přesto je však NK pravděpodobně jediná knihovna, která ze SK alespoň nějaké záznamy v katalogizaci svého fondu využívá, a to v souvislosti s přípravou CD-ROMu Česká národní bibliografie. Do naší báze importujeme nové záznamy českých knih, které NK dosud nevlastní: tyto záznamy jsou pak využívány buď ke tvorbě plnohodnotných záznamů, když se kniha do NK dostane, nebo jako zdroj urgence nedodaných povinných výtisků. Zpracováváme však takto pouze záznamy s ISBN, protože porovnávací programy, které máme k dispozici, propouštějí duplicity, které by se v bázi i na CD-ROMu obtížně likvidovaly. Co však je zajímavé: naši katalogizátoři tyto záznamy příliš nevítají a tvrdí naopak, že cizí záznamy se do té míry liší, že úpravy dají víc práce než tvorba nového záznamu. A to dostávají záznamy do jisté míry upravené a doslova "na talíři" - což teprve kdyby je měli hledat, stahovat a importovat? Prosadit sdílenou katalogizaci u nás nebude jednoduché.
Zajímalo mě, jak je tomu jinde, a tak jsem si zkusila v elektronické konferenci Knihovna vyhlásit soukromou minianketu, abych zjistila, k čemu se v různých knihovnách využívá SK CASLIN a zda přispívající knihovny poslaly do SK veškeré své záznamy knih. Odpovědí nepřišlo mnoho, proto je třeba brát výsledky s rezervou. Potvrdilo se mé očekávání, že SK CASLIN slouží zatím téměř výhradně potřebám MVS, ani jediná knihovna se nepřihlásila k pravidelnému stahování záznamů. V souvislosti s tím je však alarmující fakt, že souborný katalog obsahuje dosud jen zlomek elektronicky zpracovaného fondu přispívajících knihoven, prakticky jen nové přírůstky. V některých knihovnách se starší záznamy a retrokonverzi obávají poslat, protože se jaksi "stydí" za méně kvalitní záznamy. Jinde by jim to možná jen přidělalo práci, a konečně, nikdo je k tomu nevyzýval. (Reakce na anketu jsou bez dalšího mého komentáře k dispozici na webu). Při pohledu na přehled přispívajících knihoven na stránkách CASLIN nabývám navíc dojmu, že mnohé zapojené knihovny pravidelně neposílají ani všechny nové záznamy: pár tisíc záznamů mi na ústřední knihovnu přijde skutečně málo. Nebo že by byla značná část zaslaných záznamů vrácena pro formální chyby a již znovu neposlána? Záznamy nejsou přijaty do SK např. pro chybu v indikátoru, v opakovatelnosti pole či podpole nebo v pozici pole 100, což záznam rozhodně "znehodnocuje" méně než překlepy či chybně pojatý popis (tento druh chyb bohužel žádná strojová kontrola neodhalí). Nevím, kolik knihoven statistiky z importu analyzuje, záznamy opraví a pošle znovu (i u nás v NK s tím teprve začínáme). A všechny tyto záznamy v SK chybějí! MVS, hlavní uživatel katalogu, nepotřebuje perfektní záznamy - i záznamy z retrokonverze určitě obsahují autora, název a nakladatelské údaje, což postačí k identifikaci záznamu i k tvorbě klíče pro porovnávací programy. Asi by bylo dobré, kdyby přehled přispívajících knihoven byl hned na úvodní stránce souborného katalogu a kdyby obsahoval údaje o tom, jaká část jejich fondu je v SK obsažena a od kdy jsou zahrnuty všechny přírůstky, pokud vůbec - mohlo by to knihovny trochu motivovat k zasílání záznamů (z prestižních důvodů). Zkusme se vžít do situace pracovníka MVS: nenajde-li záznam v SK, buď usoudí, že žádná ze zapojených knihoven knihu nevlastní a půjde hledat do jiných souborných katalogů nebo katalogů dalších knihoven, nebo, je-li důkladný, půjde prohledat ještě katalogy všech jednotlivých knihoven. V prvním případě se může stát, že knihu zbytečně objednává ze zahraničí, ve druhém případě si hledáním v SK mnoho práce neušetřil. Hledá-li v SK "konečný uživatel", k informacím o obsahu SK se nejspíš nedostane vůbec a asi odchází neuspokojen častěji, než je nutné. Také si myslím, že teď, když už má SK snad za sebou různé "dětské nemoce", by knihovny mohly posílat své záznamy častěji než jednou za měsíc - všichni víme, že od získání knihy ke zpracování záznamu v domovské knihovně uplyne ne právě krátká doba, tak proč k tomu přidávat ještě další týdny. Možná by větší pohotovost SK vedla k tomu, že by knihovny i o stahování záznamů začaly uvažovat.
Mám jisté pochybnosti, že se vyplatí investice do nástrojů pro online katalogizaci v souborném katalogu. Zatím všechno nasvědčuje tomu, že ji dosud nevyužívá jediná knihovna (jinak by se s tím určitě někde pochlubila). Všichni se zaklínají tím, že vše se diametrálně změní v okamžiku, kdy zde bude Z39.50 přístup s update funkcí, který knihovnám umožní katalogizovat v domácím prostředí a společně s uložením záznamu do lokálního katalogu uložit záznam zároveň do SK. Toto budou moci využít jen ty knihovny, v nichž se vytváří celý záznam najednou, avšak tam, kde kniha prochází linkou zpracování, v níž se záznam "nabaluje", tento postup nepřipadá v úvahu. Tímto samozřejmě nechci zpochybnit užitečnost Z39.50 přístupu k soubornému katalogu, který by měl být v budoucnu pro každý online katalog, nejen souborný, samozřejmostí. Dávkové importy tedy budou i nadále převládat, a tak mě napadá, jestli by spíše nestálo za to investovat nějaké prostředky a energii do vylepšení programů na kontrolu duplicit. Souborný (a jakýkoliv) katalog je totiž "špinavý" hlavně tehdy, když má hodně duplicit, a to jak duplicitních záznamů, tak skoro-duplicit v rejstřících (tentýž název nebo tentýž autor v různých podobách, často z důvodů překlepů). Relativně čistý může být jen katalog, kde je dávkový import vyloučen a kde se důsledně využívají soubory autorit. A takový SK CASLIN nebude, tak proč by nemohl být aspoň co nejvíce souborný? V souvislosti s budováním báze národních autorit jsem slyšela i vážně míněná slova, že do SK CASLIN by se v budoucnu mohly přijímat jen záznamy prověřené proti bázi autorit. Z toho mi běhá mráz po zádech. Čím víc knihoven tam takové záznamy bude posílat, tím bude katalog samozřejmě kvalitnějším zdrojem sdílené katalogizace - ale i neprověřené, ba i méně kvalitní záznamy jsou zdrojem pro MVS a informací pro uživatele! Záznamy, které nesplňují povinné minimum údajů, ale jsou identifikovatelné (myslím teď takové, které postrádají např. věcný popis, zemi či jazyk vydání či pole 100), souborný katalog "nezašpiní". A kdyby si mohl potenciální zájemce o stahování záznamů vybrat, zda chce mít na výběr jen plnohodnotné záznamy (z "malého a čistšího" katalogu), nebo zda se chce podívat do celého ("špinavého") katalogu, nemusely by pak ani dvě koncepce souborného katalogu odvíjející se od jeho dvou hlavních a zdánlivě neslučitelných funkcí stát proti sobě. Takže, neměli bychom konečně začít SK opravdu naplňovat? K milionu záznamů má ještě daleko!