Státní technická knihovna zpřístupňuje své fondy pomocí Google Scholar
O vyhledávači Google Scholar vyšlo v Ikarovi více článků, namátkou:
http://www.ikaros.cz/node/1916
http://www.ikaros.cz/node/1871
Když byla v létě roku 2005 společnostmi Ex Libris a Google nabídnuta možnost integrace odkazů na linkserver SFX do výsledků hledání v Google Scholar, Státní technická knihovna začala tuto možnost zpřístupnění fondů zkoumat. V současnosti je Google Scholar prezentován jako jedna z možností získání licencovaných odborných článků z fondu elektronických časopisů STK v rámci přehledu databází online. Dlužno upozornit, že Google Scholar (jako nejedna z mnohých služeb a aplikací od Google) je i přes více než dvouletý veřejný provoz stále ve fázi beta.
SFX server STK byl původně vnímán zejména jako součást projektu Portálu STM, v současnosti plní též funkci linkserveru STK, čímž integruje veškeré služby knihovny. V současné době je provozována verze SFX v3.
Mezi zdrojové služby SFX STK (služby poskytující metadata serveru SFX STK) patří:
- katalogy provozované STK (Katalog knih, Katalog časopisů, Souborný katalog VPK, Katalog STM, Databáze ISSN);
- databáze OCLC – pouze referenční středisko STK (Article First, ProceedingFirst, PapersFirst a souborný katalog WorldCat);
- digitální knihovna Sciencedirect společnosti Elsevier;
- ... a Google Scholar.
Mezi cílové služby (odkazované z SFX STK) patří:
- získávání odkazů na plné texty s licencovaným či individuálně předplaceným obsahem (getFulltext);
- získávání odkazů na abstrakty či další služby poskytované v rámci licencí (getAbstract);
- služby elektronického dodávání dokumentů pomocí systémů Virtuální polytechnická knihovna (VPK) a nová DDS Národní knihovny (getDocumentDelivery);
- získávání doplňkových informací o autorovi (getAuthor);
- prohledávání různých katalogů – EZB , SK VPK, OCLC, databáze ISSN, české knihohvny pomocí JIB (getHolding);
- prohledávání souborných katalogů CASLIN a STM (getCitedJournal);
- další nastavené služby a databáze (recenze, objednávky, internetové vyhledávače, Wikipedia aj.);
- … a Google Scholar.
Tento článek shrnuje možnosti využití systému Google Scholar a propojení jeho služeb se službami STK.
Princip vazby Google Scholar a SFX
Konfigurace obecného linkserveru (např. SFX) je prováděna pomocí konfiguračního souboru, ukázkový soubor institutional_links.xml nabízí Google na adrese http://scholar.google.com/intl/en/scholar/institutional_links.xml. Generování tohoto souboru probíhá automaticky při registraci SFX do Google Scholar. Registrace je dostupná z administrátorského webového rozhraní SFX.
Předávání elektronických zdrojů zpřístupňovaných STK probíhá pomocí vystavování souboru s údaji o exemplářích. Možnosti zahrnout i tištěné exempláře časopisů STK zatím nevyužívá. Tento soubor je periodicky generován z KnowledgeBase serveru SFX pomocí nástrojů, které poskytuje Ex Libris jako součást instalace SFX. Ukázkový soubor institutional_holdings.xml nabízí Google na adrese http://scholar.google.com/intl/en/scholar/institutional_holdings.xml.
Struktura je následující:
Základem je kořenový element, do něj jsou již vnořeny elementy (záznamy) jednotlivých titulů:
<item type="electronic"> - hodnota type může být též „print“
<title>Ikaros</title> - povinný název
<issn>1212-5075</issn> - volitelné ISSN, v případě monografií ISBN
<coverage> - počátek „holdingové sekce“
<from> - počáteční předplacený rok
<year>1997</year>
<month>4</month>
<volume>1</volume>
<issue>1</issue>
</from>
<to> - poslední předplacený rok
<year>2006</year>
<month>5</month>
<volume>10</volume>
<issue>5</issue>
</to>
<embargo> - označení embarga je volitelné, využitelné pro tituly dostupné přes agregátory
<days_not_available>180</days_not_available>
<days_available>360</days_available>
</embargo>
<comment>Only abstracts available for volume 3 issue 7.</comment>
</coverage>
</item>
Zde následují další tituly.
Ze struktury je patrné, že nedochází k poskytnutí informace, od jakého poskytovatele nebo z jakého zdroje tituly knihovna předplácí či pomocí jakého systému (databáze, providera, agregátora) plné texty zpřístupňuje. Tyto informace obsahuje výlučně KnowledgeBase systému SFX.
Google si tento soubor periodicky stahuje a využívá při vkládání odkazů do výsledků vyhledávání Google Scholar.
Odkazy ve výsledcích jsou dvojího druhu:
GET @ STL vychází přímo ze souboru s údaji o exemplářích. Výsledek vyhledávání opatřený tímto odkazem by STK měla nabídnout v plném textu a v elektronické podobě.
Výsledky vyhledávání se týkají jak článků obsažených v databázích licencovaných konsorciálních i individuálně předplacených (EBSCO, Elsevier ScienceDirect, Wiley, Kluwer/Springer, Insitute of Physics, Blackwell STM + tituly individuálně předplacené STK), tak článků obsažených v seriálech zdarma dostupných (DOAJ, PubMed, Free Journals).
FIND @ STL je zobrazován u těch výsledků, u nichž lze díky Googlem zaindexovaným metadatům předpokládat, že se nalézají ve fondech knihoven (poskytnuto ISBN apod.).
Dokumenty označené tímto odkazem nemusejí být v elektronické podobě. Google Scholar na SFX odkazuje pomocí OpenURL ve verzi 0.1. Ukázky OpenURL (vztahují se ke screenshotům v další části článku):
1. příklad: kódování metadat do standardní OpenURL – typ článek
base URL | http://sfx.stk.cz:3210/sfxlcl3? |
označení zdroje | sid=google |
iniciála křestního jména autora | &auinit=T |
příjmení | &aulast=Saracevic |
název článku | &atitle=Digital+Library+Evaluation: +Toward+an+Evolution |
název periodika | &title=Library+trends |
svazek | &volume=49 |
číslo | &issue=2 |
rok | &date=2000 |
počáteční strana | &spage=350 |
ISSN | &issn=0024-2594 |
Původní OpenURL:
http://sfx.stk.cz:3210/sfxlcl3?sid=google&auinit=T&aulast=Saracevic&atitle=Digital+Library+Evaluation:+
Toward+an+Evolution+of+Concepts.&title=Library+trends&volume=49&issue=2&date=
2000&spage=350&issn=0024-2594
2. příklad: kódování metadat do OpenURL s využitím jednotného identifikátoru DOI – typ článek
base URL | http://sfx.stk.cz:3210/sfxlcl3? |
označení zdroje | sid=google |
iniciály křestního jména autora | &auinit=MAA |
příjmení | &aulast=Spasser |
název článku | &atitle=Realist+Activity+Theory+ for+Digital+Library+ Evaluation |
jednoznačný identifikátor DOI | &id=doi:10.1023/A:1015288305397 |
Původní OpenURL:
http://sfx.stk.cz:3210/sfxlcl3?sid=google&auinit=MAA&aulast=Sp
asser&atitle=Realist+Activity+Theory+for+Digital+Library+Evaluation:
+Conceptual+Framework+and+Case+Study&id=doi:10.1023/A:1015288305397
3. příklad: kódování metadat do OpenURL – typ kniha
base URL | http://sfx.stk.cz:3210/sfxlcl3? |
označení zdroje | sid=google |
iniciála křestního jména autora | &auinit=A |
příjmení | &aulast=Barth |
název knihy | &title=Digital+Libraries+in+ Computer+Science:+The+Medoc +Approach |
typ dokumentu | &genre=book |
ISBN | &isbn=3540644938 |
rok | &date=1998 |
4. příklad: kódování metadat do OpenURL s využitím proxy serveru Státní technické knihovny – typ článek
base URL | http://p3210-sfx.stk.cz.ezproxy.stk.cz:5556/sfxlcl3? |
označení zdroje | sid=google |
iniciála křestního jména autora | &auinit=PE |
příjmení | &aulast=Widener |
název článku | &atitle=Open+Metadata+Formats:+ Efficient+XML-Based+Communication+for+High+Performance+Computing |
jednoznačný identifikátor DOI | &id=doi:10.1023/A:1015637623058 |
Původní OpenURL:
http://p3210-sfx.stk.cz.ezproxy.stk.cz:5556/sfxlcl3?sid=google&auinit=PE&aulast=
Widener&atitle=Open+Metadata+Formats:+Efficient+XML-
Based+Communication+for+High+Performance+Computing&id=
doi:10.1023/A:1015637623058
Workflow rešeršní činnosti v Google Scholar
Obr.1 – standardní rozhraní Google Scholar.
Služeb SFX serveru Státní technické knihovny je možné dosáhnout z rozhraní Google Scholar
- přístupem ze studoven STK (SFX server nastaven automaticky dle IP adresy);
- ručním nastavením SFX serveru v preferencích Google Scholaru (SFX server nastaven manuálně – obr.2);
- přístupem přes proxyserver STK (pro registrované uživatele STK – obr.14).
Obr. 2 – nastavení Google Scholaru (Google Scholar Preferences).
Přehled českých knihoven využívajících odkazování na SFX z Google Scholar získáte vyhledáním slova „czech“ ve vyhledávacím poli Library Links. K 18. 5. 2006 bylo zaregistrováno 7 SFX serverů. Aktualizovaný přehled knihoven z ČR a SR udržuje Ústav výpočetní techniky UK na této stránce.
Korektní nastavení SFX serveru v Google Scholaru lze ověřit pokusným dotazem – ve výsledcích vyhledávání by měly být obsaženy odkazy FIND @ STL a/nebo GET @ STL.
Obr. 3 – ukázka dotazu – podrobnosti o operátorech apod. viz Scholar Help.
Obr. 4 – ukázka výsledků dotazu s odkazy na plné texty článků pomocí odkazů GET @ STL.
Obr. 5 – SFX menu generované na základě OpenURL (příklad 1).
Obr. 6 – získání plného textu online – v tomto případě z databáze agregátora EBSCOhost.
Obr. 7 – plný text získaný přes OpenURL resolver databáze EBSCO.
Obr. 8 – SFX menu generované na základě OpenURL s identifikátorem DOI (příklad 2).
Obr. 9 – plný text článku získaný prostřednictvím DOI ze služby SpringerLink.
Obr. 10 – ukázka výsledků dotazu s odkazem monografie [book] pomocí odkazů FIND @ STL.
Obr.11 – SFX menu generované na základě OpenURL s metadaty monografie (příklad 3).
Obr. 12 – záznam monografie v Katalogu knih STK získaný prostřednictvím ISBN předaného pomocí OpenURL.
Uvedené vyhledávání (se zobrazováním odkazů na plné texty) lze realizovat pouze ve studovnách STK. Manuální nastavení SFX serveru mimo studovny STK uvedené na obr. 2 zapříčiní, že SFX menu nebude obsahovat odkazy na plné texty zpřístupňované z licencovaných zdrojů (volně dostupné zdroje zobrazovány budou, stejně tak odkazy na knihovní katalogy apod.).
Toto omezení lze překonat využitím proxy serveru STK, jehož využívání je určeno pro registrované uživatele STK – fyzické osoby s platným čtenářským průkazem – disponující přístupem k síti internet. Proxy server STK běžící pod aplikací EZproxy je dostupný na adrese http://ezproxy.stk.cz:5556/login. Po přihlášení (obr. 13) je uživateli nabídnut seznam online zdrojů (viz obr.14).
Obr. 13 – přihlašovací formulář k proxyserveru STK.
Obr.14 – seznam online zdrojů dostupných přes proxyserver STK.
V seznamu je nutno zvolit Google Scholar. Rozdíl oproti standardnímu připojení spočívá ve faktu, že komunikace s Googlem, se serverem SFX a předplacenými databázemi je vždy navazována prostřednictvím proxyserveru STK. Dochází proto k převodu URL adresy služby (např. z http://scholar.google.com na http://scholar.google.com.ezproxy.stk.cz:5556/) – viz obr. 15.
Obr. 15 – Google Scholar prostřednictvím proxyserveru.
Taktéž výsledky vyhledávání a SFX Menu je zprostředkováno pomocí proxyserveru STK (obr. 16 a 17).
Obr. 16 – stránka výsledků vyhledávání v Google Scholaru získaná s využitím proxy serveru STK.
Obr. 17 – SFX Menu generované na základě OpenURL adresy předané z výsledků hledání v Google Scholar (viz příklad 4) a získané s využitím proxy serveru STK.
Využívání metadat získaných pomocí vyhledávání v Google Scholar není nutno omezit jen na zdroje dostupné pomocí licencovaných online zdrojů. Předávaná metadata lze úspěšně využít při vyřizování objednávky ve službách elektronického dodávání dokumentů. V současné době jsou do SFX STK zapojeny dvě služby - Virtuální polytechnická knihovna, kterou také provozuje STK, a služba elektronického dodávání dokumentů NK ČR. V případě, že knihovna nemá plný text k dispozici v elektronické podobě, jde o jediný způsob, jak požadovaný dokument získat (obr.18–20).
Obr. 18 – SFX Menu obsahující odkazy na služby DDS.
Obr. 19 – objednávkový formulář VPK s předvyplněnými metadaty převzatými z SFX.
Obr.20 – objednávkový formulář DDS NK ČR s předvyplněnými metadaty převzatými z SFX.
Pozn.: Více informací o nové službě DDS Národní knihovny naleznete např. v příspěvku Ing. Bohdana Šmilauera, předneseném na workshopu eTEN Digitisation on demand v květnu 2006 v Bratislavě.
Pro knihovny nedisponující serverem SFX či jiným linkserverem existují tři možnosti, jak zapojit své fondy do systému Google Scholar:
- využít produktu ScholarSFX (viz. Knihovna Akademie věd ČR);
- dohodnout se společností Google na poskytování holdingového souboru ve formátu XML dle výše uvedeného vzoru a naprogramovat vlastní OpenURL resolver směrující OpenURL z Google Scholar přímo do OPACu knihovny;
- dohodnout se s Jednotnou informační bránou na využití SFX serveru JIB (Vědecká knihovna v Olomouci, Univerzita Jana Evangelisty Purkyně v Ústí nad Labem, Národní knihovna v Praze, Moravská zemská knihovna v Brně).
Doufejme, že se současné problémy Googlu s nedostatečnou kapacitou disků a serverů nepromítnou do funkčnosti služby Google Scholar. Byla by to jistě škoda, ostatně konkurence nespí.