Využití MeSH při vyhledávání v Medline na webu
MeSH (Medical Subject Headings) je patrně nejrozšířenějším věcným tříděním v oblasti medicíny a kromě své původní anglické verze existuje v celé řadě jazykových mutací, včetně české. Je využíván k indexaci záznamů v databázích produkovaných National Library of Medicine (Medline, HealthStar aj.), a také v katalozích lékařských knihoven po celém světě. Jak je to s využitím MeSH při vyhledávání v databázích na webu? V rešeršní praxi je MeSH nenahraditelnou pomůckou při sestavování dotazu, většina laických uživatelů, pro které byla webová vyhledávací rozhraní pro Medline či jiné databáze (např. databáze webových zdrojů) vytvořena, však MeSH nevyužívá. Některé sofistikovanější systémy proto zahrnují i funkci "mapování" - převod dotazů v přirozeném jazyce na hesla MeSH. Přístupy k tomuto problému zahrnují využití struktury tezauru (odkazy z nedeskriptoru na deskriptor), statistických metod (společný výskyt několika deskriptorů), morfologických a syntaktických variací či sémantických sítí.
Komerční systémy
Jedním z prvních vyhledávacích systémů s přístupem přes web, kde se objevilo mapování, byl Ovid Web Gateway s funkcí "Map terms to subject headings". Tuto funkci je možno využít ve všech databázích Ovidu, které jsou indexovány pomocí tezauru, tedy nejen v Medline. Po zadání jednoho či více klíčových slov je uživateli nabídnut seznam deskriptorů MeSH, které by měly odpovídat jeho dotazu a z nichž si může pro další vyhledávání vybrat. Postup systému při nabízení je následující: Pokud je zadané klíčové slovo přímo deskriptorem MeSH, dostane uživatel dvě možnosti, buď vyhledávat pomocí deskriptoru MeSH, nebo vyhledávat svůj termín jako klíčové slovo, tedy v názvu, abstraktu a deskriptorech. Jestliže je klíčové slovo nedeskriptorem, je situace obdobná. Další případ nastane, když je klíčové slovo součástí více deskriptorů, pak uživatel obdrží kompletní seznam těchto výskytů. Pokud však zadané klíčové slovo nelze najít ani mezi deskriptory ani mezi nedeskriptory, přichází ke slovu statistika a systém vygeneruje seznam deskriptorů MeSH, které se nejčastěji vyskytují v záznamech vyhledaných pomocí uživatelem zadaného klíčového slova/slov. Není-li uživatel s tímto principem obeznámen, může být i nemile překvapen, protože systém mu nabídne i deskriptory na první pohled nesouvisející. V nápovědě se ale o podrobnostech nic nepraví. Systém také neumí ošetřit překlepy.
Mapování používá také WebSPIRS, kde se funkce nazývá "Suggest". Princip, na kterém je založena, není (stejně jako v předchozím případě) v uživatelské dokumentaci popsán, takže uživateli nezbývá, než systému věřit. Jedno je ale jisté, WebSPIRS nerozlišuje, zda lze zadané klíčové slovo najít v tezauru, nebo ne (nevyužívá tedy odkazů z nedeskriptoru na deskriptor) a pravděpodobně generuje "nabídkový seznam" pouze na základě statistické analýzy.
Třetím komerčně využívaným rozhraním s funkcí mapování je PaperChase. Deskriptory MeSH jsou uživateli nabídnuty automaticky po zadání dotazu, aniž by musel zaškrtávat nějaké okénko (Ovid) nebo použít speciální tlačítko (WebSPIRS). Algoritmus, který je ke generování seznamu vhodných deskriptorů používán, se nazývá SENSE (SEarch with New SEmantics). Spočívá v rozdělování dotazů i deskriptorů MeSH na tzv. primární sémantické faktory, reprezentující základní koncepty, které už nelze dále dělit, a v následném hledání shody mezi kombinací faktorů vytvořenou z dotazu a kombinacemi příslušejícími jednotlivým deskriptorům i nedeskriptorům. Podrobněji je tato metoda popsána v článku Yuriho Ziemana a Howarda Bleicha [1].
Nekomerční systémy
Také některé zdarma přístupné vyhledávací systémy pro Medline mají zabudovány pomůcky pro práci s MeSH, i když méně propracované, než systémy zmíněné výše. I u nich platí, že algoritmy používané ke generování nabídkového seznamu nejsou nikde v nápovědě podrobně popsány.
Dva z těchto volně přístupných systémů s možností mapování už bohužel nefungují. Jedná se o Internet Grateful Med (NLM), který k mapování využíval metatezaurus, který je součástí Unified Medical Language System (UMLS), což je báze zahrnující lexika z více než šedesáti lékařských tezaurů, terminologických slovníků a kódovníků. Druhým v současné době již nepřístupným rozhraním byl systém společnosti HealthGate, jehož mapovací funkce se nazývala ReADER.
Pravděpodobně nejpoužívanějším přístupem k Medline je v současnosti PubMed, spravovaný přímo NLM, jehož součástí je i MeSH Browser, který částečně plní mapovací funkci. Kromě toho, že si uživatel může tezaurus prohlížet ve stromové struktuře, může v něm totiž i vyhledávat. Pokud je jím zadané klíčové slovo/fráze deskriptorem či nedeskriptorem, zobrazí se mu ve výsledku pouze jeden příslušný deskriptor. V opačném případě dostane na výběr ze seznamu deskriptorů, které obsahují zadané slovo, případně s ním mají společnou část. Nemusí to být nutně slovní základ, ale třeba i několik počátečních písmen, takže např. ve výsledku dotazu "alcoholic liver" se objeví třeba i "aloe", "computer literacy" či "Libya" (abych PubMedu nekřivdila, musím dodat, že tyto termíny se vyskytují až ve spodní části poměrně dlouhého seznamu). Vybrané deskriptory pak lze použít při hledání.
Dalším systémem, který disponuje alespoň částečnou mapovací funkcí, je Knowledge Finder (Aries Systems). Knowledge Finder provádí mapování automaticky, aniž by dal uživateli možnost výběru. O tom, v jaké podobě byl jeho dotaz vyhledáván, se uživatel dozví až současně se zobrazením výsledků. Vyhledávání Knowledge Finderu se neomezuje pouze na deskriptory MeSH, ale k uživatelem zadanému slovu přidá i jeho gramatické varianty a další synonyma, která nejsou obsažena v MeSH.
Jako poslední bych chtěla zmínit Grips Web Search (DIMDI). Pomůckou pro uživatele související s MeSH či jiným tezaurem je zde funkce "Extract", kterou lze ovšem použít až v případě, že už máme nějaké vyhledané záznamy. Z nich je možné pomocí zmíněné funkce extrahovat nejpoužívanější deskriptory (tímto způsobem je zpracováno maximálně 100 záznamů, systém jejich výběru z většího souboru není popsán) a využít je k dalšímu vyhledávání.
Pokud byste chtěli vědět, jak se "nabídkové seznamy" jednotlivých systémů liší, doporučuji článek autorek Lory Gault, Mary Schultz a Kathy Davies [2], které porovnaly PubMed MeSH Browser, PubMed Index, Ovid, OCLC FirstSearch Index (MeSH Heading Phrase) a OCLC FirstSearch Index (MeSH Heading) a nebo můžete tento úkol pojmout jako zajímavé prázdninové dobrodružství.