Main content

AUTOMAT KNIHOVNA s Mgr. Filipem Křížem, vedoucím Oddělení knihovních aplikací a digitalizace Národní lékařské knihovny ČR

„Vzhledem k rychlému vývoji technologií je pořád co zlepšovat…“

Filipe, zkusím se na úvod zeptat trochu jinak, než bývá v této rubrice obvyklé – nezačnu obecně, nýbrž konkrétně: co považuješ v oblasti, kterou máš v knihovně v gesci, za nejvýznamnější počin loňského roku a co bys rád realizoval letos?

V loňském roce jsme hlavně dokončovali tříletý projekt1 Interní grantové agentury Ministerstva zdravotnictví, v rámci kterého byla – mimo jiné – převedena Digitální knihovna NLK (DK) do systé­mu Kramerius 4 (http://kramerius.medvik.cz). Jed­na­lo se o poměrně komplikovanou akci, zejména vzhledem k velkému množství born-digital dokumentů ve formátu PDF, které získáváme od vydavatelů. Objevilo se několik souvisejících problémů v konverzi a také nějaké chyby, ale musím pochválit vývojáře systému, kteří nám byli velmi nápomocní a podařilo se vše doladit, takže koncem roku mohla úspěšně proběhnout finální konverze. Vyvinuli jsme také v portálu Medvik možnost autoarchivace dokumentů samotnými autory v DK, zatím pouze v režimu neveřejného pilotního pro­vo­zu, ale plánujeme poskytovat autorům možnost archivace a zpřístupnění jejich publikací ja­ko jednu ze standardních služeb NLK. Portál Medvik byl v rámci projektu doplněn o další nadstavbové služby – propojení na Web of Science, Scopus, JCR, registr SHERPA/RoMEO, Centrální evidenci projektů VaVaI atd.

Druhým významným počinem bylo pořízení a implementace discovery systému pro e-zdroje NLK.2 Letos plánujeme integraci centrálního inde­xu do portálu Medvik, aby byly všechny dostup­né zdroje prohledávatelné z jednoho místa.

Zkusil bys popsat specifika klíčové oborové knihovny pro danou oblast – ve vašem případě lékařství – z hlediska technologií? Možná se to nijak neliší od jiných knihoven, ale přece jen…

Pro medicínu je specifické využívání tezauru Medical Subject Headings vytvářeného americkou National Medical Library v Bethesdě, který NLK překládá do českého jazyka a poskytuje zájemcům v ČR. Tento systém je používán v řadě databází a také v knihovních systémech, což nám umož­ňuje vytvářet efektivní nástroje pro vyhle­dá­vání a navigaci, přebírání bibliografických zázna­mů včetně automatizovaného převodu předmětových hesel na české ekvivalenty atd. Důležité je, že tento heslář je široce používaný pro indexaci v českých lékařských knihovnách a máme tedy k dispozici jednotný systém věcného pořádání v našem oboru. Klíčová je také volně dostupná biomedicínská databáze MEDLINE – PubMed v por­tálu NCBI, který poskytuje řadu nástrojů a služeb využitelných v našem kontextu. Například nastavitelné periodické exporty záznamů do XML, které pak konvertujeme a importujeme do BMČ, nebo služba PubMed LinkOut pro propojení na NLK dostupné plné texty atp.

Jste aktivní a úspěšní na poli digitalizace, a také – s předstihem oproti hlavnímu českému knihovně-legislativnímu proudu – v získávání e-podob vybraných periodik. Jak tahle agenda vypadá?

Agenda archivace plných textů je náročná, a to jak administrativně, tak technicky. Primárně je třeba jednat individuálně s vydavateli odborných periodik a přesvědčit je, že archivace a zpřístupnění jejich obsahu má smysl. Pak je třeba vše smluvně ošetřit a doladit podmínky zpřístupnění, což bývá časově náročné. Většina poskytovatelů naštěstí volí plné zveřejnění (případně s časovým embargem), což je pro uživatele nejvíce přínos­né. Následně je třeba získat plné texty v elektronické podobě, ideálně v PDF formátu, a pokud možno kompletní – to bývá také často problém. Chybějí čísla nebo některé články, PDF bývají vadná/nečitelná, plné texty je třeba sklidit ze stránek časopisu (pokud neexistuje offline archiv), někdy jsou plné texty pouze v HTML. V případech, kdy je číslo časopisu rozdělené na jednotlivé články, je třeba sklidit alespoň minimální metadata, aby se dala porovnat s našimi záznamy v BMČ a podařilo se plný text ztotožnit s bibliografickým záznamem článku. Chyby v datech se přirozeně vyskytují na obou stranách, takže se hodně komunikuje ohledně oprav, ladí se proces sklízení, chybějící plné texty se digita­lizují. Po zkompletování se vytvářejí importní balíčky pro import do Krameria. Takže abych to shrnul, je to agenda, která zatím nejde příliš automatizovat. Objevují se však nové možnosti pro výměnu dat publikovaných časopisů, například Open Journal System, který se pomalu rozšiřuje i mezi českými vydavateli, nebo se zvyšuje ocho­ta vydavatelů poskytovat metadata pomocí XML formátů nebo přes webová API, což umožňuje efektivnější integraci těchto dat do našich systémů a dále rozšiřuje možnosti spolupráce.

Jak jste spokojeni s Krameriem coby platformou pro zpřístupňování?

S Krameriem 4 jsme v zásadě spokojení, protože je to flexibilní systém postavený na kvalitním repozitáři Fedora a dalších otevřených systémech, což umožňuje využívat jejich API rozhraní. Toho využíváme jak pro autoarchivaci, tak pro automatické propojování DK se záznamy v portálu Med­vik. Nějaké nedostatky by se samozřejmě našly. Například v případě plného zobrazení PDF souborů uložených v K4 chybí navigační lišta, takže uživatel, který se k tomuto souboru dostane přes web vyhledávač, má problém se vůbec dostat k informaci, o jaký dokument se vlastně jedná.

Na tuzemské poměry máte docela soudobý web, na první pohled se vším, co k němu patří a má tam být. Jak jste ho navrhovali a tvořili? Jaká je jeho správa?

Web NLK je již pár let provozován v open source redakčním systému Plone, letos v březnu dostal v rámci upgrade na novou verzi Plone i modernější kabát včetně lepší navigace, přeskupení obsahu, karuselu, implementace Creative Commons licence a řady dalších vylepšení. Redesign našeho webu byl kolektivním úsilím, ideově se na něm pracovalo už poměrně dlouho, technická realizace probíhala od konce loňského roku a dí­ky dobré spolupráci s externí spolupracovnicí vše dopadlo uspokojivě. Správa obsahu je kooperativní záležitost, Plone umožňuje detailní nastave­ní publikačního workflow, což správu velmi usnadňuje. Nicméně je vzhledem k rychlému vývoji technologií pořád co zlepšovat, je třeba ještě doladit kód stránek, aby byly co nejvíce responzivní vůči mobilním zařízením.

Na webu nelze přehlédnout pojem Medvik, o kterém ses už několikrát zmínil. Jak bys novému uživateli vysvětlil, co to vlastně je, jak to vzniklo a jaká infrastruktura a data jsou v pozadí?

Podstatou systému Medvik (Medicínská virtuální knihovna) je umožnit poskytování knihovnicko-informačních služeb z jednoho místa – stejnojmenného portálu. Multiknihovní systém integrující oborové knihovny a jejich data je k tomu důle­žitým nástrojem, který přináší řadu výhod jak knihovníkům, tak čtenářům. Z hlediska uživatele-čtenáře by měl portál Medvik představovat jednotné rozhraní pro využívání služeb celé sítě lékařských knihoven a to, pokud možno, bez zby­tečných institucionálních a jiných bariér.

Již nějakou dobu pracujeme na tom, aby bylo v portálu možné jednotné přihlašování a snadná registrace v uživatelem preferovaných knihovnách s možností využívat služeb – nejen v Medviku integrovaných – lékařských knihoven. Aktuálně je v nové verzi portálu vyřešeno hlavně vyhledávání, ale například správa čtenářského konta je stále v původní verzi3, což samozřejmě není pro uživatele optimální, přestože jsou oba portály propojené.

Důležité je, aby portál poskytoval uživatelům maximum informací a návazných služeb, na nás je zajistit, aby databáze Medvik obsahovaly pokud možno všechna potenciálně využitelná data – katalogy knihoven včetně informací o dostupnosti exemplářů, analytická bibliografie BMČ, lékařské autority, tezaurus Medical Subject Headings, adresář lékařských knihoven atd. Tato data je samozřejmě třeba smysluplně propojovat, a to jak interně, tak s relevantními okolními systémy.

Takže při rozvoji portálu Medvik víceméně řešíme obdobné problémy jako projekt Centrálního portálu knihoven, do jehož řešení je NLK také zapojena, avšak s daleko menšími zdroji. Výhodou je alespoň v našem kontextu používání hesel MeSH a částečně díky systému Medvik homogenní systémové prostředí, které umožňuje efektivní využívání databází systému při rozvoji por­tálu.

Rád bych ještě zmínil, že se při vývoji portálu Medvik snažíme o to, aby byl maximálně otevřený pro roboty vyhledávacích služeb. Statistiky jeho návštěvnosti za loňský rok ukazují, že z celkového počtu 258 000 návštěv bylo 75 % přes vyhledávač Google. Pokud tedy zpřístupníme kvalitní a zajímavý obsah a poskytneme snadno použitelné služby, je tento kanál neopominutelným zdrojem potenciálních uživatelů. Vel­mi se nám také zvýšila zpětná vazba, kdy se často ozývají googlující autoři, že se jim něco nelíbí v jejich autoritním záznamu nebo že jim byly přiřazeny jiné publikace. Vycházíme jim samozřejmě vstříc, bohužel ne vždy se jedná o chybu na naší straně, protože řadu záznamů přebíráme nebo se často jedná o chybně uvedené nebo nedostatečné údaje ve veřejných zdrojích – což se ale někdy obtížně vysvětluje, protože chybu našli v našem portálu.

Jak a proč jste se rozhodli pro váš – v ČR poměrně ojedinělý – knihovní systém? Jste s ním spokojeni?

Výběr knihovního systému není triviální záležitost, v případě projektu Medvik ještě navíc komplikovaná požadavky na centralizované řešení, které v dané době žádný systém úplně nepodporoval. Systém DAWINCI firmy SVOP nicméně přes počáteční implementační potíže prokázal dostatečnou flexibilitu jak v datových strukturách a nastavitelnosti, tak při vývoji dalších potřebných funkcí. Systém Medvik je provozován již sed­mým rokem v Datovém centru NLK a uživatelé zapojených knihoven se k němu připojují přes klientskou aplikaci komunikující prostřednictvím HTTP protokolu. Medvik je knihovnám poskytován jako kompletní knihovní systém. Záleží však na potřebách konkrétní knihovny, zda využije všechny moduly nebo funkce – například zda v systému využívá kompletní akviziční postup, nebo jenom přírůstkuje. Výhodou pro zapojené knihovny je zejména úspora implementačních a provozních nákladů – systém je lékařským knihovnám poskytován zdarma. Poskytujeme ta­ké zapojeným knihovnám plnou metodickou a uživatelskou podporu i administraci systému. V loňském roce jsme do Medviku zapojili další dvě knihovny, aktuálně tedy provozujeme 12 knihoven sedmi institucí.

Jaké jsou vaše zkušenosti z výběru discovery systému? Jaké má vazby na ostatní vaše agendy?

Výběr discovery řešení pro NLK byl ovlivněn zkušenostmi s dalšími službami producenta systé­mu Summon, které úspěšně využíváme již řadu let pro správu a zpřístupnění e-zdrojů. V loňském roce nám končila smlouva na dnes již přežitý systém federativního vyhledávače, který bylo třeba nahradit. Byly proto spuštěny dva trialy – na Summon a EDS. Oba systémy mají své pro a proti, oba centrální indexy se obsahově do velké míry překrývají, oba mají svoje exkluzivní zdroje. Vzhledem k intenzivnímu používání produktů SerialsSolutions a jejich služeb a výstupů v našich systémech, zejména v portálu Medvik, by ale dostatečně funkční integrace jiného discovery řešení do našeho prostředí byla v dané situa­ci velmi časově i technicky náročná – proto bylo zvoleno řešení Summon. Situaci na trhu discovery řešení však i nadále sledujeme, vzhledem k jejich pokračujícímu vývoji a také k řešení projektu CPK uvidíme, co nám budoucnost přinese.

Vydáváte DVD Bibliomedica – není dnes (perio­dická) produkce offline nosičů poněkud obsoletní? Nese to jistě spoustu práce kolem a příjemcům se hromadí kotoučky, se kterými muse­jí něco dělat, místo aby si jen „klikli“ na nějaký online odkaz. Ptám se záměrně provokativně – dobře si pamatuji dobu, kdy ČNB vycházela na DVD a jak jsem s ní tehdy rád pracoval. Ale to bylo v době, kdy offline verze měla lepší rešer­šní možnosti a byla rychlejší než online verze…

Lze se tomu v dnešní době divit, ale stále ještě jsou uživatelé, kteří DVD Bibliomedica vyžadují a využívají. Vzhledem k tomuto zájmu tedy zatím neplánujeme jejich zrušení, navíc s vydáváním nemáme velkou práci, pouze čtvrtletně exportujeme data, což jsou víceméně automatizované procesy. Faktem však je, že někteří „DVD uživatelé“ velmi rádi přešli na online využívání BMČ přes portál Medvik. O aktuálních počtech uživatelů odebírajících DVD Bibliomedica však nemám přehled.

Závěrečná otázka bude pro tuto rubriku tradiční: jaké jsou podle tebe perspektivy již zmíněného Centrálního portálu knihoven ČR? Jsi členem jedné z pracovních skupin, tak vidíš přípravu i zevnitř…

Perspektiva CPK je dobrá, nicméně je to samo­zřejmě běh na dlouhou trať a cíl je ještě daleko. Podstatné je, že se vůbec takový projekt začal řešit, a že se na něm podílí hodně knihoven. Problematika je to velmi široká a zúčastněné knihovny mají mnoho specifik a samozřejmě také různá očekávání, co by jim vlastně měl CPK přinášet. Takže někdy se konsenzus ohledně dílčích řešení buduje postupně, ale domnívám se, že projekt pokračuje dopředu. Zásadní letos bude celý systém dobře založit tak, aby se dal postup­ně rozvíjet – je zřejmé, že portál nebude hned od začátku „zpívat všechny písničky“. Jedná se primárně o vývojový projekt, představa, že je mož­né celé řešení systému dodat na klíč, je podle mého názoru nerealistická.

Děkuji za rozhovor.

Ptal se JAN KAŇKA kanka@kfbz.cz

 

MGR. FILIP KŘÍŽ

je absolventem Ústavu informačních studií a knihovnictví FF UK. V prostředí lékařských knihoven se pohybuje od roku 2000, od roku 2005 pracuje na plný úvazek v Národní lékařské knihovně. Je vedoucím Oddělení knihovních aplikací a digitalizace. Věnuje se rozvoji systému a portálu Medvik, integraci uživatelských a datových služeb, managementu elektronických zdrojů, správě a rozvoji Digitální knihovny NLK, publikační činnosti a realizaci projektů. Je členem vývojového týmu Kramerius 4 a Pracovní skupiny pro Centrální portál projektu CPK.

 

1 Závěrečná zpráva o projektu je dostupná na adrese http://www.medvik.cz/link/MED00182895.

2 Rozhraní je dostupné na adrese http://nlk.summon.serialssolutions.com.

3 http://www.medvik.cz/bmc