Main content

Národní úložiště šedé literatury (NUŠL)

PETRA PEJŠOVÁ> petra.pejsova@techlib.cz

Na počátku roku 2010 se šedá literatura dostala na krátkou dobu do popředí zájmu světových médií, a to v souvislosti s mylnou informací o tání himalájských ledovců ve zprávě Mezivládního panelu ke klimatické změně (IPCC) z roku 2007. Problémem zde bylo, že ve zprávě byl bez jakéhokoliv ověření citován neověřený zdroj, tzv. šedá literatura.

Co je šedá literatura?

Existuje několik definic, z nichž asi nejznámější je ta, která vznikla v Luxemburgu v roce 1997 a v roce 2004 se rozšířila v New Yorku1. Volně přeloženo: Šedá literatura jsou informace produkované na všech úrovních vládních, akademických, obchodních a průmyslových institucí jak v elektronické, tak v tištěné podobě, které neprošly standardním vydavatelským procesem či nejsou distribuovány do standardní prodejní sítě, tj. jsou vydávány institucemi, jejichž hlavní činností není vydavatelská činnost.

Co vše si tedy lze pod šedou literaturou představit? Jsou to různé druhy zpráv (např. výzkumné, výroční, závěrečné z projektů), konferenční materiály (např. články, prezentace, postery), vysokoškolské kvalifikační práce (např. diplomové, disertační), firemní literatura (např. katalogy, návody), studijní materiály (např. učební texty, osnovy, záznamy z přednášek), formální i neformální komunikace (např. telefonické rozhovory, e-maily, blogy), sociální sítě (např. Twiter, Facebook), diskuse na wiki aj.

Pro vědecké účely je nezbytné používat vedle recenzovaných zdrojů též šedou literaturu, protože je v ní publikováno mnoho cenných údajů. V tomto případě se jedná především o zprávy na všech úrovních vládních a akademických orgánů, výroční zprávy podniků, závěrečné zprávy z projektů, konferenční materiály, preprinty apod. Diskutabilní jsou ovšem informace typu blogů, telefonních rozhovorů, diskusí, e-mailů apod., které jistě pomůžou dotvořit komplexní obraz o daném tématu, ale je nutné je před použitím pro seriozní práci pečlivě ověřit. Problematický je i sběr a dlouhodobé uchování takovéto neověřené literatury. Při sběru šedé literatury by se proto měl klást důraz na „důvěryhodnost“ informací, která může být zajištěna buď spoluprací s ověřenými producenty, jako jsou ústavy AV ČR, vysoké školy, státní správa atd., nebo výběrem těch druhů šedé literatury, které již prošly ověřovacím procesem, jako jsou závěrečné zprávy, konferenční materiály apod.

Národní úložiště šedé literatury

Systematické shromažďování, dlouhodobá archivace a především zpřístupnění ověřené šedé literatury uživatelům z oblasti vědy, výzkumu a vzdělávání na národní úrovni je cílem Národního úložiště šedé literatury (NUŠL). NUŠL je projekt Národní technické knihovny, která tak navázala na své předchozí zkušenosti se spoluprací s Evropskou asociací pro vy-užívání šedé literatury - EAGLE (European Association for Grey Literature Exploitation). EAGLE provozovala Evropský systém informací pro šedou literaturu - SIGLE (System for Information on Grey Literature in Europe). NTK byla zástupcem EAGLE za Českou republiku v letech 1995 až 2005, kdy byl tento systém ukončen.

Projekt Národního úložiště šedé literatury (NUŠL) se začal realizovat díky podpoře Ministerstva kultury České republiky v rámci programových projektů výzkumu a vývoje jako výzkumný záměr pod názvem Digitální knihovna šedé literatury - funkční model a pilotní realizace. Tento projekt je rozdělen do tří etap, které probíhají od roku 2008 do roku 2011. Jeho hlavním cílem je systematicky shromažďovat, dlouhodobě archivovat a zpřístupňovat odbornou šedou literaturu především z oblasti výzkumu a vývoje, státní správy a školství, ale i z komerčního sektoru a „open access“ na národní úrovni. Na podporu tohoto cíle NTK vytváří fungující síť partnerských organizací, funkční model a pilotní aplikaci. Dále na základě ověřené technologie a metod definovaných v rámci projektu vznikají doporučení a standardy pro další instituce, které se rozhodnou vytvářet digitální sbírky šedé literatury. Doporučení a standardy představují zejména doporučený metadatový formát, výměnné formáty a šablony, vzory licenčních modelů a řešené právní problematiky, metodiku ochrany, archivace a zpřístupňování digitálních dat.

Typologie NUŠL

Oblast sběru šedé literatury do NUŠL je definována v typologii, která je strukturována do více úrovní, aby mohla být lépe vyjádřena jednotlivá hlediska. Základní typologie znázorněná myšlenkovou mapou popisuje veškerá kritéria pro dokumenty, které jsou přijímány do NUŠL. Mezi základní kritéria patří sběr dokumentů v elektronické formě od roku 2009 a výběrově starších. Elektronickou formu představují především „digital born“ nebo digitalizované dokumenty. Co se týče bibliografických záznamů, jsou sbírány všechny dostupné záznamy o šedé literatuře v ČR bez omezení. Dodávky šedé literatury jsou zajišťovány od partnerských organizací z oblasti školství, výzkumu a vývoje, státní správy, komerčního sektoru a ověřených „open access“ zdrojů. Zařazována je šedá literatura, která vznikla v České republice, a jejíž obsah musí být původní a odborný. Preferovaný jazyk práce je český, anglický, slovenský a výběrově další evropské jazyky.

Ze základní typologie je dále rozpracována charakteristika druhu dokumentu, kde jsou základními skupinami vysokoškolské kvalifikační práce, studijní materiály, zprávy, autorské práce, firemní literatura, konferenční materiály a další. Jednotlivé skupiny již obsahují konkrétní druhy dokumentů. Předmětem projektu je též ověřit, které z druhů dokumentů budou početnější, a rozšířit tuto typologii o nové druhy dokumentů potřebné pro vědu a vzdělávání.

Centrální rozhraní NUŠL 

Od konce roku 2009 je k dispozici centrální rozhraní NUŠL pro snadné vyhledávání šedé literatury v České republice. Do tohoto rozhraní se postupně připojují ústavy AV ČR, vysoké školy, grantové agentury a další. Pomocí tohoto rozhraní jsou zpřístupněna metadata a plné texty šedé literatury z oblasti vědy, výzkumu a vzdělávání. Centrální vyhledávací rozhraní obsahuje funkce Web 2.0 a poskytuje vizualizaci dat a kontextovou dynamickou navigaci, které se mění se zpřesňováním dotazu. Všechna propojení vznikají dynamicky na základě aktuálně sestaveného dotazu, a tak umožňují pracovat se souvislostmi mezi dokumenty. V letošním roce je centrální rozhraní NUŠL nominováno na Cenu INFORUM 2010.

Navigace představují textové filtry v levé části obrazovky - viz obrázek, kterými jsou typ dokumentuosobyklíčová slova jazyk. Navigace typ dokumentu je strukturovaná do dvou úrovní, např. Konferenční materiály se dále dělí na Příspěvky, Sborníky a Prezentace. V této navigaci jsou zobrazeny všechny typy dokumentů v NUŠL. Navigace Osoby obsahuje jak autory dokumentů, tak další osoby spojené s tvorbou dokumentu, např. vedoucí práce u vysokoškolských kvalifikačních prací. Navigace Klíčová slova zahrnuje termíny v českém a anglickém jazyce. V navigacích Osoby a Klíčová slova jsou primárně zobrazeny čtyři termíny a maximálně 25 termínů. Navigace Jazyk poskytuje výběr všech jazyků. U jednotlivých položek v navigacích jsou vždy v závorce uvedené odpovídající počty záznamů, např. Sborníky (575). Počty záznamů v závorkách můžete vidět i u jednotlivých připojených zdrojových bází v horní liště. Zde vidíte, že zdroj NTK obsahuje 8999 záznamů, zdroj VŠE 16 420 záznamů atd. Na obrazovce se nachází ještě další pomůcka pro vyhledávání, kterou je časová osa. Na ní můžete vybrat buď konkrétní rok, nebo časové rozmezí. Výběr z časové osy je nutné vždy aktivovat tlačítkem Použít.

Dotaz lze sestavit postupným výběrem vyhledávacích kritérií z navigací nebo zadat text do vyhledávacího okénka; dále je opět možné výsledek zpřesňovat pomocí navigací, které se po každém zpřesnění mění a nabízejí jen možné varianty. Jakmile zadáte dotaz, objeví se v levé části nad navigacemi tzv. seznam omezení, která lze přidávat zpřesňováním dotazu a též je libovolně odstraňovat pouhým kliknutím myši.

Základní informace o dokumentu se dozvíte ve výpisu a podrobné informace včetně dostupnosti dokumentu se zobrazují postavením kurzoru na tuto ikonku . Název obsahuje aktivní odkaz do zdrojové databáze přímo na konkrétní záznam. Dostupnost dokumentu se pak řídí pravidly zdrojové báze. 

V současné době jsou připojeny čtyři hlavní zdroje (NTK, VŠE, AV ČR a digitální repozitář) s více než 31 000 záznamy. Vyhledávání v cen-trálním rozhraní si můžete vyzkoušet na www.nusl.cz.

Webové stránky

V roce 2008 vznikly první české webové stránky plně se věnující šedé literatuře. Poskytují informace o šedé literatuře z tuzemska i ze světa, a to zejména k legislativě spojené s šedou literaturou v ČR, o informačních zdrojích šedé literatury, odkazují na portály podporující výzkum a vývoj ve vědě v ČR, informují o projektu NUŠL a zpřístupňují on-line sborník ze Semináře ke zpřístupňování šedé literatury. Pomocí webových stránek je podporována spolupráce NUŠL s producenty dat šedé literatury, jsou vytvořeny v aplikaci Media wiki, která podporuje sdílenou tvorbu obsahu v rámci pracovní skupiny a otevírání diskusních skupin k jednotlivým tématům i s účastí veřejnosti. Na stránkách jsou průběžně aktualizovány informace o projektu, zveřejňovány jeho výstupy a je zde vystavena lokální instalace digitálního repozitáře ke stažení; od roku 2009 mají svoji anglickou verzi, která je kopií verze české. Webové stránky NUŠL naleznete na adrese http://nusl.techlib.cz/.

Akce zaměřené na oblast šedé literatury

Od roku 2008 se každoročně pořádá Seminář ke zpřístupňování šedé literatury s cílem informovat a podporovat odbornou diskusi z oblasti šedé literatury.

Témata na seminářích reflektují aktuální řešenou problematiku související s šedou literaturu jak v ČR, tak v zahraničí, jako je stav systémů pro šedou literaturu v tuzemsku i ve světě, formáty, standardy pro dlouhodobé archivování, standardizace pro popis a výměnu zdrojů, autorská práva, perzistentní identifikátory a další. Semináře jsou pořádány česko-anglicky s anglickým sborníkem. Důvodem je snaha přiblížit se zahraniční komunitě šedé literatury, která je prozatím velice malá a každý výstup ve všem srozumitelném jazyce je tedy velmi cenný. První dva ročníky semináře byly pořádány na půdě Vysokého učení technického v Brně. V letošním roce se bude seminář konat v NTK v Praze. Všechny prezentace a plné texty přednášek jsou k dispozici v on-line sborníku http://nusl. techlib.cz/sbornik/.

Na závěr tedy nabízím několik pozvánek:

• Prezentace Národního úložiště šedé literatury na konferenci INFORUM 2010 se uskuteční 26. května 2010 na VŠE v Praze v sekci Informační zdroje 3 krát jinak.

• Twelfth International Conference on Grey Literature pořádaná 6.-7. prosince 2010 v NTK. Celosvětové setkání mezinárodní komunity pro šedou literaturu, letošní ročník bude zaměřen na témata spojená s transparentností šedé literatury a jejího bezproblémového propojení s procesy výzkumu, autorství, publikování, indexace a jejího využívání ve znalostní společnosti.

• Třetí ročník Semináře ke zpřístupňování šedé literatury proběhne 8. prosince 2010 v NTK a bude rozvíjet témata z předchozích ročníků, především technické řešení sběru a zpřístupnění digitálních sbírek šedé literatury s důrazem na budování partnerské sítě.

 

ODKAZY: 

1 „Information produced on all levels of government, academics, business and industry in electronic and print formats not controlled by commercial publishing i.e. where publishing is not the primary activity of the producing body.“

(Luxembourg, 1997 - Expanded in New York, 2004, dostupné na www <http://www.greynet.org/index.html>)