Hlavní obsah stránky

Systém Kramerius v českých a slovenských knihovnách na konci roku 2011

ALEŠ BROŽEK brozek@svkul.cz

Je zajímavé, že o Krameriovi je veřejnost stále málo informovaná a ani knihovnická periodika o něm příliš často nepíší.1) Přitom je to systém, který se stále vyvíjí a který zpřístupňuje každým měsícem více a více stran zdigitalizovaných dokumentů. Na konci roku 2011 k němu existoval přístup z webů již dvaceti českých a jedné slovenské knihovny, jak dokládá Tabulka 1. Do krameriovské komunity se konečně zařadila kladenská knihovna a první bibliotéka ze Slovenska.

Zvlášť výrazný byl nárůst zdigitalizovaných dokumentů vystavených na serveru Krameria Národní knihovny. Během posledních dvanácti měsíců přibylo téměř 500 000 stran periodik. Je to díky tomu, že se postupně digitalizují deníky, které vycházely v dlouhém časovém intervalu. Do digitální podoby byly již převedeny ročníky 1846 až 1914 novin Bohemia vydávaných v němčině podobně jako Reichenberger Zeitung z let 1860 až 1935. Tyto noviny nechala převést do elektronické podoby liberecká knihovna, která k tomu využila finanční prostředky v rámci programu VISK 7. Liberecké noviny se tak rozsahem dostaly, jak ukazuje Tabulka 2, před Národní listy, které byly zdigitalizovány již v předchozích letech.

Význam Krameria pro knihovníky i uživatele knihoven není třeba zvláště zdůrazňovat. Knihovníci nemusejí nabízet tištěný dokument a obávat se, že se zažloutlý a křehnoucí papír rozpad­ne v rukách čtenáře. Uživatel knihovny v mno­ha případech nemusí zajít do knihovny, aby si půjčil určitou monografii nebo periodikum, ale stačí, když se na internetu podívá, zda takový dokument byl již zdigitalizován a vystaven. Podle data vydání dokumentu pak zjistí, zda je jeho obsah přístupný mimo vnitřní síť knihov­ny, nebo zda je chráněn a přístupný pouze z počítačů v knihovně. Ale i v tomto případě skýtá Kramerius množství výhod. Uživatel nemusí dokument objednávat, čekat, až mu ho donesou ze skladiště knihovny, ale hned si ho prohlédne na vyhrazených počítačích a případně si vytiskne to, co potřebuje.

Další předností systému je možnost plnotextového vyhledávání. V řadě případů není sice zcela spolehlivé, ale přesto jsem vždy překvapen, co lze v textech nalézt, aniž bych musel pečlivě pročítat stovky stran.

Nezkušený uživatel Krameria však často odchází od počítače zklamaný, protože dosažené výsledky neodpovídají námaze a času, který si pro práci se systémem vymezil. Důvodů je celá řada. U verze 3 mnohdy badatele odradí nutnost stáhnout si speciální plugin, aby si mohl prohlížet dokumenty ve formátu DjVu (naštěstí verze Kramerius 4 pracuje s formáty pdf a jpeg, se kterými běžné internetové prohlížeče nemají problémy). Badateli příliš nepomůže nápověda, která je velmi stručná a je psaná spíše jazykem programátora než tím, který je blízký laikům. Ti ani netuší, že některé knihy a časopisy byly zdigitalizovány, ale najdou se v jiné instalaci Krameria, než s kterou pracují. Do doby, než bude Registr digitalizace spolehlivý, nezbývá uživatelům, než aby se podívali do více instalací. Knihovníci by proto měli na tuto skutečnost upozornit na stránkách, z nichž se vstupuje do Krameria, a odkázat na přehled jeho instalací. Protože odkazy na portálu Krameria zachycují neaktuální situaci z února 2009, kdy existovalo jen 12 instalací, doplnil jsem nejnovějšími odkazy článek o systému Kramerius v české Wikipedii2). Výhodou je, že odkazy na další instalace může do této otevřené encyklopedie připsat kdokoliv, kdo se o nich dozví.

Uživatele Krameria mnohdy ani nenapadne, že některé ročníky jednoho titulu časopisu si může prohlédnout v jedné jeho instalaci a ostat­ní pak v jiné. Například Archiv orientální je téměř kompletně vystaven v síti knihoven Akademie věd, ale digitalizované ročníky 1993 a 1994 jsou k dispozici pouze v síti Jihočeské vědecké knihovny v Českých Budějovicích.

Mnohý uživatel s nelibostí nese, že se v současnosti musí naučit pracovat se třemi různými verzemi, pokud nechce vyhledávat jen v Krameriovi Národní knihovny. Ve většině knihoven byla na konci roku 2011 nainstalovaná verze 3.3.1 z roku 2009. Naproti tomu v Národní knihovně ČR fungovala vylepšená verze z roku 2010, která umožňovala fulltextové vyhledávání dokonce i v aktuálním titulu, ročníku a výtisku. Do budoucna by měly všechny knihovny přecházet na verzi Krameria 4, která byla na konci roku 2011 k vidění jen na webu Moravské zemské knihovny.

Plnotextové vyhledávání je rysem Krameria, který mu mohou závidět podobné zahraniční systémy. Rakouská národní knihovna se na konci roku 2011 pyšnila, že do jejího systému Austrian Newspaper Online, známého spíše pod zkratkou ANNO3), už během jednoho dne vstoupilo 3000 uživatelů a že počet naskenovaných stran překročil číslo 6,5 milionu.4) Vyhledávat slova v naskenovaných  dokumentech v systému ANNO však stále není možné.

Důvodem poměrně malé úspěšnosti plnotextového vyhledávání v Krameriovi je nekvalitní tisk novin. Písmeno „e“ tak proces OCR často zpracuje jako „c“, „u“ jako „n“. Slovo „ulice“ je proto potřeba při hledání zapsat i v podobě „nlice“, „nlicc“ i „ulicc“. Badatel nesmí také zapomínat na skutečnost, že slova v textech jsou často rozdělena pomocí rozdělovníku. Hledá-li články, v nichž se píše o praporech, musí do vyhledávacího pole zapsat slovo prapor nejen v jednotném i množném čísle a ve všech pádech, ale i v podobách „pra-por“5) nebo „pra-pory“ či „prapo-ry“. Badatel si musí také uvědomit, že se pravopis slov během desetiletí měnil. V 19. století se např. velmi často slovo „prapor“ psalo s dlouhým „a“, proto je nutné vyhledávat i tuto podobu.

Nepříjemná je skutečnost, že uživatel se sice dozví, na které stránce je hledaný výraz, ale nikoli na kterém místě. Zejména u novin, kde je tisk drobným písmem a v několika sloupcích, musí počítat s tím, že i s cvičeným okem nalezení odstavce s hledaným výrazem chvíli trvá. Naštěstí systém nabízí nejen odkaz na stránky obsahující hledané slovo, ale zobrazí i kus textu s vyznačeným slovem (Obr. 1). V případě, že je to slovo příliš běžné, je vhodnější vybrat ze zo­brazeného kusu slovo ojedinělé nebo slovo rozdělené rozdělovníkem. Pak se slovo s rozdělovníkem hledá jen na pravých okrajích tiskových sloupců. Je samozřejmé, že výhodné je mít co největší obrazovku počítače. V některých knihovnách jsou proto počítače, kde se pracuje se systémem Kramerius, vybaveny velkoplošnými obrazovkami postavenými na výšku.

Obr. 1

Zdá se, že mnohé monografie a ročníky novin dosud nebyly zpracovány procesem OCR a jsou vystaveny jen jako obrázek. Po vepsání  kteréhokoli slova s výjimkou slov vyskytujících se v bibliografickém popisu dokumentu proto systém ohlásí „Nalezeno 0 záznamů“. To byl v loňském roce  případ monografií a novin vystavených na serveru Krameria Divadelního ústavu v Praze a Vysoké školy ekonomické. Ale ani u již zmíněných novin Bohemia se na konci roku 2011 na serveru Národní knihovny ČR nedalo plnotextově hledat ve všech ročnících. Rok 1883 a 1885 byl prohledatelný, rok 1884 nikoli. Přitom roky 1883 až 1885 byly tištěny stejným typem fraktury. Nemožnost vyhledávat slova v Krameriusových císařských královských vlasteneckých novinách z let 1719 až 1727 lze přičíst patrně na vrub tehdy užívaným fontům, které zatím OCR nezvládá.

I když systém zobrazí část textu s vyznačeným slovem, v případě práce s Krameriem mimo síť knihovny se po poklepu myší na příslušný odkaz nezobrazí vždy text stránky, ale občas upozornění na zákon č. 121/2000 Sb. (autorský zákon). Ten říká, že volně zpřístupňovat lze jen díla autorů, od jejichž smrti uplynulo 70 let. České knihovny si stanovují rozdíl­né limity pro veřejný přístup. Národní knihov­na ČR v roce 2011 posunula linii pro jednotlivá vydání periodik do roku 1890 a monografií do roku 1880, Mendelova univerzita umožňuje studovat z domova i monografie vydané před rokem 1920. Moravská zemská knihovna se inspirovala Rakouskou národní knihovnou. Je vstřícnější vůči badatelům a zpřístupňuje ročníky novin a časopisů vydané před rokem 1940.

Pokud badatel narazí na takto chráněná díla, nezbývá mu, než si poznamenat názvy knih a periodik včetně příslušných stránek a zbytek práce dokončit na počítači v knihovně.

Doufejme, že připravovaná novela autorské­ho zákona  nebude vůči možnostem, které nabízí systém Kramerius, macešská a umožní, aby práce s tak mimořádným systémem přinášela badatelům jen radost. V budoucnu by totiž jeho prostřednictvím měly být zpřístupněny další miliony stran zdigitalizovaných dokumen­tů v rámci projektu Národní digitální knihovny a krajských digitalizačních projektů.

 

ODKAZY:

1) Výjimkou je časopis Čtenář, který se věnoval systému Kramerius spíše z pohledu programátorského v č. 6/2005 a poté v č. 6/2011, kdy referoval o systému Kramerius 4.

2http://cs.wikipedia.org/wiki/Syst%C3%A9m_Kramerius

3http://anno.onb.ac.at/

4) Čeští badatelé ocení, že ANNO již digitalizovalo několik moravik a bohemik, např. olomoucký Mährisches Tagblatt z let 1880–1898, brněnský Brünner Hebammen-Zeitung z let 1908–1918, pražský Čech z let 1904–1915, Die Epoche z let 1878–1880, Prager Tagblatt z let 1877–1938, plzeňský Pilsner Tagblatt z roku 1900–1918 a další.

5) V přednášce proslovené na 12. konferenci Archivy, knihovny, muzea v digitálním světě 2011 (www.skipcr.cz/dokumenty/akm-2011/Brozek.pdf) jsem ukázal, že podoba „pra-por“ se v pražském Krameriovi objevila při prohledání periodik 5330krát, což není zanedbatelný počet!