Hlavní obsah stránky

Systém Kramerius v českých a slovenských knihovnách na konci roku 2013

ALEŠ BROŽEK brozek@svkul.cz

Systém Kramerius je jedním z řady nástrojů pro zpřístupňování zdigitalizovaných dokumentů. Jak jsme ukázali v článku otištěném ve Čtenáři č. 4/20121, využívá ho řada knihoven. Porovnáme-li Tabulku 1 ze zmíněného čísla s Tabulkou 1 z tohoto textu a uvádějící počet zdigitalizovaných stran, dozvíme se řadu zajímavých údajů. Počet instalací sloužících uživatelům, kteří si zvykli číst zdigitalizované knihy, časopisy a noviny z pohodlí domova, se zvýšil o sedm. Krameria teď už najdou například jako součást webu liberecké krajské knihovny2 a webu knihovny Fakulty sociálních věd UK v Praze. Mezi 28 instalacemi je Univerzitná knižnica v Bratislave stále jediným slovenským zástupcem. Navíc žel velmi pasivním, protože za uplynulých 24 měsíců nevystavila v tomto systému žádný nový titul. Obdobně dopadl Kramerius i v Národním filmovém archivu a v knihovně Pedagogické fakulty UK v Praze. Jen o trochu aktivnější byla královéhradecká vědecká knihovna a zlínská krajská knihovna. Ta navíc zvládla přechod z verze 3 na verzi 4. Mezi „velké hráče“ zpřístupňující více než milion zdigitalizovaných stran se dostala Moravská zemská knihovna. Díky tomu, že umožnila prohlížet zdigitalizované dokumenty z Národní digitální knihovny, odsunula z vrcholu Národní knihovnu ČR.

Do Krameria NK ČR bylo během dvou let sice přidáno 600 000 stran, ale je to jen zlomek toho, co knihovny v roce 2012 a 2013 zdigitalizovaly z prostředků VISK 7. Pokud začne badatel prohledávat v Krameriovi NK ČR zdigitalizovaná čísla plzeňské Nové doby, najde jen záznamy do roku 1932 a kvůli období z let 1933 až 1945 si musí vyhledat web Krameria Studijní a vědecké knihovny v Plzni. Pečlivého badatele bychom proto měli v knihovnách upozornit na Registr digitalizace3. Byl vytvořen pro její koordinaci a jen z něho se dozví o postupu zpřístupňování dokumentů, které ho zajímají.

I přes relativně malý přírůstek vystavených zdigitalizovaných stránek v NK ČR je potěšitelné, že pokračuje systematická digitalizace titulů periodik, která vycházela po řadu desetiletí. Tabulka 2 přináší přehled nejrozsáhlejších zdigitalizovaných periodik v NK ČR. Je vidět, že oproti stavu k 31. 12. 2011 byly zdigitalizovány například ročníky 1936 až 1938 Reichenberger Zeitung. V tabulce je také vyznačeno, do jaké míry jsou periodika přístupná při prohlížení mimo prostory knihovny. Jak je vidět, míra přístupnosti není dána jen ustanoveními autorského zákona, ale i vstřícností samotných knihovníků.

Ačkoliv vedení Národní knihovny ČR slíbilo několik termínů, dokdy budou zdigitalizovaná data převedena z verze Kramerius 3 do verze Krameria 4, ani jeden nakonec neplatil. Na její obhajobu lze uvést, že musí do jiného formátu převést řádově větší množství dat než kterákoli jiná knihovna. Na konci roku 2011 fungovala verze Kramerius 4 jen v MZK, v průběhu dvou let se konverze zdařila dalším devíti knihovnám. V Tabulce 1 jsou jejich názvy psány kurzívou. Badatel, který pracuje s různými verzemi Krameria, by ale přivítal, kdyby už všechny knihovny přešly na verzi 4. Do prohlížeče se nemusí stahovat plug-in pro formát DjVu, protože data ve verzi 4 (Obr. 1) jsou v užívanějších formátech jpg a pdf. Jednodušší je i vyhledávání s nastavením intervalu let. Na druhou stranu je nepříjemné, že některé zcela logické a jednoduché postupy vyhledávání ve verzi 3 byly nahrazeny složitějšími a uživatelsky nepřívětivějšími. Je proto potěšitelné, že si to tvůrci verze 4 už uvědomili a začali chystat verzi 5.

Verze 4 neodstraní problém chybovosti OCR, programu, který slouží k převodu textu v podobě obrázku do textové podoby. Ačkoli se jedná o důmyslný software porovnávající znaky skenovaného textu s integrovaným slovníkem tvarů a posloupností znaků, občas například písmeno n rozpozná jako a naopak. Kvalita předlohy zejména u starých novin je tak špatná, že i samotný badatel má problém přečíst text, natož pak stroj. Badatel musí počítat i s tím, že ve slovech na konci řádku může být umístěn rozdělovník. Při hledání údajů například o pražském spolku Vltavan nevystačí zadávat slovo Vltavan v různých pádech, ale je vhodné vkládat rozdělovník. K zajímavým novinovým článkům o Vltavanu se badatel dostane, vyzkouší-li hledat také výrazy Vltavau, Vitavan, Vltauan, V!tavan, Vltsvan, Vltavsn, Vttavan, Vltavam, Vltatan, Ultavan, Ultavau, Vltsvsn, ba dokonce VlUwan, tedy řetězce písmen, jež vytvořil program OCR v nesnadno čitelném místě.

I při práci s nejnovější verzí Krameria se dozvíme jen to, na které stránce se najde hledaný výraz, nikoli však v kterém článku či novinové zprávě. Naštěstí u některých instalací zprovoznili administrátoři záložku OCR (umístěnou vedle záložek Náhled a Popis), v níž lze pomocí známé funkce ctrl+F nalézt hledaný výraz přesně na stránce.

Jak přehledně vyznačit hledaný výraz na nalezené stránce vyřešily už konkurenční systémy. Systém ANNO Národní knihovny ve Vídni4 umožňuje od května 2013 prohledávat periodika vydaná v letech 1700 až 1872, přičemž nalezený výraz je v textu v červeně podbarveném rámečku (Obr. 2). Digitales Forum Mittel- und Osteuropa5 naproti tomu zvýrazní nalezený výraz žlutým podbarvením. O obou systémech se zmiňujeme i z toho důvodu, že se v nich najdou zdigitalizovaná periodika vydávaná v českých zemích. V případě vídeňské knihovny jsou to například Moravské noviny, v případě německého fóra Südböhmische Volkszeitung6.

I když nám s digitalizací bohemik pomáhají zahraniční instituce (pro monografie zmiňme Google Books), stále zůstává řada titulů k dispozici pro krajské digitalizační jednotky. Až budou pro uživatele tyto tituly zpřístupněny, nastane ještě větší nutnost vyhledávat postupně v několika instalacích Krameria. Věřme, že to usnadní projekt České digitální knihovny7, který řeší knihovna Akademie věd ČR.

 

1 BROŽEK, Aleš: Systém Kramerius v českých a slovenských knihovnách na konci roku 2011. Čtenář, 64, 2012, č. 4, s. 136–139.

2 Platné adresy knihoven s Krameriem se snažím udržovat v článku na Wikipedii https://cs.wikipedia.org/ wiki/Syst%C3%A9m_Kramerius/. Věřím, že wikipedisté v knihovnách mi budou pomáhat.

3 http://registrdigitalizace.cz/rdcz/Další praktické příklady pro badatele jsem uvedl na 14. konferenci Archivy, knihovny, muzea v digitálním světě 2013. Prezentace je dostupná na http://bulletin.skipcr.cz/prezentace/archivy-2013/Brozek.pdf

4 http://anno.onb.ac.at/

5 http://www.difmoe.eu/?content=Periodika

6 Je zajímavé, že na tyto užitečné systémy a zdroje zdigitalizovaných bohemik upozorňuje návštěvníky webu jen knihovna Fakulty sociálních věd UK v Praze.

7 http://www.linuxexpres.cz/business/ceska-digitalni-knihovna-a-open-source-system-kramerius