Hlavní obsah stránky

Znovu a lépe! Zpráva o digitalizaci z Hradce Králové

LUCIE JIRKŮ lucie.jirku@svkhk.cz

Studijní a vědecká knihovna v Hradci Králové (SVK HK) před započetím krajského projektu Digitalizace a ukládání1digitalizovala pouze službou, vlastní digitalizační pracoviště neměla. Už od roku 2001 jsme však digitalizovali vybraná regionální periodika v rámci projektu VISK 7 a z jiných zdrojů pak cca 100 regionálních monografií. Dokumenty byly zpřístupňovány ve vlastní digitální knihovně v systému Kramerius.

V letech 2009–2010 se rozběhly v jednotlivých krajích přípravy projektů, jejich realizace postupovala různým tempem, stejně tak se lišil i rozsah projektů. V našem kraji bylo rozhodnuto o realizaci varianty, kde část digitalizace proběhne službou – digitalizace knihovních fondů (500 000 stran) a dokumentů (100 000 stran) pro organizace kraje, a zároveň v prostorách SVK HK vznikne menší Krajská digitalizační jednotka, jejímž provozem pak bude zajištěna udržitelnost projektu. Výsledkem digitalizace službou měly být PSP balíčky podle aktuální specifikace Národní digitální knihovny (NDK) – stejné balíčky měla být schopna produkovat také Krajská digitalizační jednotka. Kromě nich jsou uchovávány též původní surové dvoustrany ve formátu TIFF. Bylo rozhodnuto, že skenovat se bude na 300 dpi, a to (dle rozhodnutí u každé předlohy) buď plnobarevně, nebo ve stupních šedi.

Příprava fondu

Zatímco se na Kraji chystal projekt, v knihovně se připravoval fond k digitalizaci. Zpočátku byla příprava zajišťována postupně různými pracovníky, počátkem roku 2011 nám ale zřizovatel vyšel vstříc a dostali jsme v souvislosti s projektem do stavu jeden úvazek jen na digitalizaci a elektronické zdroje. Tím, že digitalizaci knihovních fondů řešil Kraj až jako poslední část projektu, měli jsme poměrně dost času na přípravné práce – a to, co se původně jevilo jako nevýhoda, se pak ukázalo jako výhoda. Kromě dostatku času na poctivou rekatalogizaci „s knihou v ruce“ jsme díky téměř dvouletému zpoždění měli v době vyhlášení výběrového řízení k dispozici metadatové standardy NDK, navíc se v době realizace zlepšilo fungování Registru digitalizace (RD), přibyla možnost posílat do něj hlášení dávkově v MARCxml (předchozí ruční vyplňování tabulek jsme tak mohli nahradit jednoduchým exportem ze systému Aleph), začal fungovat Resolver URN:NBN a měli jsme už také k dispozici zkušenosti z jiných krajů, kde byli rychlejší.

Během příprav byly na straně knihovny nejprve připraveny seznamy titulů vhodných k digitalizaci, celkový počet stran u vytipovaných dokumentů byl kolem 900 000, z těch se mělo dále vybírat. Šlo o regionální monografie a periodika vztahující se k území současného Královéhradeckého kraje. Speciální oblastí pak byly regionální osobnosti – k digitalizaci byla připravena jak díla daných autorů, tak díla pojednávající o nich (např. J. Škvorecký, M. Kubátová, K. V. Rais, J. Gočár, J. Kotěra a další spisovatelé či jiné osobnosti významné pro Hradec Králové či Královéhradecký kraj). Po přípravě soupisů následovala fyzická kontrola svazků ve skladech, kdy se porovnávaly počty stran a formáty uvedené v záznamech se skutečným stavem, abychom získali reálnou představu o počtu stran u jednotlivých formátů (pro zajímavost – cca měsíc práce ve dvou lidech). Poté byly tituly podle upravených seznamů postupně brány k rekatalogizaci, což si vyžádalo velkou součinnost dalších odborů a oddělení – správy fondů a jmenné a věcné katalogizace. Současně jsme ověřovali, zda daný titul už není digitalizován nebo připraven k digitalizaci někým jiným, což v počátcích příprav, kdy byly s fungováním RD problémy a existovala velká zpoždění při aktualizaci, znamenalo raději zkontrolovat jednotlivě všechny významnější digitální knihovny. Také jsme museli porovnat navzájem seznamy dalších osmi knihoven kraje, které o zapojení do projektu projevily zájem, abychom vyloučili duplicity. Proškrtané seznamy jsme pak vraceli knihovnám – ty měly za úkol tituly rekatalogizovat s knihou v ruce, zajistit čísla ČNB (pokud dokumentům příslušely) a záznamy zaslat do SK a RD. Stejné činnosti probíhaly několik let i v krajské knihovně při přípravě našeho vlastního fondu.

Vzhledem k tomu, že jsme neměli k dispozici žádný software pro sledování celého workflow digitalizace, odehrávalo (a odehrává) se vše ve sdílených tabulkách a dokumentech. A vzniklo jich postupně celkem dost; zatím žádná tabulka, zamýšlená jako poslední a definitivní, poslední a definitivní nebyla…

Výběrové řízení a realizace

Nositelem projektu byl Královéhradecký kraj, ale i naše instituce měla možnost se do určité míry zapojit do přípravy projektu a průběhu výběrového řízení. Zakázka Služba digitalizace a dodávka vybavení krajské digitalizační jednotkybyla rozdělena na dvě části, byla vyhlášena v 1. polovině roku 2013 a na konci téhož roku byly s vybranými uchazeči uzavřeny smlouvy. Pro digitalizaci službou (část A) byla vybrána místní firma A-Scan, s. r. o., a pro dodávku vybavení Krajské digitalizační jednotky (část B) pražská firma ICZ, a. s.

V lednu a únoru 2014 nastoupili na pracoviště v SVK HK tři „projektoví“ pracovníci (na DPČ s Krajem). Současně nám zřizovatel vyhověl a v únoru jsme dostali na digitalizaci a práci s e-zdroji ještě celý úvazek, který jsme mohli v průběhu realizační fáze využít především pro potřeby projektu. Za vstřícnost Kraje v personálních otázkách jsme byli velmi vděční. Měli jsme tak k dispozici dva celé úvazky na digitalizaci přímo ve stavu a tři poloviční úvazky z projektu, takže jsme byli například schopni hned kontrolovat odevzdávaná data a odchytávat chyby průběžně, aby nedocházelo zbytečně k jejich opakování v dalších dávkách.

Krajská digitalizační jednotka (KDJ)

Na konci února 2014 proběhla instalace vybavení KDJ. Dodávku provedl subdodavatel firmy ICZ, firma INCAD. Pracoviště v suterénu SVK HK bylo vybaveno kvalitním knižním skenerem Bookeye3 formátu A2 a dvěma pracovními stanicemi se SW na úpravu skenů BCS-2 a open source systémem ProArc pro metadatový popis. Součástí dodávky byl také ABBYY Recognition Server pro OCR s licencí na 15 000 stran měsíčně. V této části projektu nebyly větší problémy, dodávka sice nebyla v termínu kompletní a část věcí se řešila za chodu, ale všechny nedostatky byly postupně odstraněny a spolupráce se subdodavatelem fungovala velmi dobře. Po ukončení tříměsíčního a velmi intenzivního testování jsme na konci června 2014 zahájili ostrý provoz. Během prvního půl roku jsme spoustu titulů zpracovávali opakovaně, vždy se objevilo něco, kvůli čemu bylo třeba vše smazat a začít nanovo. Naším heslem se v té době stalo „znovu a lépe“ – a vydrželo nám minimálně po celou realizační fázi. Ve velkém formátu jsme si ho vyvěsili i na dveře KDJ, kam k němu postupně přibývala další hesla z právě skenovaných (několik desítek let starých) novin jako „od každého kvalitní práci“, „knihovna má dobré výsledky“, „každý podle svých schopností“ či „společná práce nás stmelila“.

I ostrý provoz se zpočátku nesl ve znamení testování ProArcu, vychytávání chyb a vylepšování jeho funkcí, což bylo nakonec i vítaným zpestřením práce. S čím jsme se občas dost potýkali, byl popis digitalizovaných periodik – doporučující pravidla, která byla tehdy k dispozici v rámci NDK, vycházela z ideální situace a především u periodik nepokrývala všechna specifika našeho fondu. Práce na KDJ se občas také měnila v detektivní v případě špatně svázaných či přeházených stran, čísel, ročníků, obálek či různých příloh u periodik. V takových případech jsme pak prosili o pomoc knihovníky z dalších institucí (nejen) v našem kraji, aby prověřili, jak dané periodikum vypadá v jejich fondu. Nikdy jsme se nesetkali s neochotou pomoci a téměř vždy jsme se s pomocí kolegyň nakonec dopátrali správného výsledku. Realizační fáze, kdy na KDJ pracovali projektoví pracovníci, trvala do konce února 2015.

Poté začala běžet doba udržitelnosti projektu a od 1. března 2015 jsme dostali pro práci na KDJ do stavu jeden úvazek. Zároveň se SVK HK zapojila do projektu Úřadu práce ČR pro absolventy, díky kterému jsme získali ještě další dva úvazky. Při třech až čtyřech pracovnících přímo pro KDJ pak byla naše produkce asi 14 000 stran měsíčně, projekt byl však časově omezen. V roce 2016 jsme se vrátili na oddělení digitalizace k počtu tří úvazků. S tím, že oddělení zajišťuje nejen provoz KDJ a veškeré práce související s digitalizací, včetně přípravy a zpřístupnění, obsahovou správu Digitální knihovny, ale také získávání a ukládání e-zdrojů, uzavírání smluv s nakladateli a další činnosti. Zároveň spolupracujeme na vývoji systému ProArc a RDflow.

Digitalizace službou

Jestliže realizace části B byla relativně bezproblémová, část A byla náročnější. Domluva s dodavatelem, firmou A-scan, nebyla jednoduchá (zejména zpočátku), práce nepostupovaly a byli jsme nespokojeni především s kvalitou skenů. Situace se zlepšila v polovině roku 2014 vstupem subdodavatele (firma archlife, s. r. o., respektive INCAD), zajišťujícího metadatový popis, respektive infrastrukturu pro zpracování. Na zakázce se začalo systematičtěji pracovat a i přes trvající problémy s kvalitou a dodržováním termínů začal dodavatel postupně odevzdávat dávky. Tuto část by však nebylo možné dovést do zdárného konce bez nadstandardního zapojení oddělení digitalizace SVK HK – ať už kmenových zaměstnanců, či těch „projektových“. Aby se nakonec vše stihlo, stálo to hodně úsilí a času našich pracovníků. Po skončení realizační fáze probíhaly v knihovně celé první pololetí roku 2015 ještě další kontroly odevzdaných dat a balíčky s nalezenými chybami byly reklamovány.

Uložení a zpřístupnění dat

V našem kraji, na rozdíl od některých jiných, nevznikl v rámci projektu Krajský digitální repozitář. Odevzdaná data z digitalizace službou jsou tak uchovávána jen na odevzdaných HDD (a podle pokynů Kraje ve stavu, ve kterém je dodavatel předal) ve dvou kopiích – v SVK HK a na Kraji. V knihovně máme data ještě zkopírována do vlastního úložiště (kde však nejde o dlouhodobou ochranu) a tam je v případě reklamací opravujeme, aby byla stále aktuální.

Pro zpřístupnění uživatelům byly výsledné NDK balíčky z digitalizace službou i z produkce KDJ importovány do Digitální knihovny SVK HK2. Od počátku krajského projektu do 31. prosince 2015 bylo do digitální knihovny naimportováno nově 469 400 stran z 848 monografií a 118 titulů periodik. Další přírůstky průběžně přibývají a budou přibývat i nadále; k 29. únoru 2016 bylo v naší digitální knihovně celkem 1 046 102 stran, 1117 monografií a 154 titulů periodik. (Pro porovnání – před projektem obsahovala jen 550 038 stran z 98 monografií a 22 titulů periodik.) Přes naši digitální knihovnu jsou zpřístupňována také data většiny dalších knihoven zapojených do projektu. Knihovny v ní mají vlastní virtuální sbírky a zpřístupnění u autorsky chráněných titulů je vázáno na IP adresy vybraných počítačů v té které knihovně.

Výsledky digitalizace se snažíme zpřístupnit a zužitkovat co nejvíce. Od března 2015 je naše digitální knihovna přístupná také v mobilní aplikaci Kramerius vyvíjené MZK3 a v únoru 2016 začal být její obsah (vedle NDK, MZK, KNAV a NTK) sklízen do České digitální knihovny4.

Samozřejmostí po importu do digitální knihovny je okamžité doplnění odkazu na digitalizovaný dokument do katalogizačního záznamu monografie či periodika a v roce 2015 jsme v oddělení digitalizace začali i s propojováním záznamů článků na zdigitalizovaná periodika v digitální knihovně (ze záznamu článku odkazujeme na číslo, ve kterém se nachází daný článek). Během roku 2015 bylo propojeno 6493 analytických záznamů a v propojování pokračujeme i nadále. Ke konci února 2016 je propojeno 6818 článků z celkem sedmi titulů (např. KrkonošeNoviny Jičínska či Krkonošské noviny), v roce 2016 plánujeme takto zpracovat minimálně tři další regionální periodika.

Co napsat závěrem? Především – realizační fáze projektu, kterou bylo třeba stihnout v extrémně krátkém čase, byla velmi náročná. Na druhou stranu bylo zajímavé zjistit, co všechno jsme v knihovně schopni zvládnout a ustát. A asi nejdůležitějším poznatkem je, že práce na digitalizaci nikdy nekončí – chyby v už hotovém objevujeme (náhodně) pořád, takže je stále co opravovat, znovu exportovat, validovat, importovat… Skoro se chce parafrázovat postřižinskou hlášku – Nudíte se? Kupte si knižní skener!

 

1 Královéhradecký kraj. Projekt III. Digitalizace a ukládání, reg. č. CZ.1.06/2.1.00/08.07379

2 http://kramerius4.svkhk.cz/

3 Ke stažení na https://play.google.com/store/apps/details?id=cz.mzk.kramerius.app&hl=cs

4 http://www.czechdigitallibrary.cz/