Main content

TÉMA: Koncepce digitalizace: Priority digitalizace v Moravské zemské knihovně

PETR ŽABIČKA  Petr.Zabicka@mzk.cz

Moravská zemská knihovna (MZK) začala s digitalizací v malém rozsahu již před rokem 2000. Příspěvek popisuje vývoj tohoto uchovávání dokumentů do současnosti a jeho možnosti v budoucnu.  

V začátcích digitalizace u nás se jednalo zejména o digitalizaci nejvzácnějších rukopisů dodavatelskou formou, obvykle s podporou VISK 6. Takto pořízené digitalizáty byly následně zpřístupněny prostřednictvím Manuscriptoria. V oblasti novodobých fondů bylo v této době prioritou mikrofilmování nejžádanějších titulů novin na vlastním pracovišti, k němuž se postupně přidávaly i aktivity digitalizační, zahájené digitalizací mikrofilmů Lidových novin, realizované dodavatelsky s podporou VISK 7. Od roku 2007 byly výsledky procesu digitalizace spolu s periodiky replikovanými z jiných knihoven zpřístupňovány v systému Kramerius 3. Ve stejné době MZK díky mezinárodnímu projektu EuropeanaTravel a VISK zdigitalizovala i své mapové a grafické sbírky, k čemuž už částečně využila digitalizační pracoviště, vznikající transformací pracoviště mikrofilmovacího.

Projekt Národní digitální knihovny

Tyto aktivity následně vyústily do spolupráce s Národní knihovnou ČR (NK ČR) na přípravě a realizaci projektu Vytvoření Národní digitální knihovny (NDK). Klíčovou vizí bylo udělat první krok na cestě k úplné digitalizaci našeho kulturního dědictví. V této době se odhadovalo, že v rámci projektu NDK dojde ke zvýšení poměru digitalizovaných stran bohemikálních dokumentů z přibližně dvou na deset procent jejich celkového množství. Tohoto cíle se přes všechny peripetie podařilo dosáhnout. Špičkový výkon digitalizačních pracovišť v době realizace projektu dosahoval až šest milionů stran ročně v NK ČR i v MZK s jediným cílem: dodržet indikátory projektu.

Takto obrovský výkon však s sebou nesl skryté úskalí: dosáhlo se ho na úkor cíleného obsahového výběru dokumentů. Ačkoli MZK disponuje řadou skenerů různých typů včetně několika skenerů automatických, důležitou roli hrála vždy tzv. destruktivní digitalizace, tedy proces využívající svazky vyřazované ze soukromých i veřejných knihoven, které byly určeny do sběru. Takto získaným svazkům jsou odříznuty hřbety a v podobě sady volných listů se skenují na rychlých dokumentových skenerech. Teprve po naskenování se tyto svazky likvidují.

Vedlejším efektem této aktivity bylo doplnění knihovních fondů o dokumenty, které v nich chyběly (např. z důvodu neobdržení povinných výtisků nebo jako náhrada za poškozené či ztracené svazky). Destruktivní digitalizace je dodnes nejsnadnější a nejlevnější cestou k naplňování původní vize úplné digitalizace bohemikální produkce. Jako průvodní efekt navíc zajišťuje ochranu svazků uložených ve fondu knihovny, které nejsou díky destruktivní digitalizaci zatěžovány skenováním ani nadměrným půjčováním. Zároveň se po deseti letech digitalizace dá říci, že již byla digitalizována většina knih, které v minulosti vycházely ve velkých nákladech, a byly tak ve své době známy významné části čtenářů.

Aktualizace strategie digitalizace

Mimo digitalizace běžných knihovních fondů se MZK zabývá i digitalizací zvukových dokumentů a do digitální podoby převedla i svou sbírku videopořadů na kazetách VHS. Za důležitou se považuje i ochranu elektronických dokumentů na pevných nosičích, pro jejichž ochranu vyvinula systém CDArcha.

Na základě těchto zkušeností připravuje MZK aktualizaci své strategie digitalizace, která při stanovování priorit zohledňuje jak potřeby knihovny a jejích uživatelů, tak obecné priority stanovené v národní strategii digitalizace, kterou v současnosti dokončuje NK ČR.

V rovině organizační je pro MZK i nadále prioritou úzká spolupráce s NK ČR, se kterou MZK sdílí digitalizační linku. Přestože má toto řešení i svá rizika, jak jsme se mohli přesvědčit při loňském ransomwarovém útoku na Národní knihovnu, který na půl roku výrazně zbrzdil digitalizaci v obou knihovnách, považujeme tuto spolupráci za nejvhodnější dlouhodobě udržitelné řešení digitalizace. Věříme, že se v budoucnu podaří najít způsob, jak do digitalizační linky NDK zapojit i další instituce podobně, jako je tomu například v procesu sdílené katalogizace. MZK se však neuzavírá ani spolupráci s dalšími institucemi, což dokládá i současná spolupráce s Muzeem umění v Olomouci na digitalizaci vybraných sbírek historických fondů, zejména pak hudebnin a grafik z fondů kroměřížské arcibiskupské zámecké knihovny.

Se spoluprací souvisí i hledisko ekonomické. Sdílení technických prostředků sice přináší samo o sobě úspory, současná digitalizační linka NDK je však již technicky zastaralá, protože vznikala před deseti lety a přes dílčí úpravy s sebou nese značný technologický dluh, který se projevil mimo jiné i při časově i finančně náročné obnově jejího provozu. Ve své současné podobě však linka neumožňuje další navýšení produktivity práce. Ba právě naopak: s rostoucím zastoupením periodik a dalších na zpracování náročných dokumentů při nezměněném personálním obsazení a zachování kvality celková produkce digitalizační linky klesá.

Tomuto problému se dá čelit jedině technologickou změnou. V posledním desetiletí došlo k výraznému rozvoji technologií strojového učení. Nasazení těchto technologií do digitalizačních procesů by již v blízké budoucnosti mohlo přinést výraznou redukci manuálních kroků v procesech digitalizace. Již dnes jsou k dispozici velmi efektivní nástroje pro automatický ořez a vyrovnání naskenovaného obrazu. Je nutné zmínit i OCR systém PERO, který s pomocí technologií strojového učení dokáže velmi kvalitně rozpoznat a do textu převést rukopisné písmo, a to včetně kurentu, různé druhy tištěného písma včetně fraktury nebo i velmi nekvalitní skeny jiných tištěných předloh. I řada dalších kroků při zpracování digitalizátů je dnes již řešitelná pomocí systémů strojového učení, čímž se otevírá možnost značného zefektivnění celého procesu digitalizace. MZK považuje zavedení systémů strojového učení do procesů digitalizační linky za jednu z nejdůležitějších aktuálních priorit, protože jen tak bude možné výrazně zvýšit produktivitu práce při zachování potřebné kvality. Samo sebou se rozumí, že tak jako doposud musí i nadále docházet k postupné výměně nebo rekonstrukcím samotných skenerů.

Roční přírůstek nových digitálních dokumentů bohemikální produkce je v současnosti stále ještě vyšší než kombinovaná kapacita digitalizačních linek českých knihoven, což se nezmění přinejmenším do doby zavedení nových softwarových nástrojů a zavedení povinného elektronického výtisku. I pak ale bude trvat několik desítek let, než bude možné prohlásit, že digitalizace bohemikálních fondů knihoven byla dokončena. Tím by byla naplněna vize, která dala základ projektu NDK a která je i jádrem připravované národní strategie digitalizace. Do budoucna proto i nadále zůstane pro hodnocení přínosu digitalizace klíčovým kritériem odpovědný výběr dokumentů k digitalizaci.

Konzervační povinnost

MZK jako depozitní knihovna s celonárodním výtiskem má ke svému fondu konzervační povinnost, proto je jedním z hlavních kritérií výběru fyzický stav dokumentu, který jde obvykle ruku v ruce s tím, jaký je o něj zájem. V případě periodik MZK postupuje výběr systematicky podle seznamu titulů, který byl sestaven před deseti lety. Periodika se digitalizují vždy v úplnosti s výjimkou případů, kdy knihovna zvenčí obdrží kompletní ročníky některého z žádaných periodik a může je digitalizovat destruktivní metodou. Na rozdíl od historických dokumentů, kde převažuje kritérium ochrany, je u novodobých monografií kladen větší důraz na kritérium žádanosti. Nejde jen o výběr podle zájmu uživatelů o tištěné předlohy, ale nově i o to, zda je daný dokument možné zpřístupnit uživatelům online prostřednictvím jeho zapsání na Seznam děl nedostupných na trhu.

Ostatní druhy dokumentů se digitalizují podle obdobných kritérií; u map a grafik na samostatných listech například dominuje hledisko ochrany fondu (s velkými formáty se nemanipuluje snadno a hrozí jejich poškození, proto je výhodnější je digitalizovat a fyzicky nepůjčovat). K těmto kritériím se následně připojují požadavky vzešlé z projektů, na jejichž řešení se MZK podílí, ať už jde o mezinárodní projekty EoD OpenNahráno – otevřeno, nebo projekty na národní úrovni (Humanitní vědy dokořán a další).

Požadavky na digitalizaci mohou vzejít nejen z různých útvarů knihovny, ale i přímo od uživatelů, zejména prostřednictvím sítě Ebook on Demand. Nadále také počítáme s pokračováním komplexní spolupráce s akademickými pracovišti, která dostala nový impuls v době covidových lockdownů, kdy digitální knihovny velkých knihoven byly jedním z mála možností, jak studentům a vědeckým pracovníkům zpřístupnit tištěné informační zdroje knihoven. MZK samozřejmě při výběru dokumentů pro digitalizaci zohledňuje i svou roli regionální. Prioritu proto bude i nadále dávat dokumentům se vztahem k Brnu a jižní Moravě, což dokládá i nedávno dokončená digitalizace moravské části sbírky výročních zpráv středních škol.

Zatímco malé logické celky v rozsahu několika jednotek nebo desítek kusů může MZK digitalizovat najednou, v případě kmenového fondu knihovny není takový přístup možný. Součástí procesu stanovení priorit digitalizace je proto i hledisko rovnoměrného vytěžování digitalizační linky (tedy jednotlivých skenerů nebo navazujících procesů) různými kategoriemi požadavků. Destruktivní digitalizace tak slouží jako nástroj pro plné využití kapacity digitalizační linky. Tento přístup se v kombinaci s probíhající koordinací s NK ČR a dalšími knihovnami prostřednictvím Registru digitalizace jeví za současných podmínek jako optimální cesta k naplnění vize úplné digitalizace našeho kulturního dědictví.