Hlavní obsah stránky

Registr digitalizace CZ

MARTIN LHOTÁK > lhotak@lib.cas.cz

Projekt Registr digitalizace CZ řeší společně Národní knihovna ČR, Knihovna Akademie věd ČR a společnost INCAD. Jeho cílem je vytvoření národního registru digitalizovaných dokumentů, který umožní sdílet informace o výstupech digitalizace v České republice. Soustředění a sdílení těchto informací na jednom místě umožní zabránit nechtěným duplicitám při zpracování. Určen je zejména pro knihovny, případně i další paměťové instituce, které digitalizují své fondy. Vzhledem k zamezení duplicitního zpracování je možné ušetřit finanční zdroje na skenování a další zpracování v rámci digitalizačního workflow.

Iniciativa pro vznik projektu vzešla z potřeb dvou řešitelských knihoven. Národní knihovna ČR významně navýšila v letech 2007-2009 objem digitalizace díky podpoře z Norských fondů, které přispěly na mikrofilmování a skenování 16 000 publikací (2,4 mil. stran). Při tak výrazném zvýšení produkce začala NK ČR řešit způsob efektivní evidence jednotlivých kroků digitalizačního procesu. Jako technologického partnera zvolila společnost INCAD, která již řadu let spolupracuje s knihovnami v ČR. Podobné potřeby jako Národní knihovna měla vzhledem k provozu vlastního digitalizačního centra také Knihovna Akademie věd ČR. Byl podán a následně i schválen projekt1 do dotačního programu VaV Ministerstva kultury ČR, jehož řešení bylo naplánováno na roky 2008-2011. Výstup projektu by měl řešit nejen systém pro evidenci digitalizačního procesu, ale i centrální národní evidenci všech digitalizovaných dokumentů, pro niž je informace o stavu digitalizace ve dvou řešitelských knihov­nách dobrým základem. Již v průběhu řešení projektu vznikl funkční systém a i další knihov­ny začaly přispívat informacemi o svých digitalizačních aktivitách.

Existují dvě rozhraní:

Veřejně dostupné rozhraní na adrese http://www.registrdigitalizace.cz/ je určeno pro zjiště­ní informací o digitalizovaných dokumentech:

• lokace originálního dokumentu,

• link na digitální dokument,

• informace o vlastníkovi digitálního dokumentu,

• informace o umístění v digitální knihovně,

• informace o stavu zpracování.

Na základě těchto údajů může případný zájemce o digitální dokument využít link do příslušné digitální knihovny a v rámci možností ho obdržet okamžitě, nebo zjistit, za jakých podmínek jej může získat. Zájemci o získání digitálního dokumentu (např. do vlastní digitální knihovny) mohou kontaktovat jeho vlas­t­níka a případně si domluvit podmínky pro replikaci, a tím snížit náklady na pořízení digitální formy.

Veřejné rozhraní pro Registr digitalizace může být vhodným centrálním nástrojem i pro koncové uživatele, kteří hledají na internetu digitalizovanou verzi požadovaného dokumentu.

Z hlediska sledování a evidence jednotlivých kroků digitalizačního workflow je systém vyvíjen tak, aby bylo možné evidovat různé pracovní postupy, které se mohou mezi jednotlivými pracovišti i v rámci nich při zpracování různých typů dokumentů lišit. Pro evidenci workflow je používáno rozhraní, které je dostupné pouze přihlášeným uživatelům, kteří mají nastavena příslušná práva v rámci sy­stému. Evidují se jednotlivé kroky, počínaje výběrem dokumentu k digitalizaci. Další kroky mohou být např. skenování, grafické úpravy, OCR, generování různých rozlišení a grafických formátů, vytvoření metadat atd.

Registr digitalizace je provázán s dalšími knihovními informačními systémy a při vývoji je kladen důraz na postupnou automatizaci přesunů dat a informací mezi nimi. To je velmi výhodné zejména při zpracování většího počtu dokumentů. Před zahájením digitalizace dochází nejprve k výběru záznamů příslušných dokumentů v knihovním systému (což je u obou řešitelských knihoven Aleph), které jsou hromadně vypůjčeny na fiktivního čtenáře k digitalizaci, celá dávka je pak importována do Registru a při tomto procesu probíhá automatická kontrola na duplicity vůči stávajícímu obsahu v Registru. Případný výskyt duplicit je administrátorovi procesu oznámen s výpisem příslušných záznamů. Následně prochází dokument linkou zpracování a jsou evidovány jednotlivé kroky. Při vytváření metadat by mohl v budoucnu Registr sloužit pro získání základního popisu, v současnosti je bibliografický záznam stahován z knihovního systému. Po dokončení všech kroků zpracování je kompletní digitální dokument importován do digitální knihovny (obě knihovny využívají systém Kramerius) a z něj se přes protokol OAI-PMH přenese informace o vystavení a link na digitální dokument do Registru. Informace o dokončené digitalizaci a o umístění digitálního dokumentu je pak přenesena do knihovního katalogu, takže se uživatelé knihovny mohou přes běžný OPAC dostat k jeho elektronické verzi v digitální knihovně. Posledním přesunem informace je cesta z lokálního knihovního systému do Souborného katalogu ČR, kde je zapsán link v případě, že existuje elektronická verze k příslušnému záznamu.

Vývojová skupina, ke které se přidala také Moravská zemská knihovna, pracuje nyní ze­jména na maximální automatizaci výše popsaných procesů. Cílem je také postupný přechod na open source vývoj, který by umožnil kromě centrální instalace v Národní knihovně také instalace na jednotlivých digitalizačních pracovištích, což by snížilo jejich závislost na neu­stálou dostupnost serveru v Národní knihovně. Ten by pak centrální funkci plnil sklízením dat z lokálních instalací.

Již v průběhu řešení projektu se Registr začal plnit i informacemi o digitalizačních projektech dalších knihoven, kromě zmíněných tří knihoven zahájily spolupráci také Národní technická knihovna, Národní lékařská knihov­na, Městská knihovna v Praze a komunika­-ce probíhá i s dalšími. Vzhledem k tomu, že je v Registru evidován také kompletní obsah systému Kramerius Národní knihovny, který zahrnuje všechny digitální dokumenty zpracované s podporou dotačního programu MK ČR VISK 7 Kramerius, jsou evidovanými vlastníky také instituce podpořené touto formou.

Další instituce se mohou přihlásit prostřednictvím formuláře na hlavní webové stránce Registru http://sluzby.incad.cz/esp/rdcz/. Čím více institucí bude evidovat své digitalizační aktivity, tím lépe bude Registr plnit svou funk­ci.

V dubnu tohoto roku byl podán návrh projektu na vytvoření středoevropského registru v rámci programu Central Europe. Kromě českých partnerů se ho účastní také významné knihovny ze Slovenska, Slovinska, Polska, Maďarska, Německa a Rakouska. V případě přijetí návrhu by byl projekt řešen v letech 2011 až 2013 a měl by zajistit vytvoření registrů na národních úrovních a sklízení informací do centrálního registru.

 

ODKAZY:

1 Projekt „Evidence digitalizovaných dokumentů, sledování procesu zpracování a vývoj systému pro zpřístupnění“ - DC08P02OUK008.