Main content

Portál eBadatelna Zlínského kraje aneb Od digitalizace ke zveřejnění

VÍTĚZSLAV MACH Vitezslav.Mach@kr-zlinsky.cz

Když se Zlínský kraj v roce 2011 rozhodoval, zda uskutečnit projekt s názvem Digitalizace dokumentů ve Zlínském kraji, logicky se nabízela myšlenka, jak s digitalizovaným fondem dokumentů dále naložit. Jednalo se o dokumenty paměťových institucí Zlínského kraje, ve velké většině o jejich sbírkové a knihovní fondy. Pro digitalizaci byly vybrány především fondy ohrožené, u kterých při časté mechanické manipulaci hrozila jejich devastace. Muzejní knihovny využily digitalizace také ke zkompletování regionálních periodik. Díky spolupráci především s vědeckými knihovnami, které vlastnily chybějící čísla či ročníky, se tak podařilo vytvořit ucelený fond zejména nejstarších periodik.

Kromě problematiky samotné digitalizace byla ve fázi přípravy souběžně řešena otázka, kde a jakým způsobem data digitalizovaných fondů bezpečně dlouhodobě uložit a jak tento fond dat využít pro prezentaci paměťových institucí. Postupně se zrodila myšlenka vytvořit webový portál, jehož prostřednictvím by byly sbírkové a knihovní fondy představovány široké veřejnosti. S ohledem na zveřejňovaný obsah se bude jednat o portál „regionální“ s možností poskytovat zveřejňované dokumenty do dalších nadregionálních portálů, ale i portálů „celosvětového“ významu. Ale pěkně popořádku…

Digitalizace jako impuls

Jak již bylo v úvodu řečeno, na samém začátku naší cesty k portálu eBadatelna byla digitalizace. Do projektu Digitalizace dokumentů ve Zlínském kraji se zapojily následující paměťové instituce, příspěvkové organizace Zlínského kraje:

  •  Hvězdárna Valašské Meziříčí,
  •  Krajská galerie výtvarného umění ve Zlíně,
  •  Krajská knihovna Františka Bartoše ve Zlíně,
  •  Muzeum jihovýchodní Moravy ve Zlíně,
  •  Muzeum Kroměřížska v Kroměříži,
  •  Muzeum regionu Valašsko ve Vsetíně,
  •  Slovácké muzeum v Uherském Hradišti.

Již na počátku projektu vznikla pracovní skupina s názvem „Centrum pro digitalizaci“ složená z odborných pracovníků paměťových institucí – kurátorů a pracovníků knihoven, zástupců dodavatele a zástupců Zlínského kraje z oddělení informatiky, oddělení přípravy a realizace projektů a odboru kultury a památkové péče. S odstupem času se tento krok ukázal jako velmi užitečný a naprosto klíčový pro realizaci celého projektu, ale i projektů na digitalizaci navazujících. Po celou dobu realizace projektu řešila pracovní skupina veškerou odbornou problematiku. Zabývala se výběrem dokumentů pro digitalizaci, technickými parametry digitalizace, návrhy metadatových struktur pro popis digitalizovaných fondů, které jsou pro následné strojové zpracování naprostou nezbytností.

Ve světě knihovních fondů existuje poměrně dlouho přesná standardizace pro jejich popis. Pro oblast muzejních sbírek je tato problematika zatím poměrně značně roztříštěná a datové standardy pro popis nejsou sjednoceny. Problém ohledně popisných metadat jsme tedy byli nuceni vyřešit hlavně u sbírkových fondů muzeí a galerie. Bylo nutné navrhnout a stanovit struktury pro popisná metadata sbírkových předmětů, díky kterým pak bylo možné s digitalizovanými dokumenty pracovat při dalším elektronickém zpracování, a to jak při jejich ukládání do repozitáře, tak i při práci související se zveřejněním dokumentů, což se ve výsledku úspěšně podařilo. Realizací projektu Digitalizace se podařilo vytvořit digitální fond předmětů z uvedených paměťových institucí o objemu přibližně 13 terabytů. Souběžně se také podařilo zrealizovat vytvoření krajského digitálního repozitáře, do kterého byl tento fond následně uložen.

Součástí fondu jsou dokumenty a sbírkové předměty v následujícím rozsahu:

• monografie (vydané po roce 1800 včetně) – 610 monografií s celkem 99 084 stranami ve formátu A2–A5;

• staré tisky (knihy vydané do roku 1800) – 41 starých tisků o 21 916 stranách ve formátech A1, A3, A4 a A5;

• periodika (noviny, časopisy, výroční zprávy apod.) – 53 periodik s celkem 316 024 stranami ve formátu A2–A5;

• kartografické materiály (mapy, plány, atlasy) – 1028 kusů ve formátu A–A5;

• listiny, dokumenty a plakáty – 59 dokumentů o 1273 listech ve formátech A–A6;

• fotografické a skleněné negativy – 1912 políček filmových, 1600 políček na skle;

• filmy – 71 filmů v celkové délce trvání 860 min.

Zveřejnění a zpřístupnění digitalizovaného fondu

Za účelem zveřejnění uvedeného digitálního fondu paměťových institucí byl Zlínským krajem v průběhu let 2014–2015 realizován nový projekt s názvem Zpřístupnění digitálního obsahu. Jeho úkolem a náplní bylo vytvoření komplexního softwarového řešení, které umožní výběr dokumentů z repozitáře pro zveřejnění, jejich podrobný popis kurátory, resp. kompletní přípravu pro zveřejnění a následně samotné zveřejnění dokumentu na portále eBadatelna Zlínského kraje, a to v souladu s platnou legislativou. Jedním z dalších požadavků na řešení byla existence mechanismů pro export dat do jiných portálů obdobného charakteru prostřednictvím standardizovaných protokolů – tzv. interoperabilita. Na základě diskusí v rámci pracovní skupiny „Centrum pro zpřístupnění digitálního obsahu“, která plynule navázala na práci předchozí pracovní skupiny pro digitalizaci, vznikl požadavek, aby součástí portálu eBadatelna byly nejen sekce pro zveřejnění článků a virtuálních výstav, ale také služby pro zabezpečenou komunikaci mezi konkrétním kurátorem a autentizovaným badatelem, uživatelem portálu.

Dříve než jsme byli schopni stanovit přesné zadání, byli jsme nuceni si odpovědět na dvě zásadní otázky. Ta první zněla, jestli pro zpřístupnění našich digitalizovaných fondů „vyrobit“ vlastní regionální portál, nebo data přímo poskytovat do jiných obdobných systémů – jako je například portál „eSbírky“, který provozuje Národní muzeum. Pro vytvoření vlastního portálu byly hlavními argumenty úplná a rychlá kontrola nad vlastními daty a zpětná kompatibilita dat. Vlastní portál komunikující s portálem třetí strany prostřednictvím standardizovaných protokolů pro výměnu dat může zpětnou kompatibilitu následně zajistit automatizovaně.

Druhá otázka vyvstala v momentě, kdy jsme se rozhodli realizovat vlastní portál, a týkala se samotného způsobu naplňování portálu eBadatelna dokumenty. Bylo nutné rozhodnout, zda zvolit metodu „plně automatizovaného“ naplňování portálu popisnými daty přímo z evidenčních systémů paměťových institucí, nebo řízené naplňování portálu pod přímou kontrolou kurátorů. Pro „plně automatizovanou“ metodu hovořila rychlost plnění portálu daty. Vzhledem k určité specifičnosti evidence muzejních sbírkových předmětů se jevila nemožnost kontroly stávajícího věcného popisu zveřejňovaného obsahu jako velmi negativní. Na základě odborné debaty s kurátory byl zvolen způsob, jenž každému kurátorovi umožní vlastní přípravu a popis dokumentu pro zveřejnění. Nově zjištěné skutečnosti při popisu zpětně promítne do evidenčního systému. Právě tato kontrola a následně možnost zpřesňovat samotnou evidenci sbírek byla vyhodnocena jako významná přidaná hodnota pro evidenci a stala se tak hlavním kvalitativním argumentem pro výběr této varianty.

Zveřejnění každého dokumentu prochází tedy podrobnou přípravou pod vlastní kontrolou kurátora. Tím je zajištěna aktualizace zveřejňovaných digitálních dokumentů. Přesto, že tento způsob je oproti alternativě automatizovaného plnění pomalejší, byl zvolen s ohledem na kvalitu zveřejnění dokumentů jako jediný možný.

Popis řešení zveřejnění a zpřístupnění

Celé softwarové řešení zajišťující zveřejnění a zpřístupnění digitálního fondu paměťových institucí se skládá ze dvou základních částí – modulů. Tím prvním je tzv. Office modul a druhým je samotný webový portál eBadatelna, volně dostupný z prostředí internetu. Office modul je interním modulem dostupným pouze kurátorům a pracovníkům knihoven na základě jejich autentizace. Slouží pro přípravu a podrobný popis dokumentu, vytvoření virtuálních výstav a jejich zveřejnění, redaktorům k publikování článků, správcům systému ke konfiguraci portálu, správu organizací a uživatelů, přenosu aktuálních metadatových informací z evidenčních systémů do systému pro zveřejnění. Portál eBadatelna Zlínského kraje slouží pro vyhledávání a prohlížení zveřejněných dokumentů, současně poskytuje doplňkové služby pro komunikaci badatele s kurátorem.

Příprava a popis dokumentu jsou realizovány prostřednictvím Office modulu. Kurátor si z dokumentů připravených pro zpracování vybere dokumenty, které má zájem zveřejnit na portálu. Pokud existují záznamy s popisnými údaji převzaté z evidenčního systému, jsou kurátorovi nabídnuty pro užití při podrobném popisu. Údaje věcného popisu dokumentů je možné rozdělit do dvou hlavních skupin. První skupinu tvoří údaje: typ dokumentu, podtyp dokumentu, jazyk dokumentu, období dokumentu, autor, žánr, téma, rok vzniku.

Tyto skupiny údajů současně na portálu eBadatelna tvoří výběrové fasety – filtry, které najdeme na portálu v levém panelu. Přiřazením hodnot do uvedených polí se záznamy řadí do odpovídajících kategorií, podle kterých je lze na portálu eBadatelna následně vyhledávat. Uvedené údaje jsou doplněny automaticky o názvy organizací podle správce zveřejněného dokumentu.

Druhou skupinou jsou běžné popisné údaje jako např. popis, vydavatel a další. Office modul nabízí kurátorům možnost přidání v podstatě jakéhokoli dalšího popisného pole, včetně jeho pojmenování. U každého pole s popisem může kurátor individuálně určit, zda bude údaj na portále zobrazený, nebo skrytý. Kurátor má rovněž možnost určit, která ze stran připravovaného dokumentu bude použita na portále jako miniatura, dále má rovněž možnost odeslat z evidenčního systému aktuální popisná metadata pro popis dokumentu do modulu Office. Pokud jsou pak v Office modulu tyto údaje k dispozici, na základě jednoznačné identifikace polí se přímo automaticky spárují s popisem – naplní do polí popisu odpovídajícího typu. Ostatní se zobrazí ve speciální sekci modulu a lze je jednoduše do odpovídajících polí vložit – zkopírovat manuálně. Kurátor poté může zkopírované údaje v jednotlivých polích dále aktualizovat, čímž se výrazně snižuje pracnost popisu.

Další důležité možnosti, které Office modul nabízí kurátorům při přípravě dokumentu ke zveřejnění, jsou spojeny se způsobem, resp. rozsahem zveřejnění. Kurátor má možnost řídit způsob prezentace dokumentu na portále eBadatelna. Mezi základní možnosti patří způsob zveřejnění dokumentů, které jsou chráněny autorským zákonem, a nelze tedy zpřístupnit jejich kompletní obsah. V takovém případě je zpřístupněna pouze miniatura se základními popisnými údaji o dokumentu. Výčet popisných údajů může opět určit kurátor v rámci přípravy. Na portále se pak badateli zobrazí upozornění, že dokument je autorsky chráněn. Nastavením portálu lze zajistit, že pokud si autorsky chráněné dokumenty budete prohlížet prostřednictvím portálu eBadatelna v budově instituce, která je současně správcem dokumentu, bude dokument zobrazen v plném rozsahu, ale bez jakékoliv možnosti stažení, resp. kopírování; což plně odpovídá situaci v analogovém světě dokumentů. U dokumentů, které nepodléhají autorskému zákonu, je jejich obsah zobrazován v plném rozsahu. Kurátor má možnost dále zvolit, jestli bude badatelům nabídnut export do PDF dokumentu. Pokud jde o dokument obsahující čtecí textovou vrstvu, je možné také nabídnout jeho stažení ve formátu ePUB pro elektronické čtečky knih. Dokument lze opatřit vodotiskem, včetně jeho umístění v rámci obrazu. Vymezením data počátku a konce zveřejnění lze také přesně určit časový úsek, ve kterém bude dokument viditelný na portále eBadatelna. Modul Office nabízí kurátorům množství hromadných operací nad skupinou připravovaných dokumentů. Jejich využití pak přípravu značně urychlí, například u periodik. Mimo samotný popis dokumentů obsahuje Office modul nástroje pro publikaci informativních článků a virtuálních výstav. Administrátorům modul poskytuje možnosti nastavení vzhledu portálu, datových zdrojů, statistik, řízený import dat z repozitáře, správu uživatelů apod.

Webový portál eBadatelna Zlínského kraje obsahuje základní nástroje pro vyhledávání a zobrazování zveřejněných dokumentů připravených prostřednictvím modulu Office a zveřejněných jednotlivými kurátory. Součástí jsou metadata, náhledy a detaily dokumentů, u dokumentů s textovou vrstvou OCR, exporty do souborů formátu PDF nebo formátu pro elektronické čtečky knih. Pro nalezení patřičného dokumentu, resp. skupiny dokumentů lze použít několik různých způsobů vyhledávání, včetně jejich vzájemných kombinací. Jde například o hledání podle klíčových slov, hledání pomocí výběrových filtrů-faset. Na portále naleznete rovněž sekci pro propagaci článků a propagaci virtuálních výstav. Pro registrované, resp. ověřené uživatele-badatele nabízí portál službu pro ověřenou komunikaci s badatelem nebo rezervaci dokumentu prostřednictvím služby portálu. Pro ověření je možné použít přihlášení prostřednictvím služby „mojeID“, která je v portále integrovaná. Přímo z portálu lze velmi jednoduchým způsobem „sdílet“ vybraný dokument do sociálních sítí.

Řešení má implementovány funkcionality pro výměnu dat s obdobnými portály, které rovněž disponují těmito funkcionalitami. Jde především o protokol OAI-PMH, Z39.50, SRU. V současnosti je připraven OAI provider pro portál „eSbírky“. Zlínský kraj již uzavřel smlouvy s portálem EUROPEANA, kam prostřednictvím portálu „eSbírky“ bude data poskytovat.

Co říci na závěr… aneb Jaké jsou hlavní přínosy

Zlínský kraj a jeho paměťové instituce vytvořily v rámci České republiky projekt eBadatelna, díky němuž jsou postupně digitálně zpřístupňovány zajímavé dokumenty z fondů Hvězdárny Valašské Meziříčí, Krajské galerie výtvarného umění ve Zlíně, Krajské knihovny Františka Bartoše ve Zlíně, Muzea Kroměřížska v Kroměříži, Muzea regionu Valašsko ve Vsetíně, Muzea jihovýchodní Moravy ve Zlíně a Slováckého muzea v Uherském Hradišti.

Zájemci o historii regionu si mohou na portále prohlédnout některé regionální noviny a časopisy, knihy, umělecká díla, mapy a plány či zajímavé historické fotografie a videosnímky, a to díky tomu, že část fondů paměťových institucí byla v uplynulých letech digitalizována. Vytvoření elektronických verzí dokumentů přispělo současně k jejich ochraně a mnohdy i záchraně pro budoucí generace. Významným počinem byla také spolupráce s vědeckými knihovnami při zkompletování regionálních novin, jejichž jednotlivé ročníky nebo čísla nebyly v regionu uchovány v celistvosti.

Nový portál eBadatelna přináší široké laické a odborné veřejnosti nejen zpřístupnění digitalizovaných dokumentů, jejichž počet bude průběžně neustále stoupat, ale nabízí zájemcům také zhlédnutí virtuálních výstav či studium zajímavých článků o fondech paměťových institucí.

Po stránce technické není nepodstatné zmínit, že celé řešení bylo kompletně navrženo a realizováno jako „Open Source“, což mělo za následek výrazné snížení nákladů na jeho pořízení a správu. Teď už nezbývá než kliknout v prohlížeči svého počítače na odkaz http://ebadatelna.zlkraj.cz a nechat se reálně portálem provést.