Main content

Linked Heritage – koordinace standardů a technologií za účelem obohacení Europeany

ALENA SOUČKOVÁ alena.souckova@divadlo.cz

Úvod

Europeana je velký mezinárodní portál (http://www.europeana.eu/portal/), který zpřístupňuje uživatelům digitální zdroje evropských muzeí, knihoven, archivů a audiovizuálních sbírek. Mezi miliony digitálních objektů, které jsou v Europeaně přístupné, mohou uživatelé najít obrázky (malby, kresby, fotografie, mapy), texty (knihy, periodika, dopisy, deníky a archiválie), zvukové záznamy (hudba i mluvené slovo z gramofonových desek, válečků, magnetofonových pásek i rozhlasového vysílání), videozáznamy (filmy, filmové týdeníky, televizní vysílání). Portál je multilinguální, což v tomto případě znamená, že jsou dostupné varianty v jazycích všech zemí, které se projektu účastní.

V současné době financuje Evropská komise různé dílčí, tematické projekty zaměřené na rozvoj a obohacení Europeany. Jedním z takových je i Linked Heritage, projekt zaměřený nejen na obohacení Europeany o nový obsah, ale také na digitalizační standardy, odbornou terminologii a vývoj nových softwarových nástrojů.

Základní cíle

Linked Heritage je jako jeden z dílčích projektů Europeany zaměřen na širokou oblast kulturního dědictví. Z tohoto důvodu jsou do něj zapojeny především instituce s kulturním posláním, jako jsou knihovny, muzea, archivy nebo galerie. Hlavní cíle projektu jsou tři:

•  získat pro Europeanu velký objem nových dat, a to nejen z veřejného, ale i ze soukromého sektoru,

•  zlepšit kvalitu obsahu Europeany, zejména co se týče komplexnosti metadat, potenciálu následné využitelnosti a zredukování duplicit,

• umožnit kvalitnější vyhledávání, získání a využití obsahu Europeany, ať už přímo pro účely portálu Europeany nebo třetím stranám prostřednictvím API.

Získání velkého objemu nových dat

K získání velkého objemu nových dat projektu Linked Heritage přispěje například zainteresování soukromého sektoru, který dosud na obsahu Europeany participovat nemohl. Projekt plánuje vyvinout nástroj, který umožní konvertovat metadata vydavatelů podle technických specifikací Europeany.

Další přísun dat umožní zjednodušení mapování ze zdrojových metadat paměťových institucí do formátu ESE/EDM. Toho chce projekt dosáhnout díky vývoji „mapovacího“ nástroje, který využívá zkušeností s konverzními převody z minulosti a v celé šíři všech účastníků.

Posledním prostředkem ke získání dat je jejich přímé poskytnutí tzv. agregátory (shromažďovateli) nebo poskytovateli obsahu, kteří jsou přímými účastníky konsorcia, a to včetně „prvořadých“ zemí, jež dosud do Europeany nepřispívaly vůbec, nebo jen malým množstvím dat.

Zhodnocení obsahu

Díky zprostředkovanému mapovacímu rozhraní, které minimalizuje ztrátu informací, budou moci záznamy obsahovat metadata v plné šíři. Aby se zamezilo duplicitám záznamů a nefunkčnosti odkazů, budou záznamy obsahovat persistentní identifikátory. Obsah Linked Heritage bude konvertován modelem RDF trojice a publikován v modelu Linked Data. V rámci projektu bude také prolinkována terminologie, čímž se dosáhne přesnějšího a cílenějšího vyhledávání a relevantnějších výsledků. Obsah dat bude popsán prostřednictvím rozvinutého tezauru, který zajistí maximální vytěžení informací prostřednictvím sémantických vyhledávacích nástrojů a získání výsledků vyhledávání v různých jazycích.

Konsorcium LH a jeho pracovní skupiny

V konsorciu Linked Heritage je zúčastněno 39 institucí z 21 zemí, jejichž úplný soupis lze nalézt na webových stránkách projektu http://www.linkedheritage.eu. Účastníkem za Českou republiku je Institut umění – Divadelní ústav. Práce na projektu je rozdělena mezi sedm pracovních skupin WP1–WP7:

→ WP1 Project Management and Coordination

Koordinátorem celého projektu a zároveň první pracovní skupiny je Instituto Centrale per il Catalogo Unico delle biblioteche italiane e per le informazioni bibliografiche (Itálie). Jejich úkolem je vybudovat kooperační síť odborníků a zainteresovaných subjektů, plánovat a delegovat úkoly a odpovědnosti jednotlivých pracovních skupin, zajišťovat technickou infrastrukturu a navazovat spolupráci s dalšími projekty.

→ WP2 Linking Cultural Heritage Information

Vedoucím druhé pracovní skupiny je Collections Trust (Velká Británie). Mezi hlavní úkoly této skupiny patří průzkum stavu informací z oblasti umění, jejich aplikací a potenciálu, stanovení nejvhodnějších modelů, procesů a technologií pro strukturování informačních repozitářů v modelu Linked Data. Jeho praktická aplikace na informace z oblasti kulturního dědictví, průzkum persistentních identifikátorů a stanovení vhodného jednotného standardu, průzkum metadatových modelů používaných v oblasti kulturního dědictví a jejich interoperabilita s modelem Europeany (ESE/ EDM).

→ WP3 Terminology

V krátkodobém horizontu bude Europeana požadovat sémanticky obohacený obsah, aby bylo možné používat sémantické vyhledávače a získat efektivnější výsledky hledání. Z tohoto důvodu je nutné vytvořit věcný popis obsahu vyjádřený vhodnou specifickou terminologií, která bude odpovídat zásadám sémantického webu. Vytvoření a doplnění takové terminologie na společné platformě usnadní sémantické využití věcného popisu, a přímo tak povede ke zlepšení sémantických vyhledávacích nástrojů Europeany.

Na druhou stranu, tj. i z hlediska jednotlivých poskytovatelů obsahu, přinese implementace technické platformy pro terminologii pomoc při nastavování a linkování jejich vlastních lokálních terminologií tak, aby byly kompatibilní s vícejazyčným tezaurem Europeany. Přispěvatelé tak budou moci poskytnout Europeaně svá lokální metadata v plné šíři.

Úkolu vybudování terminologické báze se ujali pracovníci Koninklijke Musea voor Kunst en Geschiedenis (Belgie).

→ WP4 Public Private Partnership

Cílem zainteresovat do projektu i soukromý sektor byla pověřena instituce EDItEUR z Velké Británie. Jejich úkolem bude v prvé řadě průzkum metadatových schémat používaných v soukromém sektoru a jejich unifikace, dále nastavení persistentních identifikátorů či řízených slovníků, ale v neposlední řadě také nastavení právního rámce pro sdílení metadat, náhledů apod.

→ WP5 Technical Integration

Technickou integrací byla pověřena Národní technická univerzita v Athénách. Jejím úkolem je zajistit včlenění technických prvků nezbytných pro přijetí dat do Europeany, vytvořit rozhraní pro integraci technických výsledků skupiny WP3 (terminologie), vybudovat technologickou platformu dostupnou on-line pro širokou škálu jednotlivých přispěvatelů, zajistit jejich školení a ověřit, zda je platforma buď přímo integrovatelná do struktury Europeany, nebo alespoň využitelná jako externí webová služba.

→ WP6 Coordination of Content

Zajištění dostatečného množství nových dat pro Europeanu je úkolem šesté pracovní skupiny, kterou vede kyperská nadace Cyprus Research and Educational Foundation společně s italským institutem Instituto Centrale per il Catalogo Unico delle biblioteche italiane e per le informazioni bibliografiche. Znamená to v prvé řadě komunikaci s jednotlivými přispěvateli, zajištění zpětné vazby pro vylepšení systému sběru dat a pomoc poskytovatelům obsahu při konverzi z jejich lokálního systému do metadatové struktury Europeany.

→ WP7 Dissemination and Training

Aby bylo možné využít výsledků práce projektu Linked Heritage v maximální míře, je nutné o něm zvýšit povědomí, a to jak ve vlastním ekosystému Europeany, tak v rámci širší veřejnosti. Osvětou mezi jednotlivými poskytovateli obsahu a agregátory chce pracovní skupina dosáhnout toho, aby byly co nejvíce využity všechny technické prostředky a možnosti, které projekt přináší. Prezentace projektu veřejnosti může přivést nové zájemce a v neposlední řadě i zlepšit standardy a technickou kapacitu v sektoru kulturního dědictví. Vedoucím pracovní skupiny je Università di Padova.

Plánované výstupy

Projekt Linked Heritage přinese několik reálných výstupů:

•  objem tři miliony nových dat, přičemž jednotliví přispěvatelé nezahrnují pouze úzkou oblast, ale široké spektrum domény kulturního dědictví,

•  lépe informovaná a kvalifikovanější komunita z oblasti kulturního dědictví,

•  doložené, odsouhlasené a publikované pokyny a příručky řešící klíčové otázky a překážky v dodávání dat do systému Europeany,

•  nové softwarové nástroje na bázi Open Source.

Závěr

Shrneme-li cíle projektu Linked Heritage, přinese ve svém výsledku celou řadu pozitivních dopadů. Zlepšením kvality dat a metadat a zpřístupněním obsahu, který pochází ze zemí dosud v Europeaně zastoupených málo, nebo vůbec, podpoří využití a vlastní „viditelnost“ portálu Europeana. Projekt také nabízí účinné vyhledávací služby díky sémanticky obohaceným a navzájem propojeným zdrojům a pomáhá překonávat různojazyčné a multikulturní bariéry díky přijaté terminologii, která umožní získat výsledky i v jiných jazycích, než je jazyk dotazu. Zapojením soukromého sektoru získá portál Europeana data také z komerční sfé-ry nakladatelství a vydavatelství. V neposlední řadě projekt podpoří využití a sdílení digitálního kulturního dědictví díky vývoji praktických pokynů, příruček, pomůcek a dalších softwarových doplňků zaměřených na problémy spojené s nefunkčními linky a duplicitními záznamy, sémantickým propojením zdrojů, nestandardní popisnou terminologií a zachováním kompletních metadatových modelů.