Analýza projektu verze 1.0
Transkript
Analýza projektu verze 1.0
VÝVOJ URI RESOLVERU PRO HISTORICKÉ DOKUMENTY Analýza projektu verze 1.0 AiP Beroun OBSAH 1 Úvod o dokumentu........................................................................................................................ 4 1.1 Účel ..................................................................................................................................... 4 1.2 Předpokládaný čtenář ........................................................................................................ 4 1.3 Termíny a konvence ........................................................................................................... 4 1.4 Reference ............................................................................................................................ 4 2 Úvod .............................................................................................................................................. 5 3 Poskytovatelé digitálních kopií .................................................................................................... 6 3.1 Dostupná datová úložiště ................................................................................................... 6 3.1.1 AIPDIG .............................................................................................................................6 3.1.2 AIPGGL .............................................................................................................................6 3.1.3 AIPNKP .............................................................................................................................6 3.1.4 BJB...................................................................................................................................7 3.1.5 BNCF ................................................................................................................................7 3.1.6 BNE ..................................................................................................................................7 3.1.7 BNL ..................................................................................................................................7 3.1.8 BNRM ...............................................................................................................................7 3.1.9 BORAJ ..............................................................................................................................8 3.1.10 BUTE............................................................................................................................8 3.1.11 CBNP............................................................................................................................8 3.1.12 ECODIC ........................................................................................................................8 3.1.13 HUL .............................................................................................................................8 3.1.14 IMI ..............................................................................................................................8 3.1.15 KNAVCR .......................................................................................................................9 3.1.16 KNM .............................................................................................................................9 3.1.17 KUNUSA .......................................................................................................................9 3.1.18 LUL ..............................................................................................................................9 3.1.19 MBR .............................................................................................................................9 3.1.20 MVT .............................................................................................................................9 3.1.21 MZK 1 ..........................................................................................................................9 3.1.22 MZK 2 ........................................................................................................................ 10 3.1.23 NLL ............................................................................................................................ 10 3.1.24 NLR............................................................................................................................ 10 3.1.25 NLROAI ...................................................................................................................... 10 3.1.26 NLS ............................................................................................................................ 10 3.1.27 NPKK.......................................................................................................................... 10 3.1.28 PNES .......................................................................................................................... 11 -2- 3.1.29 SK .............................................................................................................................. 11 3.1.30 TSL ............................................................................................................................ 11 3.1.31 TORUN ....................................................................................................................... 11 3.1.32 UCM ........................................................................................................................... 11 3.1.33 ULBEO........................................................................................................................ 11 3.1.34 ULW ........................................................................................................................... 12 3.1.35 UZK1 .......................................................................................................................... 12 3.1.36 UZK2 .......................................................................................................................... 12 3.1.37 VHU_EE1 .................................................................................................................... 12 3.1.38 VHU_EE2 .................................................................................................................... 12 3.1.39 VUL ............................................................................................................................ 12 3.1.40 ZG ............................................................................................................................. 12 4 Identifikace a vyhledání digitální kopie ..................................................................................... 14 5 Návrh realizace ........................................................................................................................... 16 6 5.1 Databáze datových úložišť ............................................................................................... 16 5.2 Obrazové kvality na datových úložištích ......................................................................... 16 5.3 Hlavní databáze URI resolveru pro historické dokumenty ............................................. 17 5.4 Vytvoření URI resolveru pro digitální kopie historických dokumentů ............................ 20 5.5 Uživatelské rozhraní ......................................................................................................... 21 5.6 Aplikační rozhraní ............................................................................................................. 21 Závěr ........................................................................................................................................... 22 -3- 1 ÚVOD O DOKUMENTU 1.1 ÚČEL Dokument obsahuje úvodní analýzu pro budoucí návrh a realizaci URI Resolveru pro historické dokumenty. Stanovuje zároveň základní očekávané vlastnosti tohoto systému. 1.2 PŘEDPOKLÁDANÝ ČTENÁŘ Tento dokument je určen především pro zadavatele (NKČR) a jako podklad pro analýzu a pilotní řešení URI resolveru pro historické fondy. Dále je tento dokument určen všem, kteří se podílejí na rozvoji projektu Manuscriptorium a s ním souvisejících projektů v oblasti historických fondů jako uživatelé. 1.3 TERMÍNY A KONVENCE Čidlo - Český systém pro identifikaci a lokalizaci dokumentů digitálního kulturního dědictví - softwarový nástroj pro podporu národního systému trvalé identifikace založený na standardu URN:NBN FyzId – jednoznačný identifikátor fyzického dokumentu, definovaný v projektu Manuscriptorium a používaný také k identifikaci dokumentů v programu VISK6 RDHF – Registr digitalizace historických fondů TEI záznam – metadatový XML záznam ve formátu TEI P5 ENRICH (k dispozici na http://www.manuscriptorium.com/schema/teiP5enrich.xsd) RDHF – Registr Digitalizace Historických Fondů URN:NBN – standard využívající národní bibliografické identifikátory jako persistentní identifikátory pro dosažení trvalé dostupnosti digitálních dokumentů 1.4 REFERENCE V dokumentu se odkazujeme na následující literaturu: [1] „CZIDLO: (Czech IDentification https://resolver.nkp.cz. and LOcalization [2] „CZIDLO: CZech IDentification and LOcalization Tool based on URN:NBN,“ [Online]. Available: https://code.google.com/p/czidlo. [3] J. Hakala, „Using National Bibliography Numbers as Uniform Resource Names,“ [Online]. Available: http://www.ietf.org/rfc/rfc3188.txt. [4] AiP Beroun, Vývoj registru digitalizace pro historické dokumenty, analýza projektu, v. 1.0, Beroun, 2015. [5] NKČR, AiP http://www.manuscriptorium.com/sites/default/files/docs/manuscriptorium_visk6_definice.pdf. -4- tool). Verze 4.2.2,“ [Online]. Available: Beroun, 2 ÚVOD Při digitalizaci historických fondů v České republice vznikají každoročně stovky digitálních kopií vzácných exemplářů knižních dokumentů, muzejních sbírkových předmětů i archiválií, přičemž digitalizace probíhá z větší části ze záchranných důvodů nebo kvůli lepším možnostem prezentace dokumentů. Digitální verze historických dokumentů jejich majitelé poté zařazují do svých vlastních, národních nebo mezinárodních digitálních knihoven tj. ukládají je do datových úložišť, ze kterých jsou digitální kopie zpřístupňovány. U digitálních dokumentů zveřejňovaných na internetu však dochází ke změnám internetových adres nebo k jejich přesunům mezi datovými úložišti či ke změnám v systémech, kde jsou tyto dokumenty popisovány a odkazovány (knihovní, muzejní, archivní dokumentografické systémy aj.). Digitální kopie se tedy např. díky změnám identifikátorů v těchto systémech stávají nedostupnými nebo necitovatelnými. Tuto situaci je možné vyřešit pomocí systému, který bude přidělovat jednoznačné persistentní URI adresy jednotlivým digitálním kopiím a zároveň bude udržovat informace o případných změnách datových úložišť nebo URL adres. Účelem URI resolveru pro historické dokumenty (tedy rukopisy, inkunábule, vzácné tisky i ostatní dokumenty do r. 1800) jako softwarového systému je umožnit komukoliv získání jednoznačného URI pro libovolnou digitální kopii požadovaného exempláře historického díla na základě informací identifikujících jednak exemplář, jednak vlastní digitální kopii, následně pak pomocí tohoto identifikátoru umožnit případnému zájemci přístup k této digitální kopii dokumentu nebo tuto kopii citovat. Identifikace digitálních kopií jednotlivých exemplářů také důvodem, proč pro historické dokumenty digitalizované jako fyzické jednotky není možné využít existující systém pro trvalou identifikaci dokumentů českého kulturního dědictví ČIDLO [1] [2]. Tento systém totiž funguje na principu využití standardu URN:NBN [3], jehož základem je používání již existujících národních bibliografických identifikátorů (např. čísla České národní bibliografie) jako základu pro identifikátor Uniform Resource Name (URN). Národní bibliografické identifikátory se přidělují nikoli fyzickým jednotkám tj. exemplářům, nýbrž intelektuálním entitám. Bibliografickou jednotkou je tedy celé vydání publikace a ne jednotlivé svazky, ačkoli digitalizován je většinou jen jeden svazek jako ukázka či model tohoto vydání. Při exemplářové digitalizaci historických dokumentů je každý jednotlivý svazek samostatnou jednotkou, která nemá přidělen žádný národní identifikátor. Jeho jednoznačná identifikace vychází z kombinace údajů o lokaci exempláře (signatura, repository) a jejím majiteli či správci. Tyto jednoznačné a persistentní identifikátory budou digitalizovaným historickým dokumentům i jejich jednotlivým digitálním kopiím přidělovány při jejich zápisu do Registru digitalizace historických fondů [4], který bude - stejně jako URI resolver pro historické dokumenty řízen a spravován Národní knihovnou ČR. Technicky bude URI resolver disponovat jednak rozhraním pro koncové uživatele, ale především aplikačním rozhraním pro komunikaci s dalšími aplikacemi, například knihovnickými systémy. Koncový uživatel, ať už badatel nebo třeba knihovní systém, získá prostřednictví URI resolveru relevantní odkaz na existující digitální kopii(e) požadovaného historického dokumentu. URI resolver pro historické dokumenty tedy umožní automatické propojování existujících systémů na nově vznikající digitální kopie bez nutnosti aktualizace metadat na straně již existujících systémů (není nutno do metadat pravidelně doplňovat identifikátory nově vzniklé digitální kopie). Technickým řešením je URI resolver pro historické dokumenty nadstavbou Registru digitalizace historických fondů (RDHF). V první fázi projektu URI resolver pro historické dokumenty zpřístupní jednoznačné URI adresy digitálních kopií dokumentů, které jsou zveřejněny v hlavním katalogu systému Manuscriptorium. Zároveň budou tyto dokumenty zapsány do Registru digitalizace historických fondů. Manuscriptorium je největším a nejkomplexnějším systémem v České republice, který poskytuje uživatelům středověké rukopisy, inkunábule, staré tisky, listiny, historické mapy a další historické dokumenty v jejich digitální podobě. Jsou v něm zpřístupněny digitální kopie dokumentů uložených nejen v knihovnách na území České republiky, ale i ve významných zahraničních knihovnách převážně ze zemí Evropské unie. Zastoupeny jsou i dokumenty ze států mimoevropských jako Jižní Korea, Arménie aj. Manuscriptorium je zároveň poskytovatelem dat pro další systémy jako např. CERL Portal či evropský projekt Europeana. -5- 3 POSKYTOVATELÉ DIGITÁLNÍCH KOPIÍ Jedním z cílů projektu Manuscriptorium je soustředit digitální kopie co nejvíce historických dokumentů z co největšího množství zdrojů. Tyto digitální kopie vznikají na území České republiky v různých programech, jako jsou například VISK6 nebo Google Books. Manuscriptorium ovšem také obsahuje velké množství digitálních kopií historických dokumentů ze zahraničí. Ty byly poskytnuty jednak v rámci evropského projektu ENRICH a také přicházejí do Manuscriptoria díky spolupráci Národní knihovny ČR s dalšími, převážně evropskými vlastníky či správci historických dokumentů a jejich digitálních kopií. Strukturální metadata digitální kopie jsou v TEI P5 záznamu uvedena v elementu <facsimile>. V atributu xml:base tohoto elementu jednotliví přispěvatelé uvádějí buď adresu datového úložiště, kde je digitální kopie uložena, nebo přímo cestu k digitální kopii. V atributu „url“ elementu <graphic> jsou potom umístěny relativní cesty k jednotlivým obrazovým souborům vzhledem k tomuto „bázovému“ URL. Při tvorbě databáze datových úložišť bude toto adresování sjednoceno, a to nikoliv úpravami v metadatových souborech TEI P5, ale v datových strukturách resolveru. V dalším textu budou uvedeny všechny současné zdroje digitálních kopií historických dokumentů využívané systémem Manuscriptorium a informace o datových úložištích, na kterých jsou digitální kopie z těchto zdrojů umístěny. 3.1 DOSTUPNÁ DATOVÁ ÚLOŽIŠTĚ V rámci projektu Manuscriptorium jsou dostupné digitální kopie fyzických historických dokumentů na mnoha datových úložištích. Jedním z největších je datové úložiště digitální knihovny Manuscriptoria, do které přibyly v poslední době také digitální kopie historických dokumentů vzniklé v projektu Google Books. Mezi významná datová úložiště patří také úložiště Moravské zemské knihovny v Brně a datová úložiště některých evropských knihoven a univerzit. V současné době jsou v rámci projektu Manuscriptorium uživatelům dostupné digitální kopie historických dokumentů na cca čtyřiceti datových úložištích. Tato datová úložiště se často velice liší například svojí organizací - adresářovou strukturou, ve které jsou umístěny digitální kopie nebo způsobem přístupu k obrazovým souborům – obrazové soubory jsou poskytovány buď přímo nebo prostřednictvím různých image serverů či serverových skriptů. Vlastní digitální kopie umístěné na těchto úložištích se také liší v mnoha ohledech. Především to je dostupnost různých obrazových kvalit obrazových souborů a také kvalita strukturálních metadat. Následuje seznam a základní a parametry datových úložišť poskytujících digitální kopie historických dokumentů pro projekt Manuscriptorium. 3.1.1 AIPDIG Datové úložiště digitální knihovny Manuscriptorium. Adresa na toto úložiště je: http://mscripthq.nkp.cz/documentrepository/manuscriptorium Cesta k obrazovému souboru: Dle specifikace VISK6 Obrazové kvality: Dle specifikace VISK – N1, N0, S0 (B&W), P0 (preview), G0 (thumbnail - gallery). Identifikátor obrazové kvality je součástí názvu souboru obrazu. Formát obrazů: JPEG, GIF, Zoomify (obrazová kvalita Z1) 3.1.2 AIPGGL Datové úložiště digitální knihovny Manuscriptorium s dokumenty Google Books. Adresa na úložiště je: http://mscripthq.nkp.cz/documentrepository/manuscriptorium_googlebooks/ Cesta k obrazovému souboru: Dle specifikace VISK6 Obrazové kvality: Dle specifikace VISK – N2, G0 3.1.3 AIPNKP Datové úložiště digitální knihovny Manuscriptorium s dokumenty Zoomify. Adresa na úložiště je: -6- http://mscripthq.nkp.cz/documentrepository/manuscriptorium Cesta k obrazovému souboru: Dle specifikace VISK6 Obrazové kvality: Dle specifikace VISK – Z1 (Zoomify) - N2 3.1.4 BJB Brašov (Rumunsko) – dokument Melissa (obsahuje jeden dokument) Adresa na úložiště je: http://86.125.112.199/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu (Melissa)/kvalita/obrazový soubor Obrazové kvality: NO (normal), PO (preview), G0 (thumbnail) 3.1.5 BNCF Datové úložiště Biblioteca Nazionale Centrale di Firenze - Itálie Adresa úložiště je: http://digitale.bncf.firenze.sbn.it/ Cesta k obrazovému souboru: Adresa úložiště/cesta k servletu?parametr OAIIMG/servlet/Img?RisIdr=BNCF0002977801&usage=3 Obrazové kvality: jedna obrazová kvalita pro obrazový soubor, např. 3.1.6 BNE Datové úložiště Biblioteca Nacional de Espańa - Španělsko Adresa úložiště je: http://www.manuscriptorium.com/apps/other/bne.php Cesta k obrazovému souboru: Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např. ?strFolder=repository/1604946_1738918_INC_002776/1604946_1738918_INC_002776_0001.png Pozn.: URL www.manuscriptorium.com/apps/other/bne.php není adresa na datové úložiště, ale na skript, který zprostředkovává obrazové soubory z datového úložiště BNE. URI resolver bude zprostředkovávat digitální kopii z původního datového úložiště BNE. 3.1.7 BNL Datové úložiště National library of Belarus – Minsk - Bělorusko (repository ОФХ архивных документов, старопечатных изданий и рукописей) Adresa úložiště je: http://content.nlb.by/content/dav/nlb/Manuscriptorium/books/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: Jedna obrazová kvalita - N0 – normal 3.1.8 BNRM Datové úložiště Biblioteca Naţională a Republicii Moldova - Moldávie Jeden dokument Adresa úložiště – cesta k dokumentu: http://digit.nkp.cz/ManuscriptoriumDataBank/Cazanii/Images/ (Národní knihovna ČR) Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: Normal, Low, BW, Preview, Thumbnail – je součástí názvu obrazového souboru -7- 3.1.9 BORAJ Benediktinské opatství Rajhrad, ve správě Muzea Brněnska, p.o., Památníku písemnictví na Moravě Adresa úložiště: http://rajhrad.mzk.cz/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: Excellent, low, bw, preview, gallery 3.1.10 BUTE The Budapest University of Technology and Economics - Maďarsko Adresa úložiště: http://www.omikk.bme.hu/ Cesta k obrazovému souboru: Adresa úložiště/adresář „collections/enrich“/kvalita/obrazový soubor – název souboru obsahuje identifikaci dokumentu – všechny dokumenty jsou uloženy v adresářích podle obrazových kvalit a rozlišeny pouze v názvu obrazového souboru. Obrazové kvality: full, normal, small 3.1.11 CBNP Biblioteka Narodowa Warszawa - Polsko Adresa úložiště: http://193.59.172.16/szzz/ Cesta k obrazovému souboru: Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např. http://193.59.172.16/szzz/ImageDownloader.do?id=6593197 Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.12 ECODIC Archives du Chapitre/Kapitelsarchiv, Sion/Sitten - Švýcarsko Adresa úložiště: http://www.e-codices.unifr.ch/manuscripts/e-codices/ Kompletní URL k obrazu je v elementu graphic, např. <graphic url="http://www.e-codices.unifr.ch/manuscripts/ecodices/thumbs/acs-0001/acs-0001_002r.jpg"/> Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.13 HUL Universitätsbibliothek Heidelberg - Německo Adresa úložiště: http://digi.ub.uni-heidelberg.de/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: čtyři velikosti (adresáře 1,2,3,4) + galerie (adresář thumb) 3.1.14 IMI Library of the Lithuanian Academy of Sciences, Manuscript Department - Litva Adresa úložiště: http://www.musicalia.lt/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor -8- Obrazové kvality: high, low 3.1.15 KNAVCR Knihovna AV ČR, v. v. i. Adresa úložiště: http://manuscriptorium.lib.cas.cz Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: excellent 3.1.16 KNM Knihovna Národního muzea Adresa úložiště: http://95.80.245.168/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: EQ (excellent?) 3.1.17 KUNUSA Íeinkaeigu (Island) Adresa úložiště: http://myndir.handrit.is/file/ Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/ obrazový soubor Obrazové kvality: excellent a thumbnail – obrazoví kvality jsou součástí názvu obrazového souboru 3.1.18 LUL Lund University Library - Švédsko Adresa úložiště: http://laurentius.ub.lu.se/storage/ (interně je přesměrován na http://www6.ub.lu.se/fsi/server?source=Laurentius) Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/obrazový soubor Obrazové kvality: jedna kvalita 3.1.19 MBR Benediktinské opatství Rajhrad Adresa úložiště: http://hades.mzk.cz/media/Rajhrad/ Jediný dokument Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/obrazový soubor Obrazové kvality: jedna kvalita 3.1.20 MVT Muzeum Vysočiny Třebíč Adresa úložiště: http://www.kkvysociny.cz/manuscriptorium/ Jediný dokument Cesta k obrazovému souboru: Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor Obrazové kvality: Normal, Preview, Gallery ve strukturálních metadatech 3.1.21 MZK 1 Moravská zemská knihovna v Brně -9- Adresa úložiště: http://hades.mzk.cz/media/mzk03 Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor Obrazové kvality: excellent, low, bw, preview, gallery 3.1.22 MZK 2 Moravská zemská knihovna v Brně Adresa úložiště: http://imageserver.mzk.cz/mzk03/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/definiční soubor pro Zoomify Obrazové kvality: Obrazy jsou zpřístupněny programem Zoomify 3.1.23 NLL Retų knygų ir rankraščių skyrius - Lietuvos evangelikų reformatų sinodas - Litva Adresa úložiště: http://www.epaveldas.lt Cesta k obrazovému souboru: Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např. vbspi/showImage.do?id=PG_S_119_1 Obrazové kvality: jedna kvalita ve strukturálních metadatech. 3.1.24 NLR National Library of Romania Adresa úložiště: http://virtual.bibnat.ro/manuscriptorium/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor Například: CR_XVII_I_4/normal/CR XVII.I4- Dositei Patriarhul Ierusalimului - 00000003.jpg"/ Obrazové kvality: normal, low, prev ve strukturálních metadatech. 3.1.25 NLROAI National Library of Romania Adresa úložiště: http://virtual2.bibnat.ro/rediscover2/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.26 NLS Народна библиотека Србије - Археографско одељење – Srbsko Adresa úložiště: http://scc.digital.nb.rs/rukopisi Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita? („mid“)/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.27 NPKK Národní pedagogická knihovna Komenského Adresa úložiště: http://193.85.211.99/NPKK/ Cesta k obrazovému souboru: Adresa úložiště/obrazový soubor – dokument je definován trojicí adresářů obrazových kvalit a v názvu obrazového souboru - 10 - Obrazové kvality: Tři obrazové kvality excellent, normal, preview ve strukturálních metadatech jsou rozlišeny pomocí prefixů _e, _n, _p v názvech obrazových souborů. 3.1.28 PNES Patrimonio Nacional – Španělsko Adresa úložiště: http://www.patrimonionacional.es/fotos/biblioteca/ibis/pmi/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.29 SK University Library Budapest - Maďarsko Adresa úložiště: http://images.konyvtar.elte.hu Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.30 TSL Свято-Троицкая Сергиева Лавра – Rusko Adresa úložiště: http://www.stsl.ru/manuscripts/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor Obrazové kvality: medium, big – ve strukturálních metadatech 3.1.31 TORUN Biblioteka Uniwersytecka w Toruniu - Polsko Adresa úložiště: http://kpbc.umk.pl/Content/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor Kde n je nějaké číslo 0..x řazené vzestupně Adresář kvalita je ve formátu d2j:thumbnail d2j:preview d2j:big Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech. 3.1.32 UCM Universidad Complutense de Madrid Adresa úložiště: http://www.manuscriptorium.com/apps/other/ - Manuscriptorium Cesta k obrazovému souboru: Adresa úložiště/cesta ke skriptu?parametr pro obrazový soubor, např. ucm.php?pgid=754201 Tam, kde chybí strukturální metadata (element facsimile), je v elementu additional/surrogates/p/ref atributu „target“ adresa na digitální kopii Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.33 ULBEO Дигитални репозиторијум - Универзитетска библиотека – Београд – Srbsko Adresa úložiště: http://digitalulb.unilib.rs Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor - 11 - Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.34 ULW Biblioteka Uniwersytecka we Wrocławiu - Polsko Adresa úložiště: http://www.bibliotekacyfrowa.pl/Content/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor Kde n je nějaké číslo 0..x řazené vzestupně Adresář kvalita je ve formátu d2j:thumbnail d2j:preview d2j:big Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech. 3.1.35 UZK1 Universitäts- und Stadtbibliothek, Köln – Německo Adresa úložiště: http://inkunabeln.ub.uni-koeln.de/inkunabeln/max/1n167 Cesta k obrazovému souboru: ? Obrazové kvality: ? 3.1.36 UZK2 Herzog August Bibliothek Wolfenbüttel – Německo Adresa úložiště: http://diglib.hab.de/inkunabeln/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.37 VHU_EE1 Benediktinské opatství Rajhrad Adresa úložiště: http://rajhrad.mzk.cz/files Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.38 VHU_EE2 Vojenský historický ústav Praha Adresa úložiště: http://manuscript.ee.cz/files Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/obrazový soubor Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech. 3.1.39 VUL Vilniaus Universiteto Biblioteka Adresa úložiště: http://atmintis.mb.vu.lt/fedora/repository/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita Obrazové kvality: normal, low, preview, thumbnail – ve strukturálních metadatech. 3.1.40 ZG Biblioteka Uniwersytetu Zielonogórskiego – Polsko - 12 - Adresa úložiště: http://zbc.uz.zgora.pl/Content/ Cesta k obrazovému souboru: Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor Kde n je nějaké číslo 0..x řazené vzestupně Adresář kvalita je ve formátu d2j:thumbnail d2j:preview d2j:big Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech. - 13 - 4 IDENTIFIKACE A VYHLEDÁNÍ DIGITÁLNÍ KOPIE Nezbytnou podmínkou pro získání jakékoliv digitální kopie konkrétního historického dokumentu je nalezení jeho perzistentního identifikátoru. Jednoznačný identifikátor fyzického dokumentu se sestaví z informací o umístění dokumentu obsažených v existujících metadatech (repository, settlement, idno). Jeho perzistence je potom zajišťována udržováním tabulky konkordancí. Jednoznačný a perzistentní identifikátor digitální kopie by měl ve své nejjednodušší podobě obsahovat (persistentní) identifikaci předlohy, tedy fyzického dokumentu, a nějakou formu vlastní identifikace. Optimálně bude identifikátor obsahovat persistentní identifikaci fyzického dokumentu, identifikátor (nebo identifikaci) digitalizačního pracoviště a identifikaci digitální kopie v rámci digitalizačního pracoviště. Protože v současné době nejsou k dispozici žádné informace o digitalizačních pracovištích ani způsobech digitalizace, bude část identifikátoru určující digitální kopii tvořena identifikátorem zdroje, odkud je tato kopie k dispozici a jejím pořadovým číslem v rámci její fyzické předlohy a jejího zdroje. Perzistentní identifikátor digitální kopie bude potom sloužit také jako identifikátor záznamu URI resolveru. Záznam URI resolveru bude obsahovat URL digitální kopie dokumentu a informace o datovém úložišti, na kterém je digitální kopie uložena. Pokud budou k dispozici, bude záznam URI resolveru také obsahovat informace o struktuře datového úložiště a všechny další potřebné informace, tak aby bylo možno přistupovat k jednotlivým obrazům digitální kopie. Vyhledání digitální kopie dokumentu je možné na základě různých množin informací a v zásadě se skládá ze dvou základních činností. Nejprve je nutné jednoznačně identifikovat fyzický dokument, tzn. nalézt jeho persistentní identifikátor. Persistentní identifikátory fyzických dokumentů jsou umístěny a udržovány v Registru digitalizace historických fondů. Persistentní identifikátor námi požadovaného dokumentu lze nalézt v zásadě třemi způsoby. 1. Známe FyzId, tedy jednoznačný identifikátor fyzického dokumentu. Po dotazu do registru RDHF obdržíme persistentní identifikátor fyzického dokumentu – RegFyzId. RegFyzId proto, že odpovídá původnímu jednoznačnému identifikátoru fyzického dokumentu v okamžiku vložení do systému Manuscriptorium a tím se také stává perzistentním pro Registr digitalizace historických fondů (RDHF). Všechna ostatní FyzId k danému fyzickému dokumentu, která byla vytvořena ať před nebo po vložení metadatového záznamu do Manuscriptoria budou uložena v tabulce konkordancí systému RDHF. Z této tabulky pak k nim bude dohledán identifikátor RegFyzId. 2. Známe informace potřebné k sestavení jednoznačného identifikátoru fyzického dokumentu. To jsou základní lokační informace z deskriptivních metadat, která jsou v Manuscriptoriu vždy k dispozici, a to repository, settlement a signatura. Poté, co je z těchto údajů sestaven jednoznačný identifikátor fyzického dokumentu, postupujeme stejně jako v bodě 1. 3. Neznáme žádné přesné informace a chceme vyhledat informace o konkrétním fyzickém dokumentu a zjistit jeho perzistentní identifikátor. Uživatel v tomto případě vyplní jemu známé informace do vyhledávacího formuláře a systém dotazem do katalogu Manuscriptoria předá uživateli seznam všech dokumentů, které odpovídají zadanému dotazu s informací o tom, zda k nim existuje digitální kopie. Uživatel poté vybere ze seznamu těch dokumentů, které digitální kopii obsahují, požadovaný dokument (pokud je v seznamu zařazen). Protože jednoznačný identifikátor fyzického dokumentu se okamžikem vložení do správního systému Manuscriptoria stává pro RDHF perzistentním (již se po dobu existence systému nemění), dostáváme tak k dispozici perzistentní identifikátor vyhledaného a zvoleného fyzického dokumentu. Postup zjištění persistentního identifikátoru fyzického dokumentu je graficky znázorněn diagramem na Obr. 1. - 14 - Obr. 1 Postup vyhledání digitálních kopií k historickému dokumentu Po obdržení perzistentního identifikátoru fyzického dokumentu vyhledáme v RDHF seznam identifikátorů k němu existujících digitálních kopií. Pomocí těchto identifikátorů nalezneme v databázi URI resolveru odpovídající záznamy obsahující informace o datovém úložišti (digitální knihovně), kde je ta která digitální kopie dokumentu uložena, včetně URI této digitální kopie. V RDHF, jehož je URI resolver nadstavbou, by také měly být k dispozici i informace o digitalizačním pracovišti a vlastní digitalizaci fyzického dokumentu. Bohužel, tyto informace nejsou v současné době k dispozici a je pravděpodobné, že pokud v budoucnu budou, tak určitě ne ke všem digitálním kopiím obsaženým v registru RDHF. - 15 - 5 NÁVRH REALIZACE URI resolver bude navržen jako nadstavba Registru digitalizace historických fondů (RDHF). Základem resolveru bude databáze přístupu ke všem digitálním kopiím registrovaným v RDHF. Součástí resolveru bude také databáze datových úložišť, na kterých jsou digitální kopie uloženy. 5.1 DATABÁZE DATOVÝCH ÚLOŽIŠŤ Databáze datových úložišť bude obsahovat informace o typu a struktuře datového úložiště, jeho identifikační údaje a údaje o jeho vlastníku/provozovateli. Záznam databáze datových úložišť bude navržen při realizaci resolveru na základě podrobného rozboru v současné době dostupných datových úložišť, na kterých jsou umístěny digitální kopie dokumentů obsažených v Manuscriptoriu, a bude vypadat přibližně takto: Identifikátor datového úložiště Repository Vlastník/správce datového úložiště Další identifikační údaje – město, země URL datového úložiště Typ datového úložiště Kontaktní údaje na správce datového úložiště Datová úložiště v projektu Manuscriptorium se liší jak v organizaci na nich uložených digitálních dokumentů, tak ve způsobu přístupu k jednotlivým obrazovým souborům. V současné době dostupná datová úložiště lze z tohoto pohledu rozdělit do několika typů: Datové úložiště má celý digitální dokument v jedné adresářové struktuře, viz Obr. 2. Tuto strukturu má většina datových úložišť. Cesta k obrazu je: URL datového úložiště + cesta k dokumentu + cesta k obrazové kvalitě + cesta k obrazovému souboru (ve většině případů pouze jeho název). Datové úložiště podle specifikace programu VISK6. Tento typ úložiště používá Manuscriptorium. Je to speciální případ předchozího typu. Struktura datového úložiště je přesně definována například v dokumentu [5]. Obrazová kvalita je kromě adresáře uvedena i v názvu obrazového souboru. Datové úložiště má soustředěny obrazové kvality všech digitálních dokumentů ve zvláštních adresářích, viz Obr. 3. Cesta k obrazu je: URL datového úložiště + cesta k obrazové kvalitě + cesta k dokumentu + cesta k obrazovému souboru. Datové úložiště předává obraz prostřednictvím Image serveru, viz Obr. 4. URL datového úložiště + cesta k obrazovému serveru (Java servlet, php skript apod.) + parametry pro přístup k obrazovému souboru. Datové úložiště používající Zoomify. Strukturou zpravidla odpovídá prvnímu typu, nepředává obraz ale definiční soubor serveru Zoomify. Cesta k souboru: URL datového úložiště + cesta k dokumentu + cesta k definičnímu souboru pro Zoomify Kompletní URL pro každý obrazový dokument (zbytečně narůstají strukturální metadata) 5.2 OBRAZOVÉ KVALITY NA DATOVÝCH ÚLOŽIŠTÍCH Digitální kopie dokumentů, které primárně nevznikly v programu VISK 6, mají kromě své struktury i rozdílné vlastnosti, co se týče jednotlivých obrazových kvalit. Obecně jsou používány tyto základní typy obrazových kvalit: Normal - uživatelská kvalita pro prezentaci obrazu v prohlížeči Preview - kvalita pro náhledové obrázky Thumbnail (gallery) - obrázky pro zobrazení v galerii Black&White - černobílý obraz Excellent - nejvyšší kvalita sloužící primárně k archivaci, poskytuje se výjimečně Některá datová úložiště poskytují digitální kopie pouze v jedné kvalitě, jiná poskytují kromě thumbnail (gallery) a preview také více než jednu kvalitu normal nebo i kvalitu excellent. Na některých datových úložištích mohou být umístěny digitální kopie různých vlastníků/správců. Ty mohou poskytovat různé obrazové kvality. Nelze proto nijak zaručit, že digitální kopie dokumentů uložené na jednom datovém úložišti budou mít stejné obrazové kvality. - 16 - Návrh URI resolveru pro přístup k digitálním kopiím historických dokumentů předpokládá nejvýše čtyři běžné obrazové kvality (preview, normal nebo excellent) plus kvality thumbnail a black&white, tedy celkem maximálně šest obrazových kvalit. 5.3 HLAVNÍ DATABÁZE URI RESOLVERU PRO HISTORICKÉ DOKUMENTY Záznam databáze URI resolveru pro historické dokumenty musí nést veškeré informace potřebné k tomu, aby bylo možno digitální kopii dokumentu, kterou záznam popisuje, kompletně a bezchybně zobrazit prohlížecím klientem. V této fázi projektu se předpokládá zobrazení všech dostupných digitálních kopií zobrazovacím mechanismem Manuscriptoria. Lze samozřejmě do budoucna vytvořit libovolné jiné zobrazovače, ať již ve formě webových klientů nebo mobilních či desktopových (multiplatformních) aplikací. Stejně jako v případě databáze datových úložišť, bude přesná podoba záznamu databáze URI resolveru podrobně navržena při realizaci. Zcela jistě bude obsahovat jednoznačný identifikátor digitální kopie, který zároveň tvoří odkaz do databáze registru RDHF pro získání dalších informací například o fyzické předloze dané digitální kopie. Dále bude obsahovat URL na datové úložiště, jeho typ popis přístupu k obrazovým souborům a další potřebné informace. Současný předběžný návrh záznamu v hlavní databázi URI resolveru bude obsahovat: Identifikátor digitální kopie z registru digitalizace RDHF Identifikátor datového úložiště, na kterém je kopie uložena, sloužící také jako odkaz do tabulky datových úložišť Typ datového úložiště – VISK6, dokument/kvalita/, kvalita/dokument/, imgServer, … URL na datové úložiště Počet obrazových kvalit Cesta pro obrazové soubory na galerii (kompletní - musí začínat http:// jinak relativně k URL datového úložiště) Cesta pro obrazové soubory kvalita 1 - preview Cesta pro obrazové soubory kvalita 2 - základní prezentační kvalita – normal (N0) Cesta pro obrazové soubory kvalita 3 - vyšší prezentační kvalita – normal (N1) Cesta pro obrazové soubory kvalita 4 - nejvyšší kvalita nebo excellent Cesta pro obrazové soubory kvalita B&W Cesta k definičnímu souboru Zoomify, pokud je použit Cesta k obrazovému serveru, pokud je použit Strukturální metadata ve tvaru id = název obrazového souboru nebo parametry image serveru pro přístup k obrazu Formát zápisu strukturálních metadat (JSON, XML) Odkaz na alternativní digitální kopii (pokud je uveden v metadatech, například v elementu surrogates) Na některých datových úložištích mohou být uloženy obrazy digitální kopie pouze v jedné (prezentační) kvalitě. Pokud zobrazovací systémy potřebují více obrazových kvalit například pro náhledy, galerie apod., lze tyto obrazové kvality se souhlasem vlastníka digitální kopie vygenerovat a umístit na datovém úložišti. Prakticky to znamená, že jedna takováto digitální kopie má obrazy v prezentační kvalitě na jednom datovém úložišti a nižší obrazové kvality na jiném. Databázový záznam registru musí umožňovat sestavení cesty k obrazu dané kvality i v tomto případě. Pole záznamu s cestami pro obrazy různých kvalit tedy budou umožňovat zápis buď relativně k bázovému URL, nebo zápis absolutní cesty (URL). Ta bude povinně začínat prefixem http://. Strukturální metadata umístěná v záznamu musí obsahovat identifikátor id, který je shodný s identifikátorem odpovídající stránky (element surface v TEI P5), label, tj. popisek obrázky (např. foliace/paginace) a cestu k obrazovému souboru (relativně k adresáři s požadovanou obrazovou kvalitou). Pokud ve zdrojových strukturálních metadatech identifikátor nebo label neexistuje, bude vygenerován automaticky. Zde je příklad zápisu strukturálních metadat pro historický dokument v programu VISK6, kde je obrazová kvalita součástí názvu souboru ve formátu JSON: { „struct“ : [ { “id”:”imgId1”, ”label”:”FC”, “iqThumb”:“AB_XII_22______1NJWG0000FC.JPG”, “iq1”:“AB_XII_22______1NJWP0000FC.JPG“, “iq2”:“AB_XII_22______1NJWN0000FC.JPG“, - 17 - “iq3”:“AB_XII_22______1NJWN1000FC.JPG“, “iqBW”:“AB_XII_22______1NJWS0000FC.GIF“ }, { “id”:”imgId2”, … } ] } Příklad pro zápis v XML: <struct> <graphic id=”imgId1” label=”FC”> <img iq=”thumb”>AB_XII_22______1NJWG0000FC.JPG</img> <img iq=”1”>AB_XII_22______1NJWP0000FC.JPG</img> <img iq=”2”>AB_XII_22______1NJWN0000FC.JPG</img> <img iq=”3”>AB_XII_22______1NJWN1000FC.JPG</img> <img iq=”BW”>AB_XII_22______1NJWS0000FC.GIF</img> </graphic> <graphic id=”imgId2”> … </graphic> </struct> Pokud digitální kopie obsahuje obrazy pouze jedné kvality, bude zápis ve formátu JSON vypadat například takto: { „struct“ : [ { “id”:”imgId1”, ”label”:”FC”, “iqNone”:“AB_XII_22______1NJWN0000FC.JPG”, }, { “id”:”imgId2”, … }, … ] } A obdobně v XML: <struct> <graphic id=”imgId1” label=”FC”> <img>AB_XII_22______1NJWN0000FC.JPG</img> </graphic> <graphic id=”imgId2” label=”1r”> … </graphic> … </struct> Forma strukturálních metadat pro datové úložiště s image serverem bude obdobná jako při přímé adresaci obrazu s tím rozdílem, že místo názvu souboru bude uveden parameter(y) pro identifikaci požadovaného obrazu serverem. Pro nejjednodušší případ, kdy je k dispozici pouze jedna obrazová kvalita bude zápis vypadat kupříkladu takto: { „struct“ : - 18 - [ { “id”:”imgId1”, ”label”:”FC”, “iqNone”:“?id=6537934”, }, { “id”:”imgId2”, … }, … ] } Obr. 2 Nejrozšířenější typ datového úložiště – URL/cesta k dokumentu/kvalita/obrazový soubor - 19 - Obr. 3 Datové úložiště URL/kvalita/cesta k dokumentu/obrazový soubor Obr. 4 Datové úložiště s image serverem 5.4 VYTVOŘENÍ URI RESOLVERU PRO DIGITÁLNÍ KOPIE HISTORICKÝCH DOKUMENTŮ Realizace URI resolveru pro digitální kopie historických dokumentů předpokládá již existující Registr digitalizace historických fondů (RDHF). Úkolem registru RDHF je soustředit informace o všech dostupných digitálních kopiích historických dokumentů, URI resolver pro historické dokumenty potom zajistí přístup k těmto digitálním kopiím. Před počátečním naplněním URI resolveru daty bude nejprve RDHF doplněn o databázi datových úložišť. Ta vznikne zčásti automatizovaně s využitím informací dostupných v metadatových TEI P5 záznamech - 20 - Manuscriptoria a informací získaných ze systému zpracování dat pro prezentační systém Manuscriptoria. Následně bude vytvořena hlavní databáze URI resolveru obsahující veškeré informace potřebné k zpřístupnění digitálních kopií historických dokumentů. Jednotlivé záznamy databáze URI resolveru vzniknou na základě analýzy strukturálních metadat digitálních kopií, ze kterých potom budou vytvořena normalizovaná strukturální metadata, která se stanou součástí záznamu databáze URI resolveru. Předpokládaná struktura těchto normalizovaných metadat je probírána v kapitole 5.3. Vzhledem k tomu, že fyzické předlohy digitálních kopií mívají často mnoho set stran, i takto zjednodušená a minimalizovaná metadata budou nabývat na velikosti a je pravděpodobné, že budou umístěna v externích souborech, přístupných skrze databázový záznam. 5.5 UŽIVATELSKÉ ROZHRANÍ Uživatelské rozhraní URI resolveru pro historické dokumenty bude mít dvě základní části. První část uživatelského rozhraní bude administrační a bude přístupna pouze pověřeným osobám (administrátorům). Toto prostředí bude zajišťovat údržbu databáze datových úložišť a samozřejmě také zprávu hlavní databáze URI resolveru. Administrační rozhraní bude s největší pravděpodobností společné s administračním rozhraním Registru digitalizace historických fondů, to znamená, že administrátor bude mít současně k dispozici jak nástroje pro správu záznamů v databázích RDHF, tak také nástroje pro správu datových úložišť a hlavní databáze URI resolveru. Podrobná analýza administračního rozhraní včetně všech jeho funkcí bude provedena při realizaci registru RDHF a URI resolveru. Rozhraní pro běžného uživatele je druhou částí uživatelského rozhraní URI resolveru. Toto rozhraní bude napojeno na uživatelské rozhraní Registru digitalizace historických fondů a mělo by běžnému uživateli umožnit vyhledat a následně i zobrazit digitální kopii požadovaného fyzického dokumentu. Systém vyhledá na základě informací zadaných uživatelem digitální kopii dokumentu podle algoritmu uvedeného na Obr. 1. Poté zobrazí uživateli jednotlivé obrazy digitální kopie v první fázi nejspíše zobrazovačem ze systému Manuscritorium. Do budoucna by pak mohly vzniknout klientské mobilní i desktopové aplikace. 5.6 APLIKAČNÍ ROZHRANÍ Nejdůležitějším rozhraním URI resolveru pro historické dokumenty bude bezpochyby aplikační rozhraní systému. Jeho základní funkcí bude umožnit spolupracujícím systémům přístup k požadovaným digitálním kopiím historických dokumentů. Využívat ho budou především knihovnické, muzejní či archivní systémy, ale pravděpodobně také různé internetové rešeršní a prezentační systémy působící v oblasti historických fondů. Aplikační rozhraní zajistí přístup k digitální kopii buď podle jejího jednoznačného identifikátoru přímo z databáze nebo jejím vyhledáním v RDHF. Vyhledání se realizuje podle diagramu na Obr. 1 zadáním buď přímo identifikátoru fyzického dokumentu FyzId nebo zadáním informací potřebných k jeho sestavení, tedy repository, settlement a idno. Odpovídající identifikátor FyzId bude potom zjištěn voláním služby generátoru FyzId. Aplikační rozhraní bude zajišťovat především tyto funkce: Předání identifikátorů všech digitálních kopií požadovaného fyzického dokumentu Předání URL na datové úložiště a kompletních strukturálních metadat pro požadovanou digitální kopii Předání požadovaného obrazu v požadované kvalitě z požadované digitální kopie, případně předání definičního souboru Zoomify k požadovanému obrazu z požadované digitální kopie Předání informací o daném datovém úložišti Předání jednoho kompletního záznamu databáze URI resolveru k požadované digitální kopii Při vlastní realizaci URI resolveru budou pravděpodobně do aplikačního rozhraní přidány další funkce podle požadavků od spolupracujících systémů. - 21 - 6 ZÁVĚR URI resolver pro historické fondy popsaný v této analýze bude pomocí persistentních identifikátorů zajišťovat trvalý přístup k jednotlivým digitálním kopiím historických dokumentů, a to jak pro koncové uživatele díky uživatelskému rozhraní, tak pro externí systémy v rámci aplikačního rozhraní. Přidělování persistentních identifikátorů pro digitální kopie bude probíhat na základě zápisu digitalizovaného exempláře do Registru digitalizace historických fondů. V něm získá svůj persistentní identifikátor celý dokument i jeho jednotlivé digitální kopie. Tyto identifikátory budou zároveň fungovat jako identifikátor záznamu pro URI resolver. Resolver bude kromě samotného identifikátoru digitální kopie udržovat ve své interní databázi informace o datovém úložišti, na kterém se daná digitální kopie nachází, případně i další údaje nezbytné pro přístup k této kopii. Popisné údaje o digitalizovaném dokumentu budou - oproti resolveru využívanému v České republice pro zajištění dostupnosti moderních nebo born-digital dokumentů (Čidlo) - zapsány v Registru digitalizace historických fondů (RDHF) a URI resolver bude na tyto údaje odkazovat ze své databáze přístupu k digitálním kopiím. I sama správa persistentních identifikátorů digitalizovaných dokumentů a jednotlivých digitálních kopií bude probíhat v registru RDHF. Hlavní úlohou URI resolveru pro historické dokumenty tedy bude udržovat aktuální informace o struktuře datových úložišť a způsobech přístupu k digitálním kopiím dokumentů na nich uložených (včetně informací o dostupnosti různých obrazových kvalit a strukturálních metadat), aby mohl na jejich základě zpřístupňovat funkční URL digitálních kopií historických dokumentů. Už v první fázi, kdy bude URI resolver zajišťovat trvalou dostupnost digitálních dokumentů zveřejněných v systému Manuscriptorium, bude jeho databáze úložišť spravovat informace o minimálně čtyřiceti datových úložištích rozmístěných po celé Evropě. Díky tomu bude také možné ověřit, zda bude realizovatelná nadnárodní, případně celoevropská spolupráce pro zajištění trvalé dostupnosti digitálních kopií jednotlivých exemplářů historických dokumentů. Po spuštění URI resolveru by mohl být postup majitelů či správců historických dokumentů následující: pro zajištění trvalé dostupnosti digitalizovaného exempláře by majitel/správce nechal svůj digitalizovaný historický dokument zapsat do Registru digitalizace historických fondů. Tím bude jeho digitálnímu dokumentu přiřazen persistentní identifikátor a zároveň bude obdobný identifikátor přiřazen i samotné digitální kopii. Mimo to bude v první fázi projektu dokument také zpřístupněn v hlavním katalogu systému Manuscriptorium, který bude počátečním zdrojem dat pro registr RDHF i URI resolver. Pokud budou v URI resolveru již zapsány informace o datovém úložišti, ze kterého je digitální kopie zpřístupňována, práce majitele/správce končí a jeho digitalizovaný dokument bude díky URI resolveru vždy dohledatelný. V případě, že majitel/správce dokumentu má svou digitální kopii uloženu na datovém úložišti, které ještě není zapsáno v databázi URI resolveru, je zapotřebí dodat správci URI resolveru (NKČR) informace o takovém úložišti. Zároveň, nastanou-li změny v datovém úložišti, např. změna adresářové struktury nebo změna zpřístupňovaných obrazových kvalit digitálního dokumentu, musí o nich být správce URI resolveru informován, aby zajistil správné mapování URL adres jednotlivých digitálních kopií a tím i optimální funkčnost URI resolveru. - 22 -