Analýza projektu verze 1.0

Transkript

Analýza projektu verze 1.0
VÝVOJ URI RESOLVERU PRO HISTORICKÉ DOKUMENTY
Analýza projektu
verze 1.0
AiP Beroun
OBSAH
1
Úvod o dokumentu........................................................................................................................ 4
1.1
Účel ..................................................................................................................................... 4
1.2
Předpokládaný čtenář ........................................................................................................ 4
1.3
Termíny a konvence ........................................................................................................... 4
1.4
Reference ............................................................................................................................ 4
2
Úvod .............................................................................................................................................. 5
3
Poskytovatelé digitálních kopií .................................................................................................... 6
3.1
Dostupná datová úložiště ................................................................................................... 6
3.1.1
AIPDIG .............................................................................................................................6
3.1.2
AIPGGL .............................................................................................................................6
3.1.3
AIPNKP .............................................................................................................................6
3.1.4
BJB...................................................................................................................................7
3.1.5
BNCF ................................................................................................................................7
3.1.6
BNE ..................................................................................................................................7
3.1.7
BNL ..................................................................................................................................7
3.1.8
BNRM ...............................................................................................................................7
3.1.9
BORAJ ..............................................................................................................................8
3.1.10
BUTE............................................................................................................................8
3.1.11
CBNP............................................................................................................................8
3.1.12
ECODIC ........................................................................................................................8
3.1.13
HUL .............................................................................................................................8
3.1.14
IMI ..............................................................................................................................8
3.1.15
KNAVCR .......................................................................................................................9
3.1.16
KNM .............................................................................................................................9
3.1.17
KUNUSA .......................................................................................................................9
3.1.18
LUL ..............................................................................................................................9
3.1.19
MBR .............................................................................................................................9
3.1.20
MVT .............................................................................................................................9
3.1.21
MZK 1 ..........................................................................................................................9
3.1.22
MZK 2 ........................................................................................................................ 10
3.1.23
NLL ............................................................................................................................ 10
3.1.24
NLR............................................................................................................................ 10
3.1.25
NLROAI ...................................................................................................................... 10
3.1.26
NLS ............................................................................................................................ 10
3.1.27
NPKK.......................................................................................................................... 10
3.1.28
PNES .......................................................................................................................... 11
-2-
3.1.29
SK .............................................................................................................................. 11
3.1.30
TSL ............................................................................................................................ 11
3.1.31
TORUN ....................................................................................................................... 11
3.1.32
UCM ........................................................................................................................... 11
3.1.33
ULBEO........................................................................................................................ 11
3.1.34
ULW ........................................................................................................................... 12
3.1.35
UZK1 .......................................................................................................................... 12
3.1.36
UZK2 .......................................................................................................................... 12
3.1.37
VHU_EE1 .................................................................................................................... 12
3.1.38
VHU_EE2 .................................................................................................................... 12
3.1.39
VUL ............................................................................................................................ 12
3.1.40
ZG ............................................................................................................................. 12
4
Identifikace a vyhledání digitální kopie ..................................................................................... 14
5
Návrh realizace ........................................................................................................................... 16
6
5.1
Databáze datových úložišť ............................................................................................... 16
5.2
Obrazové kvality na datových úložištích ......................................................................... 16
5.3
Hlavní databáze URI resolveru pro historické dokumenty ............................................. 17
5.4
Vytvoření URI resolveru pro digitální kopie historických dokumentů ............................ 20
5.5
Uživatelské rozhraní ......................................................................................................... 21
5.6
Aplikační rozhraní ............................................................................................................. 21
Závěr ........................................................................................................................................... 22
-3-
1
ÚVOD O DOKUMENTU
1.1 ÚČEL
Dokument obsahuje úvodní analýzu pro budoucí návrh a realizaci URI Resolveru pro historické
dokumenty. Stanovuje zároveň základní očekávané vlastnosti tohoto systému.
1.2 PŘEDPOKLÁDANÝ ČTENÁŘ
Tento dokument je určen především pro zadavatele (NKČR) a jako podklad pro analýzu a pilotní řešení
URI resolveru pro historické fondy. Dále je tento dokument určen všem, kteří se podílejí na rozvoji projektu
Manuscriptorium a s ním souvisejících projektů v oblasti historických fondů jako uživatelé.
1.3 TERMÍNY A KONVENCE
Čidlo - Český systém pro identifikaci a lokalizaci dokumentů digitálního kulturního dědictví - softwarový
nástroj pro podporu národního systému trvalé identifikace založený na standardu URN:NBN
FyzId – jednoznačný identifikátor fyzického dokumentu, definovaný v projektu Manuscriptorium
a používaný také k identifikaci dokumentů v programu VISK6
RDHF – Registr digitalizace historických fondů
TEI záznam – metadatový XML záznam ve formátu TEI P5 ENRICH (k dispozici na
http://www.manuscriptorium.com/schema/teiP5enrich.xsd)
RDHF – Registr Digitalizace Historických Fondů
URN:NBN – standard využívající národní bibliografické identifikátory jako persistentní identifikátory pro
dosažení trvalé dostupnosti digitálních dokumentů
1.4 REFERENCE
V dokumentu se odkazujeme na následující literaturu:
[1]
„CZIDLO: (Czech IDentification
https://resolver.nkp.cz.
and
LOcalization
[2]
„CZIDLO: CZech IDentification and LOcalization Tool based on URN:NBN,“ [Online]. Available:
https://code.google.com/p/czidlo.
[3]
J. Hakala, „Using National Bibliography Numbers as Uniform Resource Names,“ [Online]. Available:
http://www.ietf.org/rfc/rfc3188.txt.
[4]
AiP Beroun, Vývoj registru digitalizace pro historické dokumenty, analýza projektu, v. 1.0, Beroun, 2015.
[5]
NKČR,
AiP
http://www.manuscriptorium.com/sites/default/files/docs/manuscriptorium_visk6_definice.pdf.
-4-
tool).
Verze
4.2.2,“
[Online].
Available:
Beroun,
2
ÚVOD
Při digitalizaci historických fondů v České republice vznikají každoročně stovky digitálních kopií vzácných
exemplářů knižních dokumentů, muzejních sbírkových předmětů i archiválií, přičemž digitalizace probíhá z větší
části ze záchranných důvodů nebo kvůli lepším možnostem prezentace dokumentů. Digitální verze historických
dokumentů jejich majitelé poté zařazují do svých vlastních, národních nebo mezinárodních digitálních knihoven tj.
ukládají je do datových úložišť, ze kterých jsou digitální kopie zpřístupňovány. U digitálních dokumentů
zveřejňovaných na internetu však dochází ke změnám internetových adres nebo k jejich přesunům mezi datovými
úložišti či ke změnám v systémech, kde jsou tyto dokumenty popisovány a odkazovány (knihovní, muzejní,
archivní dokumentografické systémy aj.). Digitální kopie se tedy např. díky změnám identifikátorů v těchto
systémech stávají nedostupnými nebo necitovatelnými.
Tuto situaci je možné vyřešit pomocí systému, který bude přidělovat jednoznačné persistentní URI adresy
jednotlivým digitálním kopiím a zároveň bude udržovat informace o případných změnách datových úložišť nebo
URL adres.
Účelem URI resolveru pro historické dokumenty (tedy rukopisy, inkunábule, vzácné tisky i ostatní
dokumenty do r. 1800) jako softwarového systému je umožnit komukoliv získání jednoznačného URI pro
libovolnou digitální kopii požadovaného exempláře historického díla na základě informací identifikujících jednak
exemplář, jednak vlastní digitální kopii, následně pak pomocí tohoto identifikátoru umožnit případnému zájemci
přístup k této digitální kopii dokumentu nebo tuto kopii citovat.
Identifikace digitálních kopií jednotlivých exemplářů také důvodem, proč pro historické dokumenty
digitalizované jako fyzické jednotky není možné využít existující systém pro trvalou identifikaci dokumentů
českého kulturního dědictví ČIDLO [1] [2]. Tento systém totiž funguje na principu využití standardu URN:NBN [3],
jehož základem je používání již existujících národních bibliografických identifikátorů (např. čísla České národní
bibliografie) jako základu pro identifikátor Uniform Resource Name (URN). Národní bibliografické identifikátory se
přidělují nikoli fyzickým jednotkám tj. exemplářům, nýbrž intelektuálním entitám. Bibliografickou jednotkou je
tedy celé vydání publikace a ne jednotlivé svazky, ačkoli digitalizován je většinou jen jeden svazek jako ukázka či
model tohoto vydání.
Při exemplářové digitalizaci historických dokumentů je každý jednotlivý svazek samostatnou jednotkou,
která nemá přidělen žádný národní identifikátor. Jeho jednoznačná identifikace vychází z kombinace údajů
o lokaci exempláře (signatura, repository) a jejím majiteli či správci. Tyto jednoznačné a persistentní identifikátory
budou digitalizovaným historickým dokumentům i jejich jednotlivým digitálním kopiím přidělovány při jejich zápisu
do Registru digitalizace historických fondů [4], který bude - stejně jako URI resolver pro historické dokumenty řízen a spravován Národní knihovnou ČR.
Technicky bude URI resolver disponovat jednak rozhraním pro koncové uživatele, ale především
aplikačním rozhraním pro komunikaci s dalšími aplikacemi, například knihovnickými systémy. Koncový uživatel, ať
už badatel nebo třeba knihovní systém, získá prostřednictví URI resolveru relevantní odkaz na existující digitální
kopii(e) požadovaného historického dokumentu. URI resolver pro historické dokumenty tedy umožní automatické
propojování existujících systémů na nově vznikající digitální kopie bez nutnosti aktualizace metadat na straně již
existujících systémů (není nutno do metadat pravidelně doplňovat identifikátory nově vzniklé digitální kopie).
Technickým řešením je URI resolver pro historické dokumenty nadstavbou Registru digitalizace historických fondů
(RDHF). V první fázi projektu URI resolver pro historické dokumenty zpřístupní jednoznačné URI adresy
digitálních kopií dokumentů, které jsou zveřejněny v hlavním katalogu systému Manuscriptorium. Zároveň budou
tyto dokumenty zapsány do Registru digitalizace historických fondů.
Manuscriptorium je největším a nejkomplexnějším systémem v České republice, který poskytuje
uživatelům středověké rukopisy, inkunábule, staré tisky, listiny, historické mapy a další historické dokumenty
v jejich digitální podobě. Jsou v něm zpřístupněny digitální kopie dokumentů uložených nejen v knihovnách na
území České republiky, ale i ve významných zahraničních knihovnách převážně ze zemí Evropské unie.
Zastoupeny jsou i dokumenty ze států mimoevropských jako Jižní Korea, Arménie aj. Manuscriptorium je zároveň
poskytovatelem dat pro další systémy jako např. CERL Portal či evropský projekt Europeana.
-5-
3
POSKYTOVATELÉ DIGITÁLNÍCH KOPIÍ
Jedním z cílů projektu Manuscriptorium je soustředit digitální kopie co nejvíce historických dokumentů z co
největšího množství zdrojů. Tyto digitální kopie vznikají na území České republiky v různých programech, jako
jsou například VISK6 nebo Google Books. Manuscriptorium ovšem také obsahuje velké množství digitálních kopií
historických dokumentů ze zahraničí. Ty byly poskytnuty jednak v rámci evropského projektu ENRICH a také
přicházejí do Manuscriptoria díky spolupráci Národní knihovny ČR s dalšími, převážně evropskými vlastníky či
správci historických dokumentů a jejich digitálních kopií.
Strukturální metadata digitální kopie jsou v TEI P5 záznamu uvedena v elementu <facsimile>. V atributu
xml:base tohoto elementu jednotliví přispěvatelé uvádějí buď adresu datového úložiště, kde je digitální kopie
uložena, nebo přímo cestu k digitální kopii. V atributu „url“ elementu <graphic> jsou potom umístěny relativní
cesty k jednotlivým obrazovým souborům vzhledem k tomuto „bázovému“ URL. Při tvorbě databáze datových
úložišť bude toto adresování sjednoceno, a to nikoliv úpravami v metadatových souborech TEI P5, ale v datových
strukturách resolveru. V dalším textu budou uvedeny všechny současné zdroje digitálních kopií historických
dokumentů využívané systémem Manuscriptorium a informace o datových úložištích, na kterých jsou digitální
kopie z těchto zdrojů umístěny.
3.1 DOSTUPNÁ DATOVÁ ÚLOŽIŠTĚ
V rámci projektu Manuscriptorium jsou dostupné digitální kopie fyzických historických dokumentů na
mnoha datových úložištích. Jedním z největších je datové úložiště digitální knihovny Manuscriptoria, do které
přibyly v poslední době také digitální kopie historických dokumentů vzniklé v projektu Google Books. Mezi
významná datová úložiště patří také úložiště Moravské zemské knihovny v Brně a datová úložiště některých
evropských knihoven a univerzit. V současné době jsou v rámci projektu Manuscriptorium uživatelům dostupné
digitální kopie historických dokumentů na cca čtyřiceti datových úložištích. Tato datová úložiště se často velice liší
například svojí organizací - adresářovou strukturou, ve které jsou umístěny digitální kopie nebo způsobem
přístupu k obrazovým souborům – obrazové soubory jsou poskytovány buď přímo nebo prostřednictvím různých
image serverů či serverových skriptů. Vlastní digitální kopie umístěné na těchto úložištích se také liší v mnoha
ohledech. Především to je dostupnost různých obrazových kvalit obrazových souborů a také kvalita strukturálních
metadat. Následuje seznam a základní a parametry datových úložišť poskytujících digitální kopie historických
dokumentů pro projekt Manuscriptorium.
3.1.1 AIPDIG
Datové úložiště digitální knihovny Manuscriptorium.
Adresa na toto úložiště je:
http://mscripthq.nkp.cz/documentrepository/manuscriptorium
Cesta k obrazovému souboru:
Dle specifikace VISK6
Obrazové kvality:
Dle specifikace VISK – N1, N0, S0 (B&W), P0 (preview), G0 (thumbnail - gallery).
Identifikátor obrazové kvality je součástí názvu souboru obrazu.
Formát obrazů:
JPEG, GIF, Zoomify (obrazová kvalita Z1)
3.1.2 AIPGGL
Datové úložiště digitální knihovny Manuscriptorium s dokumenty Google Books.
Adresa na úložiště je:
http://mscripthq.nkp.cz/documentrepository/manuscriptorium_googlebooks/
Cesta k obrazovému souboru:
Dle specifikace VISK6
Obrazové kvality:
Dle specifikace VISK – N2, G0
3.1.3 AIPNKP
Datové úložiště digitální knihovny Manuscriptorium s dokumenty Zoomify.
Adresa na úložiště je:
-6-
http://mscripthq.nkp.cz/documentrepository/manuscriptorium
Cesta k obrazovému souboru:
Dle specifikace VISK6
Obrazové kvality:
Dle specifikace VISK – Z1 (Zoomify) - N2
3.1.4 BJB
Brašov (Rumunsko) – dokument Melissa (obsahuje jeden dokument)
Adresa na úložiště je:
http://86.125.112.199/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu (Melissa)/kvalita/obrazový soubor
Obrazové kvality:
NO (normal), PO (preview), G0 (thumbnail)
3.1.5 BNCF
Datové úložiště Biblioteca Nazionale Centrale di Firenze - Itálie
Adresa úložiště je:
http://digitale.bncf.firenze.sbn.it/
Cesta k obrazovému souboru:
Adresa
úložiště/cesta
k
servletu?parametr
OAIIMG/servlet/Img?RisIdr=BNCF0002977801&usage=3
Obrazové kvality: jedna obrazová kvalita
pro
obrazový
soubor,
např.
3.1.6 BNE
Datové úložiště Biblioteca Nacional de Espańa - Španělsko
Adresa úložiště je:
http://www.manuscriptorium.com/apps/other/bne.php
Cesta k obrazovému souboru:
Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např.
?strFolder=repository/1604946_1738918_INC_002776/1604946_1738918_INC_002776_0001.png
Pozn.: URL www.manuscriptorium.com/apps/other/bne.php není adresa na datové úložiště, ale na skript, který
zprostředkovává obrazové soubory z datového úložiště BNE. URI resolver bude zprostředkovávat digitální kopii
z původního datového úložiště BNE.
3.1.7 BNL
Datové úložiště National library of Belarus – Minsk - Bělorusko
(repository ОФХ архивных документов, старопечатных изданий и рукописей)
Adresa úložiště je:
http://content.nlb.by/content/dav/nlb/Manuscriptorium/books/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality:
Jedna obrazová kvalita - N0 – normal
3.1.8 BNRM
Datové úložiště Biblioteca Naţională a Republicii Moldova - Moldávie
Jeden dokument
Adresa úložiště – cesta k dokumentu:
http://digit.nkp.cz/ManuscriptoriumDataBank/Cazanii/Images/
(Národní knihovna ČR)
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality:
Normal, Low, BW, Preview, Thumbnail – je součástí názvu obrazového souboru
-7-
3.1.9 BORAJ
Benediktinské opatství Rajhrad, ve správě Muzea Brněnska, p.o., Památníku písemnictví na Moravě
Adresa úložiště:
http://rajhrad.mzk.cz/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality:
Excellent, low, bw, preview, gallery
3.1.10
BUTE
The Budapest University of Technology and Economics - Maďarsko
Adresa úložiště:
http://www.omikk.bme.hu/
Cesta k obrazovému souboru:
Adresa úložiště/adresář „collections/enrich“/kvalita/obrazový soubor – název souboru obsahuje identifikaci
dokumentu – všechny dokumenty jsou uloženy v adresářích podle obrazových kvalit a rozlišeny pouze v názvu
obrazového souboru.
Obrazové kvality:
full, normal, small
3.1.11
CBNP
Biblioteka Narodowa Warszawa - Polsko
Adresa úložiště:
http://193.59.172.16/szzz/
Cesta k obrazovému souboru:
Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např.
http://193.59.172.16/szzz/ImageDownloader.do?id=6593197
Obrazové kvality:
Jedna obrazová kvalita ve strukturálních metadatech.
3.1.12
ECODIC
Archives du Chapitre/Kapitelsarchiv, Sion/Sitten
- Švýcarsko
Adresa úložiště:
http://www.e-codices.unifr.ch/manuscripts/e-codices/
Kompletní URL k obrazu je v elementu graphic, např.
<graphic
url="http://www.e-codices.unifr.ch/manuscripts/ecodices/thumbs/acs-0001/acs-0001_002r.jpg"/>
Obrazové kvality:
Jedna obrazová kvalita ve strukturálních metadatech.
3.1.13
HUL
Universitätsbibliothek Heidelberg
- Německo
Adresa úložiště:
http://digi.ub.uni-heidelberg.de/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality:
čtyři velikosti (adresáře 1,2,3,4) + galerie (adresář thumb)
3.1.14
IMI
Library of the Lithuanian Academy of Sciences, Manuscript Department - Litva
Adresa úložiště:
http://www.musicalia.lt/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
-8-
Obrazové kvality: high, low
3.1.15
KNAVCR
Knihovna AV ČR, v. v. i.
Adresa úložiště:
http://manuscriptorium.lib.cas.cz
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality: excellent
3.1.16
KNM
Knihovna Národního muzea
Adresa úložiště:
http://95.80.245.168/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality: EQ (excellent?)
3.1.17
KUNUSA
Íeinkaeigu (Island)
Adresa úložiště:
http://myndir.handrit.is/file/
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/ obrazový soubor
Obrazové kvality: excellent a thumbnail – obrazoví kvality jsou součástí názvu obrazového souboru
3.1.18
LUL
Lund University Library - Švédsko
Adresa úložiště:
http://laurentius.ub.lu.se/storage/
(interně je přesměrován na
http://www6.ub.lu.se/fsi/server?source=Laurentius)
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/obrazový soubor
Obrazové kvality: jedna kvalita
3.1.19
MBR
Benediktinské opatství Rajhrad
Adresa úložiště:
http://hades.mzk.cz/media/Rajhrad/
Jediný dokument
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/obrazový soubor
Obrazové kvality: jedna kvalita
3.1.20
MVT
Muzeum Vysočiny Třebíč
Adresa úložiště:
http://www.kkvysociny.cz/manuscriptorium/
Jediný dokument
Cesta k obrazovému souboru:
Adresa úložiště/adresář dokumentu/kvalita/obrazový soubor
Obrazové kvality: Normal, Preview, Gallery ve strukturálních metadatech
3.1.21
MZK 1
Moravská zemská knihovna v Brně
-9-
Adresa úložiště:
http://hades.mzk.cz/media/mzk03
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor
Obrazové kvality: excellent, low, bw, preview, gallery
3.1.22
MZK 2
Moravská zemská knihovna v Brně
Adresa úložiště:
http://imageserver.mzk.cz/mzk03/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/definiční soubor pro Zoomify
Obrazové kvality: Obrazy jsou zpřístupněny programem Zoomify
3.1.23
NLL
Retų knygų ir rankraščių skyrius - Lietuvos evangelikų reformatų sinodas - Litva
Adresa úložiště:
http://www.epaveldas.lt
Cesta k obrazovému souboru:
Adresa úložiště/cesta k servletu?parametr pro obrazový soubor, např.
vbspi/showImage.do?id=PG_S_119_1
Obrazové kvality: jedna kvalita ve strukturálních metadatech.
3.1.24
NLR
National Library of Romania
Adresa úložiště:
http://virtual.bibnat.ro/manuscriptorium/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor
Například:
CR_XVII_I_4/normal/CR XVII.I4- Dositei Patriarhul Ierusalimului - 00000003.jpg"/
Obrazové kvality: normal, low, prev ve strukturálních metadatech.
3.1.25
NLROAI
National Library of Romania
Adresa úložiště:
http://virtual2.bibnat.ro/rediscover2/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.26
NLS
Народна библиотека Србије - Археографско одељење – Srbsko
Adresa úložiště:
http://scc.digital.nb.rs/rukopisi
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita? („mid“)/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.27
NPKK
Národní pedagogická knihovna Komenského
Adresa úložiště:
http://193.85.211.99/NPKK/
Cesta k obrazovému souboru:
Adresa úložiště/obrazový soubor – dokument je definován trojicí adresářů obrazových kvalit a v názvu
obrazového souboru
- 10 -
Obrazové kvality: Tři obrazové kvality excellent, normal, preview ve strukturálních metadatech
jsou rozlišeny pomocí prefixů _e, _n, _p v názvech obrazových souborů.
3.1.28
PNES
Patrimonio Nacional – Španělsko
Adresa úložiště:
http://www.patrimonionacional.es/fotos/biblioteca/ibis/pmi/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.29
SK
University Library Budapest - Maďarsko
Adresa úložiště:
http://images.konyvtar.elte.hu
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.30
TSL
Свято-Троицкая Сергиева Лавра – Rusko
Adresa úložiště:
http://www.stsl.ru/manuscripts/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita/obrazový soubor
Obrazové kvality: medium, big – ve strukturálních metadatech
3.1.31
TORUN
Biblioteka Uniwersytecka w Toruniu - Polsko
Adresa úložiště:
http://kpbc.umk.pl/Content/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor
Kde n je nějaké číslo 0..x řazené vzestupně
Adresář kvalita je ve formátu
d2j:thumbnail
d2j:preview
d2j:big
Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech.
3.1.32
UCM
Universidad Complutense de Madrid
Adresa úložiště:
http://www.manuscriptorium.com/apps/other/
- Manuscriptorium
Cesta k obrazovému souboru:
Adresa úložiště/cesta ke skriptu?parametr pro obrazový soubor, např. ucm.php?pgid=754201
Tam, kde chybí strukturální metadata (element facsimile), je v elementu additional/surrogates/p/ref atributu
„target“ adresa na digitální kopii
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.33
ULBEO
Дигитални репозиторијум - Универзитетска библиотека – Београд – Srbsko
Adresa úložiště:
http://digitalulb.unilib.rs
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
- 11 -
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.34
ULW
Biblioteka Uniwersytecka we Wrocławiu - Polsko
Adresa úložiště:
http://www.bibliotekacyfrowa.pl/Content/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor
Kde n je nějaké číslo 0..x řazené vzestupně
Adresář kvalita je ve formátu
d2j:thumbnail
d2j:preview
d2j:big
Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech.
3.1.35
UZK1
Universitäts- und Stadtbibliothek, Köln – Německo
Adresa úložiště:
http://inkunabeln.ub.uni-koeln.de/inkunabeln/max/1n167
Cesta k obrazovému souboru: ?
Obrazové kvality: ?
3.1.36
UZK2
Herzog August Bibliothek Wolfenbüttel – Německo
Adresa úložiště:
http://diglib.hab.de/inkunabeln/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.37
VHU_EE1
Benediktinské opatství Rajhrad
Adresa úložiště:
http://rajhrad.mzk.cz/files
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.38
VHU_EE2
Vojenský historický ústav Praha
Adresa úložiště:
http://manuscript.ee.cz/files
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/obrazový soubor
Obrazové kvality: Jedna obrazová kvalita ve strukturálních metadatech.
3.1.39
VUL
Vilniaus Universiteto Biblioteka
Adresa úložiště:
http://atmintis.mb.vu.lt/fedora/repository/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita
Obrazové kvality: normal, low, preview, thumbnail – ve strukturálních metadatech.
3.1.40
ZG
Biblioteka Uniwersytetu Zielonogórskiego – Polsko
- 12 -
Adresa úložiště:
http://zbc.uz.zgora.pl/Content/
Cesta k obrazovému souboru:
Adresa úložiště/relativní cesta k dokumentu/kvalita,n/obrazový soubor
Kde n je nějaké číslo 0..x řazené vzestupně
Adresář kvalita je ve formátu
d2j:thumbnail
d2j:preview
d2j:big
Obrazové kvality: big, preview, thumbnail – ve strukturálních metadatech.
- 13 -
4
IDENTIFIKACE A VYHLEDÁNÍ DIGITÁLNÍ KOPIE
Nezbytnou podmínkou pro získání jakékoliv digitální kopie konkrétního historického dokumentu je nalezení
jeho perzistentního identifikátoru. Jednoznačný identifikátor fyzického dokumentu se sestaví z informací
o umístění dokumentu obsažených v existujících metadatech (repository, settlement, idno). Jeho perzistence je
potom zajišťována udržováním tabulky konkordancí. Jednoznačný a perzistentní identifikátor digitální kopie by
měl ve své nejjednodušší podobě obsahovat (persistentní) identifikaci předlohy, tedy fyzického dokumentu,
a nějakou formu vlastní identifikace. Optimálně bude identifikátor obsahovat persistentní identifikaci fyzického
dokumentu, identifikátor (nebo identifikaci) digitalizačního pracoviště a identifikaci digitální kopie v rámci
digitalizačního pracoviště. Protože v současné době nejsou k dispozici žádné informace o digitalizačních
pracovištích ani způsobech digitalizace, bude část identifikátoru určující digitální kopii tvořena identifikátorem
zdroje, odkud je tato kopie k dispozici a jejím pořadovým číslem v rámci její fyzické předlohy a jejího zdroje.
Perzistentní identifikátor digitální kopie bude potom sloužit také jako identifikátor záznamu URI resolveru. Záznam
URI resolveru bude obsahovat URL digitální kopie dokumentu a informace o datovém úložišti, na kterém je
digitální kopie uložena. Pokud budou k dispozici, bude záznam URI resolveru také obsahovat informace
o struktuře datového úložiště a všechny další potřebné informace, tak aby bylo možno přistupovat k jednotlivým
obrazům digitální kopie.
Vyhledání digitální kopie dokumentu je možné na základě různých množin informací a v zásadě se skládá
ze dvou základních činností. Nejprve je nutné jednoznačně identifikovat fyzický dokument, tzn. nalézt jeho
persistentní identifikátor. Persistentní identifikátory fyzických dokumentů jsou umístěny a udržovány v Registru
digitalizace historických fondů. Persistentní identifikátor námi požadovaného dokumentu lze nalézt v zásadě třemi
způsoby.
1. Známe FyzId, tedy jednoznačný identifikátor fyzického dokumentu. Po dotazu do registru RDHF
obdržíme persistentní identifikátor fyzického dokumentu – RegFyzId. RegFyzId proto, že odpovídá
původnímu jednoznačnému identifikátoru fyzického dokumentu v okamžiku vložení do systému
Manuscriptorium a tím se také stává perzistentním pro Registr digitalizace historických fondů (RDHF).
Všechna ostatní FyzId k danému fyzickému dokumentu, která byla vytvořena ať před nebo po vložení
metadatového záznamu do Manuscriptoria budou uložena v tabulce konkordancí systému RDHF. Z této
tabulky pak k nim bude dohledán identifikátor RegFyzId.
2. Známe informace potřebné k sestavení jednoznačného identifikátoru fyzického dokumentu. To jsou
základní lokační informace z deskriptivních metadat, která jsou v Manuscriptoriu vždy k dispozici, a to
repository, settlement a signatura. Poté, co je z těchto údajů sestaven jednoznačný identifikátor
fyzického dokumentu, postupujeme stejně jako v bodě 1.
3. Neznáme žádné přesné informace a chceme vyhledat informace o konkrétním fyzickém dokumentu
a zjistit jeho perzistentní identifikátor. Uživatel v tomto případě vyplní jemu známé informace do
vyhledávacího formuláře a systém dotazem do katalogu Manuscriptoria předá uživateli seznam všech
dokumentů, které odpovídají zadanému dotazu s informací o tom, zda k nim existuje digitální kopie.
Uživatel poté vybere ze seznamu těch dokumentů, které digitální kopii obsahují, požadovaný dokument
(pokud je v seznamu zařazen). Protože jednoznačný identifikátor fyzického dokumentu se okamžikem
vložení do správního systému Manuscriptoria stává pro RDHF perzistentním (již se po dobu existence
systému nemění), dostáváme tak k dispozici perzistentní identifikátor vyhledaného a zvoleného fyzického
dokumentu.
Postup zjištění persistentního identifikátoru fyzického dokumentu je graficky znázorněn diagramem na
Obr. 1.
- 14 -
Obr. 1 Postup vyhledání digitálních kopií k historickému dokumentu
Po obdržení perzistentního identifikátoru fyzického dokumentu vyhledáme v RDHF seznam identifikátorů
k němu existujících digitálních kopií. Pomocí těchto identifikátorů nalezneme v databázi URI resolveru odpovídající
záznamy obsahující informace o datovém úložišti (digitální knihovně), kde je ta která digitální kopie dokumentu
uložena, včetně URI této digitální kopie. V RDHF, jehož je URI resolver nadstavbou, by také měly být k dispozici
i informace o digitalizačním pracovišti a vlastní digitalizaci fyzického dokumentu. Bohužel, tyto informace nejsou
v současné době k dispozici a je pravděpodobné, že pokud v budoucnu budou, tak určitě ne ke všem digitálním
kopiím obsaženým v registru RDHF.
- 15 -
5
NÁVRH REALIZACE
URI resolver bude navržen jako nadstavba Registru digitalizace historických fondů (RDHF). Základem
resolveru bude databáze přístupu ke všem digitálním kopiím registrovaným v RDHF. Součástí resolveru bude také
databáze datových úložišť, na kterých jsou digitální kopie uloženy.
5.1 DATABÁZE DATOVÝCH ÚLOŽIŠŤ
Databáze datových úložišť bude obsahovat informace o typu a struktuře datového úložiště, jeho
identifikační údaje a údaje o jeho vlastníku/provozovateli. Záznam databáze datových úložišť bude navržen při
realizaci resolveru na základě podrobného rozboru v současné době dostupných datových úložišť, na kterých jsou
umístěny digitální kopie dokumentů obsažených v Manuscriptoriu, a bude vypadat přibližně takto:







Identifikátor datového úložiště
Repository
Vlastník/správce datového úložiště
Další identifikační údaje – město, země
URL datového úložiště
Typ datového úložiště
Kontaktní údaje na správce datového úložiště
Datová úložiště v projektu Manuscriptorium se liší jak v organizaci na nich uložených digitálních
dokumentů, tak ve způsobu přístupu k jednotlivým obrazovým souborům. V současné době dostupná datová
úložiště lze z tohoto pohledu rozdělit do několika typů:

Datové úložiště má celý digitální dokument v jedné adresářové struktuře, viz Obr. 2. Tuto strukturu má
většina datových úložišť. Cesta k obrazu je: URL datového úložiště + cesta k dokumentu + cesta
k obrazové kvalitě + cesta k obrazovému souboru (ve většině případů pouze jeho název).

Datové úložiště podle specifikace programu VISK6. Tento typ úložiště používá Manuscriptorium. Je to
speciální případ předchozího typu. Struktura datového úložiště je přesně definována například
v dokumentu [5]. Obrazová kvalita je kromě adresáře uvedena i v názvu obrazového souboru.

Datové úložiště má soustředěny obrazové kvality všech digitálních dokumentů ve zvláštních adresářích,
viz Obr. 3. Cesta k obrazu je: URL datového úložiště + cesta k obrazové kvalitě + cesta k dokumentu +
cesta k obrazovému souboru.

Datové úložiště předává obraz prostřednictvím Image serveru, viz Obr. 4. URL datového úložiště + cesta
k obrazovému serveru (Java servlet, php skript apod.) + parametry pro přístup k obrazovému souboru.

Datové úložiště používající Zoomify. Strukturou zpravidla odpovídá prvnímu typu, nepředává obraz ale
definiční soubor serveru Zoomify. Cesta k souboru: URL datového úložiště + cesta k dokumentu + cesta
k definičnímu souboru pro Zoomify

Kompletní URL pro každý obrazový dokument (zbytečně narůstají strukturální metadata)
5.2 OBRAZOVÉ KVALITY NA DATOVÝCH ÚLOŽIŠTÍCH
Digitální kopie dokumentů, které primárně nevznikly v programu VISK 6, mají kromě své struktury
i rozdílné vlastnosti, co se týče jednotlivých obrazových kvalit. Obecně jsou používány tyto základní typy
obrazových kvalit:

Normal - uživatelská kvalita pro prezentaci obrazu v prohlížeči

Preview - kvalita pro náhledové obrázky

Thumbnail (gallery)
- obrázky pro zobrazení v galerii

Black&White
- černobílý obraz

Excellent
- nejvyšší kvalita sloužící primárně k archivaci, poskytuje se výjimečně
Některá datová úložiště poskytují digitální kopie pouze v jedné kvalitě, jiná poskytují kromě thumbnail
(gallery) a preview také více než jednu kvalitu normal nebo i kvalitu excellent. Na některých datových úložištích
mohou být umístěny digitální kopie různých vlastníků/správců. Ty mohou poskytovat různé obrazové kvality.
Nelze proto nijak zaručit, že digitální kopie dokumentů uložené na jednom datovém úložišti budou mít stejné
obrazové kvality.
- 16 -
Návrh URI resolveru pro přístup k digitálním kopiím historických dokumentů předpokládá nejvýše čtyři
běžné obrazové kvality (preview, normal nebo excellent) plus kvality thumbnail a black&white, tedy celkem
maximálně šest obrazových kvalit.
5.3 HLAVNÍ DATABÁZE URI RESOLVERU PRO HISTORICKÉ DOKUMENTY
Záznam databáze URI resolveru pro historické dokumenty musí nést veškeré informace potřebné k tomu,
aby bylo možno digitální kopii dokumentu, kterou záznam popisuje, kompletně a bezchybně zobrazit prohlížecím
klientem. V této fázi projektu se předpokládá zobrazení všech dostupných digitálních kopií zobrazovacím
mechanismem Manuscriptoria. Lze samozřejmě do budoucna vytvořit libovolné jiné zobrazovače, ať již ve formě
webových klientů nebo mobilních či desktopových (multiplatformních) aplikací.
Stejně jako v případě databáze datových úložišť, bude přesná podoba záznamu databáze URI resolveru
podrobně navržena při realizaci. Zcela jistě bude obsahovat jednoznačný identifikátor digitální kopie, který
zároveň tvoří odkaz do databáze registru RDHF pro získání dalších informací například o fyzické předloze dané
digitální kopie. Dále bude obsahovat URL na datové úložiště, jeho typ popis přístupu k obrazovým souborům
a další potřebné informace. Současný předběžný návrh záznamu v hlavní databázi URI resolveru bude obsahovat:
















Identifikátor digitální kopie z registru digitalizace RDHF
Identifikátor datového úložiště, na kterém je kopie uložena, sloužící také jako odkaz do tabulky
datových úložišť
Typ datového úložiště – VISK6, dokument/kvalita/, kvalita/dokument/, imgServer, …
URL na datové úložiště
Počet obrazových kvalit
Cesta pro obrazové soubory na galerii (kompletní - musí začínat http:// jinak relativně k URL datového
úložiště)
Cesta pro obrazové soubory kvalita 1
- preview
Cesta pro obrazové soubory kvalita 2
- základní prezentační kvalita – normal (N0)
Cesta pro obrazové soubory kvalita 3
- vyšší prezentační kvalita – normal (N1)
Cesta pro obrazové soubory kvalita 4
- nejvyšší kvalita nebo excellent
Cesta pro obrazové soubory kvalita B&W
Cesta k definičnímu souboru Zoomify, pokud je použit
Cesta k obrazovému serveru, pokud je použit
Strukturální metadata ve tvaru id = název obrazového souboru nebo parametry image serveru pro
přístup k obrazu
Formát zápisu strukturálních metadat (JSON, XML)
Odkaz na alternativní digitální kopii (pokud je uveden v metadatech, například v elementu surrogates)
Na některých datových úložištích mohou být uloženy obrazy digitální kopie pouze v jedné (prezentační)
kvalitě. Pokud zobrazovací systémy potřebují více obrazových kvalit například pro náhledy, galerie apod., lze tyto
obrazové kvality se souhlasem vlastníka digitální kopie vygenerovat a umístit na datovém úložišti. Prakticky to
znamená, že jedna takováto digitální kopie má obrazy v prezentační kvalitě na jednom datovém úložišti a nižší
obrazové kvality na jiném. Databázový záznam registru musí umožňovat sestavení cesty k obrazu dané kvality i
v tomto případě. Pole záznamu s cestami pro obrazy různých kvalit tedy budou umožňovat zápis buď
relativně k bázovému URL, nebo zápis absolutní cesty (URL). Ta bude povinně začínat prefixem http://.
Strukturální metadata umístěná v záznamu musí obsahovat identifikátor id, který je shodný
s identifikátorem odpovídající stránky (element surface v TEI P5), label, tj. popisek obrázky (např.
foliace/paginace) a cestu k obrazovému souboru (relativně k adresáři s požadovanou obrazovou kvalitou). Pokud
ve zdrojových strukturálních metadatech identifikátor nebo label neexistuje, bude vygenerován automaticky.
Zde je příklad zápisu strukturálních metadat pro historický dokument v programu VISK6, kde je obrazová
kvalita součástí názvu souboru ve formátu JSON:
{
„struct“ :
[
{
“id”:”imgId1”,
”label”:”FC”,
“iqThumb”:“AB_XII_22______1NJWG0000FC.JPG”,
“iq1”:“AB_XII_22______1NJWP0000FC.JPG“,
“iq2”:“AB_XII_22______1NJWN0000FC.JPG“,
- 17 -
“iq3”:“AB_XII_22______1NJWN1000FC.JPG“,
“iqBW”:“AB_XII_22______1NJWS0000FC.GIF“
},
{
“id”:”imgId2”,
…
}
]
}
Příklad pro zápis v XML:
<struct>
<graphic id=”imgId1” label=”FC”>
<img iq=”thumb”>AB_XII_22______1NJWG0000FC.JPG</img>
<img iq=”1”>AB_XII_22______1NJWP0000FC.JPG</img>
<img iq=”2”>AB_XII_22______1NJWN0000FC.JPG</img>
<img iq=”3”>AB_XII_22______1NJWN1000FC.JPG</img>
<img iq=”BW”>AB_XII_22______1NJWS0000FC.GIF</img>
</graphic>
<graphic id=”imgId2”>
…
</graphic>
</struct>
Pokud digitální kopie obsahuje obrazy pouze jedné kvality, bude zápis ve formátu JSON vypadat například takto:
{
„struct“ :
[
{
“id”:”imgId1”,
”label”:”FC”,
“iqNone”:“AB_XII_22______1NJWN0000FC.JPG”,
},
{
“id”:”imgId2”,
…
},
…
]
}
A obdobně v XML:
<struct>
<graphic id=”imgId1” label=”FC”>
<img>AB_XII_22______1NJWN0000FC.JPG</img>
</graphic>
<graphic id=”imgId2” label=”1r”>
…
</graphic>
…
</struct>
Forma strukturálních metadat pro datové úložiště s image serverem bude obdobná jako při přímé
adresaci obrazu s tím rozdílem, že místo názvu souboru bude uveden parameter(y) pro identifikaci požadovaného
obrazu serverem. Pro nejjednodušší případ, kdy je k dispozici pouze jedna obrazová kvalita bude zápis vypadat
kupříkladu takto:
{
„struct“ :
- 18 -
[
{
“id”:”imgId1”,
”label”:”FC”,
“iqNone”:“?id=6537934”,
},
{
“id”:”imgId2”,
…
},
…
]
}
Obr. 2 Nejrozšířenější typ datového úložiště – URL/cesta k dokumentu/kvalita/obrazový
soubor
- 19 -
Obr. 3 Datové úložiště URL/kvalita/cesta k dokumentu/obrazový soubor
Obr. 4 Datové úložiště s image serverem
5.4 VYTVOŘENÍ URI
RESOLVERU
PRO
DIGITÁLNÍ
KOPIE
HISTORICKÝCH
DOKUMENTŮ
Realizace URI resolveru pro digitální kopie historických dokumentů předpokládá již existující Registr
digitalizace historických fondů (RDHF). Úkolem registru RDHF je soustředit informace o všech dostupných
digitálních kopiích historických dokumentů, URI resolver pro historické dokumenty potom zajistí přístup k těmto
digitálním kopiím.
Před počátečním naplněním URI resolveru daty bude nejprve RDHF doplněn o databázi datových úložišť.
Ta vznikne zčásti automatizovaně s využitím informací dostupných v metadatových TEI P5 záznamech
- 20 -
Manuscriptoria a informací získaných ze systému zpracování dat pro prezentační systém Manuscriptoria. Následně
bude vytvořena hlavní databáze URI resolveru obsahující veškeré informace potřebné k zpřístupnění digitálních
kopií historických dokumentů. Jednotlivé záznamy databáze URI resolveru vzniknou na základě analýzy
strukturálních metadat digitálních kopií, ze kterých potom budou vytvořena normalizovaná strukturální metadata,
která se stanou součástí záznamu databáze URI resolveru. Předpokládaná struktura těchto normalizovaných
metadat je probírána v kapitole 5.3.
Vzhledem k tomu, že fyzické předlohy digitálních kopií mívají často mnoho set stran, i takto zjednodušená
a minimalizovaná metadata budou nabývat na velikosti a je pravděpodobné, že budou umístěna v externích
souborech, přístupných skrze databázový záznam.
5.5 UŽIVATELSKÉ ROZHRANÍ
Uživatelské rozhraní URI resolveru pro historické dokumenty bude mít dvě základní části. První část
uživatelského rozhraní bude administrační a bude přístupna pouze pověřeným osobám (administrátorům). Toto
prostředí bude zajišťovat údržbu databáze datových úložišť a samozřejmě také zprávu hlavní databáze URI
resolveru.
Administrační rozhraní bude s největší pravděpodobností společné s administračním rozhraním Registru
digitalizace historických fondů, to znamená, že administrátor bude mít současně k dispozici jak nástroje pro
správu záznamů v databázích RDHF, tak také nástroje pro správu datových úložišť a hlavní databáze URI
resolveru. Podrobná analýza administračního rozhraní včetně všech jeho funkcí bude provedena při realizaci
registru RDHF a URI resolveru.
Rozhraní pro běžného uživatele je druhou částí uživatelského rozhraní URI resolveru. Toto rozhraní bude
napojeno na uživatelské rozhraní Registru digitalizace historických fondů a mělo by běžnému uživateli umožnit
vyhledat a následně i zobrazit digitální kopii požadovaného fyzického dokumentu. Systém vyhledá na základě
informací zadaných uživatelem digitální kopii dokumentu podle algoritmu uvedeného na
Obr. 1. Poté zobrazí uživateli jednotlivé obrazy digitální kopie v první fázi nejspíše zobrazovačem ze
systému Manuscritorium. Do budoucna by pak mohly vzniknout klientské mobilní i desktopové aplikace.
5.6 APLIKAČNÍ ROZHRANÍ
Nejdůležitějším rozhraním URI resolveru pro historické dokumenty bude bezpochyby aplikační rozhraní
systému. Jeho základní funkcí bude umožnit spolupracujícím systémům přístup k požadovaným digitálním kopiím
historických dokumentů. Využívat ho budou především knihovnické, muzejní či archivní systémy, ale
pravděpodobně také různé internetové rešeršní a prezentační systémy působící v oblasti historických fondů.
Aplikační rozhraní zajistí přístup k digitální kopii buď podle jejího jednoznačného identifikátoru přímo
z databáze nebo jejím vyhledáním v RDHF. Vyhledání se realizuje podle diagramu na
Obr. 1 zadáním buď přímo identifikátoru fyzického dokumentu FyzId nebo zadáním informací potřebných
k jeho sestavení, tedy repository, settlement a idno. Odpovídající identifikátor FyzId bude potom zjištěn voláním
služby generátoru FyzId.
Aplikační rozhraní bude zajišťovat především tyto funkce:

Předání identifikátorů všech digitálních kopií požadovaného fyzického dokumentu

Předání URL na datové úložiště a kompletních strukturálních metadat pro požadovanou digitální kopii

Předání požadovaného obrazu v požadované kvalitě z požadované digitální kopie, případně předání
definičního souboru Zoomify k požadovanému obrazu z požadované digitální kopie

Předání informací o daném datovém úložišti

Předání jednoho kompletního záznamu databáze URI resolveru k požadované digitální kopii
Při vlastní realizaci URI resolveru budou pravděpodobně do aplikačního rozhraní přidány další funkce podle
požadavků od spolupracujících systémů.
- 21 -
6
ZÁVĚR
URI resolver pro historické fondy popsaný v této analýze bude pomocí persistentních identifikátorů
zajišťovat trvalý přístup k jednotlivým digitálním kopiím historických dokumentů, a to jak pro koncové uživatele
díky uživatelskému rozhraní, tak pro externí systémy v rámci aplikačního rozhraní.
Přidělování persistentních identifikátorů pro digitální kopie bude probíhat na základě zápisu
digitalizovaného exempláře do Registru digitalizace historických fondů. V něm získá svůj persistentní identifikátor
celý dokument i jeho jednotlivé digitální kopie. Tyto identifikátory budou zároveň fungovat jako identifikátor
záznamu pro URI resolver. Resolver bude kromě samotného identifikátoru digitální kopie udržovat ve své interní
databázi informace o datovém úložišti, na kterém se daná digitální kopie nachází, případně i další údaje nezbytné
pro přístup k této kopii.
Popisné údaje o digitalizovaném dokumentu budou - oproti resolveru využívanému v České republice pro
zajištění dostupnosti moderních nebo born-digital dokumentů (Čidlo) - zapsány v Registru digitalizace historických
fondů (RDHF) a URI resolver bude na tyto údaje odkazovat ze své databáze přístupu k digitálním kopiím. I sama
správa persistentních identifikátorů digitalizovaných dokumentů a jednotlivých digitálních kopií bude probíhat
v registru RDHF.
Hlavní úlohou URI resolveru pro historické dokumenty tedy bude udržovat aktuální informace o struktuře
datových úložišť a způsobech přístupu k digitálním kopiím dokumentů na nich uložených (včetně informací
o dostupnosti různých obrazových kvalit a strukturálních metadat), aby mohl na jejich základě zpřístupňovat
funkční URL digitálních kopií historických dokumentů. Už v první fázi, kdy bude URI resolver zajišťovat trvalou
dostupnost digitálních dokumentů zveřejněných v systému Manuscriptorium, bude jeho databáze úložišť
spravovat informace o minimálně čtyřiceti datových úložištích rozmístěných po celé Evropě. Díky tomu bude také
možné ověřit, zda bude realizovatelná nadnárodní, případně celoevropská spolupráce pro zajištění trvalé
dostupnosti digitálních kopií jednotlivých exemplářů historických dokumentů.
Po spuštění URI resolveru by mohl být postup majitelů či správců historických dokumentů následující:
pro zajištění trvalé dostupnosti digitalizovaného exempláře by majitel/správce nechal svůj digitalizovaný historický
dokument zapsat do Registru digitalizace historických fondů. Tím bude jeho digitálnímu dokumentu přiřazen
persistentní identifikátor a zároveň bude obdobný identifikátor přiřazen i samotné digitální kopii. Mimo to bude
v první fázi projektu dokument také zpřístupněn v hlavním katalogu systému Manuscriptorium, který bude
počátečním zdrojem dat pro registr RDHF i URI resolver. Pokud budou v URI resolveru již zapsány informace
o datovém úložišti, ze kterého je digitální kopie zpřístupňována, práce majitele/správce končí a jeho digitalizovaný
dokument bude díky URI resolveru vždy dohledatelný.
V případě, že majitel/správce dokumentu má svou digitální kopii uloženu na datovém úložišti, které ještě
není zapsáno v databázi URI resolveru, je zapotřebí dodat správci URI resolveru (NKČR) informace o takovém
úložišti. Zároveň, nastanou-li změny v datovém úložišti, např. změna adresářové struktury nebo změna
zpřístupňovaných obrazových kvalit digitálního dokumentu, musí o nich být správce URI resolveru informován,
aby zajistil správné mapování URL adres jednotlivých digitálních kopií a tím i optimální funkčnost URI resolveru.
- 22 -