Digitální knihovny: principy a problémy

Transkript

Digitální knihovny: principy a problémy
Digitální knihovny: principy a problémy
Jaroslav Pokorný
MFF UK
Katedra softwarového inženýrství
Praha
email: [email protected]
J. Pokorný, Knihovny 01
1
Úvod
• digitální knihovna - od r. 1994
(elektronická knihovna, virtuální knihovna)
• vize: J.C.R. Licklider, 1965
• rozvoj:
– knihy (Fox, Arms, …)
– časopisy (D-Lib Magazine, Int. J. on DL)
– konference (ACM Int. Conf. on DL)
– předmět výuky
J. Pokorný, Knihovny 01
2
Úvod
?
• digitální knihovna jako disciplína
knihovníci: další krok v automatizaci knihoven
databázisti: architektura federativních databází
propagátoři hypertextu: aplikace hypertextové
technologie
informatici: aplikace workflow systémů
propagátoři Webu: Web je digitální knihovna
J. Pokorný, Knihovny 01
3
Obsah
•
•
•
•
•
vymezení pojmu digitální knihovny
komponenty digitální knihovny
architektura digitální knihovny
budování digitální knihovny
od digitální knihovny k automatizované
digitální knihovně
• závěr
J. Pokorný, Knihovny 01
4
Vymezení pojmu DK
Co je společné mnoha definicím:
• DK není jednotlivá entita
• DK vyžaduje technologii umožňující propojit
několik informačních zdrojů
• propojení mezi více DK a informačními
službami má být pro uživatele transparentní
• cílem budování DK je univerzální přístup
k informačním zdrojům a službám
J. Pokorný, Knihovny 01
5
Vymezení pojmu DK
Zde:
DK je řízená kolekce informací spolu s jistými
službami, přičemž tyto informace jsou
uloženy v digitální formě a jsou přístupné po
síti
Lépe: systém DK
J. Pokorný, Knihovny 01
6
komunikace
(průchodnost, konektivita)
Umístění digitální knihovny ve výpočetním
a komunikačním prostoru
trajektorie v technologii
digitálních knihoven:
intelektuální přístup ke
globálně
distribuovaným
informacím
počítačové zpracování (flops)
digitální obsah
méně
J. Pokorný, Knihovny 01
více
(původ: S. Griffin, NSF)
7
Komponenty digitální knihovny
• elementy
– data
– metadata
– procesy
• doména
⇒ fyzické, digitální, hybridní knihovny
• přístup: onl-line přes knihovnu, přímo, na CDROM (např. ACM a IEEE Digital libraries)
J. Pokorný, Knihovny 01
8
Komponenty digitální knihovny
data
objekty převedené kniha, časopis,
z fyzických zdrojů video
nové digitální
objekty
J. Pokorný, Knihovny 01
hypertextová
kniha,
počítačový
program,
vizualizace
vědeckých dat,
elektronický
časopis
metadata
procesy
statický index,
tezaurus,
klasifikace,
prostorové
umístění
akvizice dat,
dynamický index,
profily uživatelů,
anotace zdrojů,
tématické
portály,
ontologie
fulltextové
vyhledávání,
perzonalizace
nabídek
přírůstků,
výběr pomocí
agentů
katalogizace,
vyhledávací
služby,
výpůjční služby
9
Architektura digitální knihovny
klasické konceptuální schéma
uživatel
uživatel
knihovník
knihovník
tvůrce
tvůrce
informací/
informací/
vydavatel
vydavatel
J. Pokorný, Knihovny 01
server
server
digitální
digitální
knihovny
knihovny
klient
klient
digitální
digitální
knihovny
knihovny
10
Architektura digitální knihovny
brány
uživatelská rozhraní
procesor pro MM/ HT
manažer pracovních
toků
vyhledávací stroje, klasifikátory,
…
SŘBD
data, MM Info
J. Pokorný, Knihovny 01
manažer práv
přístupu
repozitář
11
Architektura digitální knihovny
konceptuální schéma s distribuovanými
informačními zdroji
uživatel
uživatel
knihovník
knihovník
tvůrce
tvůrce
informací/
informací/
vydavatel
vydavatel
tvůrce
tvůrce
informací/
informací/
vydavatel
vydavatel
tvůrce
tvůrce
informací/
informací/
vydavatel
vydavatel
J. Pokorný, Knihovny 01
server
server
digitální
digitální
knihovny
knihovny
klient
klient
digitální
digitální
knihovny
knihovny
Internet
12
Architektura digitální knihovny
kooperace na různých úrovních
Úroveň
Způsob kooperace
Příklad
federace
striktní standardy
MARC, Z39.50
sklízení dat
shromažďování
dat
vyhledávací
middelware
J. Pokorný, Knihovny 01
DK nabízí základní
metadata, protokol,
otevřené archivy
registraci
DK nekooperují; vyhledávání
vyhledávací
pomocí služeb
stroje
zdroje s metadaty jsou volně
Z93.50, XML,
zapojovány do sítě
RDF, SDLIP
13
Federace
autonomní DK založené na standardech a
dohodách
standardy a dohody:
• technické: formáty, protokoly, systémy ochrany,
apod.
• obsahové: data a metadata (včetně sémantiky)
• organizační : přístup, služby, placení,
autentizace, apod.
Př.: Z39.50 a MARC
federace jsou potřebné, ale velmi náročné a dost
řídké
J. Pokorný, Knihovny 01
14
Sklízení dat
DK:
• poskytují stručná metadata pro každý prvek dat
(např. Dublin Core)
• podporují jednoduchý protokol pro přístup k
metadatům
automatičtí ženci:
• sklízejí metadata automaticky
• budují se automatické služby
Př.: Open Archives Initiative
J. Pokorný, Knihovny 01
15
Shromažďování dat
služby pro otevřený přístup k informacím
dokonce i když jejich poskytovatelé se
nedohodnou na standardech
• vyhledávací robot shromažďuje informace,
které jsou otevřené k přístupu a indexuje je
• možné jsou automatizované služby (např.
ResearchIndex)
Př.: Internet Archive, Google
J. Pokorný, Knihovny 01
16
Vyhledávací middleware
uživatel
uživatel
ontologie
dotaz
odpověď
mediátor 1
mediátor 3
ontologie 3
mediátor 2
ontologie 1
repozitář 1
informační
zdroj 1
J. Pokorný, Knihovny 01
ontologie 2
Z 39.50,
repozitář 2
XML, RDF
informační
zdroj 2
SDLIP
17
Model 5S
Societies
Scenarios
Spaces
Structures
Streams
J. Pokorný, Knihovny 01
18
Model 5S
• Společenství: interakce lidí (, počítačů)
• Scénáře: služby, funkce, operace, metody
• Prostory: domény + omezení (např.
vzdálenost, sousedství): 2D, vektory,
pravděpodobnost
• Struktury: relace, stromy, uzly a hrany
• Proudy: posloupnosti prvků (text, audio,
video, síťový provoz)
J. Pokorný, Knihovny 01
19
5S: kombinace
• Společenství + Scénáře = uživatelský
model
• Společenství + Scénáře + Prostory =
uživatelské rozhraní
• Proudy + Struktury = značkování
• Proudy + Struktury + Scénáře = objekt
• Struktury + Scénáře = SŘBD
J. Pokorný, Knihovny 01
20
DK zkracuje řetěz mezi autorem
a čtenářem
autor
editor
Recenzent
vydavatel
A&I
akvizice
knihovna
čtenář
J. Pokorný, Knihovny 01
21
Přechod od klasické knihovny k
digitální
• vybudování technické infrastruktury (sítě, technika)
• konstrukce digitálních kolekcí (skenování, tvorba
metadat, popis zdrojů a jeho kódování, ontologie),
• přehodnocení některých klasických knihovnických
služeb, případně zavedení zcela nových, které vyžaduje
nový způsob zpracování.
⇒ s technologickými problémy se spojují i problémy
metodologické a ryze informatické
Nové standardy: DC, XML, RDF
Další problémy: jména digitálních objektů
J. Pokorný, Knihovny 01
22
Absorbování nových forem
reprezentace informací do DK
objevování informací pomocí Webu:
• konkurence knihovně nebo její nový element?
anonymní uživatel (knihovny):
„Dříve jsem používal Inspec. Nyní místo toho
používám Google.“
proč?
– širší záběr (šedá literatura, multimediální informace)
– lepší řazení
– bezprostřední přístup k informacím (např. otevřený
přístup k publikaci)
J. Pokorný, Knihovny 01
23
Absorbování nových forem
reprezentace informací do DK
webové vyhledávací služby mají mnoho
slabin
------
výběr je velmi libovolný
indexování je nahrubo
žádné řízení autorit
detekce duplicit slabá
nízká přesnost (ale vysoká úplnost!)
mnoha uživatelům to vyhovuje ...
J. Pokorný, Knihovny 01
24
Absorbování nových forem
reprezentace informací do DK
webové vyhledávání:
• výběr každé webové stránky
• indexování každého slova
• opakuje se každý měsíc
rysy: hrubá síla
jednoduché algoritmy + škálovatelná
výpočetní kapacita
J. Pokorný, Knihovny 01
25
Absorbování nových forem
reprezentace informací do DK
archivace a konzervace
Př.: Internet Archive
• měsíčně, webový robot sbírá každou
otevřenou webovou stránku včetně obrázků
• webové stránky jsou konzervovány pro příští
generace
• soubory jsou dostupné akademickým
institucím
Problémy: dynamika Webu (poločas rozpadu
webové stránky je 2 roky)
J. Pokorný, Knihovny 01
26
Absorbování nových forem
reprezentace informací do DK
vazby pomocí odkazů
Př.: ResearchIndex (CiteSeer, ScienceIndex)
• tvorba: plně automatická
• otevřený přístup ke všemu z informatiky
• služba zdarma
kontrast k Web of Science
• tvorba: kombinace automatických prostředků
a odborníků
• omezený počet časopisů
• velmi drahé
J. Pokorný, Knihovny 01
27
Od DK k automatizované digitální
knihovně
Změny:
• v kvalitě knihovnických služeb
• v kvantitě knihovnických služeb
• nové ekonomické modely
• pojem automatizované digitální knihovny
J. Pokorný, Knihovny 01
28
Vědecké knihovny jsou drahé
Každá z těchto knihoven stojí více než
skenování všech jejich knih
J. Pokorný, Knihovny 01
29
Vědecké knihovny jsou drahé
materiál
knihovny
J. Pokorný, Knihovny 01
budovy a
zařízení
personál
30
Potenciál digitálních knihoven
otevřený
přístup
materiál
J. Pokorný, Knihovny 01
budovy a
zařízení
personál
31
4 ekonomické modely
Příklad: televizní vysílání
Otevřený přístup
reklama
externí financování
komerční televize
veřejno-právní televize
Omezený přístup
předplatné
zaplať za použití
J. Pokorný, Knihovny 01
kabelová televize
zaplať za pořad
32
Příklady
staré
nové
knihy v tisku (předplatné)
Amazon.com (reklama)
Medline (zaplať za použití)
Grateful Med (externí)
časopisy (předplatné)
archivy ePrint (externí)
Westlaw (zaplať za použití)
Legal Information Institute
(externí)
Inspec (předplatné)
Google (reklama)
J. Pokorný, Knihovny 01
33
Náklady na automatizované digitální
knihovny
společnost Google
• 5.5 milionů vyhledávání denně
• 85 lidí (polovina technický personál, 14 má
PhD v informatice)
• 2,500 PC pod Linuxem, s 80 terabytes na
discích
Internet Archive
• 7 lidí + podpora od Alexa
J. Pokorný, Knihovny 01
34
O budoucnosti otevřeného přístupu
Dominantní silou bude tlak autorů, který zdůrazňuje
spíše otevřený přístup než uzavřený.
• bude působit více ekonomických modelů současně
• otevřený přístup bude možná ke všem vědeckým či
odborným informacím
• nejčastější ekonomický model: informace budou
publikovány organizací, která je produkuje
Organizace, které budou produkovat informace budou
univerzity, konference, laboratoře, společnosti atd.
J. Pokorný, Knihovny 01
35
Potenciál automatizovaných
digitálních knihoven
otevřený
přístup
?
materiál
J. Pokorný, Knihovny 01
buildings
počítače
&&
facilities
sítě
personál
36
Nové role vědeckých knihoven
Akademické knihovny a asociace by měly
poskytovat podporu pro otevřený přístup
k informacím:
-- zakládat standardy pro kvalitu výstupů výzkumu
-- udržovat lokální archivy
-- dlouhodobě pečovat o digitální informace a chránit je
Důsledek: obnovení primární funkce - být vzdělávací
institucí
J. Pokorný, Knihovny 01
37
6 trendů místo závěrů
Z konference Asociace amerických knihoven, 2000:
• Jak zajistit věrohodnost a prestiž digitálních
informačních zdrojů?
• Jak prohledávat digitální kolekce, které jsou ve více
jazycích?
• Jak integrovat digitální kolekce, aby samy poskytovaly
uživateli další nabídku možností vztažených k jeho
problému?
• Jak perzonalizovat služby podle profilu a zájmu
uživatele?
• Jak organizovat, aby informace samy hledaly svého
uživatele?
J. Pokorný, Knihovny 01
38

Podobné dokumenty

Citace odborné literatury jako nástroj rozvoje služeb a integrace

Citace odborné literatury jako nástroj rozvoje služeb a integrace (SCI) je v podstatě jediným kandidátem, který přichází do úvahy, pokud systém, který směřuje k budování integrovaného informačního celku, míří také k aplikaci citačních vazeb, které, jak známo, jso...

Více

Úkoly a řešení 2015

Úkoly a řešení 2015 soutěžícím naznačit, že úkoly které je letos čekají mají nějakou spojitost se vzduchem, nebo děním ve vzduchu.

Více

Digitální knihovny: principy a problémy

Digitální knihovny: principy a problémy dokumentů: rozšiřují svůj dosah na artefakty, které nemohou být reprezentovány nebo distribuovány v tištěné formě, např. videa přednášek, hlasové záznamy apod. V této práci budeme pod pojmem digitá...

Více

Úvod - Robotika.cz

Úvod - Robotika.cz Základní robotické algoritmy pro plánování, lokalizaci a řízení. Vývojové postupy (simulátor, logy, XPlight) (cca 5 přednášek) Grand Challenge — 3D World Náročnější druhy algoritmů, pravděpodobnost...

Více

zde - Mediální studia / Media Studies

zde - Mediální studia / Media Studies Snad každá komunikační inovace se ve Spojených státech stala v prvních fázích svého rozšíření obětním beránkem, jemuž byl připisován nárůst odcizení mezi lidmi, podíl na pokračujícím rozpadu pospol...

Více

Prezentace aplikace PowerPoint

Prezentace aplikace PowerPoint Vývoj Internetových Aplikací základní pojmy, technologie, …

Více

Digitální knihovny: více problémů než očekávání?

Digitální knihovny: více problémů než očekávání? Mění se také role digitálních knihoven. Nejde již pouze o tradiční služby podporující informační potřeby jednotlivých uživatelů. Digitální knihovny se stávají součástí např. systémů pro řízení obsa...

Více

Celý text - Česká společnost pro právo životního prostředí

Celý text - Česká společnost pro právo životního prostředí pokud taková řízení neexistují, do  jiných řízení nebo do  řízení, která mají být zavedena pro dosažení souladu s cíli Směrnice EIA. K významné změně Směrnice EIA došlo přijetím Směrnice Rady 2003/...

Více