Získat - Informační věda

Transkript

I N V E S T I C E
D O
R O Z V O J E
V Z D Ě L Á V Á N Í
Univerzita Karlova v Praze
Ústav informační studií a knihovnictví
Modul č. 3
Informační věda
Martin Souček
Určeno pro projekt:
Název: Studium informační vědy a znalostního managementu v evropském kontextu
Reg. číslo: CZ.1.07/2.2.00/07.0284
Operační program Vzdělávání pro konkurenceschopnost
Oblast podpory. 2.2 Vysokoškolské vzdělávání
Realizace: Vysoká škola báňská - TU Ostrava, Ekonomická fakulta, pracoviště Obchodní
akademie a VOŠ Valašské Meziříčí
OBSAH
1
ÚVODNÍ SLOVO........................................................................................................................................ 5
2
INFORMAČNÍ VĚDA ................................................................................................................................ 6
3
4
5
2.1
OBLASTI ZÁJMU INFORMAČNÍ VĚDY ..................................................................................................... 6
2.2
DŮLEŽITÉ OSOBNOSTI INFORMAČNÍ VĚDY ............................................................................................ 8
POJEM INFORMACE ............................................................................................................................... 9
3.1
CO JE TO INFORMACE ............................................................................................................................ 9
3.2
TŘI BUCKLANDOVY PŘÍSTUPY K POJMU INFORMACE .......................................................................... 10
3.3
JE INFORMACE MĚŘITELNÁ? ............................................................................................................... 11
3.4
VĚDECKÉ INFORMACE ........................................................................................................................ 12
TEORIE INFORMACE............................................................................................................................ 13
4.1
ZÁKLADNÍ KOMUNIKAČNÍ SCHÉMA: ................................................................................................... 13
4.2
KÓDOVÁNÍ .......................................................................................................................................... 14
4.3
MNOŽSTVÍ INFORMACE ....................................................................................................................... 14
4.4
SAMOOPRAVNÉ KÓDY ......................................................................................................................... 15
INFORMAČNÍ EXPLOZE ...................................................................................................................... 16
5.1
TŘI PŘELOMOVÁ OBDOBÍ .................................................................................................................... 16
5.2
PŘEDPOKLADY INFORMAČNÍ EXPLOZE ................................................................................................ 17
5.2.1
Nárůst objemu informací v elektronické podobě .......................................................................... 18
5.2.2
Dostupnost informací .................................................................................................................... 19
5.2.3
Moorův zákon – podmínka informační exploze............................................................................ 20
5.3
6
DŮSLEDKY, PROBLÉMY....................................................................................................................... 20
5.3.1
Information Overload Research Group ......................................................................................... 21
5.3.2
Řešení důsledků informační exploze, efektivní vyhledávání informací........................................ 22
INFORMACE V PROSTŘEDÍ WEBU................................................................................................... 23
6.1
POVRCHOVÝ WEB ............................................................................................................................... 24
6.1.1
Definice povrchového webu a základní principy fungování ......................................................... 24
6.1.2
Roboti, indexování povrchového webu......................................................................................... 24
6.2
6.2.1
Definice hlubokého webu a základní principy .............................................................................. 25
6.2.2
Proč je hluboký web skrytý........................................................................................................... 26
6.2.3
Vyhledávání v prostředí hlubokého webu..................................................................................... 26
6.3
7
9
FENOMÉN GOOGLE ............................................................................................................................. 28
6.3.1
Cíle společnosti ............................................................................................................................. 28
6.3.2
PageRank ...................................................................................................................................... 33
INFORMETRIE, SCIENTOMETRIE A BIBLIOMETRIE ................................................................. 35
7.1
INFORMETRIE ...................................................................................................................................... 35
7.2
SCIENTOMETRIE .................................................................................................................................. 36
7.3
BIBLIOMETRIE .................................................................................................................................... 37
7.3.1
8
HLUBOKÝ WEB ................................................................................................................................... 25
Bibliometrické zákony .................................................................................................................. 38
7.4
WEBOMETRIE ..................................................................................................................................... 39
7.5
CITAČNÍ ANALÝZY .............................................................................................................................. 40
7.6
SCIENTOMETRICKÉ A BIBLIOMETRICKÉ INDIKÁTORY A JINÉ METRIKY ................................................ 44
7.6.1
Impakt faktor................................................................................................................................. 46
7.6.2
Další klasické bibliometrické indikátory ISI................................................................................. 48
7.6.3
H-index.......................................................................................................................................... 49
7.6.4
Eigenfactor .................................................................................................................................... 52
7.6.5
Omezení indikátorů ....................................................................................................................... 52
CITAČNÍ DATABÁZE A EVALUACE VĚDY ..................................................................................... 55
8.1
DATABÁZE PRO HODNOCENÍ VĚDY ..................................................................................................... 57
8.2
CITAČNÍ DATABÁZE ............................................................................................................................ 59
8.2.1
ISI Web of Science a citační rejstříky ........................................................................................... 60
8.2.2
Scopus ........................................................................................................................................... 65
8.2.3
Google Scholar.............................................................................................................................. 70
8.3
DALŠÍ ANALYTICKÉ NÁSTROJE A NÁSTROJE MAPOVÁNÍ VĚDY ............................................................ 71
8.4
POUŽITÁ LITERATURA......................................................................................................................... 75
SPOLEČENSKÉ DOPADY MODERNÍCH INFORMAČNÍCH TECHNOLOGIÍ ........................... 77
Vliv na člověka a jeho sebepojetí.................................................................................................. 78
9.1.1
9.1.1.1
10
11
Příklady k zamyšlení: problémy s identitou ........................................................................................ 79
9.2
VLIV NA PRACOVNÍ A VOLNOČASOVÝ REŽIM ...................................................................................... 79
9.3
VLIV NA DISTRIBUCI MOCI VE SPOLEČNOSTI ....................................................................................... 80
9.4
VLIV NA ŽIVOTNÍ PROSTŘEDÍ .............................................................................................................. 80
9.5
MCLUHANOVA TEORIE MÉDIÍ ............................................................................................................. 81
9.5.1
Vliv médií na společnost ............................................................................................................... 82
9.5.2
McLuhanova tetráda na zkoumání médií ...................................................................................... 83
9.6
ÚKOLY ................................................................................................................................................ 84
9.7
LITERATURA ....................................................................................................................................... 84
INFORMAČNÍ ETIKA ............................................................................................................................ 85
10.1
VYMEZENÍ INFORMAČNÍ ETIKY ........................................................................................................... 85
10.2
KONFLIKTNÍ OBLASTI MIMOETICKÉ DIMENZE NAKLÁDÁNÍ S INFORMACEMI ....................................... 86
10.2.1
Zpřístupňování informací vs. omezování přístupnosti informací ............................................. 86
10.2.2
Odpovědnost za publikované informace či informační produkt............................................... 87
10.2.3
Korektní nakládání s vlastnickými právy původce informací či informačního produktu......... 87
10.2.4
Analýza informačních konfliktů............................................................................................... 87
10.2.5
K zamyšlení: eticky složité situace........................................................................................... 88
10.2.6
Úkol.......................................................................................................................................... 90
10.2.7
Použitá literatura....................................................................................................................... 90
HUMAN-COMPUTER INTERACTION................................................................................................ 90
11.1
VAZBA NA JINÉ OBLASTI A SOUVISEJÍCÍ OBORY .................................................................................. 91
11.1.1
Iniciativy a organizace HCI...................................................................................................... 91
11.1.2
Metodologie HCI...................................................................................................................... 92
11.2
INFORMAČNÍ ARCHITEKTURA ............................................................................................................. 93
11.2.1
Iniciativy a organizace IA ........................................................................................................ 94
11.2.2
Základní pilíře IA ..................................................................................................................... 94
11.3
PŘÍSTUPNOST ...................................................................................................................................... 95
11.3.1
Iniciativy v oblasti přístupnosti webu....................................................................................... 96
11.3.2
Metodiky a legislativní předpisy přístupnosti webu ................................................................. 96
11.4
12
POUŽITELNOST WEBU ......................................................................................................................... 98
11.4.1
Iniciativy v oblasti použitelnosti webu ..................................................................................... 98
11.4.2
Metody použitelnosti webu ...................................................................................................... 99
11.5
SHRNUTÍ ............................................................................................................................................. 99
11.6
SEZNAM POUŽITÉ LITERATURY ......................................................................................................... 101
PRÁVO A INTERNET ........................................................................................................................... 102
12.1
INTERNET Z HLEDISKA PRÁVA........................................................................................................... 102
12.2
VYMAHATELNOST A PŮSOBNOST PRÁVA NA INTERNETU .................................................................. 102
12.3
POJEM DUŠEVNÍHO VLASTNICTVÍ ...................................................................................................... 104
12.4
AUTORSKÉ DÍLO ............................................................................................................................... 104
12.5
ZPŘÍSTUPNĚNÍ DÍLA PROSTŘEDNICTVÍM INTERNETU ......................................................................... 106
12.6
STAHOVÁNÍ DÍLA Z INTERNETU ........................................................................................................ 107
12.7
P2P SÍTĚ A AUTORSKÉ PRÁVO ........................................................................................................... 107
12.8
OCHRANA AUTORSKÝCH PRÁV ......................................................................................................... 108
1
ÚVODNÍ SLOVO
Nebývá jednoduché stručně vysvětlit, co je obsahem informační vědy. I když lze snadno
sdělit, že je to věda, která se zabývá komunikací informací ve společnosti, její obrovský
význam a přínos se ujasní až po určitém studiu.
Informační věda je poměrně mladý, ale dynamický obor, který se vhledem k neustále
rostoucí nutnosti systemizace informací rychle rozvíjí. Zkoumá pohyb informací v lidské
společnosti, odhlíží od toho jakým způsobem se technicky informace přenášejí (to
přenechává informatice), ale zabývá se informacemi z hlediska obsahového. Zkoumá
způsob jejich symbolického vyjádření (reprezentaci), jejich medializaci (prezentaci) i
proces jejich přijímání (recepci).
Má dva základní aspekty společenskovědní s výrazným filozofickým akcentem a
technický, který poskytuje velmi účinné nástroje pro uspořádání informací a jejich
vyhledávání. V tomto materiálu se budeme nejprve věnovat filosofickým a sociologickým
východiskům a následně se pokusíme popsat technické nástroje, které má informační věda
k dispozici.
O tom jak významný je předmět zájmu informační vědy uveďme za všechny příklad její
geniální aplikace, fenomenální růst firmy Google. Ten je výbornou ukázkou a dokladem,
že v oblasti systemizace informací leží obrovský vědecký potenciál, budoucnost a úspěch.
Ukazuje to výraznou společenskou potřebu tohoto výzkumu, význam mezioborové
součinnosti i možnost synergické spolupráce vědy a komerční sféry. V případě Google je
výsledkem takové spolupráce úspěch v hodnotě 25 mld USD ročního obratu, což stojí za
pozornost.
Nicméně informační věda potřebuje velmi širokou základnu a velký mezioborový záběr
aby na takovéto úspěchy mohla pomýšlet. Nesmí ztratit ze zřetele filozofické,
sociologické, společenské, právní, matematické ani technické aspekty a přitom si udržet
své směřování a svébytnost. Pokud se jí to podaří, bude v blízké budoucnosti představovat
jeden s nejvýznamnějších vědních oborů vůbec.
2
INFORMAČNÍ VĚDA
Informační věda reflektuje změny které probíhají důsledkem vlivu moderních
komunikačních technologií a sleduje jejich dopad ve všech oblastech lidského konání.
Manuel Castells tvrdí, že žijeme v nové době, kterou nazývá informační, kdy životy
jedinců i společenských skupin je tvarován novými technologickými prostředky. Je to
právě rozvoj těchto prostředků, který propojuje stále hustší a kapacitnější informační sítí
celý svět, nabízí nové způsoby komunikace a zásadně tak mění
informační toky a
informační chování v celé společnosti.
Obecně řečeno zkoumá informační věda několik základních oblastí, které rychle proměňují
v kontextu rozvoje informační společnosti – vytváření a vznik informačních pramenů;
přenos, oběh, a šíření informací; zpracování, ukládání a vyhledávání informací;
informační fondy (kolekce, knihovny); jazykové nástroje komunikace informací a roli
člověka jako příjemce a zprostředkovatele informací.
Stručně řečeno je to tedy teoreticko-praktický obor, jehož ústředním tématem je zkoumání
vztahů mezi člověkem, informacemi a technologiemi v jejich společenském kontextu.
Tyto tři složky v jejichž průniku se nachází jádro informační vědy se navzájem ovlivňují,
doplňují a prolínají (Grešková, 2007).
Informační věda je poměrně mladým oborem, její základy byly položeny v polovině 20.
století. Jako samostatná vědecká disciplína byla informační věda deklarována v roce 1958,
kdy byl ve Velké Británii vytvořen Institute of Information Scientists (IIS). V této době byl
hlavní důraz kladen na aplikovanou úroveň informační vědy v oblasti bibliometrie a teorie
informace. Později se prosazují kognitivní aspekty informační vědy a do popředí zájmu
vstupuje člověk a výzkum jeho interakce s informačním prostředím, což přináší důležitý
obrat ve vývoji tohoto oboru (Ingwersen, 1992).
2.1
Oblasti zájmu informační vědy
Informační věda je typicky multioborová vědní disciplína. Níže uvádím výběrový přehled,
který ilustruje oborovou rozmanitost této platformy a připojuji stručný popis rozhraní ve
kterém se daný obor dotýká informační vědy:
Strana 6
Sociologie – vývoj a dopady komunikačních změn ve společnosti s ohledem na prudký
rozvoj informačních technologií a rozvoj nových medií, problém rozdělení společnosti
podle přístupu k novým technologiím a médiím (digital divide), vývojové komunikační
tendence ve společnosti; problematika sociologických průzkumů
Filozofie – filozofické aspekty informační/znalostní společnosti; etické aspekty nakládání s
informacemi
Informatika – problematika technické realizace komunikace, koordinace rozvoje
elektronické komunikace s růstem výpočetního výkonu a se zvyšováním kapacity datových
úložišť, standardizace komunikačních protokolů v informačních systémech
Psychologie – psychologické aspekty vyhledávání informací, chování uživatelů informací
(information seeking behaviour); psychologické aspekty komunikace člověk–počítač
(human-computer interaction); pojetí informace jako psychofyziologického jevu
Pedagogika – teorie výchovy a vzdělávání; pedagogické a didaktické metody; vzdělávací
programy jednotlivých typů a stupňů vzdělávacích institucí
Politologie – vliv schopnosti pracovat s informacemi na rozhodování občanů v oblasti
politického života; princip rovného přístupu k informacím a jeho vliv na rozvoj
demokracie
Právo – legislativní aspekty přístupu k informacím a jejich využívání
Lingvistika – obecné principy fungování přirozeného lidského jazyka jako základního
komunikačního nástroje, zkoumání komunikace a
jazyka pomocí matematických a
statistických metod, počítačové modelování jazykových systémů a strojový překlad
Ekonomie – ekonomické aspekty rostoucí úrovně informační gramotnosti (vliv na
produktivitu práce, míru nezaměstnanosti apod.)
Teorie komunikace
- problematika přenosu, kódování a měření informace z
matematického pohledu, definuje technicky a matematicky komunikační prostředí v rámci
teorie přenosu informace
Statistika –
rozvoj a zpracování empirických dat pomocí matematických metod,
modelování náhodnosti a neurčitosti pomocí teorie pravděpodobnosti, plánování,
sumarizace a analýza konkrétních pozorování
Strana 7
2.2
Důležité osobnosti informační vědy
Paul Otlet (1868 - 1944) - belgický právník a bibliograf, jeden ze zakladatelů informační
vědy, autor spisu o teorii dokumentace. Spolu s Henri La Fontainem založili Mezinárodní
bibliografický institut v Bruselu s cílem zachytit celosvětovou literární produkci. Pro
obsahové zatřídění záznamů vytvořili MDT.
Shyali Ramamrita Ranganathan (1892 - 1972) - je považován za otce knihovnictví v
Indii a celosvětově patří k významným postavám na poli knihovnictví a informační vědy.
Za jeho největší přínos knihovnické vědě jsou považovány jeho teorie klasifikace a teorie
indexace.
George Kingsley Zipf (1902 - 1950) - americký psycholog a lingvista, profesor lingvistiky
na Harvardově univerzitě. Věnoval se kvantitativní analýze jazyka (Zipfův zákon).
Samuel Clemens Bradford (1878 - 1948) - americký knihovník, jeden ze zakladatelů
bibliometrie. Výsledky studia rozložení článků v odborných časopisech z oboru geofyziky
zobecnil v tzv. Bradfordův zákon, platný pro všechny obory.
Derek J. De Solla Price (1922 - 1983) - americký historik vědy, zakladatel scientometrie.
V dílech Little Science, Big Science (1963) a Science Since Babylon (1961) mj. empiricky
prokázal exponenciální vzrůst počtu dokumentů.
Vannevar Bush (1890 - 1974) - ředitel MIT ( Massachusetts Institute of Technology) a
amerického úřadu pro vědu a výzkum (US Office for Scientific Research and
Development), poradce prezidenta Roosevelta. Autor návrhu hypertextového systému
(memex), který by organizoval informace a umožňoval přístup k nim na principu
podobném asociativnosti lidského myšlení.
Eugen Garfield (1925) - zakladatel a čestný ředitel Institute of Scientific Information, od
r. 1955 vydává Science Citation Index, vydavatel časopisu Scientist.
Jiří Cejpek (1928 - 2005) - profesor Univerzity Karlovy. V letech 1956 - 1970 působil na
Filozofické fakultě Univerzity Karlovy nejprve jako odborný asistent a od roku 1968 jako
docent katedry knihovnictví a vědeckých informací. V letech 1990 - 1994 stál v čele
Ústavu informačních studií a knihovnictví.
Strana 8
3
POJEM INFORMACE
3.1
Co je to informace
Začněme s nelehkou otázkou - co je to vlastně informace. Termín který je tak často
používán se při bližším zkoumání ukazuje jako těžko uchopitelný.
Termín informace prostupuje všemi oblastmi lidské činnosti, v této všeobecnosti spočívá je
jeho síla i jeho problematičnost. Na jedné straně všichni tomuto pojmu nějak rozumí, nějak
jej interpretují a připouští jeho důležitost, na straně druhé jsou způsoby této interpretace
velmi rozdílné a obtížně slučitelné.
Etymologicky pojem informace pochází z latinského podstatného jména „informatio“,
které bylo odvozeno ze slovesa „informare“ – informovat. Tento termín se začal používat
ve středověké filozofii ve smyslu „dát formu myšlence“, zformulovat myšlenku. Je tedy
zřejmé že už od samého vzniku toto slovo popisovalo určité zhmotnění myšlenky do
komunikovatelné podoby s cílem sdělovat, přenášet myšlenky, komunikovat.
Uvedu pro ilustraci tři různé způsoby chápání pojmu informace:
•
informace
jako
sdělení
-
komunikovatelný
poznatek,
který má význam pro příjemce ( údaj usnadňující volbu mezi alternativními
rozhodovacími možnostmi)
•
informace jako psychofyziologický jev, tedy jako součásti lidského vědomí
•
Norbert Wiener definuje informaci jako "obsah toho, co se vymění s vnějším
světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním„
Je zřejmé, že v případě informace se tedy jedná o nematematickou veličinou, kterou lze jen
obtížně definovat a měřit. Existují i intuitivní přístupy k chápání tohoto pojmu, cítíme že
informace je to, co přijímáme například formou textů, řečí, pomocí obrazů a že tato
informace zřejmě souvisí se získanou kvalitou.
Například Ingwersen chápe informaci jako jev, který přichází určitá změna, na jedné straně
odráží znalostní změnu tvůrce který ji formuloval a na straně druhé ovlivňuje příjemce
informace a mění stav jeho znalostí. V případě že dochází ke změně pouze u znalostních
Strana 9
struktur tvůrce informace, je možné mluvit o potencionální informaci, nebo li o datech
které mají pro příjemce hodnotu jenom latentní a skrytou (Ingwersen, 1992).
Pojem informace úzce souvisí s příbuznými pojmy data a znalost. Data jsou v této
souvislosti chápány jenom jako řetězce znaků, které představují formalizované vyjádření
(zatím potenciální) informace, připravené pro přijetí lidmi nebo ke strojovému zpracování.
Data je zapotřebí zpracovat, komunikovat a vnímat, pak se teprve stávají informací. Další
úrovní je pak znalost (či poznatek), která předpokládá zařazení, uchování a iterpretaci
informace v rámci hiearchicky uspořádaných znalostních struktur, ať už v hlavě příjemce
nebo v rámci informačního systému. Znalost je tedy to, co bylo uvedeno do souvislostí, co
jedinec ví poté co informace interpretoval v určitém kontextu.
Obrázek 1- Jak souvisí informace, data a znalosti
3.2
Tři Bucklandovy přístupy k pojmu informace
M. Buckland vychází ze vztahů mezi znalostmi, objekty a procesy a rozlišuje 3 pohledy:
informace jako znalost
je objektem informace jako procesu. Jde o entitu, nikoliv proces. Znalosti, názory, víra ..
nelze se jich přímo dotknout.
•
informace jako proces
Strana 10
•
někdo někoho informuje, sděluje mu zprávu. Závisí na kontextu.
informace jako věc
hmatatelná entita, dokument. Jde o fixovanou informaci, informaci v určité materiální
reprezentaci.
Jako stěžejní v rámci systematizace pohledu na pojem informace pokládá dělící čáru mezi
nehmotnou a hmotnou informací. Pokud se jí lze dotknout, změřit jí, není to znalost, ale
nějaká fyzická entita, může to být například papírový dokument. V době elektronického
zpracování informací to ale může také představovat nějaký informační systém, který je
fyzicky reprezentován servery a datovými úložišti, kde se informace zpracovávají a často i
neustále proměňují, jsou v neustálém procesu změny. Tím do tohoto rozdělení zavání
klidový stav, kdy informace je sama o sobě beze změny a proces vývoje, ve kterém se
informace proměňuje. Tím se termín informace rozpadá na čtyři aspekty, dané rozdělením
informace hmotná nebo nehmotná a informace věc nebo proces.
NEHMOTNÁ
VĚC
PROCES
HMOTNÁ
Znalost
Dokument
Sdělení
Zpracování dat
Obrázek 2- Čtyři aspekty informace podle Bucklanda
3.3
Je informace měřitelná?
Někdy se uvádí, že informace má v rámci sociální komunikace podobnou roli jako energie
v termodynamice. Proto se dává do souvislosti s pojmem entropie, který v tomto oboru
vznikl. Klíčový je v této souvislosti druhý termodynamický zákon, podle kterého mají
uzavřené systémy tendenci neustále zvyšovat svoji entropii – svojí míru neuspořádanosti,
míru rozmanitosti. Nejvyšší entropii má takový systém, který není organizován žádnými
vnitřními pravidly, takový systém je homogenní, všechny prvky jsou rozloženy, bez
odlišností, heterogenity v něm vznikají přidáním energie zvenčí.
Strana 11
Přenesením tohoto modelu do oblasti informační vědy dává prostor určování velikosti
informace která vstupuje do systému pomocí sledovaní změn v uspořádanosti tohoto
systému. Znamená to tedy, že čím více roste informace, tím více klesá entropie a naopak.
Množství informace je tedy dáno rozdílem mezi stavem neurčitosti systému (entropie),
kterou měl systém před přijetím informace a stavem neurčitosti, která se přijetím
informace odstranila. Informace tak snižuje nebo odstraňuje neurčitost systému, protože je
kvantitativní mírou vnitřních zákonitostí. V tomto smyslu může být informace považována
jak za vlastnost organizované hmoty vyjadřující její vnitřní strukturu.
3.4
Vědecké informace
V rámci vědy a výzkumu je velmi důležitý způsob výměny vědeckých informací, protože
ten předurčuje a determinuje schopnost vědy rozvíjet se na základě vzájemné spolupráce a
sdílení poznatků. Forma této komunikace je ustálena na standardní procesy jejich
nejběžnější podobou je článek v odborném časopise. Mezi další běžné výsledky vědy a
výzkumu patří konferenční příspěvek (c konferenčním sborníku), review (shrnutí
nějakého tématu v přehledovém článku), nebo postery (velkoplošné panely používané na
konferencích k popisu problematiky a diskuzi nad příslušným tématem). Na analýze
vědeckých výstupů je založena scientometrie, obor který zkoumá vědeckou komunikaci a
pokouší se je její kvantitativní měření a evaluaci.
Výstupem vědecké činnosti je tedy publikace výsledků v některé s uvedených forem, která
má ve odborném světě určitý dopad, vliv. Jediným nesubjektivním způsobem jak tento vliv
můžeme měřit je citační ohlas, to jakou odezvu a zájem daný výstup vyvolal mezi
odborníky v daném oboru. Tyto citační ohlasy se snažíme systematicky mapovat a získávat
z nich síť kde jsou jednotlivé vědecké výstupy vzájemně propojeny a ze které pak
vyvstávají důležité vztahy a souvislosti.
Na tomto místě je nutné zdůraznit základní vlastnosti vědeckých informací, kterými se
odlišují od ostatních druhů sociální komunikace (Königová, 2002).
•
přesnost, objektivnost, pravdivost, platnost, jednoznačnost, účelnost, společenská
hodnota atd
•
stárnutí informace - snižování hodnoty v závislosti na čase
•
sémantická povaha – informace je zachycena smysluplným souborem znaků
•
nezávislost na jazyku a nosiči - tentýž obsah může mít různé formy
Strana 12
•
neaditivnost, nekomutativnost, neasociativnost
•
rozptyl informací v časopisech
•
nezávislost na tvůrcích
4
TEORIE INFORMACE
4.1
ZI
Základní komunikační schéma:
Kodér
Přenos
Dekodér
PI
Šum
ZI: zdroj informace – člověk nebo stroj nebo příroda
Kodér: informace je zakódována (= zpráva)
Přenos: zakódovaná zpráva je poškozena Šumem
Dekodér: odkódováné zprávy (převedené do řeči, písma apod.)
PI: příjemce informace
Zde je vidět, že informace není to co máme v hlavě, ale to co dokážeme komunikovat
někomu jinému. Přitom je jasné, že neexistuje způsob, kdy dekódovaná informace je úplně
shodná s původní informací – sémantický obsah přenesený k příjemci není úplně shodný se
sémantickém obsahem na straně zdroje informace.
Strana 13
Odtud je jasné, že pojem informace má mnoho rovin a že je těžké definovat pojem
informace v plném rozsahu.
Zároveň je jasné, že základním prvkem zpracování informace (tak aby vůbec mohla být
přenesena od původce k příjemci) je kódování, tj. převedení informace do nějakého řetězce
znaků (znaky mohou být např. také fonémy). Proto se napřed seznámíme velmi letmo se
základními principy kódování.
4.2
Kódování
Abeceda je (konečná) množina znaků používaných v daném kódu.
Slovo = konečná posloupnost znaků z dané abecedy
Délka slova = počet znaků ve slově
Kódovaní je převedení informace do zadaného kódu, případně převedení informace
z jednoho kódu do druhého kódu.
Binární kódování: abeceda obsahuje pouze dva znaky 0 a 1 tj. A = {0,1}.
Kód: kód je zadán, pokud je zadána množina kódových slov, tj. podmnožina množiny
všech možných
slov. Obvykle je množina kódových slov zadána nějakou soustavou
podmínek.
Blokový kód: zpráva je rozdělena do částí (bloků) o stejné délce, každý blok je zakódován
samostatně a zakódované bloky jsou spojeny do zakódované zprávy.
4.3
Množství informace
1 bit = jednotka informace = množství informace obsažené v binárním slově o délce jedna.
Množství informace obsažené v binárním slově o délce n (tj. slovo = a1…an , kde ai
{0,1}, i = 1, … , n) je rovno n bitů, Inf (slovo o délce n) = n bitů.
Strana 14
Funkce Inf je definována jako informace obsažené v daném řetězci vyjádřené pomocí
jednotky bit.
Množství informace lze vyjádřit obecně pomocí počtu všech možných slov.
Máme-li binární slova o délce n, potom jejich počet je roven 2n.
Pro binární slova tedy platí
Inf (binární slovo délky n) = log 2 (počet binárních slov délky n)
Definice obecná: množství informace obsažené ve slově dané délky je rovno
dvojkovému logaritmu počtu všech možných slov dané délky.
Toto platí např. pro libovolnou abecedu
•
A = abeceda = {z1, …, zS} kde z1, …, zS jsou znaky abecedy A.
•
Počet možných slov o délce n v této abecedě je zřejmě Sn a tedy
•
h
I (slovo délky n) = log 2 S = h ⋅ log 2 S
( )
Např. informace obsažené v 1 znaku abecedy A je rovna log 2 S
Pozn. log2x je to číslo, kterým musíme umocnit 2, abychom dostali x, tj.
2 log 2 x = x
4.4
Samoopravné kódy
Samoopravné kódy jsou nezbytné pro fungování počítačů – dokáží kompletně eliminovat
možné chyby pamětí a disků.
Budeme uvažovat binární kódy tj. s = 2, A = {0,1}.
Hammingova vzdálenost dvou bitových slov (o stejné délce) je rovna počtu míst ve
kterých se tyto dva bitové řetězce liší.
Základní opakovací kód:
Slovo a1…an (kde a1,…,an {0,1}) je kódováno jako a 1 a 1 a 1 a 2 a 2 a 2 a n a n a n .
Je jasné, že 1 chybu lze vždy opravit.
Strana 15
Opakovací kód je definován jako množina kódových slov (délky 3n).
OpKod = { a 1 a 1 a 1 …a n a n a n : a1,…,an {0,1}}.
Lze snadno vidět, že dvě kódová slova z Op Kod mají Hammigovu vzdálenost ≥ 3.
Obecný argument:
Pokud sestrojíme kód, kde každá dvě slova budou mít Hammingovu vzdálenost alespoň 3,
bude možné vždy opravit chybu, pokud řetězec obsahuje nejvýše jednu chybu.
Konkrétní konstrukce samoopravných kódů je předmětem algebry a je systematicky
vypracována. Základní samoopravný Hammingův kód umožňuje zakódovat do bloku 7
binárních znaků informaci obsahující 4 bity tak, že kód automaticky opraví jednu chybu.
(pomocí opakovacího kódu bychom k přenesení 4 bitů potřebovali 12 bitů.)
Metody pro samoopravné kódy umožňují pomocí vhodně zavedené redundance snížit
pravděpodobnost neopravené chyby na prakticky nulu. Podrobně popisovat je nebudeme,
protože tyto metody tvoří část aplikované informatiky, což není obsaženo v Informační
vě dě .
ytvoření a použití efektivních samoopravných kódů je absolutně nezbytné pro praktickou
realizaci počítače. Kdyby nebyly k dispozici, počítače by vůbec nebylo možné používat.
Poznamenejme také, že základní myšlenka teorie samoopravných kódů, tj. myšlenka
využití redundance je výchozím prvkem divadelní hry Václava Havla Vyrozumění.
Zajímavé je také to, že myšlenka kvantových počítačů začaly být brána vážně až poté, co
byla vytvořena efektivní teorie kvantových samoopravných kódů.
5
INFORMAČNÍ EXPLOZE
„V poslední třetině 20. století technologická revoluce soustředěná okolo informací
změnila způsob, jakým myslíme, žijeme, umíráme, vedeme válku i milujeme."
Manuel Castells
5.1
Tři přelomová období
Při historické analýze informačního vývoje se uvádí několik přelomových období, kdy se
výrazně změnil způsob komunikace informací ve společnosti, vytvářeli se nové informační
a komunikační kanály a proměnil se i způsob sdílení informací v celospolečenském
kontextu.
V historii představuje takový první zásadní mezník vznik písma a na něj navázané období
zakládání knihoven (uvádí se 4. tisíciletí před K. po vzniku písma v údolích Eufratu a
Tigridu a následně také v údolí Nilu). Končí tím období předávání informací, znalostí a
Strana 16
náboženských nauk „od úst k uchu“ a začíná první fáze zpracování, ukládání informací a
jejich systemizace.
Dalším zásadním historickým přelomem je vynález knihtisku na přelomu středověku a
novověku, který znamenal zásadní revoluci ve způsobu šíření informací. Hlavní
dokumentem, který knihtisk pomohl rozšířit byla kniha, která již přestala být nedostupnou
a drahou záležitostí ale nacházela si postupně cestu i do nižších vrstev společnosti. Byly
položeny základy pro všeobecné rozšiřování vzdělanosti, širokou dostupnost informací.
Tato skutečnost se stala i zásadním podnětem pro změnu čtení, čtení již neznamenalo
předčítání a naslouchání, lidé si začali číst pro sebe, díky čitelnějšímu písmu bylo čtení
snazší, mnoho lidí bylo motivováno aby se naučili číst. Začali se objevovat konkrétní
autoři jednotlivých knih, skončila doba anonymního vydávání. Šestnácté století pak bylo
stoletím komunikační revoluce, na jeho počátku již v Evropě existovalo téměř tisíc
tiskáren, vyráběly se stovky exemplářů jednotlivých titulů, docházelo k jejich obrovskému
zlevnění a zpřístupnění.
Třetím přelomovým obdobím je vývoj informačních technologií přinášející zásadní změnu
komunikace ve společnosti. Tento proces začal již v druhé polovině 19-tého století
rozvojem telegrafie a pokračoval v poválečném období vývojem elektronkových počítačů
(elektronika), které nahradily jejich elektromechanické předchůdce. Zásadní společenská
změna však nastala až s příchodem a rozšířením internetu koncem 90-tých let, kdy se díky
rozvoji prostředků záznamu a šíření informací spolu s rychlým vývojem infrastruktury
zásadním způsobem začíná měnit způsob práce s informacemi.
Takto začíná informační exploze moderního věku, která má výrazně jiné charakteristiky
než uvedená přelomová období ve starověku a na počátku novověku. Dotýkáme se zde
podstaty celé společensko kulturní změny která charakterizována termínem „information
overload“ – informační přetížení. Tento termín a jeho společenské pojetí předchází době
internetu. Poprvé jej zmínil a popularizoval v 70-tých letech Alvin Toffler, který
poukazoval na obtíže člověka, který se má rozhodovat v situaci, kdy má příliš mnoho
informací.
5.2
Předpoklady informační exploze
Jak svět vstupuje do nové éry globalizace, je stále více lidí připojeno k internetu (od roku
1995 se počet uživatelů navýšil 40 krát – na dnešní cca 2 miliardy uživatelů) a tito
Strana 17
uživatelé mají v úhrnu obrovskou schopnost vytvářet a zpracovávat data z internetových
stránek, jejichž počet roste geometrickou řadou.
Růst počtu uživatelů sítě internet
Počet uživatelů
(tis.)
2 000 000
1 800 000
1 600 000
1 400 000
1 200 000
1 000 000
800 000
600 000
400 000
200 000
0
1987
1996
2000
2003
2005
2010
Rok
Zároveň je společnost na informacích a moderních informačních kanálech čím dál více
závislá, hlavním předpokladem společenského a hospodářského růstu již nejsou suroviny a
ekonomické zdroje, ale kvalitní informace a znalosti. Zvyšuje se tedy závislost na všech
formách informací (kupodivu si ani neklademe otázku, zda je tato závislost prospěšná a
zda nemohou mít informace v jistých situacích i negativní účinek na náš život).
Předpoklady informační exploze se dají charakterizovat třemi hlavními faktory, jimiž jsou:
•
obrovský nárůst objemu dokumentů a informací v elektronické podobě,
•
dostupnost těchto informací díky stále lepšímu síťovému propojení
•
platnost Moorova zákova o exponenciálním růstu výpočetního výkonu počítačů
5.2.1 Nárůst objemu informací v elektronické podobě
Rychle roste objem vytvářených informací, které vznikají buď přímo v elektronické
podobě (born digital), nebo jsou nějakým způsobem digitalizovány (scanování, OCR,
digitalizace analogových zdrojů). Do procesu zpřístupňování starších a historických
dokumentů se nyní v rámci digitalizačních projektů vkládá velké množství prostředků,
přičemž se často jedná o velmi zajímavé a hodnotné dokumenty, které tvoří webový
Strana 18
prostor stále atraktivnějším. Míra v jaké objem dostupných informací narůstá je skutečně
spíše explozí, k čemž pochopitelně výrazně přispívá snadnost kopírování, publikování a
sdílení dat.
Zároveň výrazně narůstá počet kanálů pro příjímání informací, jako jsou například např.
emailová komunikace, instant messaging, RSS, mobilní telefony, PDA, čtečky
elektronických knih (Kindle, Sony PRS, iPAD) a další.
5.2.2 Dostupnost informací
Webový prostor (cyberspace) se obrovským tempem rozšiřuje, propojuje a zpřístupňuje
obrovské objemy informací, takže pro své uživatele nabízí stále více.
Počet webových serverů na internetu
leden 2000 - cca 10 miliónů webových serverů
červen 2005 - přes 70 miliónů webových serverů
září 2007 - přibližně 135 million webových serverů
duben 2009 - více než 232 miliónů webových serverů
Obrázek 3- Počet webových serverů na internetu
Strana 19
5.2.3 Moorův zákon – podmínka informační exploze
•
Už
řadu
let
se
potvrzují
předpoklady
systematického
technického
a
technologického rozvoje, tak jak je vyslovil roku 1965 chemik a spoluzakladatel
firmy Intel Gordon Moore. Jeho původní znění bylo: „složitost součástek (výkon)
se každý rok zdvojnásobí při zachování stejné ceny.“
Mluví se tedy o
exponenciálním růstu výpočetního výkonu, který je běžně dostupný na trhu. Tento
zákon je dodnes, tedy už bezmála půl století, považován za velmi dobrý odhad
technologického a ekonomického vývoje. V současné době by jej stačilo mírně
upřesnit a prohlásit že každých cca 18 měsíců se výpočetní výkon a kapacita disků
zdvojnásobí. V praxi to tedy znamená, že za posledních cca 40 let tedy vzrostl
výpočetní výkon přibližně 100 milionkrát. Mnozí vědci předpokládají, že tento
zákon zůstane v platnosti i následujících 20 let a možná i déle.
•
Jeho význam pro informační vědu je obrovský, protože ve onom trojúhelníku
člověk -
technologie
- informace představuje motor který roztáčí spirálu
bouřlivých změn v informačních procesech celé společnosti a v jejím informačním
chování. Důsledkem těchto změn je obrovský nárůst elektronických informací
všeho druhu, nejrůznější kvality a důležitosti, tedy proces, který nazýváme
informační explozí. Moorův zákon charakterizuje technický a ekonomický vývoj,
který je v dlouhodobém kontextu přímou příčinou a předpokladem této exploze.
5.3
Důsledky, problémy
Důsledky informační exploze jsou patrné evidentní v každém oboru lidské činnosti. Jenom
objem vědeckých informací se zdvojnásobí během tří let a tento interval se postupně
zkracuje. Informační exploze přináší pochopitelně dokumenty různé kvality a
spolehlivosti, přináší také řadu rozporných a nepřesností dostupných informacích, kdy části
dokumentů jsou zavádějící, zkreslené informačními šumy a nemají jasnou strukturu.
Uživatelova situace je navíc zkomplikovaná tím, že většinou nejsou dostupné metody pro
porovnání a zpracování různých druhů informací.
Al Gore pojmenovává problém „informačního odpadu“ tedy informací které nikomu
neslouží, jsou nadbytečné (jenom komplikují informační procesy), nebo dokonce škodlivé
a nebezpečné a nazývá je „exformace“. Příkladem mohou být gigabajty logů operačních
Strana 20
systémů a aplikací které nikdo nidky nekůže zpracovat a přečíst, případně vyloženě
negativní ,toxických' informací (např. xenofóobní, komunistické a fašistické materiály,
návody na výrobu otravných látek, drog apod.) Data a informací tedy evidentně vytváříme
v daleko větších kvantech než kdykoliv předtím, ale neptáme se jestli jsou pro nás
prospěšná, či nikoliv. Začínáme narušovat proces, v němž se informace postupně
přeměňují ve znalosti a pak (někdy) ve spojení s vnímavým a inteligentním člověkem se
mění na moudrost. Pro dokončení tohoto procesu nezbývá dostatek času, protože přirozený
pomalý proces konverze informací na znalosti, je přerušen záplavou nových údajů, které
se derou do pozornosti člověka a vyžadují zpracování.
Tento proces přináší v odborném životě nezbytnou nutnost specializace každého
kvalifikovaného pracovníka, zaměření se na konkrétní úzce definovaný problém.
Výsledkem pak bývá v extrémních případech člověk který ví „skoro všechno o skoro
ničem“ (někdy nezíván nehezkým pejorativním termínem fachidiot). Pokud takovýto
pracovník nemá v hlavě informace z souvisejících disciplín, nemá nadhled v rámci svého
oboru, nemůže pochopit širší souvislosti a správně se rozhodovat v složitějších situacích.
Člověk s polyglotickým vzděláním, který by obsáhnul vševědění lidstva nemůže být
z tohoto světa a zůstává jen nedostupnou výzvou z antických časů.
Hodnota informace klesá s jejím rozšířením, má velký a význam důležitost jen když je
vzácná, pokud se stane všeobecně známou, snižuje se její informační hodnota (to že Země
obíhá kolem Slunce, je dnes triviální a v podstatě bezcenná informace). Na druhou stranu
lze sledovat proces, kdy v záplavě nových informací část z těch starších přestává být
validní. Jsou již překonané a ztrácí význam, původní znalost je překryta a zapomenuta
(staré technologické postupy, řemesla).
Máme tedy v současné době přístup k obrovskému množství informací ze široké škály
odvětví a oborů, je jen na nás, jak tohoto využijeme. Nicméně schopnost člověka
"vstřebávat" informace je značně omezena našimi intelektuálními schopnostmi a zvětšuje
se buď vůbec, nebo jen velmi pomalu.
5.3.1 Information Overload Research Group
Řada akademických pracovníků, firemních ředitelů a politiků pochopilo rostoucí důležitost
tohoto fenoménu. V červnu 2008 skupina výzkumníků z rozličných pracovišť zakládá
Information Overload Research Group (IORG) - neziskovou organizaci určenou pro
Strana 21
podporu výzkumu této problematiky a pro hledání nových řešení v oblasti Information
overload.
Obrázek 4- IORG, www: iorgforum.org
5.3.2 Řešení důsledků informační exploze, efektivní
vyhledávání informací
Řešení nebo alespoň zmírnění problému informační exploze je komplikované a netriviální.
V každém případě přijít na pomoc informační specialisté, lidé kteří těží ze zkušeností
knihovníků, kteří jsou zvyklí systemizovat informace již po tisíce let a kteří s využitím
znalostí v oblasti ICT vytvoří informační procesy které zafungují jako určité "prodloužení"
a "zesílení" lidských schopností. Výsledkem jsou pak informační systémy které jsou
schopné kategorizovat tematicky a kvalitativně informace, opatřit je metadaty a nabídnout
je uživateli v jednoduchém a uživatelsky přívětivém prostředí.
Pro pořízení metadat, což je klíčový proces pro systemizaci informací, jsou v principu
možné dva přístupy – manuální a strojový:
manuální přístup – znamená systemizaci informací v rámci knihovnické kategorizace,
věcný a identifikační popis, zařazení dokumentů do thesaurů a číselníků, využití selekčních
jazyků, hraje nezastupitelnou roli v knihovnách, u kvalitních sbírek a v profesionálních
databázových centrech
Strana 22
strojové zpracování – typicky to bývá indexování dokumentů pro fulltextové vyhledávání,
automatické generování anotací, search engine, zpracování dat s využitím umělé
inteligence, bez zásahu člověka, využívá se především v prostředí webu
Začíná být zřejmé, že kromě těch nejkvalitnějších databází a digitálních knihoven ve
světovém informačním prostoru jednoznačně vítězí strojové indexování a fulltextové
vyhledávání, protože neexistuje jiný efektivní způsob jak zpracovat neustále narůstající
obrovský objem informací.
Strojové zpracování umožňuje docílit velkou rychlost zpracování a je tak možno
zpracovávat obrovské datové objemy. Je pochopitelné, že takto nelze dosáhnout kvality,
přesnosti zpracování a úrovně přidané hodnoty, kterou přináší manuální zpracování, ale
nutnost velkých výkonů a průběžné aktualizace metadat je v konečném důsledku
rozhodující. Nejdále ve strojovém zpracování informací pokročila společnost Google,
které ukazuje směry kterým se tyto technologie budou v budoucnosti rozvíjet, což je
především aplikace algoritmů pro posouvání relevance a rozvoj paralelizace vyhledávacích
procesů, kterým lze docílit obrovský výpočetní výkon (jeden dotaz v Google Search je
zpracován cca na 5 tisíci počítačích)
V rámci obrovských datových objemů se do budoucna ukazují jako nejprogresivnější
strojové metody zpracování informací, přičemž se technologie tohoto zpracování neustále
intenzivně rozvíjí. Manuální zpracování a kategorizace je čím dál více vyhrazeno
klasickým knihovnickým sbírkám a databázovým systémům s těmi nejhodnotnějšími a
nejkvalitnějšími daty.
6
INFORMACE V PROSTŘEDÍ WEBU
Informace ve webovém prostředí jsou dostupné v různých úrovních zpřístupnění. Některá
data jsou zcela otevřeně vystavena na webovém serveru, jiná jsou uložena takovým
způsobem, že se přímému přístupu brání, ať je to již záměr či chyba jejich administrátorů.
Z tohoto pohledu rozeznáváme tzv. povrchový (volný) web, který je veřejně přístupný,
běžně indexovaný vyhledávači a obsahuje cca trilion (1,000,000,000,000) indexovaných
webových stránek a tzv. hluboký (skrytý) web, který vyhledávací stroje nejsou schopny
indexovat.
Strana 23
Lze zjednodušeně říci, že pokud za povrchový web považujeme všechny výsledky
dosažitelné dotazem v obecném vyhledávači typu Google, je pak hluboký web všechno
ostatní, vše co existuje v elektronické a sdílené podobě, nicméně to nemůžeme objevit
pomocí vyhledávačů v rámci dostupných výsledků.
6.1
Povrchový web
Povrchovým webem rozumíme tu část internetového prostoru, která je běžným
vyhledávačem typu Google Search indexována a zpřístupněna. Tento webový podprostor
je nám všem dobře známý a záleží jen na naší schopnosti dobře formulovat dotaz a
nacházíme okamžité odpovědi na naše otázky. Na druhou stranu je to prostor, který
principielně obsahuje informace které jsou často neověřené, mohou být neúplné,
neaktuální, nespolehlivé informace, zkrátka data která pomyslně řadíme do pejorativní
oblasti informačního „smogu“.
6.1.1 Definice povrchového webu a základní principy fungování
Povrchový web, stručně řečeno, je webový prostor, který je indexovaný vyhledávači a
který je tedy prohledatelný v rámci používání těchto vyhledávačů. Lapidárně a
zjednodušeně řečeno - povrchový web je to co najde vyhledávač Google. Tím je zároveň
naznačeno, že existují oblasti webu do kterých Google vstoupit nemůže...
Pro pochopení termínu povrchový web je rozhodující porozumět mechanismu, kterým
jednotlivé internetové vyhledávače (search engine) v prostředí webu zpracovávají
informace. Tyto internetové vyhledávače se skládají se ze tří modulů – webového robota,
indexátoru a vyhledávacího modulu. Takovýchto internetových vyhledávačů je celá řada,
Googlre mezi nimi sice výrazně dominuje, ale desítky ostatních můžete na jít třeba
v katalogu Yahoo.
•
6.1.2 Roboti, indexování povrchového webu
Přestavme si, že robot (crawler) stáhne určitou webovou stránku do databáze. Na této
stránce projde postupně všechny odkazy a příslušné stránky také stáhne. Takto postupuje
pořád dál (ze zadané množiny výchozích bodů) až postupně projde velkou část všech
webových serverů a uloží si obsah jejich stránek do databáze. Stažené stránky jsou pak
Strana 24
zařazeny do indexu používaného pro fulltextové vyhledávání (indexátor). Jsou vyřazena
stop slova, lemmatizace, jsou provedeny indexace. Když chce uživatel najít stránku, která
obsahuje určitá slova, pracuje s vyhledávacím modulem, který prohledá index a seřadí
nalezené stránky podle relevance a několik prvních pošle uživateli.
Parametr relevance podle kterého jsou stránky seřazeny je klíčový, Google má svůj
pagerank, Seznam používá S-Rank, vyhledávač Jyxo má Jyxo Rank. Dobře navržený
algoritmus pro výpočet ranku stránky je klíčem k úspěchu celého vyhledávače.
Jak bylo již uvedeno každý vyhledavač používá pro indexování stránek svého robota,
každý z těchto robotů má svoje specifické vlastnosti. Příkladem těchto vyhledávacích
robotů jsou GoogleBot, SeznamBot, JyxoBot, Morfeo Holmes, MsnBot, Slurp a další.
6.2
Hluboký web
Hluboký web (deep web) je tvořen běžně nedostupnými dokumenty a daty v
profesionálních databázích. Uvádí se že je cca 500x obsáhlejší než povrchový, nicméně
přesná čísla nejsou dostupná, protože neexistuje dobrý způsob jak hluboký web komplexně
zmapovat a změřit. V každém případě je rozsáhlost hlubokého webu oproti povrchovému
impozantní.
6.2.1 Definice hlubokého webu a základní principy
Termínem hluboký web, nebo také neviditelný web, se označuje ta část webu, která je pro
běžné uživatele vyhledávacích strojů typu Google skrytá. Zmíněný termín „neviditelný“
není úplně přesný, protože tyto informace samozřejmě k nalezení jsou, avšak ne běžným
fulltextovým vyhledáváním, které používá drtivá většina uživatelů. Pro ně zůstávají tyto
informace neviditelné.
Hluboký web je taková oblast internetu, která není strojově prohledavatelná a která má
své specifické vlastnosti. Na rozdíl od neuspořádaných a neúplných informací, které známe
z běžného (tzv. povrchového) webu, poskytuje informace systemizované v databázích,
nebo v databázových centrech, které bývají relevantní a poměrně spolehlivé.
Termín hluboký web se používá zhruba od roku 2000, kdy jej zavedla společnost
BrightPlanet. Definovala jej jako neindexovatelnou část webu a tvrdí, že hluboký web je
Strana 25
asi řádově větší než povrchový web. Hluboký web obsahuje stovky miliard dokumentů
vysoké kvality, které jsou přístupné prostřednictvím databázových center (MAKULOVÁ
2002).
6.2.2 Proč je hluboký web skrytý
Pro pochopení, proč je hluboký web pro vyhledávače neviditelný, je třeba vyjít ze způsobu
práce těchto vyhledávačů. Výše jsme uvedli že robot prochází web po jednotlivých
odkazech, nicméně toto jeho chování je limitováno na přímé linky v html kódu. Pokud se
mu postaví do cesty přihlášení, dotazovací okno, flash a podobné překážky je pro něj tato
cesta uzavřená. Řekněme si tedy, co roboti prohledávat neumí:
•
stránky, kde je potřeba přihlášení
•
stránky s restrikcí přístupu na určitý rozsah IP adres;
•
databáze, kde musí uživatel klást dotaz;
•
stránky zabezpečené technologií CAPTCHA;
•
stránky používající nevhodným způsobem JavaScript, FLASH či AJAX;
Jakmile tedy vyhledávací stroj narazí na stránky, které mají výše popsané vlastnosti, není
schopen je zaindexovat. Důležité jsou pro nás první dva body, protože ty jsou v případě
hlubokého webu majoritní. Proto jsou z indexace vyloučena všechna databázová centra,
všechny dynamické portály s databázemi, databáze skryté v internetu atd. k těmto zdrojům
musí tedy uživatelé přistupovat jiným způsobem a použít například vstupních bodů, které
budou popsány v dalších kapitolách.
Jedná se o sofistikované portálové aplikace, které pracují v heterogenním databázovém
prostředí a jsou nazývány profesionální databázová centra, databázoví agregátoři,
poskytovatelé profesionálních informačních zdrojů pro vědu a výzkum.
6.2.3 Vyhledávání v prostředí hlubokého webu
Hlavním datovým zdrojem, který tvoří největší část hlubokého webu jsou profesionální
databáze a tudíž znalost hlubokého webu může být chápána jako orientace v těchto
databázích a databázových centrech.
Strana 26
Takovýmto prostorem jsou databázová centra, která ve většině případů stojí na
komerčních základech a která obsahují velké množství ověřených informačních pramenů
seskupených v jednotlivých tématicky zaměřených databázích. v těchto případech bývá
podmínkou, aby organizace, jejichž služeb využíváme, navázala smluvní vztahy s
příslušnými databázovými centry a domluvila se s nimi na platebních podmínkách. Na
rozdíl od portálů probíraných v předchozí kapitole nejsou totiž tato databázová centra
volně přístupná.
Příkladem může být největší databázové cetrum Dialog, který bývá někdy označován za
nejrozsáhlejší databázový
systém vůbec (VLASÁK 1999). V současné době nabízí
v rámci svých produktů přístup do databází o celkovém datovém objemu více než 15
terabytů. Tvoří bezpochyby světovou špičku v poskytování online informačních služeb na
poli obchodu, vědy, techniky, financí a práva, s více než 670 zaměstnanci a přímým
působením v 27 zemích celého světa.
Brány do hlubokého webu - příklady
•
Turbo10: Turbo10 umožňuje klást dotazy více než 800 vyhledávačům, které jsou
zaměřeny na hluboký web.
•
BusinessResearch: Tento vyhledávací nástroj je zaměřený na aplikovaný výzkum.
•
Science Research Portal – tento vyhledávací portál umožňuje prohledávat hluboký
web v oblasti vědeckých informací.
•
Lycos Invisible Web Catalog – jde o jednu z nejlepších služeb pro orientaci v
prostředí hlubokého webu. Mapuje více než 10 000 databází.
•
Infomine Multiple Database Search – rozcestník k více než 15 000 databázím,
určeným především pro akademickou komunitu. Jeho součástí jsou i odkazy na
elektronické časopisy, knihy, knihovní katalogy apod.
•
AlphaSearch – služba, která nabízí jedny z nejkvalitnějších odkazů, ačkoli jejich
počet není z nejvyšších. Při mapování neviditelného webu se tato služba zaměřuje
na zdroje značované jako „vstupní brány“.
•
WebData – databázový portál nabízející k jednotlivým databázím anotace, recenze
a hodnocení kvality.
Strana 27
Všechny živé systémy (živé v nejširším možném smyslu slova – např. živočichové,
rostliny, houby apod.) nějakým způsobem pracují s informací. Základní činnosti při práci
s informacemi jsou: uchovávání a předávání (přitom vědomě poněkud přehlížíme tvorbu
nových informací).
6.3
Fenomén Google
Způsob práce s informací se v čase mění – probíhá nejen evoluční vývoj, ale také revoluce.
Revoluční vývoj může být ukázán na novém pojetí přístupu k informacím, tak jak jej
prezentuje firma Google již od roku 1999. Jde o ambice, které si dříve nikdo nepoložil, ani
si je reálně neuměl nikdo představit. Tyto aktivity překračují kategorizaci na hluboký a
povrchový webu, proto o nich budeme pojednávat ve zvláštní kapitole.
6.3.1 Cíle společnosti
Firma Google si již na počátku stanovil zjednodušeně řečeno následující cíle:
•
Uspořádat dosažitelné informace na webu (a kdekoliv jinde)
•
Zpřístupnit dosažitelné informace
Uspořádání informací na internetu znamená především indexování celého obsahu webu.
•
Tento cíl si zakladatelé Googlu stanovili explicitně přesto, že v té době byl
takovýto cíl zřejmě nedosažitelný. Nenechali se touto skutečností odradit a pustili
se do práce.
•
Aby bylo možné indexovat celý existující bylo nutné vytvořit nové postupy jak
v oblasti SW, tak i v oblasti HW. Cíl vyžadující tak ohromný výpočetní a
paměťový výkon vyžadoval nové postupy jak v oblasti SW (ohromná paralelizace
výpočtů) tak v oblasti HW (vytvoření ohromné kapacity). Zakladatelé řešili tento
úkol tím, že vytvořili nové postupy síťových kooperací (vesměs patentované) a tím,
že vytvořili ohromné farmy PC-serverů, které jim poskytly ohromný výpočetní a
paměťový výkon.
Strana 28
•
Právem je Google nazýván novým typem firmy – hardwarově-softwarová firma –
díky tomu nemá fakticky konkurenci – je na špici jak v oblasti HW tak v oblasti
SW
•
Kvantitativní data – Google využívá více než 450:000 PC serverů, každý dotaz do
vyhledávače je zpracováván v průměru v 7.000 počítačích.
•
Dnes má Google indexovaný a (mnohonásobně uložený) celý obsah internetu,
k tomu digitalizovaný a indexovaný obsah desítek velkých knihoven, produkci
desítek tisíc nakladatelů, dostupná digitální data o zemském povrchu (mapy i
fotografie), a nikdo neví co ještě
•
Je možné uzavřít, že první cíl Googlu – uspořádat dostupné informace firma plní
Druhý cíl zpřístupnění informací je nejméně tak ambiciózní jako první cíl uspořádání
informací – spíše je daleko ambicióznější, ale to posoudí budoucnost. Cíl zpřístupnit
informace si Google představuje takto
•
Uživatel zadá svůj požadavek na informace tím, že specifikuje pomocí pojmů
vyjádřených slovy jaké informace chce najít
•
Google dokáže upravit (interpretovat) zadaná data v dotazu tak, aby „pochopil“ o
co uživateli jde
•
Cílem Goolgovského vyhledávače je nastavit pořadí webových stránek tak, aby
byly seřazeny v pořadí klesající relevance – relevancí se rozumí relevance
vzhledem k zadanému dotazu – nástrojem k tomu je vytvoření tzv. „page rank“ což
znamená ohodnocení relevance dané stránky vůči zadanému dotazu (přesný postup
tvoří obchodní tajemství fy Google)
Cílem stanovit relevanci stránek vzhledem k zadanému dotazu si Google dal prakticky
naprosto nesplnitelný cíl. Znamená to totiž
•
Interpretovat zadaný vyhledávací řetězec ve smyslu „co měl uživatel na mysli, když
zadal právě tento řetězec“ ? Takto pojatý úkol je konečným cílem oboru Sémantika
a je v pohledu teoretické sémantiky nedosažitelný. Firma Google si opět (již
podruhé po zadání úlohy indexace celého internetu) položila cíl, který podle
zdravého rozumu je nesplnitelný – strojově pochopit ze zadaného dotazu o co
uživateli fakticky jde. Vývojáři Googlu si s tím určitým způsobem poradili
Strana 29
o Vytvořili si pojem relevance stránky vzhledem k zadanému dotazu –
znamená to, že stránka má určitý „page rank“daný tím jak často je
odkazována z jiných stránek a dalšími hledisky, které vystihují relevanci
určité stránky vůči zadanému dotazu
o Formulovali ideu, že sémantický obsah jakéhokoliv jazykového výrazu lze
reprezentovat pomocí obsahů stránek na internetu a pomocí vztahů mezi
stránkami na internetu. Tato značně troufalá myšlenka znamená v praxi to,
že internet v nějaké formě obsahuje věrnou reprezentaci sémantických
obsahů. Pokud by tato „hypotéza“byla pravdivá, znamenalo by to historický
pokrok v oblasti sémantiky. Znamenalo by to, že veškeré sémantické
obsahy lze nalézt na internetu, stačí je jen najít. To by byla naprostá
revoluce v oblasti informační vědy, protože by to znamenalo, že konečný cíl
sémantiky tj. reprezentovat sémantické obsahy by byl efektivně dosažen.
Toto je spíše utopie, ale pokroky jsou nesmírné.
o Tvorba indexu relevance, který umožňuje seřadit odpovědi na dotaz dle
relevance je úctyhodná (přitom faktické algoritmy nejsou známy).
•
Musíme si uvědomit, že bez HW-SW schopností fy Google by vyhledávání na
internetu bylo utopií.
Vyhledávač firmy Google je vlajkovou lodí firmy, ale Google nabízí nejméně sto dalších
velice sofistikovaných aplikací. Některé z nich zmíníme
•
Gmail je nový typ poštovního internetového klienta, který má značné výhody
o Je nejrychlejší
o Umožňuje řazení mailů do komunikací ve skupinách
o Umožňuje naprosto bezprecedentně rychlé prohledávání v poště
o Umožňuje současné prohledávání internetu
•
Dodává jednoduchý ale funkční systém pro práci s dokumentem (Google docs)
současně zpracovávaným více uživateli
o Aplikace Google docs je plně funkční a velmi jednoduchá a rychlá
o Je zdarma
•
Google Maps a Google Earth – aplikace mapující zemský povrch – nesmírně
populární a užitečná umožňující efektivní prohlížení map a fotografií zemského
povrchu
Strana 30
•
Google Books – aplikace umožňující vyhledávání v digitalizovaných knihách
(obecně bez možnosti prohlížení obsahu) pomocí indexování obsahu knih. Google
zastává stanovisko, že pouhé indexování obsahu knihy není porušením autorského
zákona: umožňuje vyhledávané místo najít, ale neumožní zpřístupnění obsahu
knihy (pouze krátký citát).
o Problém uživatele zda knihu koupit nebo ne spočívá většinou v tom, zda
kniha je relevantní nebo není – Google mu pomáhá najít správný odhad
relevance. Potom může uživatel buď knihu koupit nebo si ji vypůjčit
v knihovně.
o Domníváme se, že jednak je Google v právu, pokud se domnívá, že
indexace sama není porušením autorských práv a jednak, že autorská práva
se vztahují na sémantický obsah a ten není indexováním nijak odhalen. Dále
se domníváme, že aplikace Google Books umožní mnoha uživatelům najít
knihu, kterou by si i koupili, kdyby o ní věděli.
o Tato snaha Googlu o zpřístupnění digitálního obsahu je ku prospěchu
celého lidského společenství
Firma Google navíc rozřešila i (pro jiné nerozřešitelný problém) problém financování.
Vytvořila takové formy reklamy na internetu, které mají kladný výnos pro podnikatele a
zároveň nejsou dehonestující pro zaměstnance. Jimi vytvořená pravidla financování
prostřednictvím diskuse s partnery vedou na spravedlivější přerozdělování v rámci státu (a
pouze státu – po provedení hlasování se na návrh zapomene).
Rozhodnutí fy Google nabízet aplikace běžnému uživateli zdarma je klíčové – a to jak pro
uživatele, tak i pro firmu. Tím Google získal rozhodující objem uživatelů, protože v řadě
směrů nabízí nejlepší produkt a zdarma. Google si uvědomil, že získání uživatele je
cennější než jeho platba.
Plně globální věk vzniká až s firmou Google. Její cíle jsou plně globální
•
Indexovat celý internet
•
Zpřístupnit všechny dostupné informace na celém světě
•
Získat pro sebe všechny uživatele tím, že jejich produkt je nejlepší a je zdarma
Strana 31
•
Nezbytné finanční výnosy získat od firem prostřednictvím reklamy (neboť oslovují
všechny uživatele) a tím potřebné náklady na provoz a rozvoj rozdělit na ty, kteří
přebytečné zdroje mají
•
Měřítkem je pro ně objem všech dostupných informací
Aktivity firmy Google naráží ovšem na přirozené limity
•
Autorská práva – Google má za cíl indexovat všechny informace a zpřístupnit
pouze ty, které jsou z hlediska autorských práv volné
o Existence neúměrně dlouho trvajících autorských práv je zřejmou brzdou
jakéhokoliv pokroku lidstva – cestou praktického omezení práv Google
pomáhá lidstvu překonat tuto hlubokou překážku pokroku
o Vlastnické vztahy k poznatkům jsou zásadním omezením lidstva – dovedete
si představit svět, ve kterém by Pythagorova věta byla soukromým
vlastnictvím ? (zobecnění Pythagorovy věty jsou základem moderní vědy
např. kvantové mechaniky a teorie relativity – obě teorie jsou bez
Pythagorovy věty nemyslitelné)
o Problém autorských práv ke svým produktům Google rozřešil – většina jich
je dostupná zdarma. Google žije z reklamy a to není otázka využívání
produktů.
•
Hlavní veřejně známé rysy
o nejpoužívanější vyhledávač, založený v roce 1997 Pagem a Brinnem
o více než sto dalších produktů – valná většina služeb zdarma
o obrat 21 miliard USD
o proklamované zásady
o „Don't be evil “
o „A healthy disregard for the impossible“
Další aplikace
o Google Video + YouTube
o Google Docs & Spreadsheets
o Google Maps + Google Earth
o Google Reader
Strana 32
o Google Calendar
o Google Books
o Blogger
o Picasa + Picasa Web Albums
6.3.2 PageRank
Parametr PageRank funguje jako dnes již slavná obchodní značka Googlu. Je to
výsledek algoritmu, který vytvořili zakladatelé firmy a který je pravidelně vylepšován
a upravován. Tento koncept odráží důležitost jednotlivých stránek a lze jej slovy tvůrců
popsat takto: "To calculate the uniquely democratic nature of the web by using its vast link
structure as an indicator of an individual page's value." [PAGE L. 1998].
Celý systém se opírá o analýzu odkazů miliard webových stránek tvořících internet.
Princip je následující: odkazuje-li jedna stránka na druhou, dává jí tak vlastně hlas
a zvyšuje její důležitost. Neznamená to samozřejmě, že stránky se při vyhledávání
zobrazují výhradně podle PageRanku, konečné pořadí je určeno až kombinací s obsahem
stránky a konkrétními on-page faktory. [SEO konzultace 2008].
Současný algoritmus PageRank není přesně znám (tvoří součást obchodního tajemství),
k dispozici je pouze algoritmus tak, jak byl původně zveřejněn [PAGE 1998]:
(1 − d ) +
PR( A) =
m
n
PR(Bi )
∑ d × C (Bi )
i =1
•
PR (A) je PageRank stránky A
•
PR (Bi) je PageRank stránky Bi, která na stránky a odkazuje
•
C(Bi) je počet odchozích odkazů na stránce Bi
•
m je celkový počet indexovaných stránek
Strana 33
•
d je faktor útlumu (tzv. damping faktor), který nabývá hodnot od nuly do jedné.
Další kroky algoritmu
•
jako vstupní hodnoty PR(Bi) se berou hodnoty PageRanku stránek z minulé
iterace výpočtu
•
odkazuje-li jedna stránka na druhou, dává jí tak vlastně hlas a zvyšuje její
důležitost.
•
stránky se při vyhledávání nezobrazují výhradně podle PageRanku, konečné
pořadí je určeno až kombinací s obsahem stránky a konkrétními on-page
faktory
•
PageRank je v podstatě počítání odkazů – zhruba řečeno
Strana 34
7
INFORMETRIE, SCIENTOMETRIE A BIBLIOMETRIE
Lucie Vavříková
Informetrie, scientometrie a bibliometrie jsou si velmi blízké, bývají možná i právem
někdy zaměňovány, to však může být způsobeno právě tím, že se navzájem prolínají,
spolupracují spolu, používají stejné metody, jednu si dnes bez druhé nelze představit.
V pramenech se také objevuje několik různých pojetí jejich vzájemného vztahu, vymezení
každé z nich není zcela jednoznačné. Jejich vztah je naznačen na obr. č. 2:
INFORMETRIE
Scientometrie
Bibliometrie
Obr. 1 – Vzájemný vztah informetrie, scientometrie a bibliometrie
Zastřešující je informetrie, jak naznačuje její název, zabývá se informacemi, respektive
informačním procesem a měřením informačních toků. Bibliometrie a scientomterie se
navzájem velmi překrývají, mají totožné vědecké metody, dělají obdobné analýzy,
nicméně bibliometrie je omezena na zaznamenané informace a jejich bibliografie (řekněme
publikace obecně), zatímco scientometrie je vymezena sociálním aspektem vědu, zkoumá
pouze publikace, resp. vědecké výstupy ve vědecké komunitě. Bibliometrie je „starší“,
v podstatě je scientometrie jen její nadstavbou a doplňkem; scientometrie obecně ke svému
zkoumání využívá zejména bibliometrických metod. Pojmy bibliometrie a scientometrie
uvedl Pritchard a Nalimov s Mulčenkem takřka ve stejný čas (1969), informetrie si na svou
definici počkala dalších 10 let.
7.1
Informetrie
Informetrie je ze zmiňovaných třech dílčích disciplín nejširší, její povaha je nejvíce
teoretická a zajišťuje takto metodologický základ zbývajícím dvěma. Informetrie se zabývá
měřením toku informací, hodnocením informačního procesu. Jedná se o vědní obor, který
Strana 35
používá matematicko-statistických metod k popisu a analýze informačních jevů za účelem
hledání jejich zákonitostí [KTD, 2003]. Jako součást informační vědy se zabývá především
kvantifikací informace, kvantitativní analýzou informačních toků a dokumentů apod.; její
výsledky slouží např. pro analýzu kvantitativního růstu literatury, účinnosti informačních
systémů či role informací ve vědecké komunikaci. Informetrie je metoda zkoumající a
kvantitativně měřící vznik, oběh a působení informací v jakékoli oblasti společenského
života jednotlivce nebo společnosti. Usiluje o vyjádření hodnoty informačního sdělení.
[KÖNIGOVÁ, 2001].
7.2
Scientometrie
Existuje řada způsobů jak ve vědě měřit ve kvalitu a kvantitu. Scientometrie je věda, která
se tímto měřením zabývá, snaží se nalézat metody a metriky pro určení jednoho či druhého
aspektu, obecněji se také vžil pojem měření výkonnosti vědy. Ve své samotné podstatě
sleduje a hodnotí komunikaci ve vědě, neboť všechna měření jsou odvozena od interakcí
mezi jednotlivými elementy scientometrie, touto základní interakcí je citace. Její název je
odvozen z metrein – měřit (řec., lat.), scientia – znalost, vědění. Scientometrie přímo
navazuje a vychází z informační vědy a používá mj. její metody, pro správné pochopení je
ji třeba vsadit do kontextu jednotlivých metod bibliometrie a informetrie. Prakticky je
scientometrie dnes nejvíce využívána pro hodnocení vědy pro rozdělování finančních
zdrojů ve vědě.
Scientometrie, v angličtině „Scientometrics“, se obecně řečeno zabývá měřením vstupů a
výstupů ve vědě a měřícími procedurami ve vědě [KÖNIGOVÁ, 2001]. Z pohledu
sociologického se jedná o studium kvantitativních aspektů vědecké komunikace
(publikace, citace). Jejím cílem je vyvinout indikátory intelektuální a sociální organizace
vědeckých disciplín za pomoci vzájemných vztahů mezi autory a texty [LEYDESDORFF,
2001]. Scientometrie provádí matematické a statistické analýzy vědeckého výzkumu
(častěji v tzv. tvrdých vědách) [KTD, 2003]. Pomocí scientometrie lze určit vzory a
identifikovat charakteristiky jak autorů, tak dokumentů. Metodami scientometrie lze
propojit informace o institucích na úrovni výzkumných skupin
s vývojem na úrovni
jednotlivých disciplín a oborů. Jeden z nejdůležitějších cílů scientometrie je zkoumat
kvantitativní vztahy produkce, diseminace a impaktu/vlivu vědeckých informací
[VINKLER, 2008].
Strana 36
Pokud uvážíme dnešní ekonomické aspekty hodnocení vědy, lze definici scientometrie
ještě o kousek posunout, scientometrie zkoumá vědeckou produktivitu a její výslednou
prospěšnost, současný výzkum využívá jak bibliometrické tak ekonomické analýzy
[DIODATO, 1994], věda je uvažována jako ekonomická aktivita [TAGUE-SUTCLIFFE,
1992].
D. J. de Solla Price, zakladatel scientometrie, se výrazně zabýval oblastí historie vědy a
vědy o vědě, z kvantitativních analýz odvozoval tvrzení o exponenciálním charakteru
vývoje či rozložení zkoumaných jevů. Mezi nejznámější patří zákon o exponenciálním
růstu počtu dokumentů a tvrzení, že polovina vědeckých článků je publikována druhou
odmocninou počtu všech autorů [KTD, 2003].
V dnešní době využívá scientometrie zejména data dvou komerčních produktů, databáze
citačních rejstříků dnes sjednocená do platformy ISI Web of Science (Thomson Reuters)
s více jak čtyřicetiletou historií a konkurenční citační databáze Scopus od nizozemského
vydavatele Elsevier spuštěná před 5 lety. S rozvojem technologií je však stále snazší pro
ostatní producenty zabudovávat do svých databází a dalších informačních a znalostních
produktů prvky scientometrických analýz, zejména sledovat vzájemné citace. Velmi
diskutován je např. nástroj Google Scholar. Z dalších produktů zahrnující tyto nástroje je
databáze PubMed, CSA Illumina aj.
7.3
Bibliometrie
Výraz bibliometrie bývá velmi často používán jako souhrnný pojem, autoři často
informetrii nebo scientometrii od ní nerozlišují. Pravděpodobně je to tím, že převážná část
metodologického aparátu je definována jako bibliometrická.
Bibliometrie se zabývá studiem kvantitativních aspektů produkce, rozšiřování a užití
zaznamenaných informací. Vytváří si matematický model a teorie procesů a poté je
aplikuje pro odhadování vývoje a pro rozhodování [TAGUE-SUTCLIFFE, 1992].
Bibliometrie pomocí kvantitativních analýz, statistik a datových vizualizací zjišťuje
charakteristiky referencí, citací, autorů, časopisů, institucí, slov, klíčových slov,
klasifikačních kódů atd. Typickou a jednou z nejstarších je bibliometrická analýza
kvantitativního růstu literatury. Do bibliometrie dnes bývá velmi často také zařazována
Strana 37
oblast výzkumu informačních potřeb (uspokojení nebo neuspokojení požadavků uživatelů),
neboť bibliometrie tvoří jeho valnou část, jako např. hodnocení intenzity využívání
knihovních a informačních fondů.
7.3.1 Bibliometrické zákony
Jak bylo již výše zmíněno, máme tři bibliometrické zákony Lotkův, Bradfordův a Zipfův,
mezi nejpoužívanější bibliometrické metody řadíme publikační a citační analýzy.
Lotkův zákon, známý jako zákon měření vědecké produktivity [KÖNIGOVÁ, 2001], který
byl definován při srovnávání publikační činnosti autorů v oblasti chemie a fyziky, říká, že
se stoupajícím počtem publikovaných článků klesá počet autorů píšící největší poměr
množství článků [Scientometrics, 2007]. Pokud a1 autorů publikuje jeden článek, pak an
bude počet autorů, kteří publikují n článků:
an = a1 / n 2
Zipfův zákon neboli frekvenční analýza respektive „rozptyl slov v textu“ [KÖNIGOVÁ,
2001] byl definován Georgem Kingsley Zipfem, americkým psychologem a lingvistou.
Zipfův zákon vyjadřuje skutečnost, že základ lexiky vytváří relativně malý počet silně
frekventovaných slov. Zipf slova uspořádal podle frekvence ( f ) výskytu, slovo s nejvyšší
hodnotou výskytu získalo r =1, následující r = 2 atd. Jsou-li slova dlouhého textu seřazena
podle pořadí klesající četnosti jejich výskytu, potom součin pořadí ( r ) a četnosti ( f ) pro
každé slovo textu bude přibližně táž konstanta ( C ), která závisí na délce textu.
r*f=c
Na základě Zipfova zákona se konstruovaly také slovníky nevýznamových (stop) slov,
které jsou základem pro automatické vyhledávání.
Bradfordův zákon, je zákon rozptylu informací, nebo rozptylu relevantních článků
v časopisech [KÖNIGOVÁ, 2001]. Definoval jej Samuel Clemens Bradford, americký
knihovník, jeden ze zakladatelů bibliometrie. Tento zákon se prakticky může použít např.
Strana 38
pro tvorbu a vyváženost knihovních fondů. Obdobně jako Lotkův zákon definuje nepřímou
úměru mezi časopisy a relevantními články v nich - maximální počet relevantních článků
je soustředěn v minimálním počtu časopisů tvořících tzv. jádro. Jádro oboru pak tvoří
nejužší skupina časopisů, ve kterých vyšlo nejvíce relevantních článků.
7.4
Webometrie
S nástupem počítačů, nejen že se díky obrovskému výpočetnímu, propojovacímu a
úložnému potenciálu scientometrie velmi rozvíjí, dochází také k transformování
bibliometrických metod do tohoto prostředí a formuje se kybermetrie, nebo také
webometrie. Lze je chápat jako totožné, pokud bychom je chtěli od sebe alespoň nějak
odlišit, kybermetrie je určena obecně aplikací do kyberprostoru, navíc první časopis
zabývající se touto oblastí nese název Cybermetrics, webometrie se pak spíše aplikuje
v rámci World Wide Web, jinak zjednodušeně označované jako internet nebo web. O obou
se začíná hovořit v roce 1997. Vzhledem k dnešnímu vymezení většiny služeb právě
v rámci internetu, respektive využívání zdrojů skrze webové rozhraní, na kterém jsou
analýzy založeny, bude zde souhrnně použit termín webometrie.
Webometrie se zabývá kvantitativními aspekty vytváření a užití informačních zdrojů,
struktur
a
technologií
celého
internetu,
přičemž
využívá
bibliometrického
a
informetrického přístupu. Web může být v jistých aspektech nahlížen stejně jako klasická
„papírová“ komunikace, kde tradiční informační entity a citace jsou nahrazeny webovými
stránkami a odkazy. Výrazným rozdílem proti klasickému prostředí je možnost
oboustranného propojení a samozřejmě to, že ve webovém prostředí neexistuje kontrola
kvality
[BJÖRNEBORN,
INGWERSEN,
2004].
Webometrie
je
stále
ještě
v experimentálním stádiu, je zkoumáno, zda bibliometrické metody mohou v tomto
prostředí být aplikovány [NORUZI, 2006].
Zkoumat lze ve všech složkách digitálního prostředí, tj. v sítích jednotlivých domén,
intranetu; webometrie provádí hodnocení sítí podle objemu informačních kolekcí, počtu
www stránek, podle četností vstupu, času odezvy. Provádí klasifikaci stránek podle
způsobu prezentace, vytváří statistiky užívání, hodnotí produktivitu autorů [SOUČEK,
2006].
Strana 39
7.5
Citační analýzy
Tato kapitola se pokusí přiblížit základní metodu zkoumání v bibliometrii a scientometrii:
citační analýzy, jejich účel, využití a omezení. Ačkoliv je kapitola pojmenována ve
stručnosti „Citační analýzy“, seznámíme se nejprve s analýzami publikačními, které jsou
vlastním základem analýz citačních. Citační a publikační analýzy jsou základní
bibliometrické metody, které umožňují měření a tím vzájemné srovnávání v oblasti vědy a
výzkumu.
Uvést publikační analýzy je nezbytné proto, že pokud chceme získat kompletní obraz vědy
např. v daném státě, je nezbytné se zaměřit již na základní úroveň, tj. přímo na samotné
publikování, ještě než budeme zkoumat další komunikaci díla v rámci vědy. Pro důslednou
interpretaci výsledků citačních analýz je nutné přihlédnout k výsledkům publikační
analýzy. Např. pokud bychom z citační analýzy usoudili, že v určitém oboru nejsou
v daném regionu kvalitní vědci, neboť nejsou citováni, je důležité nejprve zjistit, zda-li se
v daném regionu v daném oboru vůbec publikuje. Citační a publikační analýzy nejsou vždy
vymezeny zvlášť, často jsou v rámci analýzy citační provedeny analýzy publikační.
Publikační analýza je matematicko-statistická bibliometrická metoda, která se zabývá
kvantitativním
měřením
produkce
publikací.
Publikační
analýzou
nejčastěji
vyhodnocujeme [INGWERSEN, LARSEN, 2007]:
•
geografickou oblast
•
vědní oblast
•
časovou periodu
•
typ vědecké literatury
•
autora v oboru nebo zemi
•
časopisy v oboru
•
instituce
Publikační analýzou stanovujeme např. jaké typy publikací jsou typické pro danou oblast
[INGWERSEN, LARSEN, 2007]:
•
přírodní vědy a medicína
•
recenzované články
Strana 40
•
článek typu review
•
dopisy a poznámky (typické zejména pro fyziku a obdobné oblasti)
•
technické a počítačové vědy
•
•
příspěvky ve sborníku (recenzované)
•
patenty
•
společenské a humanitní vědy
•
knihy (antologie a monografie; recenzované a vydané)
•
Citační analýza je matematicko-statistická bibliometrická metoda, která kvantifikuje
vztahy mezi autory, dokumenty a vědními obory na základě bibliografických citací a
bibliografických referencí. Konkrétně citační analýzy zkoumají citovanost dokumentů,
četnosti citací v dalších pracích apod. [KTD, 2003]. Analýzy se zabývají výzkumem
citačních vazeb a citací. Jedná se o zkoumání témat, směrů, množství a vazeb, jsou
vytvářeny např. citační sítě a grafy [JANSSENS, 2006]. Výsledkem citační analýzy může
také být určení hodnoty scientometrického indikátoru [SMELSER, BALTES, 2004].
Analýzou citačních rejstříků je možné určit a popsat směr budoucího vývoje vědních
disciplín a mapovat vědu [JANSSENS, 2006]. Pomocí citačních analýz se měří tzv.
viditelnost v oblasti vědy.
Citace je znak vědecké komunikace, je znakem užití informace. Citace navzájem propojuje
dokumenty, pomocí nich lze vymodelovat odbornou literaturu jako velkou síť dokumentů,
které jsou spojeny citacemi. Citace jsou dvojího druhu: citace a reference. Formálně
reference ve vědecké komunikaci označuje použití informace, citace vyjadřuje příjem
tohoto použití ve vědecké komunikaci.
Citační analýzy měří a indikují zejména:
•
počet citací dokumentu
•
vztahy dokumentů
•
vzájemnou obsahovou souvislost
•
nepřímou obsahová souvislost (více dokumentů citovaných jedním dokumentem,
jeden dokument citovaný více dokumenty)
Strana 41
•
jádro oboru
•
kvantifikované profily oboru a prognostické odhady
Výsledky citačních analýz lze interpretovat v několika směrech, lze z nich usuzovat na
[MOED, c2005]:
•
výkonnost vědy
•
odbornou kvalitu
•
vliv
•
dopad
Jako aplikovaná metoda má citační analýza význam pro optimalizaci informačních toků a
pro profilování knihovních fondů; je také základem citačního mapování vědy pomocí
konstrukce citační sítě [KTD, 2003]. Citační analýzy jsou dnes využívány zejména
v oblasti hodnocení vědy. Výsledky citačních analýz jsou přímo závislé na zdroji dat, na
jeho excerpci, kvalitě záznamů a jejich metadat. Při interpretaci výsledků citačních analýz
je nutno vždy přihlížet k možnostem a mezím použitých metod a zdrojů.
Rizika a omezení citačních analýz
Citační analýzy jsou omezovány mnoha aspekty, které mohou výsledky zkreslovat.
Zásadní je identifikace elementů, je velmi těžké určit, zda se jedná o téhož autora, instituci,
velmi složité je identifikovat úroveň elementu (výzkumný tým) a vzájemnou spolupráci,
obdobné problémy jsou s identifikací publikace. Identifikaci z pohledu textu pak
znesnadňují homonyma, synonyma, zkratky a různé variantní názvy. Velmi složité je určit
typologii dokumentů.
Mezi technická omezení řadíme zejména otázku vzájemného propojování citací (vychází
z nedokonalé identifikace). Citační analýzy předpokládají citační morálku, třetím
omezením je morální aspekt. Na etické rovině hovoříme zejména o nadměrném citování
sebe sama (autocitace), vzájemné bezdůvodné citování a zneužívání spoluautorství
(uvedení autorů, kteří na publikaci nemají žádný či jen minimální podíl).
V jednotlivých oborech se výrazně liší citační zvyklosti; v molekulární biologii a
biomedicíně je snazší dosáhnout citovanosti než v teoretické fyzice (totéž se do určité míry
Strana 42
projevuje i uvnitř oborů). Vyšší citovanost přináší bádání na pomezí oborů,
v interdisciplinárních oblastech.
Na obecnější úrovni si pak musíme uvědomit, že často mnoho pramenů (neformálních)
citováno není vůbec (konzultace s kolegy aj.), že stále jsme omezeni daným zdrojem dat a
nikdy se nemůžeme vyvarovat lidské potažmo úřední chybě.
Mimořádně vysokou citovanost také mívají přehledové články a některé metodické práce.
Ačkoli vysoká citovanost pravděpodobně indikuje, že daná práce či její autor přináší pro
odbornou komunitu něco důležitého a objevného, je třeba mít stále na paměti, že pro vědu
mají velký význam i lidé, jejichž originální badatelský přínos není velký, ale jsou skvělými
popularizátory, mají organizační schopnosti nebo umějí dobře přednášet. Podrobněji jsou
omezení a rizika rozebrána v kapitole Scientometrické a bibliometrické indikátory.
Citační rejstříky
V dnešní době se nástroje citačních analýz díky výpočetní technice rychle rozvíjejí.
Klasickým nástrojem je citační resjtřík (též citační index), který má za cíl mapování vědy,
prestiže autorů, časopisů, oborů, pracovišť atd. Otcem citačních rejstříků je Eugene
Garfield, který definoval citační rejstřík, pro jejich vývoj založil Institute of Scientific
Information ve Philadelphii r. 1958. Citační rejstřík je ve své minimální podobě seznam
publikovaných článků opatřený výčtem jejich citací v daném časovém období. Základní
metodou je tedy sledování a zaznamenávání citací a jejich počtu a slouží tak k průzkumu
citovanosti, respektive jsou zdrojem pro vytváření citačních analýz. V dnešním kontextu
můžeme chápat citační rejstřík šířeji, v podstatě lze jakýkoliv informační zdroj, který
disponuje údaji o vzájemném propojení dokumentů pomocí citací či referencí, označit za
citační rejstřík. Nebo můžeme koncept uchopit obráceně a říci, že citační rejstříky jsou
dnes již automatickou součástí tzv. citačních databází, které nabízí další nástroje k citačním
analýzám.
Citační rejstříky lze rozdělit na několik druhů
polytematické - zahrnují více oblastí vědy, nejznámější Science Citation Index (v rámci
databáze ISI Web od Science na platformě ISI Web of Knowledge), novější databáze
Scopus (http://www.scopus.com), Google Scholar (http://scholar.google.com).
Strana 43
oborové
v rámci databáze Medline (http://www.medline.com)
astronomie, fyzika - NASA ADS (http://adsabs.harvard.edu)
medicínský citační index Národní lékařské knihovny (http://www.nlk.cz)
preprintová digitální knihovna pro fyziku v Los Alamos (http://www.lanl.gov)
a další...
specializované – jsou orientovány na specifickou formu vědecké komunikace, např.
patentový citační rejstřík Derwent Innovation Index, STN International aj.
Nejznámější (a původní) citační rejstříky jsou:
SCI = Science Citation Index (od r. 1961) – ukazatel citací v přírodních. lékařských a
technických vědách
SSCI = Social Science Citation Index – zaměřený na společenské vědy (od r. 1969)
AHCI = Arts and Humanities Citation Index (od r. 1978) – obsahuje data z oblasti
humanitních věd a umění
Jsou dostupné v rámci databáze ISI Web of Science, analytické výsledky z těchto dat jsou
podrobně vypracovávány v databázi Journal Citation Reports.
Podrobnější informace k citačním rejstříkům, databázím, které substituují citační rejstříky a
dalším zdrojům pro citační analýzy jsou uvedeny v kapitole Citační databáze a
scientometrické zdroje.
7.6
Scientometrické a bibliometrické indikátory a jiné
metriky
„Každý indikátor má své přednosti a svá omezení. Nesmí se na ně hledět jako na
„absolutní“ ukazatele; mají komplementární roli. Různé bibliometrické postupy a
Strana 44
metody musí být používány v kombinaci, přestože mohou někdy vést k protichůdným
výsledkům, zvláště pokud poskytují užitečné informace a odpovídají vědeckým a
odborným standardům. Přes svá omezení, bibliometrické ukazatele poskytují
zásadní kvantitativní měřítka vědeckého výkonu.“
[OKUBO, 1997]
Scientometrie je věda, která se snaží vstupy a výstupy ve vědě uchopit, zejména
kvantitativně. K tomu potřebujeme definované metriky, na základě nichž můžeme právě
kvantitu určit; určujeme ji indikátory, v kontextu evaluativní scientometrie hovoříme o
scientometrických prvcích. V průběhu vývoje scientometrie bylo navrženo velké množství
indikátorů, které charakterizují scientometrické elementy, neboli určují jejich status
[BOLLEN, RODRIGUEZ, SOMPEL, 2008]; a dnes jsou velkým tempem navrhovány a
vyvíjeny indikátory další. Nejtradičnějším indikátorem je impakt faktor, navržený
Eugenem Garfieldem a další z kolekce Institute for Scientific Information (Citing Half-life
aj.), dnes mu adekvátní konkurenci tvoří H-Index. Jelikož všechny indikátory mají svá
omezení, nevýhody a zkreslují svým způsobem výsledky, vždy jsou navrhovány indikátory
komplementární, které se snaží tato omezení zmenšit a redukovat zavádějící výpovědní
hodnoty.
Pokud hovoříme o indikátorech a jejich definicích, velmi jasně vstupujeme do sporu
tvrdých věd a věd společenských (sociální, humanitní). Na společenské vědy lze indikátory
aplikovat jen v omezeném měřítku, neboť společenské vědy mají velmi odlišné
charakteristiky vědní komunikace, ať už se jedná o typ publikací, poločas rozpadu nebo
regionální vymezenost. Proto zejména ve společenských vědách je význam indikátorů
velmi relativizován a je stále zdůrazňován význam recenzního řízení. Rozdíly mezi
hodnotami indikátorů jsou samozřejmě i mezi jednotlivými vědeckými disciplínami, nelze
jednotlivé obory, potažmo tak ani vědce, či instituce, srovnávat na základě absolutní
hodnoty indikátoru. Obecně jsou však indikátory určeny pro hodnocení na všech úrovních,
na mikro- (autor, článek), střední (výzkumný tým, projekt, instituce) i makroúrovni (velké
instituce, stát, region).
Jak je zmíněno na začátku, indikátory hovoří o kvantitativních aspektech. V dnešní době
mnoho systémů hodnocení vědy jej přebírají jako náhradní evaluační nástroj. Právě
vzhledem k mnoha omezením, které jednotlivé indikátory mají, nelze nahradit kvalitativní
posuzování, stejně jako nelze brát výstupní hodnoty jednotlivých metrik jako absolutní
bernou minci. K rozhodnutí o zapojení indikátoru jako hodnotícího prvku je nejprve nutné
Strana 45
se důsledně seznámit s jeho vlastnostmi, definicemi a užitými metodami tak, aby alespoň
co nejlépe odpovídal záměru hodnocení.
7.6.1 Impakt faktor
„Dobrý sluha, ale zlý pán“ Špála
O impakt faktoru bylo napsáno mnohé, jeho dlouholetá historie ho podrobila řadě kritiky,
která byla impulzem pro vznik nových indikátorů, nicméně impakt faktor je dodnes velmi
uznávaným indikátorem, mnoho systémů hodnocení vědy využívá tuto metriku jako
součást evaluace výstupů z vědy.
impakt faktor = počet citací / počet publikací
Impakt faktor vyjadřuje impakt individuálních časopisů, podle toho, jak byly průměrně
citovány ve 2 předchozích letech (v roce 2004 je IF určen za r. 2002-03). Impakt faktor je
uváděn na tři desetinná místa.
Celý název tohoto indikátoru je Journal Impact Factor, který avizuje, že je primárně určen
pro aplikaci na časopisy, nikoliv na jiné scientometrické elementy, nelze jím hodnotit
autory nebo články samotné. Při takovéto aplikaci se dopouštíme chyby, kdy uvažujeme,
že úspěšný článek mnohokrát citovaný je totožný s tím, který takřka nebyl citován, pouze
byl uveřejněn ve stejném časopise, potažmo autoři jsou v tuto chvíli posuzování jako stejně
úspěšní, mají stejný impakt faktor [EGGHE, 2007].
Impakt faktor je přidělován časopisům, které jsou excerpovány do tzv. citačních rejstříků,
v současné době tedy do databáze ISI Web of Science, jejímž producentem je korporace
Thomson Reuters. Databáze zahrnuje citační rejstříky Science Citation Index, Social
Science Citation Index a Arts & Humanities Citation Index. Databáze ISI Web of Science
je zpřístupněna mj. v integrovaném rozhraní ISI Web of Knowledge, které zahrnuje také
databázi Journal Citation Reports, v níž jsou publikovány právě hodnoty impakt faktorů a
další indikátory derivované z citačních rejstříků.
Strana 46
Z impakt faktoru lze vyvozovat, s jakou pravděpodobností lze očekávat, že články
v časopise uveřejněné by mohly být citovány [ŠPÁLA, 2006]. Neboť právě časopis, ve
kterém byl vydán, má přidělen takový impakt faktor, kolik v průměru jeho články získávají
citací, lze pak předpokládat, že článek by tento počet citací mohl získat taktéž.
Historie
Impakt faktor byl definován v r. 1955 v rámci projektu citačních rejstříků Eugenem
Garfieldem, který pro zavedení tohoto indikátoru založil Institute for Scientific
Information ve Philadelphii (USA). V r. 1960 vzniká první obecný citační rejstřík, o rok
později byl zpracován první Science Citation Index. Následovalo vydání Journal Citation
Reports, dnes je vše dostupné v rámci integrovaného rozhraní producenta Thomson
Reuters ISI Web of Knowledge.
Kontroverzní impakt faktor:
Sám Eugene Garfield se ve svých posledních článcích věnuje fenoménu impakt faktoru a
jeho kritice, respektive jeho použití. Vyskytují se pochyby o uvádění impakt faktoru na 3
desetinná místa. Pomocí impakt faktoru nelze srovnávat časopisy z různých vědeckých
disciplín nebo hodnotit autory, impakt faktor se liší podle časové periody, ne ve všech
případech při delší časové periodě impakt faktor stoupá [ŠPÁLA, 2006].
Nejrozsáhlejší kritiku konceptu impakt faktoru patrně provedl v r. 1997 Per O. Seglen
[SEGLEN, 1997] [HJØRLAND,2007]. Zásadními body jsou:
•
není statisticky reprezentativní pro individuální články v časopise
•
nekoreluje s aktuálními citacemi jednotlivých článků
•
autoři i vybírají podle mnoha jiných kritérií, když nabízejí článek do časopisu
•
citace necitovatelných jednotek jsou v databázi započítávány
•
nereflektuje nadměrnou citovanost publikací typu review
•
rozsáhlé články získávají více citací, hodnota impakt faktoru se zvyšuje
•
navyšování citací pomocí autocitací u časopisů s kratší periodou vydávání, jinak též
selektivní autocitace, články mají tendenci přednostně citovat jiné články ve
stejném časopise
•
autory časopisu jsou preferovány citace v národním jazyce časopisu
Strana 47
•
omezené pokrytí databáze
•
v databázi nejsou zahrnuty knihy, i když jsou významným zdrojem citací
•
orientace databáze zejména na anglický jazyk, dominance amerických publikací
•
kolekce časopisů v databázi se může rok od roku lišit
•
vyšší hodnoty mají výzkumné oblasti s rychle zastarávajícími informacemi
•
závislost na dynamice oboru v daném čase
•
menší vědecké disciplíny většinou nemají časopisy s vysokým impaktem
•
je silně ovlivněn vztahy mezi jednotlivými disciplínami (např. klinický vs. základní
výzkum)
•
je určen mírou citovanosti, což neplatí vice versa
•
ignoruje kvalitu přijatých citací, rozpor mezi prestiží a popularitou
7.6.2 Další klasické bibliometrické indikátory ISI
Spolu se zavedením impakt faktoru byly zavedeny další indikátory, jejichž hodnoty jsou
určovány z datové kolekce citačních rejstříků. Indexy jsou určován buď pro jednotlivé
časopisy, nebo v rámci předmětné oblasti, tzv. agregované indexy.
Immediacy Index
Immediacy Index, v češtině nazýván jako index bezprostředního vlivu nebo odezvy, někdy
označován také jako Garfieldův index, vyjadřuje průměrný počet citací, který článek získal
v roce jeho publikování.
immediacy index = počet citací článku v daném roce / počet článků v daném roce
Vzhledem k tomu, že je uvažován průměr citací na článek, immediacy index redukuje vliv
velkých časopisů. Časopisy s velkou periodicitou jsou zvýhodněny, neboť mají více času
v průběhu roku nasbírat citace. Časopisy, které vycházejí nepravidelně nebo ke konci roku
Strana 48
tak mají nižší immediacy index. Tento index je vhodný zejména pro srovnávání časopisů
zabývající se velmi aktuálními otázkami a dynamickými vědními disciplínami.
Cited Half-life
Poločas citovanosti, jak je do češtiny tento ukazatel překládán, udává po kolika letech (ve
vztahu k určitému roku) se objeví 50% všech citací na články daného časopisu v citačních
rejstřících. Například časopis, který v roce 2001 má cited half-life 5, což znamená, že
články publikované mezi 1997-2001 (včetně) odpovídají polovině všech citací článků
z tohoto časopisu v roce 2001. Cited half-life je vypočítáván pouze pro ty časopisy, které
byly citovány více než stokrát v daném roce.
Cited half-life má výpovědní hodnotu zejména pro akvizici a archivování, změny mohou
naznačovat změnu ve formátu časopisu a dá se z nich vyvozovat historie časopisu.
Citing Half-life
Poločas citování vyjadřuje průměrné stáří článků, které jsou citovány v daném časopise
v jednom roce. Např. pokud má časopis v r. 2008 hodnotu citing half-life 9, značí to, že
polovina článků, které byly články v průběhu roku v daném časopise citovány, byly
publikovány mezi lety 2000-2008 (včetně). Obdobně jako cited half-life je tento index
vypočten jen u časopisů s více jak 100 referencemi.
7.6.3 H-index
H-index je poměrně nový indikátor, byl definován v roce 2005 fyzikem Jorge Hirschem.
tento indikátor byl vědeckou komunitou velmi rychle akceptován, dnes je již plně
respektovaným ukazatelem. Název H-index byl původně odvozen právě od příjmení autora
Hirsch, dnes se však již využívá spíše jeho charakteristiky a h je interpretováno jako highly
cited index.
H-index je číslo h, které udává počet publikací, které byly alespoň h-krát citovány.
Pokud tedy vědec má h-index roven 5, značí to, že nehledě na to, kolik publikací celkově
napsal, 5 jeho publikací bylo nejméně 5krát citováno.
Strana 49
H-index lze jednoduše odečíst i ze seznamu publikací seřazených podle počtu citací, kdy hindex je průsečíkem pořadí dokumentu a udaného počtu citací.
Př.:
pořadí
název
počet citací
1
Dokument A
20
2
Dokument B
8
3
Dokument C
5
4
Dokument D
4
5
Dokument E
1
h = 4: pořadí = počet citací
H-index může být aplikován na jakýkoliv scientometrický element na mikroúrovni (pro
hodnocení autorů byl tento indikátor původně vytvořen, jinak např. časopis) a na střední
úrovni (výzkumný tým, instituce aj.). Pomocí H-indexu lze odvozovat také vývoj vědecké
disciplíny, pokud provedeme rešerši na tuto oblast a seřadíme dle citací, definovat aktuální
témata a naopak eliminovat témata zastarávající [BORNMANN, 2007].
Výhody H-indexu
Fakt, že byl H-index odbornou komunitou velmi rychle přijat, svědčí o tom, že má mnoho
výhod. Je především určen pro efektivní hodnocení na mikroúrovni, pokrývá jak množství
tak „viditelnost“ [BORNMANN, 2007], tedy neuvažuje málo citované publikace nehledě
na jejich množství [EGGHE, 2007] a minimalizuje vliv vědců s jednou citovanou
publikací, kteří však jiný přínos nemají (typicky autor publikace typu review). Hlavní
předností
je
též
jeho
jednoduchost
a
odvoditelnost
z jednoduchého
seznamu
[BORNMANN, 2007].
Nevýhody H-indexu
To, co je na jedné straně interpretováno jako výhoda, se může z obráceného úhlu pohledu
jevit též jako nevýhoda. Konkrétně h-index nebere v potaz, je-li článek dále citován a jestli
dále obdrží 100, 1000 nebo více citací [EGGHE, 2007], tj. nerozlišuje již dále kvalitní
Strana 50
vědce, kterých je v populárních disciplínách mnoho. Indexu je taktéž někdy označován za
index průměrnosti, neboť výrazně zvýhodňuje vědce dlouhodobě působící v oboru,
nicméně v takovém případě lze velmi jednoduše aplikovat časové omezení a naopak
umožňuje srovnání vědců různého věku [ŠPÁLA, 2006]. Právě možností určení časové
periody pomocí indexu lze sestavit jakousi klasifikační stupnici. Např. pokud vědecký
pracovník po 20 letech práce dosáhne h rovné 20, je ho možno označit za úspěšného.
Pokud h bude rovné 40 je vynikající a při hodnotě 60 (nebo 90 po 30 letech) je skutečně
výjimečným jedincem. [ŠPÁLA, 2006].
Taktéž přílišná jednoduchost se stává terčem kritiky, otázkou zůstává, zda lze měřit vše jen
jedním indexem a redukovat tak vícestranný pohled [GLÄNZEL, 2006]. H-index dodnes
taktéž není ověřen ve všech vědních oblastech [BORNMANN, 2007], jeho funkčnost je
dokázána zejména v některých tvrdých vědách (fyzika, biologie, ekologie, evoluční
biologie). Opět se vracíme k obecnému omezení většiny indikátorů, kdy h-indexem taktéž
lze porovnávat pouze vědce působící v jedné vědní oblasti, neřeší problém rozlišných
charakteristik vědních oborů. Sám Hirsch konstatuje, že index neodstraňuje problém
review, které vždy získává více citací než článek s původním výzkumem [ŠPÁLA, 2006].
Revize h-indexu a nové indikátory z něj odvozené
Všechna omezení h-indexu vedla k zamyšlení a pokusu limitování daného parametru, který
do této metriky vstupuje, a dalšímu zdokonalení tohoto indikátoru. Jak již bylo zmíněno,
ihned vešlo v používání omezení na danou časovou periodu. Problematika autocitací lze
taktéž poměrně jednoduše řešit tak, že publikace budou do výpočtu započteny jen v tom
případě, kdy po odečtení autocitací převyšuje výsledný počet citací hodnotu h-indexu.
Bornmann [2007] a Hirsch se shodli taktéž na řešení problému rozdílu mezi jednotlivými
disciplínami na základě jejich charakteristiky spoluautorství; pokud sečteme všechny hautory (multiplicitně) a podělíme h-indexem, dostaneme se k hodnotám, které rozdíly mezi
jednotlivými disciplínami redukují a můžeme je tak srovnávat [BATISTA, 2006].
K h-indexu byly definovány další komplementární indikátory, které vychází z jeho
podstaty, jako např. a-index nebo g-index (viz následující podkapitola o dalších
indikátorech).
Strana 51
7.6.4 Eigenfactor
Jednu z nových metod určených k hodnocení vědy nabízí portál Eigenfactor.org s
podtitulem „Ranking and Mapping Scientific Knowledge“. Pro hodnocení portál používá
dva indikátory Eigenfactor Score a Article Influence. Eigenfactor Score vyjadřuje míru
důležitosti časopisu pro vědeckou komunitu. Podle definice a matematického modelu sítě
dokumentů navzájem propojené citacemi, ve které se vědec pohybuje, je to odhad procenta
času, který stráví uživatelé s daným časopisem. Také proto se toto skóre zvětšuje s
velikostí časopisu, je přímo závislé na počtu článků, větší časopisy mají také větší
Eigenfactor Score. Skóre je uváděno jako percentil, tj. součet skóre všech časopisů je roven
100. V r. 2006 měl nejvyšší Eigenfactor Score časopis Nature, a to 2.138; v první tisícovce
časopisů skóre neklesá pod 0.01.
Druhý indikátor, Article Influence, je určen k odhadnutí důležitosti časopisu nehledě na
jeho velikost (počet publikovaných článků). Article Influence vyjadřuje míru průměrného
vlivu každého článku v časopise za pět let po jeho publikování. Pokud je jeho hodnota u
časopisu např. 20, znamená to, že průměrný článek v tomto časopise je dvacetkrát vlivnější
než průměrný článek v celé kolekci dat. Tento indikátor je srovnatelný s impakt faktorem.
7.6.5 Omezení indikátorů
Identifikace měřených elementů
Zásadní problematikou při hodnocení elementů je jejich identifikace, určení, jejich
vymezení. Omezení lze rozdělit na technická,
obsahová a etická, vždy narážíme na
zásadní problém kategorizace a klasifikace na všech úrovních či právě nedodržení vědecké
morálky. V případě omezení v kombinaci obsahové i technické úrovně jmenujme například
identifikaci autora samotného. Pro vymezení autora nepostačuje jméno, je nutné ho určit
dalšími metainformacemi, jako např. obor, instituce. Bohužel však při trendu dnešní vědy
k akademické mobilitě a spolupráci je instituce naopak jako určující prvek velmi
problematický. Z obsahového hlediska se jako problémové jeví vymezení disciplíny,
důvody jsou tendence k interdisciplinaritě, nejasné vymezení dokumentů, zahlušení
polovědeckými typy dokumentů, mnohočetné publikování, nemožnost nalézt všechny
citace aj. Z technického hlediska je největším problémem propojování záznamů (citace na
citovaný dokument a vice versa).
Strana 52
Datová základna a excerpce
Indikátory jsou vždy aplikovány na určitou datovou základnu, na kolekci dat, která je
ovlivněna jejím výběrem. Ačkoliv pravidla excerpce se snaží držet jistou kvalitativně
kvantitativní linii, nikdy není možné zajistit naprosto vyváženou sbírku. Pokud bychom
uvažovali všechny výsledky, nemusí být zaručena kvalita zvažovaných výstupů a do
výsledků by tak mohli zasáhnout např. chronicky píšící autoři; nehledě na to, že obsáhnutí
veškeré vědecké produkce je s velkou pravděpodobností utopie.
Charakteristiky vědních disciplín
Jak již bylo zmíněno, každá vědecká disciplína má jiné charakteristiky, lze říci, že každou
vědní disciplínu vykazuje jisté charakteristiky vědní komunikace; liší se z hlediska času,
četnosti, typu publikací aj.
Přehledové výstupy
Zde se dostáváme k problému jakési užitečnosti či užitnosti. Review neboli přehled je
obvykle sepsán vědcem, který se v oboru již dobře orientuje a je schopen uchopit
problematiku a systematicky ji popsat, zároveň jméno autora často přináší jistou garanci
obsahu. Takový článek je pro ostatní velmi cenný z hlediska užitku, neboť „zkracuje“ pro
ostatní cestu ad fontes, tedy k původním pramenům, které by jinak museli složitě
objevovat v původních vědeckých výstupech. Z toho plyne, že článek dosahuje vysoké
citovanosti, aniž by však měl samotný vědecký přínos, aby předkládal vědecké komunitě
cokoliv nového. Navíc se v tomto případě nejedná jen o články, ale samozřejmě knihy,
skripta aj. Stejný problém lze definovat i mezi klinickým a základním výzkumem, kdy
jeden nutně používá definice druhého, zpětně však tato vazba neexistuje.
Autocitace
Autocitace je velmi známý a diskutovaný etický problém, neboť vědec by v seznamu
použité literatury neměl nadbytečně odkazovat sám na sebe. Uvádí se, že maximální
únosná míra autocitace je 20% [JANOŠ, 2001]. V současné době, kdy je mnohem
jednodušší a efektivnější kontrola autocitací, se odborná veřejnost na základě rozsáhlých
Strana 53
analýz začíná klonit k názoru, že autocitace nejsou zásadním problémem ve výsledcích, že
je ovlivňují jen málo a spíše kolem této problematiky panuje „dlouhodobá hysterie“.
Některé nástroje dnes již umožňují v předdefinovaných analytických nástrojích autocitace
vyloučit. Při vylučování takových citací však musí být zvážen fakt, že autor se zpravidla
systematicky věnuje jedné oblasti, jeho odkazování na starší díla je pak zcela logické a
adekvátní.
Časová perioda
Pokud indikátor není sám definován v rámci času (Impact Factor), podstatně do jeho
výsledku právě volba časové periody zasahuje. U zkoumaných dat v dané disciplíně
musíme vždy uvážit potřebný výsledek a podle toho volit, v případě multioborových
analýz se opět potýkáme s problematikou rozdílů v charakteristice vědní komunikace.
Každý indikátor je časem zkreslován jiným způsobem.
Spoluautorství
Spoluautorství prvořadě nelze označit za pouze etické omezení. Chápáno v kontextu etiky
se jedná pouze o praxi uplatňovanou zejména v některých oborech, např. v medicíně, kdy
se autorská odpovědnost přisuzuje nejen opravdovému autoru, nýbrž i jeho
spolupracovníkům, nadřízeným a osobám jinak spjatým s výzkumným prostředím. Druhou
stránkou spoluautorství, které limituje výpovědní hodnoty indikátorů, je jeho kvantitativní
uchopení. Těžko lze srovnávat velké množství výstupů vědce, který se na mnoha
citovaných článcích podílel, než menší množství článků jednoho autora; nelze objektivně
jasně definovat, který má větší přínos pro vědu. Počet spoluautorů je jedním ze znaků
komunikace jednotlivých vědních disciplín.
Nesrovnatelnost napříč vědními disciplínami
K této problematice již bylo dost zmíněno – v anglickém pojmosloví se často označuje
jako citation pattern. Jedná se o rozdílnost vědní komunikace v jednotlivých disciplínách a
některých dalších charakteristik, jako je zastarávání informací, i když pokud chápeme
komunikaci v tom nejširším kontextu, je možné i zastarávání informací sem zařadit. Mezi
Strana 54
typické komunikační charakteristiky patří počet časopisů, počet vydávaných článků,
průměrný počet citací na článek.
Negativní citace
Byť velmi omezeným jevem, ale přeci jen zkreslujícím jsou takzvané negativní citace.
Jedná se o situaci, kdy vědec publikuje dílo, které je nekvalitní nebo má jiné závažné
nedostatky, ve vědecké komunitě to vyvolá patřičnou reakci a článek pak vykazuje velkou
citovanost, neboť na něj každý poukazuje. Tento jev nelze žádnou automatickou metodou
vyloučit, zde si je nutné uvědomit, že právě v tuto chvíli velmi závisí na povědomí a
znalostech hodnotitele. Nicméně je prokázáno, že negativní citace výsledky zásadním
způsobem nezkreslují. Navíc negativní citovanost často se projevuje jen v krátkém
časovém intervalu.
Open Access
Aspektem, který se do hodnot indikátorů může projevovat, je míra přístupu k informaci.
Jestliže je publikace volně dostupná, hodnota indikátoru může stoupat [OpCit, 2008],
neboť publikace má větší možnosti získat své publikum a následně citace.
8
CITAČNÍ DATABÁZE A EVALUACE VĚDY
Lucie Vavříková
Jednou z kvalifikací informační profese je znalost, kde najít patřičné informace, jaké zdroje
pro získání relevantních a pertinentních informací využít. Pokud informační profesionál
nedisponuje těmito znalostmi, musí znát alespoň metody, jak nejrelevantnější zdroje
nalézt. Jednou z možných metod je užití citačních databází, které uživatele pomocí citační
a publikační analýzy nasměrují k takovým zdrojům, které již prošly jakýmsi hodnocením.
Podle míry citovanosti článku (časopisu, autora) lze usuzovat na kvalitu zdroje. Toto
Strana 55
hledisko výběru zdrojů však není vždy relevantní, je třeba si uvědomit, že kritérium míry
citovanosti nemusí být vždy adekvátní, často mohou být lepším zdrojem oborové databáze.
Oborové databáze mají výhodu v tom, že zachází se specifickými informacemi. Mívají
kvalitnější relevantní popisný aparát, neboť mohou zohledňovat typickou strukturu
dokumentů. Mají vlastní oborové tezaury, předmětová hesla či klíčová slova. Vynikají
hloubkou obsahu, jsou schopné dát odpověď na velmi specifické a přesně definované
dotazy. Vzhledem k jejich orientaci na obsah však nedisponují pokročilými funkcemi jako
je práce s autory či institucemi, málokdy nabízejí specifické funkce, které usnadňují práci
uživatelům.
Oproti tomu citační databáze nabízí rychlou identifikaci významných zdrojů, publikací a
autorů pro daný okruh. Jsou obsahově méně hluboké než oborové databáze, svým
polytematickým zaměřením však doplňují oborové databáze o aspekt interdisciplinarity.
Pro uživatele jsou k dispozici další analytické nástroje, databáze se snaží autoritně
zpracovávat autory a instituce. Díky těmto nástrojům pak můžeme porovnávat časopisy,
autory, zkoumat jejich vzájemnou spolupráci atd.
Pokud se zabýváme scientometrií, narazíme na několik typů zdrojů informací. Klasickým
jsou již zmíněné citační databáze, do kterých řadíme ISI Web of Science s jejich citačními
rejstříky, databázi Scopus, Google Scholar a některé oborové databáze, které propojují
jednotlivé dokumenty na základě citací a referencí (PubMed). Tyto zdroje užíváme
k analýzám výstupů ve vědě a jednomu z hodnocení vědeckých výstupů.
Především společnost Thomson Reuters rozvinula zdroje pro scientometrii v oblasti vědy o
vědě a jejího hodnocení. Nabízí několik databází, které slouží k hodnocení vědy na úrovni
časopisů, institucí či států. Scopus postupně dohání tyto databáze implementací funkcí
přímo do databáze, které umožňují srovnatelné analýzy.
Ve scientometrii lze využít dalších syntetických nástrojů, jako jsou portály informací o
nejvíce citovaných vědcích či časopisech, nebo portály, které na základě propojení
dokumentů citacemi se snaží mapovat vědu a vytvářet další analýzy. Rozdělení na různé
typy není kategorické, mnoho zdrojů se překrývá a lze je zařadit do více kategorií.
Strana 56
8.1
Databáze pro hodnocení vědy
Databáze pro hodnocení vědy můžeme rozlišit na dva základní druhy. První, z provenience
společnosti Thomson Reuters [Thomson Reuters, 2008] (sekce Scientific, oblast Research
and Development), které poskytují analytická a syntetická data vycházející z ISI Web of
Science a citačních rejstříků a jejich využívání. Tyto databáze jsou bohužel v rámci ČR
takřka nedostupné. Druhou kategorií jsou databáze na národní úrovni, které zabezpečují
proces hodnocení vědy v daném státě. Za ČR je to databáze RIV, rejstřík informací o
výsledcích, který je součástí informačního systému výzkumu, vývoje a inovací v ČR.
Dostupný je na http://aplikace.isvav.cvut.cz/prepareResultForm.do. Těmto databázím se
zde věnovat nebudeme.
Essential Science Indicators [Thomson Reuters, 2008]
Souhrnná databáze statistik vědecké výkonnosti a vědeckých trendů založená na počtech
publikovaných článků a citačních dat z databází Thomson Reuters. Je to analytický zdroj
informací, který umožňuje analyzovat výkonnost vědy na různých úrovních, identifikovat
vědecké trendy, určovat nejvýkonnější státy, časopisy, instituce aj., hodnotit vědecké
výstupy a jejich impakt, hodnotit autory.
Institutional Citation Report [Thomson Reuters, 2008]
Tato databáze je určena k analýzám vědeckých výstupů a impaktu na institucionální
úrovni. Umožňuje srovnávat, řadit a hodnotit instituce.
National Citation Report [Thomson Reuters, 2008]
Je obdobou výše uvedené databáze Institutional Citation Reports, je zaměřena na státní
úroveň.
National Science Indicators [Thomson Reuters, 2008]
Strana 57
Statistická databáze vědecké výkonnosti v rámci státu. Obsahuje statistiky z více jak 180
států, jsou k dispozici data 25 let zpětně. Nabízí vizualizaci dat.
Journal Performance Indicators [Thomson Reuters, 2008]
Nabízí data z více než 10000 vědeckých vysoce citovaných časopisů za více jak 25 let,
poskytují za různá období pro různé časopisy a články různé citační a impaktfaktorové
údaje. V porovnání s Journal Citation Reports poskytují přesnější údaje [ŠPÁLA, 2006].
Journal Citation Reports [Thomson Reuters, 2008]
Tradiční databáze je přímým výstupem z dat citačních rejstříků Science Citation Index a
Social Science Citation Index.
Obr. 2 – Vstupní obrazovka do databáze Journal Citation Reports
Journal Citation Reports poskytuje statistické informace a analytická data o časopisech,
výsledky citačních analýz, určuje pro každý časopis bibliometrické indikátory impakt
faktor, Immediacy Index, Cited Half-life. Po kliknutí na název časopisu jsou k dispozici
další údaje o časopisu včetně výpočtů daných indikátorů. Databáze je vhodně propojena s
databází Ulrich´s Periodical, která zpřístupňuje detailní data o časopisech. Dostupná v ČR,
samostatně
nebo
v rámci
platformy
ISI
Web
of
Knowledge
(http://www.isiknowledge.com/).
Strana 58
Obr. 3 – Analytický přehled časopisů v oblasti Information Science and Librarianship podle
impakt faktoru
8.2
Citační databáze
Jako citační databáze dnes bývají uváděny „dvě plus jedna“ základní platforma: ISI Web
of Science, Scopus a opatrně je přidáván Google Scholar. Samozřejmě by bylo možné při
dnešních technologických možnostech uvádět i další databáze, jako je např. PubMed,
rozhraní databáze Medline, které sbírají informace citacích. Citační databáze však tyto
záznamy propojují v obou směrech a nabízejí další funkce pro citační a jiné analýzy. Právě
proto se Google Scholar ke dvojici přiřazuje opatrně, neboť v současné chvíli spíše slouží
jako vyhledávač než jako citační databáze.
Strana 59
8.2.1 ISI Web of Science a citační rejstříky
Databáze ISI Web of Science již byla zmíněna mnohokrát. Její historické kořeny,
respektive předchůdci, sahají až do 60. let 20. století, kdy Eugene Garfield začal vytvářet
citační rejstříky a založil Institute of Scientific Information (zkratka ISI - před jménem
databáze). S příchodem informačních a komunikačních technologií vznikla počítačová
verze, v dnešní podobě je to typicky zelené rozhraní ISI Web of Science. Dnes je
producentem mediální a informační magnát Thomson Reuters, ještě nedávno spadala pod
sekci Thomson Scientific, než došlo k fúzi s Reuters.
ISI Web of Science je databáze, která sdružuje několik dílčích informačních zdrojů,
v závislosti na subskripci instituce. Pro ČR jsou v rámci ISI Web of Science dostupné
všechny tři citační rejstříky, Science Citation Index, Social Science Citation Index, Arts
and Humanitites Citation Index a některé dílčí databáze.
V rámci integrace svých zdrojů společnost Thomson Reuters provozuje platformu ISI Web
of Knowledge (http://www.isiknowledge.com/), ve které jsou sdruženy všechny
předplacené zdroje. Je možné pracovat jak zároveň ve všech tak pouze v jedné z databází.
V ČR jsou typicky v rámci ISI Web of Knowledge dostupné databáze ISI Web of Science,
Current Contents Connect a Journal Citation Reports. Current Contents Connect je
databáze obsahů a bibliografických informací odborných časopisů a knih. V rámci této
databáze jsou zveřejňovány články dříve, než vyjdou v časopise.
Science Citation Index je nejstarším citačním rejstříkem, byl definován v r. 1961 a poprvé
vydán r. 1963. Je to databáze převážně bibliografických informací (bez plných textů). Do
tohoto rejstříku je excerpováno přibližně 3700 odborných časopisů, ve své rozšířené verzi
Science Citation Index Expanded přes 6500, z oblasti zemědělství, biologie, ekologie,
z oblasti inženýrství a technických věd, aplikovaných věd, medicíny a lékařských věd,
fyziky a chemie. Informace jsou aktualizovány týdně.
Social Science Citation Index vznikl v r. 1973, obsahuje data z přibližně 2000 časopisů
z 50 společenskovědních disciplín. Některé časopisy mohou být zařazeny v obou dvou
rejstřících. Tradičně nejsilnějšími disciplínami jsou právě ty, které mají časopisy v obou
Strana 60
rejstřících. Patří mezi ně psychologie, psychiatrie a pečovatelství. Dalšími výraznými
disciplínami jsou ekonomie, management, politologie a sociologie.
Arts and Humanitites Index je nejmladší, je datován do r. 1979. Tato databáze není
zpracována jako dvě předchozí do Journal Citation Reports. Obsahuje přes 1000 časopisů
z oblasti umění a humanitních věd, mezi ně patří např. disciplíny jako archeologie, umění a
architektura, historie, jazykověda a lingvistika, literatura, filozofie, herectví, náboženství a
religionistika; nechybí ani kategorie všeobecností. Tento rejstřík má vlastní specifický
popisný aparát.
Obr. 4 – Úvodní obrazovka databáze ISI Web of Science s rozhraním jednoduchého
vyhledávání
Strana 61
Databáze ISI Web of Science disponuje uživatelsky přívětivým jednoduchým
vyhledávacím rozhraním. Nabízí specifické možnosti vyhledávání jako je „Cited
References Search“, hledání v citacích určeného autora a zdroje, a pokročilé vyhledávání.
Lze si ukládat historii vyhledávání. Jakoukoliv sadu výsledků lze analyzovat ve smyslu
počtu záznamů podle autora, země, typu dokumentu, instituce, časopisů atd. Tato data je
možné si uložit.
Obr. 5 – Analýza sady vyhledaných záznamů podle zastoupení autorů
Portál nabízí personalizované funkce jako je sestavení vlastního seznamu časopisů,
upozornění na citace nebo právě uložení hledání. Je efektivně propojen s dalšími službami
s dílny
Thomson
Reuters
jako
je
citační
manažer
EndNote
Web
(https://www.myendnoteweb.com/), do kterého lze přímo ukládat záznamy, jako i do
Strana 62
dalších referenčních manažerů. Nabízí odkaz na portál MyResearcher’s ID, který se snaží
za pomoci uživatelů vytvořit standardizovaný seznam autorit. Je možné zadaný dotaz
použít
pro
vyhledávání
na
webu
pomocí
služby
Scientific
WebPlus
(http://scientific.thomsonwebplus.com/) zaměřené na vyhledávání odborných informací.
V poslední době se databáze hojně zaměřila na vylepšení identifikace autorů a institucí,
pokud autora vyhledávání rozpozná jako autoritu, nabídne k němu tzv. Distinct Author Set,
tj. souhrn všech údajů, které jsou mu v rámci databáze přiřazeny.
Obr. 6 – Sada informací k danému autoru (Distinct Author Set)
Databáze umožňuje vytvořit tzv. Citation Report, který analyzuje výsledky. Zobrazuje graf
publikací za rok a citací přijatých každý rok. Informuje o celkové citovanosti, průměrné
citovanosti a h-indexu. Z výsledků analýzy je možné vyloučit autocitace. Obsahuje tabulku
citací podle jednotlivých článků a roku.
Strana 63
Obr. 7 – Citační analýza článků daného autora – graf vydaných publikací v určitém roce,
graf citací přijatých každý rok. Napravo další statistické údaje.
Obr. 8 – Analýza citací každého článku podle jednotlivých let
Databáze ISI Web of Science obsahuje snadno ovladatelné nástroje umožňující základní
scientometrické analýzy. Je dnes respektovaným zdrojem informací, i když při tom, jak
stabilní a dlouholetou pozici na trhu má, se samozřejmě vyskytuje řada kritických ohlasů.
Co se týče uživatelského rozhraní, trochu zaostává za svou konkurencí, databází Scopus,
která je podstatně intuitivnější a více zaměřená na uživatele. Velmi těžké je v databázi
zjistit, jak prohlížet obsažené zdroje. Obsahově se o databázi ISI Web of Science hovoří
jako o úzké a hluboké, kdežto Scopus je považován za mělký a široký. Obojí dvojí může
Strana 64
být i výhodou i nevýhodou. Velkým přínosem je to, že existují dva silně konkurenční
produkty, což tlačí vývoj jejich možností velkou rychlostí dopředu a snaží se dohánět
vzájemné nevýhody.
8.2.2 Scopus
Scopus (www.scopus.com) je citační a abstraktová databáze produkovaná tradičním
vydavatelem odborné literatury společností Elsevier (založena r. 1880). Byla spuštěna v r.
2004. Excerpuje přes 15 000 vědeckých časopisů ze všech oblastí vědy. Zahrnuje
informační zdroje z největších patentových databází, z webu a dalších zdrojů.
Retrospektiva databáze je do r. 1966, je aktualizována denně. Citační a jiné analýzy lze
provádět s daty od r. 1996, starší záznamy nejsou plně zpracovány. V ČR není vyjma
některých ústavů Akademie věd ČR a České geologické služby k dispozici.
Strana 65
Obr. 9 - Úvodní obrazovka databáze Scopus s rozhraním jednoduchého vyhledávání
Úvodní obrazovka nabízí tradičně jednoduché vyhledávání obohacené o možnosti omezení
na časovou periodu, typ dokumentu a předmětnou oblast. V dalších záložkách jsou
k dispozici specifická vyhledávání, a to autorů, pracovišť a vyhledávání pokročilé. Po
provedení vyhledávání jsou k dispozici výsledky podle kategorie zdroje – přímo z databáze
Scopus, potom z databáze referencí, které nemají primární záznam v databázi, výsledky
z webu,
které
jsou
získány
pomocí
vyhledávače
odborné
literatury
Scirus
(www.scirus.com), z patentových databází a z tzv. vybraných zdrojů, tj. z institucionálních
repositářů, preprintových archivů, open access archivů aj. Databáze taktéž obsahuje tzv.
Articles in Press, tj. články, které jsou před oficiálním publikováním, ale již jsou přijaty do
časopisu.
U každého záznamu je uveden počet citací, jakákoliv sada výsledků se dá obdobně jako v
ISI Web of Science analyzovat podle let a přijatých citací. U článku je k dispozici seznam
Strana 66
referencí přímo opatřený počty citací a dalším aparátem, který umožňuje s tímto seznamem
či jednotlivou referencí rovnou pracovat.
Co se týče autorů a pracovišť, v databázi Scopus se nachází jejich autoritní seznamy; pro
každého autora či instituci jsou tak zvlášť zpracovávány analytické údaje. V profilu autora
jsou pak k dispozici poměrně detailní informace, jako variantní názvy jména, afiliace
aktuální i historické, publikační historie, odkazy na všechny články, předmětná oblast
autora, či seznam spoluautorů. Z analytických dat je k dispozici počet článků, referencí a
citací, h-index autora a přehled článků a citací za celou publikační historii podle
jednotlivých let. Data autora lze jednoduše analyzovat na tzv. h-grafu, který graficky
znázorňuje přehled citací podle článků. K dispozici jsou také grafy publikovaných článků
v jednotlivých letech a totéž pro citace. H-graf se dá aplikovat na jakoukoliv sadu
výsledků, tedy i na sadu článků, časopis aj.
Strana 67
Obr. 10 – Analytický nástroj H-graf, který zobrazuje vztah článků a počtu citací, na průniku
křivky grafu s diagonálou lze odečíst H-index
Vraťme se k pracovištím, jejich identifikaci a dostupným analytickým nástrojům. Mimo
popisných informací zde nalezneme údaje jako výčet článků, autorů, počtu patentů, zdrojů,
ve kterých autoři tohoto pracoviště publikují, je zpracována analýza spolupracujících
institucí. Na koláčovém grafu je zobrazeno rozvržení činnosti v jednotlivých vědeckých
disciplínách, které lze přepnout na tabulkové zobrazení.
Pro analytické zpracování časopisů je k dispozici Journal Analyzer v části Analytics,
pomocí něhož lze časopisy na základě citačních analýz porovnávat.
Strana 68
Obr. 11 – Analyzátor časopisů, umožňuje vzájemně porovnávat citace a publikované články
v jednotlivých časopisech
U profilů jednotlivých časopisů je pak k dispozici přehled všech čísel a k tomu analytický
nástroj pro zobrazení citačních analýz dle jednotlivých let.
Databáze nabízí také možnosti personalizace, umožňuje uložit si vlastní seznam autorů,
časopisů a článků. K dispozici je možnost zřídit si upozornění na nová čísla časopisů,
změnu výsledků vyhledávání a na citace dokumentů nebo autora. Je možné si ukládat
historii vyhledávání.
Obdobně jako ISI Web of Science je k dispozici propojení s referenčními manažery
(RefWorks), dalšími vyhledávači, katalogy místní knihovny a dalších zdrojů (také Ulrich’s
Periodical).
Scopus má v sobě zabudováno mnoho nástrojů, které jsou v případě produktů Thomson
Reuters rozdrobeny do jednotlivých databází, je velmi přehledný a intuitivní. Omezením je
zmíněné zpracování citačních dat pouze po r. 1996, otázkou je, zda-li při současném
rychlém vývoji vědy tato retrospektiva není dostatečná. Pravděpodobně v příštím roce by
měla být tato databáze k dispozici i v ČR, výsledky z ní jsou již letos zahrnuty do
hodnocení vědy v ČR.
Strana 69
8.2.3 Google Scholar
Obr. 12 – Výsledky vyhledávání v Google Scholar
Google Scholar Beta (http://scholar.google.cz/ nebo http://scholar.google.com/) byl
spuštěn na konci roku 2004 a zpočátku zejména odborná veřejnost na něj pohlížela skrze
prsty. Google Scholar prohledává databáze vydavatelů odborné literatury, odborných
časopisů, odborných repositářů, preprintových a open access archivů (mezi přispěvatele
patří Elsevier, American Chemical Society, PubMed, OCLC, Blackwell, the Institute of
Physics, the Nature Publishing Group, Wiley Interscience a Springer atd.). Obsahem
pokrývá taktéž projekt Google Books. U větších zdrojů se však často vyskytuje problém,
že je zaindexována jen jejich malá část (Elsevier, PubMed). Doposud se Google Scholar
nepodařilo doplnit zásadní mezery v obsahu o nejlépe hodnocené časopisy [JACSÓ, 2008].
V oblasti citačních analýz poskytuje Google Scholar pouze počet citujících dokumentů
s patřičným odkazem na ně. Vyhodnocuje ještě klíčové autory (cca 5) – nejčastěji se
vyskytující autory v rámci vyhledaných výsledků. Vzhledem k obrovskému obsahu počty
citací nemusí být vypovídající, neboť Google Scholar obsahuje velké množství duplicit,
triplicit a vyšších řádů četnosti. To plyne především z nedokonalé práce se strukturovaným
textem, stále se objevují neexistující jména autorů, informace v polích, které tam zjevně
Strana 70
nepatří, a to často i pokud jsou ve zdrojovém dokumentu uvedena správně. Google Scholar
navíc nedisponuje možností seřadit jakkoliv jinak výsledky vyhledávání, jsou seřazeny
podle počtu citací [JACSÓ, 2008].
Výhodou Google Scholar je především velmi rychlé jednoduché vyhledávání v obrovském
množství zdrojů nehledě na vědeckou disciplínu. Dokáže najít plný text článku, který
z klasických databází není dostupný, neboť nemáte zdroj předplacen, na internetu však je.
Nabízí také spojení s českými SFX službami a dalšími knihovními katalogy. Velkou
výhodou je šíře geografického a jazykového pokrytí. Do Google Scholar se může zapojit
takřka kdokoliv.
Google Scholar je zdarma, nabízí velmi rychlé vyhledání napříč obory, v současné době
ale stále není vhodný pro jakékoliv bibliometrické či scientometrické hodnocení [JACSÓ,
2008].
8.3
Další analytické nástroje a nástroje mapování vědy
V dnešní době rozvinutých webových služeb máme k dispozici portály, které nám
předkládají automaticky výsledky citačních analýz. Většinou jsou spojené s producentem
citační databáze. Mezi takové právě patří portál Scopus TopCited a ISI HighlyCited.com.
Scopus TopCited (http://www.topcited.com/)
Portál TopCited nabízí přesně to, co evokuje jeho název. Na základě dat z databáze Scopus
zveřejňuje přehledně 20 nejcitovanějších článků pro každou vědeckou disciplínu mezi lety
2004 a 2008 ve zvolené časové periodě. Pomocí tohoto nástroje se velmi snadno získají
charakteristiky vědecké disciplíny podle počtu citací. V současné době jsou nejcitovanější
články z oblasti genetiky, částicové fyziky a medicíny.
ISI HighlyCited (http://isihighlycited.com/)
Tento portál poskytuje profily nejcitovanějších autorů a nejprestižnějších pracovišť,
vychází z dat Thomson Reuters a databáze ISI Web of Science. Na tomto portálu se
Strana 71
výrazněji projevuje původní proamerické zaměření databáze ISI Web of Science,
nenalezneme na něm např. ani jednoho českého vědce.
SciMago (http://www.scimagojr.com/)
SCImago Journal & Country Rank je portál, který obsahuje a zpřístupňuje scientometrické
indikátory časopisů a zemí vytvořených z dat, která pochází z databáze Scopus. Tato
platforma získala název podle indikátoru SCImago Journal Rank (SJR), který byl vyvinut
na stejném principu jako je algoritmus Google PageRank [HANUŠOVÁ, 2008].. Tento
indikátor poskytuje představu o „viditelnosti“ či „známosti“ vědeckých periodik. Data mají
retrospektivu do roku 1996.
U časopisů a států jsou přehledově k dispozici údaje SCImago Journal Rank, H-index,
celkové počty dokumentů, referencí, citací, citovatelných dokumentů, porovnání
dokumentů a citací, referencí a dokumentů. Časopisy lze filtrovat dle země nebo oboru
periodika. Pominout nelze zajímavou stránku World Report, kde jsou sumarizovány údaje
o celé světové vědecké produkci. Můžeme se tak například dozvědět, že poměr všech a
citovatelných dokumentů je 10:9 či že nejvíce se publikuje v medicíně (cca 20 %
dokumentů).
Jednou z hlavních funkcí webu SCImago je možnost porovnání dvou až čtyřech periodik či
zemí. Samozřejmostí je možnost omezit porovnání na určitý obor nebo srovnat region
(např. pozici České republiky v rámci vědecké výkonnosti ve východní Evropě). K tomu
jsou k dispozici i pokročilé vizualizační funkce.
Eigenfactor.org (http://www.eigenfactor.org/index.php) [VAVŘÍKOVÁ, 2008]
Portál Eigenfactor.org s podtitulem „Ranking and Mapping Scientific Knowledge“
poskytuje hodnocení odborných časopisů, zajímavé vizualizační, statistické a srovnávací
výstupy v mapování vědy a velmi srozumitelně ukazuje provázanost vědeckých disciplín.
Portál taktéž poskytuje informace o ceně časopisu (v rámci subskripcí) a porovnávání cen
časopisů (ve spolupráci s portálem Journalprices.com). Na portálu jsou k dispozici
statistiky nejlepších časopisů.
Tento portál analyzuje data poskytnutá Thomson Reuters Journal Citation Reports Dataset,
přebírá data z rejstříků Science Citation Index a Social Science Citation Index. K
Strana 72
hodnocení užívá pětileté citační okno, tj. hodnocení v r. 2006 je vypočítáno z dat za léta
2001-2005.
Portál přisuzuje časopisům dva indikátory – Eigenfactor Score a Article Influence.
Eigenfactor Score (dále ES) je míra důležitosti časopisu pro vědeckou komunitu. Podle
definice a matematického modelu je to odhad procenta času, který stráví uživatelé s daným
časopisem. Také proto se toto skóre zvětšuje s velikostí časopisu, je přímo závislé na počtu
článků, větší časopisy mají také větší ES. Součet všech ES všech časopisů je roven 100,
každému časopisu je přisouzena poměrná část ze 100. V r. 2006 měl nejvyšší ES časopis
Nature, a to 2.138; v první tisícovce časopisů ES neklesá pod 0.01.
Abychom mohli odhadnout důležitost časopisu nehledě na jeho velikost (počet
publikovaných článků), je zaveden druhý indikátor, Article Influence (dále AI). AI je míra
průměrného vlivu každého článku v časopise za pět let po jeho publikování. Pokud je AI u
časopisu např. 20, znamená to, že průměrný článek v tomto časopise je dvacetkrát vlivnější
než průměrný článek v celé kolekci dat. Tento indikátor je srovnatelný s impakt faktorem.
Pro každý časopis jsou k dispozici informace o něm, hodnoty indikátorů portálu a jejich
srovnání s impakt faktorem. Grafy názorně zobrazují vývoj časopisu, z čehož v případě
porovnání nejlepších časopisů lze usuzovat na vývoj disciplíny jako takové v rámci celé
vědy, případně obráceně zjišťovat trendy ve vědě. Statistiky jsou dostupné pro několik let.
Velmi zajímavé jsou vizualizační funkce portálu. Na základě propojení dokumentů
citacemi je k dispozici interaktivní mapa vědy, která vždy zobrazuje vazby na příbuzné
disciplíny, včetně typu vazby. Druhá vizualizace slouží názornému porovnávání časopisů a
analytických údajů.
Strana 73
Obr. 13 – Mapa společenských věd podle portálu Eigenfactor.org
Strana 74
8.4
Použitá literatura
•
BATISTA, P.D., CAMPITELI, M.G., KINOUCHI, O. Is it possible to compare
researchers with different scientific interests? Scientometrics. 2006, vol. 68, no. 1,
s. 179–189.
•
BJÖRNEBORN, Lennart, INGWERSEN, Peter. Perspectives of webometrics.
Scientometrics. 2001, vol. 50, no. 1, s. 65-82.
•
BJÖRNEBORN, Lennart, INGWERSEN, Peter. Toward a basic framework for
webometrics. Journal of American Society of Information Science and Technology.
2004, vol. 55, is. 14, s. 1216-1227.
•
BOLLEN, Johan, RODRIGUEZ, Marko. A., SOMPEL, Herbert Van de. Journal
Status. Scientometrics. 2006, vol. 69, no. 3, s. 669-687.
•
BORNMANN, Lutz, DANIEL, Hans-Dieter. What Do We Know About the h
Index?. Journal of the American Society for Information Science and Technology.
2007, vol. 58, is. 9, s. 1381-1385.
•
Cybermetrics : international journal of scientometrics, informetrics, and
bibliometrics [online]. Consejo Superior de Investigaciones Cientificas, Centro de
Informacion y Documentacion Cientifica. 1997- , vol. 1, is. 1- . Spain : 1x ročně.
Dostupný z WWW: < http://www.cindoc.csic.es/cybermetrics/cybermetrics.html>.
ISSN 1137-5019.
•
DIODATO, Virgil Pasquale. Dictionary of Bibliometrics. New York : Haworth
Press, 1994. 185 s. Dostupný z WWW:
<http://books.google.cz/books?id=XBg1SNzNTD0C&printsec=frontcover>.
ISBN 1560248521.
•
EGGHE, Leo. From h to g: the evolution of citation indices. Research Trends
[online]. 2007, is. 1 [cit. 2008-08-24]. Dostupný z WWW:
<http://info.scopus.com/researchtrends/archive/RT1/exp_op_1.htm>.
•
GLÄNZEL, Wolfgang. On the h-index : A mathematical approach to a new
measure of publication activity and citation impact. Scientometrics. 2006, vol. 67,
no. 2, s. 315-321.
•
GLÄNZEL, Wolfgang, DEBACKERE, Koenradd. Measuring communication in
science : Opportunities and limitations of bibliometric methods [online]. Leuven :
Steunpunt O&O Indicatoren, [2004] [cit. 2008-09-06]. Ppt prezentace. Dostupný z
WWW:
<http://www.google.cz/url?sa=t&source=web&ct=res&cd=1&url=http%3A%2F%
2Fwww.ulb.ac.be%2Funica%2Fdocs%2FSch-com-2004-presGlanzel.ppt&ei=9qfDSPCBJZSa1wbM74ToBw&usg=AFQjCNH15XCttR2zAwIF
-Q2ZCXcS5vz1EQ&sig2=d_awnWCYJSv0eeZ_Pl3bng>.
•
GODIN, B. On the origins of bibliometrics. Scientometrics. 2001, vol. 68, no. 1, s.
109-133.
Strana 75
•
GRANOVSKY, Y. V. Is it possible to measure science? V. V. Nalimov's research
in scientometrics. Scientometrics. 2001, vol. 52, no. 2, s. 127-150.
•
HANUŠOVÁ, Soňa. SCImago Journal & Country Rank. Ikaros [online]. 2008, roč.
12, č. 6 [cit. 2008-10-17]. Dostupný z WWW: <http://www.ikaros.cz/node/4829>.
URN-NBN:cz-ik4829. ISSN 1212-5075.
•
HJøRLAND, Birger. Impact Factor [online]. 2007 , 21-4-2007 [cit. 2008-08-24].
Dostupný z WWW:
<http://www.db.dk/bh/core%20concepts%20in%20lis/articles%20az/impact_factor.htm>.
•
INGWERSEN, Peter, LARSEN, Birger. Advanced publication and citation
analysis [ppt prezentace]. Danmarks Biblioteksskole. 2007, [cit. 2008-09-20].
Studijní materiál ke kurzu Information Seeking and Information Retrieval Theories.
•
JACSÓ, Péter. Google Scholar Revisited. Online Information Review [online].
2008, vol. 32, is. 1 [cit. 2008-10-10]. ISSN 1468-4527.
•
JANOŠ, Karel. 2001. Informační etika. In PAPÍK, Richard; SOUČEK, Martin;
STÖCKLOVÁ, Anna. Informační studia a knihovnictví v elektronických textech I
[CD-ROM]. Praha : Ústav informačních studií a knihovnictví FF UK, c2001.
•
JANSSENS, Frizo, et al. Towards mapping library and information science.
Information Processing and Management. 2006, vol. 42, is. 6, s. 1614-1642.
•
KÖNIGOVÁ, Marie. 2001. Vybrané kapitoly z informační vědy. In PAPÍK,
Richard; SOUČEK, Martin; STÖCKLOVÁ, Anna. Informační studia a
knihovnictví v elektronických textech I [CD-ROM]. Praha : Ústav informačních
studií a knihovnictví FF UK, c2001.
•
KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV)
[online]. Praha : Národní knihovna České republiky, 2003. Dostupný z WWW:
<http://sigma.nkp.cz/cze/ktd>.
•
MOED, Henk F. Citation Analysis in Research Evaluation. [s.l.] : Springer, c2005.
346 s. Information Science and Knowledge Management; sv. 9. ISBN 1-40203713-9.
•
NORUZI, A. The web impact factor : A critical review. Electronic Library. 2006,
vol. 24, is. 4, s. 490-500.
•
OKUBO, Y. Bibliometric indicators and analysis of research systems: Methods and
examples. OECD, Paris, 1997, STI Working Papers 1997/1 – OCDE/GD(97)41.
•
SEGLEN, Per O. Citations and Journal Impact Factors : Questionable Indicators of
Research Quality. Allergy : European Journal of Allergy and Clinical Immunology.
1997, Vol. 52, no. 11, s. 1050-1056.
•
SHAPIRO, F.R. Origins of bibliometrics, citation indexing and citation analysis:
the neglected legal literature. Journal of the American Society for Information
Science and Technology. 1999, vol. 43, is. 5, s. 337-339.
•
SCHWARZ, Josef. Před 40 lety začala zlatá éra citačních rejstříků vědecké
literatury. Ikaros [online]. 2003, roč. 7, č. 11 [cit. 2008-02-23]. Dostupný z WWW:
<http://www.ikaros.cz/node/1520>. URN-NBN:cz-ik1520. ISSN 1212-5075.
Strana 76
9
•
Scientometrics from past to present. Research Trends [online]. 2007, is. 1 [cit.
2008-09-06]. Dostupný z WWW:
<http://info.scopus.com/researchtrends/archive/RT1/bib_mes_1.htm>.
•
SCImago: Journal & Country Rank [online]. c2007-2008 [cit. 2008-10-10].
Dostupný z WWW: <http://www.scimagojr.com/>
•
Scopus [online]. c2008 [cit. 2008-10-10]. Dostupný z WWW:
<http://www.scopus.com/>.
•
SMELSER, N. J., BALTES, P. B. International Encyclopedia of the Social &
Behavioral Sciences. Loet Leydesdorff. Amsterdam : Elsevier, c2004.
Scientometrics, s. 13752-13755. ISBN 0-08-043076-7.
•
SOUČEK, Martin. Informační věda : studijní materiály k předmětu \"Úvod do
informační vědy\" [online]. 2006 , 17.10.2006 [cit. 2008-09-06]. Dostupný z
WWW: <http://uisk.ff.cuni.cz/detail.do?articleId=1959>.
•
ŠPÁLA, Milan. Impakt faktor – Dobrý sluha, ale špatný pán. Ikaros [online]. 2006,
roč. 10, č. 4 [cit. 2008-08-24]. Dostupný z WWW:
<http://www.ikaros.cz/node/3293>. URN-NBN:cz-ik3293. ISSN 1212-5075.
•
TAGUE-SUTCLIFFE, Jean. An introduction to informetrics. Information
Processing & Management. 1992, vol. 28, is. 1, s. 1-3.
•
The effect of open access and downloads ('hits') on citation impact: a bibliography
of studies [online]. 4 August 2008 [cit. 2008-08-23]. Dostupný z WWW:
<http://opcit.eprints.org/oacitation-biblio.html>.
•
Thomson Reuters [online]. c2008 [cit. 2008-10-10]. Dostupný z WWW:
<http://www.thomsonreuters.com/>.
•
VAVŘÍKOVÁ, Lucie. Hodnocení a mapování vědy pomocí portálu
Eigenfactor.org. Ikaros [online]. 2008, roč. 12, č. 8 [cit. 2008-10-17]. Dostupný z
WWW: <http://www.ikaros.cz/node/4935>. URN-NBN:cz-ik4935. ISSN 12125075.
•
VINKLER, Peter. An attempt for defining some basic categories of scientometrics
and classifying the indicators of evaluative scientometrics. Scientometrics. 2001,
vol. 50, no. 3, s. 539-544.
•
XING, Wenpu, GHORBANI, Ali. Weighted PageRank Algorithm. In Second
annual conference on communication networks and services research CNSR’04 .
Fredericton : [s.n.], 2004. s. 305-314. Dostupný z WWW:
<http://ias.cs.unb.ca/papers/xingw_weighted.pdf>.
SPOLEČENSKÉ DOPADY MODERNÍCH
INFORMAČNÍCH TECHNOLOGIÍ
Jan Činčera
Strana 77
Předmětem informační etiky je podle některých autorů i oblast tzv. makroetiky, zkoumající
společenské dopady informačních technologií a služeb. Je zřejmé, že vývojem, distribucí či
používáním určitých aplikací vstupujeme do sítě komplikovaných environmentálněsociálních vztahů, ze kterých následně plynou eticky konfliktní situace. Dopady
informačních služeb a technologií na moderní společnosti jsou zkoumány řadou disciplín a
vzhledem k jejich komplexnosti o nich nelze vypovídat jednoznačné soudy.
V rámci informační etiky nás budou zajímat následující oblasti:
•
vliv na člověka a jeho sebepojetí.
•
vliv na pracovní a volnočasový režim.
•
vliv na distribuci moci ve společnosti.
•
vliv na životní prostředí.
9.1.1 Vliv na člověka a jeho sebepojetí.
V rámci sebepojetí člověka bychom chtěli otevřít několik klíčových témat, na kterých
budeme ilustrovat problémy s pojené s informační etikou. Jedním z nich je závislost na
internetu, která se projevuje neschopností ukončit práci na internetu, rostoucím počtem
hodin online, lhaním o délce času stráveném v síti či jinými projevy psychologické
závislosti. Za nejadiktivnější aplikace jsou považovány zejména ty, které umožňují
komunikaci v reálném čase.
Specifickou oblastí jsou také nové formy sexuality umožněné internetovými aplikacemi
(tzv. kybersex). Opět lze říct, že zatímco někteří autoři se obávají odcizení způsobené touto
formou sexuality či rizik spojených s oboustrannou anonymitou, jiní mluví o legitimní
formě sexuálního projevu dospělých lidí.
Další oblastí je experimentování s vlastní identitou. Anonymita internetových aplikací
umožňuje svobodně si volit a experimentovat s různými identitami, např. měnit si pohlaví
či věk oproti skutečnosti.
Diskutován je dopad těchto experimentů na psychiku a
sebepojetí – zatímco někteří autoři oceňují pozitivní stránky nových zkušeností, jiní se
obávají rozštěpení mezi internetovou a neinternetovou identitu a neschopnost je v reálném
životě sjednotit.
Strana 78
9.1.1.1 Příklady k zamyšlení: problémy s identitou
V tomto případě platí, že vhodným příkladem lze docílit lepšího pochopení, než
dalekosáhlým obecným popisem a vysvětlováním. Zde jsou tedy tři případy, které ilustrují
problémy s identitou, které se v rámci anonymního světa internetových aplikací často
vyskytují:
1. Stewart má v reálném světě nízké sebevědomí a problémy s navazováním vztahů.
V GargoyleMOO vystupuje pod jménem Achilles. Zatímco jeho studentský pokojík
v RL je skromný a jednoduchý, Achilles bydlí v přepychovém a elegantně zařízeném
bytě, vyzdobeném obrazy Achillových přátel z celého světa. Jako Achilles se
Stewart seznámil s jednou ze tří ženských obyvatel GargoyleMOO, Winterlight.
Pozval ji na virtuální schůzku do italské restaurace a strávil s ní romantický večer.
Po nějaké době známosti ji požádal o ruku a ona přijala. Ona mu poslala růži,
kterou nosila ve vlasech, on jí tisíc papírových hvězd. Ačkoliv Stewart se svatební
oslavy účastnil před monitorem svého bytu, jeho přátelé z Německa se sjeli na
svatební party k serveru, na kterém je MOO provozováno. Stewart se nyní cítí na
MOO závislý: jeho alter ego Achilles je sice populární, ale jen ve své roli,
Stewartovi se nepodařilo jeho prostřednictvím zbavit se vlastních mindráků
(Turkle, 2000).
2. Šťastně ženatý čtyřiatřicetiletý designer Case hraje v MedievalMUD studentku
práva, která dostala nabídku k sňatku od jednoho ze šlechticů, kteří provozují její
školu a který jí platí studium. Case alias studentka Mairead obtížně prožívá pocit
nerovného vztahu (Turkle, 2000).
3. Doug vystupuje v několika různých MOO a MUD pod čtyřmi různými postavami.
První je svůdná žena, druhou chlapský kovboj. Třetí nenápadný králík
nespecifikovaného pohlaví, kterého Doug využívá pro uspokojení svých
voyeuristkých sklonů. Poslední postavou je ”sexuální turista”, pod kterým Doug
žije v sexuálně orientované FurryMUDs. ”RL je jen další z oken a zpravidla ne
moje nejlepší.” (Turkle, 2000).
9.2
Vliv na pracovní a volnočasový režim
V této oblasti nás může zajímat několik okruhů otázek. Jaký má například dopad
teleworkingu na pracovní efektivitu i sociální vztahy. Současné výzkumy zkoumají
zejména dopady práce na dálku na sociální aktivity zaměstnance, které jsou zásadním
samozřejmě vyhodnocovány jako výrazně negativní, na druhé straně ale jsou oceňovány
úspory na pracovišti, omezení výdajů za jízdy i možnost zaměstnat pracovníky ze
vzdálených chudších zemí.
Strana 79
Vliv moderních technologií má vliv také na rychlost života a množství i chápání volného
času. Zejména sociální sítě představují nový fenomén v oblasti sociálních kontaktů
s osobami, které známe i které neznáme z reálného života.
Vnikají také například nové formy online spirituality, na internetu se objevují nové
náboženské skupiny, provozuje se online magie, diskutují se náboženské otázky. Věřící
mohou konzultovat otázky víry s duchovními, se kterými se nikdy fyzicky nepotkali a kteří
žijí ve vzdálených zemích. To může ovlivňovat i jejich soužití s většinovou společností a
umocňovat fundamentalistické protesty.
9.3
Vliv na distribuci moci ve společnosti
Distribuce moci ve společnosti je primárně vymezena právním prostředím ve kterém se
pohybujeme. Právní normy podchycující také „život“ na internetu a staví se poněkud do
protikladu s původním chápáním internetu jako svobodného média. V rámci webových
komunit byly například řešeny otázky cenzurování internetu, oprávněnost boje hackerů
proti eticky závadným dokumentům či jiné aktivity zabíhající za obvyklý právní rámec.
Vliv internetu na moderní pojetí demokracie se projevuje na mnoha úrovních, internet
ovlivňuje výsledky tradičních voleb, zvyšuje kontrolu veřejnosti nad politiky, nabízí ale i
vizi online demokracie využívající průběžná elektronická referenda k diskutovaným
tématům. Internet na druhé straně také umožňuje kontrolu státu a firem nad občanem a
fakticky omezuje jeho právo na ochranu soukromí.
Informační propast – digital divide, je problematika o které se nyní mluví velmi často a
na mnoha úrovních, bývá chápána jako negativní projev vlivu internetu a informačních
technologií na sdílení vlivu a moci mezi chudší a bohatší společenskou vrstvou, případně
chudými a bohatými zeměmi. Na druhé straně sebou tento proces může nést i určité
pozitivní aspekty, zatímco se dříve se upozorňovalo na rozšiřování vzdálenosti mezi oběma
světy, je dnes možné najít řadu pozitivních příkladů o přínosech mobilních telefonů pro
chudé obyvatele Afriky či o přínosu internetu anglicky mluvícím indickým programátorům
a konzultantům.
9.4
Vliv na životní prostředí
Jak dopadá informační společnost na životní prostředí je téma kontroverzní, nabízející více
problémů než jejich řešení. Můžeme se ptát jestli moderní média umožňují bezpapírovou
Strana 80
společnost nebo naopak povzbuzují k vyšší produkci papíru? Zatímco v posledních dvaceti
letech pravděpodobně platilo druhé tvrzení, v současné době se rozšiřující zařízení na čtení
elektronických dokumentů možná povede k náhradě části „papírové komunikace“ za
elektronickou, ale je to bohužel zatím jenom jeden z trendů. Vyvstává tu dále problematika
obrovského nárůstu elektronického odpadu (důsledek Moorova zákona) a tento odpad
stále ještě nenachází vhodnou formu zpracování či recyklace. S výrobou elektroniky navíc
souvisí řada negativních environmentálních i sociálních dopadů v zemích, odkud se dováží
příslušné suroviny či kde se likviduje stará elektronika.
Zde je ale na druhé straně také potřeba zmínit, že existuje i výrazně pozitivní vliv internetu
na environmentální uvědomění, např. možnost koordinovat mezinárodní výchovné
projekty, sdílet podklady a informace, zapojovat žáky do jejich samostatného vyhledávání
atp.
Celkově lze shrnout, že vliv moderních informačních technologií a služeb na společnost je
nejednoznačný a zároveň velmi silný. To je pro nás významnou motivací zkoumat tuto
problematiku hlouběji a provádět systematické sociologické analýzy, které nám umožní
problému výše zmíněným problémům rychle a dobře porozumět. Obecně platí, že některé
dopady jsou jednoznačně negativní a je naším úkolem hledat dílčí řešení vzniklých situací
u jiných se hodnocení zdá být věcí názoru a společenské diskuse a u dalších není vůbec
predikovat jejich budoucí vývoj a zaujmout relevantní stanovisko.
9.5
McLuhanova teorie médií
„Když generál Sarnoff, prezident společnosti RCA, před několika lety přijímal
čestný doktorát univerzity Notre Dame, prohlásil: ”Máme příliš silný sklon dělat
z technologických nástrojů obětní beránky za hříchy těch, kdo je mají v rukou.
Produkty moderní vědy nejsou samy o sobě dobré, nebo špatné; jejich hodnotu
určuje způsob, jakým jsou použity.” Tak mluví soudobý náměsíčník. Dejme tomu, že
bychom řekli: ”Jablečný koláč není sám o sobě ani dobrý, ani špatný; jeho hodnotu
určuje způsob, jakým ho použijeme.” Nebo: ”Virus neštovic není sám o sobě ani
dobrý, ani špatný; jeho hodnotu určuje způsob, jakým je použit.” A ještě: ”Střelné
zbraně nejsou samy o sobě ani dobré, ani špatné; jejich hodnotu určuje způsob,
jakým jsou použity.” Jako by byly střelné zbraně dobré, kdyby kulky zasáhly
správné cíle. Pokud televizní obrazovka vypálí správnou munici na správné cíle, je
dobrá. To neříkám ze zlomyslnosti. Na Sarnoffově tvrzení neobstojí nic, neboť
ignoruje podstatu všech médií vpravdě narcisovským způsobem člověka, který je
hypnotizován amputací a extenzí svého bytí v nové technické podobě.” (Marshal
McLuhan)
Strana 81
Marshall McLuhan (1911-1980) radikálně proměnil pohled sociálních věd na média.
Média, která chápal jako všechny technologie rozšiřující lidské tělo a smysly, podle jeho
názoru nejsou eticky neutrálními zprostředkovateli informací. Naopak, samotné médium je
poselstvím („the medium is the message“). Je aktivním činitelem, které přináší vlastní
informace a mění nás svojí podstatou.
9.5.1 Vliv médií na společnost
Podle McLuhana nejsou média pouhými nástroji přenosu informací, ale jsou rozšířením
člověka – extenzí určitého smyslu. Písmo a zařízení na přenos písma (knihtisk) je například
extenzí oka. Rozhlas extenzí ucha. Rozšířením smyslového orgánu se ale lidé mění. Mění
se způsob vnímání a komunikování světa, náš způsob uvažování o něm a následně i
společenské instituce, které jsou na tomto vnímání závislé.
McLuhan popisuje tři fáze vývoje lidské společnosti podle převládajícího média.
V preliterárních kulturách převládala přímá komunikace, pro kterou bylo typické zapojení
více smyslů: zraku, sluchu, hmatu, čichu. Společnost té doby měla podobu venkovských
komunit. Moc drželi silní vůdci, schopni svým projevem ovlivnit ostatní. Soukromí
neexistovalo, současně byla společnost provázána řadou silných vazeb.
Knihtisk přinesl zásadní zvrat a dominanci oka nad ostatními smysly. Člověk mohl
komunikovat nepřímo, o samotě, prostřednictvím knih. To vedlo k zániku původních
venkovských struktur a k individualizaci. Individualizace přinesla pojem soukromí a
koncept lidských práv.
Elektronická média pak přinesla další změnu, protože opět začala zapojovat další smysly.
V důsledku se podle McLuhana ve dnešní době opět vrací určité vesnické hodnoty, svět se
stává „globální vesnicí“. Spojujeme se s dalšími lidmi bez ohledu na geografické
vzdálenosti do elektronických komunit, ve kterých se vytvářejí nepsaná zvyková pravidla.
Soukromí se stává diskutovaným a ohroženým konceptem.
Podle McLuhana je současně každé přechodové období charakteristické velkou mírou
společenské nejistoty a výbuchy násilí. Média předešlé epochy (rukopisná kniha, tištěná
kniha) bývají považována za hodnotnější, než média nová (tištěná kniha, elektronická
kniha). Dalším pozoruhodným aspektem je otázka dobrovolnosti využívání nových médií.
McLuhan upozorňuje, že nová média jsou nejprve svobodnou volbou, ale od jistého
Strana 82
rozšíření se stávají vyžadovanou nutností. Ve dnešní době je možné zamyslet se například
nad reálností volby nepoužívat mobilní telefon či internet…
9.5.2 McLuhanova tetráda na zkoumání médií
McLuhan proto navrhuje zkoumat média jako fenomény, které do určité míry žijí vlastním
životem a ovlivňují společnost nezávisle na přání svých vynálezců a uživatelů. Pro analýzu
médií navrhnul čtyři navazující okruhy otázek, tzv. tetrádu:
1. Co médium intenzifikuje neboli umocňuje, rozmnožuje a posiluje?
2. Co médium archaizuje neboli co činí zastaralým, překonaným?
3. Co médium aktualizuje neboli co probouzí k novému životu?
4. Co je nevyhnutelnou inverzí média, tedy v co se nakonec zvrhne?
Pro porozumění se formou krátkého zamyšlení pokusíme aplikovat na příkladě mobilních
telefonů:
Mobilní telefony intenzifikují sociální komunikaci a to ústní i písemnou. Zvyšují počet
příležitostí, kdy jsme v kontaktu s blízkými osobami a můžeme se s nimi domlouvat a
koordinovat. Pravděpodobně také zvyšují naše pracovní tempo, protože nám umožňují
zvládat a řešit problémy rychleji a proto si jich také více brát. Na druhé straně archaizují
tradiční poštovní služby. Do určité míry archaizují pevné plánování a spolehlivost – díky
mobilním telefonům je možné termíny kdykoliv změnit a aktualizovat. Lze uvažovat o
archaizaci pevného rozdělení času mezi pracovní dobu a volný čas – díky mobilním
telefonům jsme kdekoliv a kdykoliv dostupní a tato dostupnost je po nás často vyžadována.
Mobilní telefony aktualizují písemnou komunikaci, ovšem formou upraveného a trochu
komprimovaného jazyka. Aktualizují také možnosti kontroly – například rodičů nad dětmi.
Mobilní telefony se možná z komunikačního prostředku zvrhnou v čistou zábavu –
komunikaci pro komunikaci.
McLuhanova teorie médií zůstává dodnes teorii inspirující a provokativní. Současně
v době, která je médii utvářena v mnohem větší míře, než kdykoliv dříve, stojí jeho názory
za připomenutí a analýzu. McLuhan svým způsobem stál na počátku bádání v oblasti
informační vědy, zkoumající například dopady internetu na sociální vztahy, sexualitu či
trávení volného času. Analýza společenských dopadů médií otevírá široký vějíř etických
Strana 83
konsekvencí, jejichž porozumění je zásadní pro každého, kdo v této oblasti profesně
působí.
9.6
Úkoly
Který z dopadů
společenských moderních informačních technologií považujete za
nejsilnější / nejvíce pozitivní / nejvíce negativní? Proč?
Vyberte si libovolnou otázku, která Vás zaujala. Najděte k ní na internetu další informace a
relevantní odborné studie. Připravte na dané téma prezentaci, kterou promítnete ostatním.
Prodiskutujte s přáteli případ Stewarta, Case a Douga. Posuďte, do jaké míry je pro ně
zkušenost experimentování s vlastní identitou přínosem pro vlastní osobnostní rozvoj,
případně co by se mělo změnit, aby se tato zkušenost stala reálným přínosem.
Aplikujte McLuhanovu tetrádu na Facebook či sociální sítě obecně. Dohledejte
k jednotlivým bodům potřebné informace z relevantních výzkumů publikovaných
v dostupných zdrojích.
9.7
Literatura
•
Anderson, Craig A., Dill, Karen E. Video Games and Agressive Thoughts,
Feelings, and Behavior in the Laboratory and in Life. Journal of Personality and
Social Psychology, Vol. 78, 2000, no 4, p. 772-790.
•
Činčera, Jan. Internet a trvale udržitelný život. Environmentální a společenské
dopady rozšiřování globálních počítačových sítí. [Disertace] Praha: Ústav
informačních studií a knihovnictví FF UK v Praze, 2001. 168 s.
•
Johnson, Deborah G. Is the Global Information Infrastructure a Democratic
Technology? In Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social
and moral issues in the computer age. New York: Prometheus Books, 2000. S. 304318.
•
Spinello, Richard A. Case Studies in Information and Computer Ethics. Upper
Sadle River: Prentice Hall, 1997.
•
Turkle, Sherry. Who Am We? In Baird, R. M., Reagan, R., Rosenbaum, S. E.
Cyberethics: social and moral issues in the computer age. New York: Prometheus
Books, 2000. S. 129-141.
Young, Kimberly S. University of Pittsburgh at Bradford. Internet addiction: The
Emergence of a New Clinical Disorder. CyberPsychology and Behavior, Vol. 1,
1998. No. 3., pages 237-244. [WWW dokument]
http://www.netaddiction.com/articles/newdisorder.htm
•
•
MCLUHAN, M. Člověk, média a elektronická kultura. Výbor z díla. Brno: Jota,
2000.
Strana 84
•
MCLUHAN, M . Jak rozumět médiím. Extenze člověka. Praha: Odeon, 1991.
10 INFORMAČNÍ ETIKA
Jan Činčera
10.1
Vymezení informační etiky
Praxe nakládání s informacemi přináší kromě praktických problémů také etická dilemata,
které se řeší na úrovni státní, institucionální či individuální. Teoretickým podchycením
těchto dilemat se zabývá etika, která se v závislosti na svém zaměření označuje jako
informační, počítačová, kyberetika, novinářská etika či jinak.
Karel Janoš (1993) definoval informační etiku jako “oblast morálky uplatňované při
vzniku, šíření, transformaci, ukládání, vyhledávání, využívání a organizaci informací.” (s.
47)
Etická dilemata, která s informační praxí mohou být spojována, přitom mohou mít dvě
roviny. Na první, mikroetické, jde především o správnost či nesprávnost určitého způsobu
nakládání s informacemi. Mikroetické problémy jsou problémy, související s vlastní
informační prací a individuálním chováním aktérů informačního procesu (tedy například
ochrana soukromí, ochrana duševního vlastnictví, atd.).
Oproti tomu makroetické problémy souvisejí s dopady informačních technologií na
společnost, tedy například s problémem nerovného přístupu k informacím (tzv. digital
divide), zranitelností informační společnosti, atd.
Podle Ladda (2000) je předmětem makroetiky morální posuzování norem, praktik, institucí
a zákonů, které jsou budovány na bázi mikroetiky. Zejména hledisko společenských
dopadů internetu se stává v posledních letech součástí každé práce o informační etice.
Strana 85
10.2
Konfliktní oblasti mimoetické dimenze nakládání
s informacemi
V rámci této kapitoly se budeme soustředit na mikroetiku. Typická problémová a
konfliktní situace může být například otázka do jaké míry je správné zpřístupňovat
některé informace a do jaké míry v určitých případech omezit přístupnost informací.
Dalším typickým problémem může být odpovědnost za publikované informace nebo
informační produkt. Třetí skupinou problémů je korektní nakládání s vlastnickými
právy původce informací či informačního produktu.
10.2.1 Zpřístupňování informací vs. omezování přístupnosti
informací
V mnoha případech narážíme na těžko řešitelné rozpory, které v některých případech
nemají jednoznačnou odpověď a musí se k přistupovat citlivě, nepředpojatě, případ od
případu se snažit nalézt eticky přiměřené rozhodnutí. Příkladem může být požadavek a
ochranu soukromí versus snaha státu o zajištění bezpečnosti občanů, zejména v souvislosti
s bojem proti terorismu (informace o výrobě výbušnin, výroba jaderných zbraní, politicky
citlivé údaje, silná kryptografie apod.). Dalším takovým typickým rozporem je otázka,
jakým způsobem najít hranici mezi právem člověka na informace a legitimní snahou
ochránit soukromí? S tímto rozporem se běžně setkáváme na mnoha úrovních. Do jaké
míry má zaměstnavatel právo vstupovat do soukromí svých zaměstnanců (např. monitoring
zaměstnanecké korespondence). Kde končí obchodní tajemství a začíná právo na
informace například oblasti vlivu firem na životní prostředí? Do jaké míry může být
legální obchodování s osobními údaji získanými z počítačových sítí či jiných zdrojů? Kde
je hranice soukromí například u veřejně činných osob, nebo do jaké míry máme znát
informace o osobách, které byly odsouzené, nebo jsou jako narušení jedinci jsou
považováni za nebezpečné pro své okolí?
Strana 86
10.2.2 Odpovědnost za publikované informace či informační
produkt
V této oblasti se nejčastěji diskutuje problematika provozování informačních aplikací, u
kterých existuje riziko, že v důsledku jejich používání vznikne jedinci či společnosti újma.
Příkladem může být provozování potenciálně adiktivních aplikací (např. online casina),
publikace rasistických či jinak násilí podněcujících dokumentů, xenofobních dokumentů,
publikace agresivních interaktivních aplikací, např. počítačových her, virtuálních světů
(MUDs), publikace nepravdivých či záměrně zkreslených informací (například záměrné
politické dezinformace).
10.2.3 Korektní nakládání s vlastnickými právy původce
informací či informačního produktu.
V tomto případě se jedná o takové zacházení s informačními produkty, které nerespektuje
přání jejich původce. Jedná se v nejčastějších případech o porušení citačních zásad,
hacking a cracking, nelegální stahování softwaru a jiných produktů.
10.2.4 Analýza informačních konfliktů
Jak k takovým konfliktům přistupovat? Můžeme využít následující postup:
Porovnat situaci se stávajícími normami, tj. právním řádem, firemním etickým kodexem či
společenským územ.
Identifikovat zainteresované strany konflikty a vyhodnotit jejich stanoviska, postoje a
důvody, proč je zaujímají.
Pokusit se konflikt posoudit z hlediska obecných etických zásad, tj. např. podle
kategorického imperativu či podle utilitaristického přístupu.
Přihlédnout v hodnocení k vlastnímu svědomí a pocitům.
Příklad: V létě 2000 zveřejnil britský bulvární deník jména a fotografie všech osob,
kteří byli v posledních letech propuštěni z vězení po odpykání trestu za pohlavní
zneužívání dětí. List argumentoval tím, že občané mají právo vědět o nebezpečí,
Strana 87
které hrozí jejich dětem. Policie se ale obávala, že zveřejnění jmen povede
k rozvrácení snahy těchto osob o normální život a k jejich útěku do anonymity, kde
nebudou pod státní kontrolou.
Rozbor:
V našich podmínkách by zveřejnění jmen propuštěných delikventů znamenalo
porušení zákona na ochranu osobních údajů.
V konfliktu figurují tři zainteresované strany:
Propuštění delikventi – požadují ochranu svého soukromí z důvodu obavy o svůj
život;
Noviny – požadují zveřejnění informace, důvodem je naděje ve zvýšení prodejnosti;
Veřejnost – požaduje zveřejnění informace, důvodem je obava o bezpečnost dětí.
Podle Kantova kategorického imperativu bychom se museli ptát, zda by fungovala
společnost, ve které by každý měl přístup k trestnímu rejstříku všech ostatních. To
by pravděpodobně vedlo k ostrakizaci osob s popsaným rejstříkem a ztížení jejich
možné resocializace. Podle utilitaristické zásady nejvyššího dobra největšímu počtu
osob bychom měli vážit, zda více dobra více lidem přinese zveřejnění (=vyšší pocit
bezpečnosti a vyšší prodejnost) nebo utajení (=ochrana delikventů). Krátkodobě
patrně převažuje užitek ze zveřejnění, dlouhodobě ale může vést ke zvýšení
nebezpečnosti propuštěných trestanců.
Intuitivně cítíme určitou nekorektnost tohoto zveřejnění a lze se domnívat, že tu jde
do značné míry o zisk vydavatele.
10.2.5 K zamyšlení: eticky složité situace
Odpůrci internetové cenzury jsou přesvědčeni, že online komunita je schopna své
problémy řešit i bez rušivého vpádu státní moci. Na internetu například existují
organizované
skupiny
hackerů
soustředěně
útočících
proti
pornografickým
či
spammerským serverům, proti kterým používají legální i nelegální prostředky. Je ovšem
sporné, zda tyto skupiny dosáhnou stejné efektivity, jako policejní zásah. Jejich činnost je
jednak trestná, jednak neúčinná - vymazané pornografické servery jsou schopny obnovit
svoji činnost po několika minutách. Proto mnoho protipornografických hackerských skupin
- Condemned, Cyber Angels, antichildporn.org opouští hackerské metody a přechází na
legální formy boje. I ty se ovšem míjejí s účinkem. Ač je dětská pornografie všude ve světě
zakázána (v roce 1982 rozhodnul americký Nejvyšší soud, že se na ní nevztahuje svoboda
projevu, daná Prvním dodatkem, trestné je nejen její šíření, ale i pouhé vlastnění), není
zatím FBI schopna proti virtuální dětské pornografii zasahovat (Burke, 2000).
Strana 88
Scientologická církev je mnohými považována za jednu nejnebezpečnějších sekt,
využívajících rafinované psychologické postupy k získání dalších platících příznivců.
Přestože v USA může volně fungovat, je v některých evropských státech zakázána či
nepovolena, bývalý německý kancléř Kohl ji dokonce prohlásil za hrozbu německé
demokracii. V roce 1991 vznikla na internetu diskusní skupina, spojující odpůrce
scientologické církve, alt.religion.scientology. V této konferenci se jednoho dne objevily
dlouhé texty, získané nelegálním (hackerským) průnikem na weby Scientologické církve.
Texty obsahovaly interní informace, známé jaké Pokročilé technologie, určené pouze pro
zasvěcené. Texty obsahovaly bizarní popisy mimozemských bytostí, prehistorických
jaderných válek a další kapitoly, které “nezasvěceným” musely připadat dost komické.
Zástupci Církve se obrátili na soud s žalobou o porušení svých autorských práv. Soud jim
dal za pravdu, ale poté co právníci Církve požadovali zrušení konference, ukázalo se, že to
technicky není možné: net news konference jsou zrcadleny na stovkách news serverů a
nemají
žádného
odpovědného
provozovatele.
Příspěvky
byly
navíc
odeslány
prostřednictvím finského anonymního remaileru a nebylo tedy možné zjistit, kdo je jejich
skutečným původcem. Scientologům se ale podařilo získat soudní příkaz k tlaku na
finského provozovatele remailovací služby a přinutili ho, aby odhalil jména odesílatelů.
To vyvolalo veliké pobouření mezi internetovou komunitou a kritický text se začal
objevovat na diskusních konferencích odeslaný prostřednictvím sítě anonymních remailerů
a s tedy nezjistitelnými odesílateli. Protože scientologové začali v této fázi války uvažovat
o spamovém útoku a zasypávání nepřátelských konferencí maily oslavujícími
Scientologickou církev, byly připraveny nástroje, které se od té doby začaly používat proti
spammerům: cancelbot, umožňující smazat spam z konference a cancelfile, umožňující
automaticky mazat maily od jednoho adresáta. Tyto nástroje ale dokázala využít i Církev a
tak od roku 1994 začaly z alt.religion.scientology mizet texty. Pod informací o smazání stál
podpis “Cancelbunny” , anonymní osobnosti, která nepřiznala svoji vazbu na Církev a ani
Církev nikdy nepřiznala svůj vztah k ní. Válka ovšem neskončila: internetová komunita
vytvořila nástroj zvaný Lazarus, pomocí kterého je možné smazané příspěvky opět křísit
(Post, 1996).
Strana 89
10.2.6 Úkol
Přečtěte si v libovolné učebnici etiky informace o vybrané etické teorii (Aristoteles, Kant,
utilitarismus, kontraktariánská etika, atd.). Vyhodnoťte, do jaké míry s teorií souhlasíte a
jak byste ji mohli využít při řešení konfliktů v informační praxi.
Analyzujte příklady uvedené v kapitole „K zamyšlení“ a vyhodnoťte je podle výše
uvedené metodiky. Svoje řešení prodiskutujte s přáteli.
Najděte v novinách libovolnou zprávu o konfliktu, týkajícím se informací. Rozeberte jej
podle výše uvedených bodů a rozhodněte, jaké řešení považujete za správné.
10.2.7 Použitá literatura
•
Burke, Lynn. Wired News Report. Hackers' New Tack on Kid Porn. [WWW
dokument]. http://www.wired.com/news/politics/0,1283,33869,00.html. 3:00 a.m.
3.Feb.2000 PST
•
Capurro, Raffael. Moral Issues in Information Science. [WWW dokument]. 1985.
Dostupné z <http://www.capurro.de>
•
Capurro, Raffael. Ethical Challenges of the Information Society in the 21st
Century. [WWW dokument]. 2000. Dostupné z <http://www.capurro.de>
•
Janoš, Karel. Informační etika. Praha: Univerzita Karlova, 1993.
•
Ladd, John. Ethics and the Computer World: A New Challenge For Philosphers. In
Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social and moral issues in
the computer age. New York: Prometheus Books, 2000.
•
Moor, James H. What Is Computer Ethics. In Baird, R. M., Reagan, R.,
Rosenbaum, S. E. Cyberethics: social and moral issues in the computer age. New
York: Prometheus Books, 2000.
•
Post, David G. The First Internet War. [WWW dokument]
http://www.cli.org/DPost/X0003_ARTICLE4.html . 1996.
11 HUMAN-COMPUTER INTERACTION
Vznik HCI se datuje od 70.-80. let 20. stol. s nástupem osobních počítačů. Tehdy si mnozí
uvědomili, jak je obrácení pozornosti na interakci člověk-počítač velmi důležité, protože
Strana 90
nedostatečně navržená rozhraní mezi člověkem a počítačem mohou vést k nenadálým
problémům.
V současné době neexistuje jednoznačně výstižná, všeobecně použitelná definicie HCI. Je
ale možné skonstatovat, že je společensko-technologickou vědou, která zkoumá
problematiku interakce komunikace mezi člověkem (jednotlivcem či skupinami) a
počítačem (počítačovými systémy), lidské vnímání a poznávání a schopnost využívat
počítač. Studuje chování a informační potřeby konečného uživatele při využívání
informačních a komunikačních technologií (ICT - Information and Communication
Technologies) s cílem zlepšit použitelnost a intuitivnost využívání ICT i u méně odborných
uživatelů. Zahrnuje procesy relevantního vyhledávání informací, uživatelských rozhraní a
dalších atributů informačních systémů či informačních technologií (Pilecká, 2009;
Součková, 2003). Proto je HCI orientován i na design, tvorbu a testování použitelnosti a
přístupnosti informačních systémů a jejich rozhraní tak, aby byly co nejjednodušší a
nejintuitivnější pro konkrétně definovanou skupinu uživatelů. Existuje nejméně 7
klíčových principů designu uživatelského rozhraní (UID - User Interface Design), které by
neměly být v žádném případě opomíjeny, a sice tolerance, jednoduchost, viditelnost,
dostupnost, konzistentnost, struktura a zpětná vazba (Tidwell, 1999).
11.1
Vazba na jiné oblasti a související obory
HCI představuje spleť vzájemně propojených oborů - počítačové grafiky, kognitivní
psychologie (včetně lidských faktorů), ergonomiky, inženýrských oborů a systémů, jenž
jsou součástí počítačové vědy, operačních systémů nevyjímaje. Můžeme zde zařadit i další
přidružené obory, jakými jsou umění, design, psychologie, kognitivní psychologie,
lingvistika, sociologie, filosofie, antropologie, fyziologie, umělá inteligence, kognitivní
věda, etika a estetika.
11.1.1 Iniciativy a organizace HCI
Nejznámější organizací zabývající se problematikou interakce člověka s počítačem je
ACM SIGCHI. Tato speciální zájmová skupina expertů, profesionálů, akademiků a
studentů (Special Interest Group on Computer–Human Interaction), vydává časopisy,
publikace, tutoriály, provozuje online diskusní fóra. Pravidelně také pořádá workshopy a
Strana 91
konference. Jejich každoroční konference ACM's Conference on Human Factors in
Computing Systems patří mezi nejprestižnější konference HCI.
Česká odnož ACM - Prague ACM SIGCHI je občanské sdružení, které si klade za cíl
budovat komunitu lidí zajímajících se o návrh uživatelských rozhraní (user interface
design), použitelnost (usability) a přístupnost (accessibility).
Další, neméně známou organizací je i The American Center for Design (ACD), která patří
mezi primární zdroje informací o designu. Na rozdíl od ACM SIGCHI, sdružuje výhradně
profesionály a experty z nejrůznějších oblastí teoretického i praktického designu.
11.1.2 Metodologie HCI
Mnohé metodologie designu pochází z modelu, ve kterém uživatelé, designéři a technické
systémy vzájemně interagují. Přesto je metodologie HCI závislá na její konkrétní aplikaci.
Společnou je zřejmě jen evaluace. Například rané metodologie považovali uživatele a jeho
kognitivní procesy za předvídatelné a tím pádem i plně kvantifikovatelné, čemuž ve
výsledku odpovídaly i první protypy rozhraní. Moderní modelování uživatelů se zaměřuje
spíše na stálou zpětnou vazbu a komunikaci mezi uživateli, designéry a inženýry.
Uživatelsky orientovaný design (UCD - User-centred design), design zaměřen na uživatele,
představuje moderní, rychle se rozvíjející filosofii designu, která má za to, že dobrý design
musí sloužit
především zájmu uživatelů. Uživatelské požadavky jsou od začátku
(životního cyklu tvorby uživatelského rozhraní) zaznamenávány a následně dolaďovány
prostřednictvím různorodých metod, např. etnografických studií, testování prototypů,
testování použitelnosti apod. K metodám obecnějšího charakteru řadíme např. participační
design. Ten zdůrazňuje aktivní participaci koncových uživatelů na designu rozhraní
prostřednictvím různých workshopů a sezení. Nabízí vhodné společné komunikační
prostředí pro technické i netechnické účastníky (vývojáře, designéry i uživatele).
Mezi další nejpoužívanější metody HCI (zejména při tvorbě uživatelských rozhraní) patří
design
zaměřen
na
aktivity
(activity-centered
design),
‘Affordance
Analysis’,
‘bodystorming’, kontextuální design (contextual design), ‘focus group’, ‘iterative design’,
‘pictive user interface workshop method’, design založený na scénářích (Scenario Based
Design - SBD), analýza/modelování úkolů (task analysis, task modeling), Experiment
Strana 92
Čaroděje ze země Oz (Wizard of Oz experiment) či design zaměřen na používání (usagecentered design).
12.1.3 Uživatel jako klíčový element
Jak je již vidět z výše uvedeného, současný trend je zcela zaměřen na uživatele a jeho
potřeby. Uživatel je centrálním a určujícím činitelem celého informačního systému. Bez
respektování potřeb uživatelů pracuje systém víceméně naprázdno. Kvalitu uživatelsky
přívětivého rozhraní určuje:
•
interaktivita - rozhraní komunikuje s uživatelem, informuje jej o tom, co se děje
•
průhlednost - ovládání je jednoduché a reakce systému předvídatelné
•
přehlednost - orientace je snadná nejen na první obrazovce, ale v celém systému
•
empatie - rozhraní je “šito” na míru uživateli
•
standardizace - klasické a navyklé pracovní postupy uživatele jsou zachovány i s
ohledem na zvyklosti a standardy operačního systému, pro který je program
navržen
•
srozumitelnost - pojmy, které rozhraní používá jsou obecně známy, popřípadě
známy alespoň skupině uživatelů, pro které je program určen
•
návodnost - rozhraní provází uživatele celým systémem bez učení se navigace v
systému
•
ochrana - před nebezpečnými operacemi, které mohou připravit uživatele o data
•
pomoc - vybavení přehlednými návody a pomůckami.
11.2
Informační architektura
Pojem informační architektura (Information Architecture - IA) byl poprvé použit
Richardem Saul Wurmanem v roce 1976 na konferenci The Architecture of Information.
Trvalo více než 20 let než se IA ujala jako vědní disciplína.
IA můžeme definovat jako vědeckou disciplínu zabývající se organizací a rozvržením
(layout) obsahu systému / rozhraní/ webu. Ale také jako umění i vědu organizace a
Strana 93
modelování informací způsobem, který úspěšně naplňuje potřeby uživatelů obzvláště v
komplexních systémech. Jedná se ku příkladu o knihovní systémy, systémy pro správu
obsahu, kde je nevyhnutné vhodně podchytit vývoj databází a webu, programování či
technické psaní.
Institut informační architektury (podrobněji o instituci viz níže) definuje informační
architekturu pomocí tří obecných prohlášení (Our, 2007):
Strukturální design sdílených informačních prostředí.
Umění a věda organizace a popisu webových sídel, intranetů, online komunit a softwaru
za účelem následného vyhledání a využití.
Vznikající zájmová skupina přenášející principy designu a architektury do digitální sféry.
Informační architekt je pak osoba, která organizuje vzory v datech, transformuje je z
komplexní do přehledné podoby, vytváří strukturu nebo mapu informací umožňující
snadnou orientaci a cestu k poznatkům. Jde o profesi 21. století s úkolem řešit problémy
organizování informací tak, aby byly snadno pochopitelné a srozumitelné (Makulová,
2005).
11.2.1 Iniciativy a organizace IA
Institut informační architektury (The Information Architecture Institute - IAI) byl zřízen v
roce 2002 jako nezisková organizace pro experty a technicky zdatné odborníky. Poskytuje
informační zdroje, informační nástroje, školení, konference, workshopy, semináře apod.
Snahou je nabídnout mezinárodní členství, které
propojí různé jazyky, kultury a
perspektivy.
11.2.2 Základní pilíře IA
Informační architekturu tvoří několik základních “pilířů” - organizační systém, systém
popisu (labeling system), navigační systém a vyhledávací systém. IA se tedy zaměřuje na
informační, nikoli grafický design.
Strana 94
Organizačný systém - informace jsou organizovány za účelem jejich lepšího řízení,
vysvětlení, pochopení a v neposlední řadě i využití. Proto základem by měla být náležitá
klasifikace. Cílem je podpora navigace, vyhledávání a popis, který bude vyhovovat právě
uživatelům systému/ rozhraní/ webového sídla.
Systém popisu - popisný systém slouží jako reprezentace informací. Úkolem je popis
informací sémanticky jednoznačným (a tím pádem i efektivním) způsobem pro daného
koncového uživatele či uživatelské komunity.
Navigační systém - jedná se o prvky, které usnadňují navigaci v systému/ rozhraní/ sídle/
podle předem stanovených kroků. Typickými nástroji jsou organizační systémy, globální
navigační systémy, lokální navigační systémy, mapy a indexy systému/rozhraní/sídel,
průvodci či doplňkové navigační schémata.
Vyhledávací systém - patří zde nástroje umožňující formulaci uživatelského požadavku –
vyhledávací rozhraní, vyhledávací algoritmus, dotazovací jazyk se svou syntaxí a
sémantikou, zobrazené výsledky vyhledávání atd. (Morville, 2006; Makulová, 2005).
11.3
Přístupnost
Přístupnost (web accesibility) ve všeobecnosti znamená takový stav, kdy daná věc (webová
stránka, sídlo, systém, uživatelské rozhraní) neklade svým uživatelům při jejim užívání
žádné překážky (Špinar, 2004).
Termín přístupnost bývá někdy nesprávně významově zaměňován za dostupnost
(availability) či použitelnost (usability). I když je v běžné řeči považujeme za synonyma, v
oblasti HCI máme na mysli především logický přístup (vhodné podmínky pro zpracování
informací v mysli), na rozdíl od fyzického přístupu (dostupnosti), např. připojení na
internet. Přístupnost webu je neoddělitelnou součástí použitelnosti webu. Neexistují mezi
nimi pevné hranice, nicméně neplatí, že každá přístupná stránka je i bezprostředně
použitelná a naopak.
Strana 95
11.3.1 Iniciativy v oblasti přístupnosti webu
Zřejmě nejznámější iniciativou v oblasti přístupnosti webu je Web Accessibility Initiative WAI fungující v rámci konsorcia World Wide Web. Její činnost je možné rozdělit do pěti
základních okruhů: vývoj nových technologií, výzkum, výchova a vzdělávání, poskytování
nástrojů, vydávání odborných návodů. V posledně zmíněné oblasti se realizovaly vydáním
dvou směrnic - Směrnice přístupnosti webu 1.0 a Směrnice přístupnosti webu 2.0 (Web
Accessibility Guidelines - WCAG).
Neméně známým sdružením je WebAIM - Web Accessibility in Mind, které již od roku
1999 poskytuje řešení problematiky přístupnosti webu. Jde o neziskovou organizaci v
rámci Centra pro znevýhodněné na americké univerzitě státu Utah (Center for Persons with
Disabilities at Utah State University). Cílem WebAIM je šířit povědomí o přístupnosti a
použitelnosti webu pro všechny skupiny znevýhodněných uživatelů - publikační činností,
podporou výměny informací a zkušeností v online komunitách, aktivní účástí ve výzkumu
a na legislativním procesu, poskytováním služeb a vytvářením sofwarových nástrojů,
stejně tak instruktážních videí.
11.3.2 Metodiky a legislativní předpisy přístupnosti webu
Některé země chtěly přístupnost webu řešit legislativní cestou. Průkopníky se staly USA.
Začátkem 90.-tych let se ve Státech odehrálo několik soudních sporů, ve kterých žalující
strana (znevýhodnění uživatelé a organizace bojující za práva menšin) požadovala
rovnocenný přístup ve společnosti a k informacím. Na tyto spory reagoval v roce 1998
prezident Clinton podepsáním dodatku k novelizovanému zákonu Rehabilitation Act z
roku 1973, ve kterém byl vznesen požadavek na vypracování konkrétních regulí
přístupnosti webových sídel. Vznikl tak dokument Section 508. Podkladem tohoto
prováděcího předpisu byly právě Směrnice přístupného webu 1.0 (WCAG 1.0). V roce
1998 si kanadská vláda stanovila vyšší cíl, a to přijetím Směrnic s druhým stupněm jejich
priority - na rozdíl od USA, kde Section 508 vychází pouze z prvního stupně priority.
První zemí na evropském kontinentu, která přijala v roce 1999 rezoluci vztahující se na
přístupnost webu se stalo Portugalsko (Slatin, 2003). V květnu v roku 2002 zavedlo
Strana 96
Spojené království pravidla Code of Practice, která dala základ zákonu Disability
Discrimination Act (DDA).
Pro pravidla přístupnosti webu není vždy nutné chodit daleko. V České republice existují
dvě velice zdařilé metodiky Blind Friendly Web (dále jen BFW) a Pravidla pro tvorbu
přístupného webu, které tvoří přílohu zákonu č. 365/2000 Sb. o informačních systémech
veřejné správy.
BFW podrobně popisuje pravidla pro přístupné webové stránky pro zrakově znevýhodněné
uživatele. Jejich autorem je Radek Pavlíček ze Sjednocené organizace nevidomých a
slabozrakých České republiky.
V Best Practice - Pravidla pro tvorbu přístupného webu, na rozdíl od BFW, jsou kontrolní
body poměrně konkrétně definovány (lepší sémantika), což usnadňuje jejich srozumitelnou
interpretaci i bez podrobnějšího výkladu. Příručka přístupnosti obsahuje 37 kontrolních
bodů, které jsou dostupné jak v základní, tak i rozšířené formě s detailním popisem.
12.3.3 Kategorie znevýhodněných uživatelů
I když pod “hlavičkou” znevýhodněných najdeme velice různorodou skupinu lidí, i zde je
možná alespoň částečná kategorizace, přičemž je nutné si uvědomit, že tyto skupiny se
mohou překrývat. To znamená, že uživatel z hlediska této kategorizace může spadat do
několika skupin, respektive trpět i několika znevýhodněními. Jde o kategorie:
Zdravotně znevýhodnění uživatelé (tělesně, smyslově, kognitivně) - např. imobilní či
částečně mobilní občané, zrakově, sluchově, rečově znevýhodnění a také lidé s poruchami
kognice.
Uživatelé se zobrazovacími problémy - uživatelé s nejrůznějším hardwarových a
softwarovým vybavením (monochromatický či žádný monitor, řečový syntentizátor apod.)
Dočasně znevýhodnění uživatelé - nejen dočasně zdravotně znevýhodnění lidé (např. po
úrazech, zlomeninách končetin apod.), ale i uživatelé s nevyhovujícím pracovním
prostředím (např. příliš nebo málo osvětlený monitor).
Špinar (2004), s trochou nadsázky, označuje roboty vyhledávacích nástrojů (web crawlers)
za samostanou znevýhodněnou skupinu “uživatelů”. Jelikož jsou také “nevidomí”, jejich
činnost závisí na kvalitním, čistém zdrojovém kódu.
Strana 97
11.4
Použitelnost webu
Dodržování nejdůležitějších zásad použitelnosti systému/ rozhraní/ webu zvyšuje
srozumitelnost a přehlednost. Interakce s rozhraním by tedy měla probíhat bez nutnosti
složitého přemýšlení.
K dispozici dáváme i několik dalších definic použitelnosti, např.:
•
Použitelnost je stupeň do jakého se software, hardware anebo výrobek lehce
používá a vyhovuje lidem, kteří to využívají
•
Použitelnost je o tom, zda-li je výrobek efektivní, výkonný a uspokojuje ty, kteří jej
používají
•
Použitelnost označuje skupinu technik, které profesionálové z oblasti použitelnosti
používají ke tvorbě použitelných výrobků
•
Použitelnost můžeme definovat jako lehké využívání systému ke konkrétním
účelům.
Mezinárodní norma ISO 9241, v části 11 definuje použitelnost jako využívání produktu
uživateli za účelem dosažení specifických cílů, a to efektivně, s vysokým stupněm
výkonnosti a míry uspokojení. Použitelnost můžeme v obecnějším chápání brát jako
takový přístup k vývoji výrobku, který předpokládá přímou zpětnou vazbu uživatele během
výrobního cyklu, s cílem snížení nákladů a naplnění potřeb uživatelů (Makulová, 2009).
11.4.1 Iniciativy v oblasti použitelnosti webu
Cílem nejvýznamnější iniciativy použitelnosti webu - Asociace profesionálů použitelnosti
(The Usability Professionals’ Association - UPA) je být především autoritativní organizací
pro použitelnost, uživatelsky orientovaný design a ‘user experience’ (UX). Dále je zde
snaha podporovat výzkum, vzdělávání a profesní růst, propagovat obchodní hodnoty v
uživatelsky orientovaném designu a stejně tak usnadňovat komunikaci expertů sdílením a
výměnou informací. I proto UPA každoročně organizuje jednodenní konferenci World
Usability Day, která probíhá ve stejný den ve více než 43 zemích světa pro nejširší
spektrum publika. U nás ji převzala záštitu Prague ACM SIGCHI.
Strana 98
11.4.2 Metody použitelnosti webu
Mezi nejčastější metody použitelnosti patří např. uživatelské testování, ‘eye-tracking’,
testování prototypů (na papíře, nebo ve formě elektronické prezentace). Důležité tak je
zjistit a zajistit čitelnost obsahu při všech rozlišeních, jasný účel webu, členění textu,
informace o smyslu webu, sdělení informací o organizaci, firmě či instituci vlastnící/
spravující daný systém. Dále také způsob vytváření obsahu, navigaci, vyhledávání, včetně
grafiky a animace, grafického designu a prvků uživatelského rozhraní. Opomenout bychom
neměli ani záhlaví oken, URL adresy, přivítání a poděkování, informace o případných
technických problémech, zprávy a tisková prohlášení, informační okna a úvodní stránky,
reklamu, podporu komunit a shromažďování informací o zákaznících. Nejdůležitější
informace by se vždy měly nacházet v první polovině “obrazovky”.
Pokud totiž většinu výše uvedených kritérií systémy/ rozhraní/ webová sídla splňují, mají
podle Nielsena (2005) tyto čtyři charakteristické znaky:
•
Snadná naučitelnost a zapamatovatelnost
•
Vysoká výkonnost uživatelů při provádění a dokončování stanovených úkolů
•
Nízká chybovost
•
Spokojenost.
11.5
Shrnutí
S nástupem osobních počítačů si mnozí uvědomili, jak je obrácení pozornosti na interakci
člověk-počítač velmi důležité, jelikož nedostatečně navržená rozhraní mezi člověkem a
počítačem mohou vést k nepředvídatelným problémům. HCI představuje spleť vzájemně
propojených oborů - počítačové grafiky, kognitivní psychologie (včetně lidských faktorů),
ergonomiky, inženýrských oborů a systémů, jenž jsou součástí počítačové vědy, operační
systémy nevyjímaje. HCI je orientována i na design, tvorbu a testování přístupnosti a
použitelnosti informačních systémů a jejich rozhraní tak, aby byly co nejjednodušší a
nejintuitivnější pro konkrétně definovanou skupinu uživatelů. Přístupnost je neoddělitelnou
součástí použitelnosti. Neexistují mezi nimi pevné hranice, nicméně neplatí, že každý
přístupný systém, rozhraní či web je i bezprostředně použitelný a naopak.
Strana 99
Nesmí se však opomínat ani informační architektura, která navrhuje vhodné rozvržení
(layout) obsahu systému /rozhraní/ webu, organizaci a modelování informací tak, aby
potřeby uživatelů, obzvláště v komplexních systémech, byly úspěšně naplňovány.
Strana 100
11.6
Seznam použité literatury
•
Best practice - Pravidlá pro tvorbu přístupného webu. Verze 1.0. 2004 [online].
Praha : Ministerstvo informatiky (Odbor metodické podpory ISVS), 2004 [cit.
2010-08-21]. Dostupný z WWW:
<http://aplikace.mvcr.cz/archiv2008/micr/files/1510/mi_final_bp_web_pristupnost
_20040722.pdf>.
•
FOJTU, A. Analýza súčasného stavu a perspektívy riešenia v oblasti iniciatívy
prístupnosti webových sídiel [Diplomová práce]. Univerzita Komenského v
Bratislave; Filozofická fakulta; Katedra knižničnej a informačnej vedy. Bratislava:
FFUK, 2005. 70 s.
•
MAKULOVÁ, S. 2005. Informačná architektúra. In Ikaros [online]. 2005, roč. 9, č.
9 [cit. 29.08.2010]. Dostupný z WWW: <http://www.ikaros.cz/node/2007>. URNNBN:cz-ik2007. ISSN 1212-5075.
•
MAKULOVÁ, S. 2009. Ako sa vyvíjalo chápanie použiteľnosti webových sídiel.
In ELET Newsletter. [online] 1. január 2009 [cit. 2009-11-29]. Dostupný z WWW:
<http://www.elet.sk/?pouzitelnost-pristupnost&sprava=ako-sa-vyvijalo-chapaniepouzitelnosti-webovych-sidiel>.
•
MORVILLE, P., ROSENFELD, L. 2006. Information Architecture for the World
Wide Web. 3rd ed. Cambridge: O’Reilly, 2006. 504 p. ISBN 0-596-52734-9.
•
NIELSEN, J. 2002. Web Design. 1. vyd. Praha : SoftPress s.r.o., 2002. 382 s. ISBN
80-86497-27-5.
•
Our mission - The Information Architecture Institute. 2007 [online]. Last modified
January 16, 2007 [cit. 2010-08-29]. Dostupný z WWW:
<http://iainstitute.org/en/about/our_mission.php>.
•
PAVLÍČEK, R. 2005. Blind Friednly Web : Dokumentace zásad přístupnosti
webových stránek pro těžce zrakově postižené uživatele [online]. Praha :
Sjednocená organizace nevidomých a slabozrakých ČR, 2005 [cit. 2004-08-17].
Dostupný z WWW: <http://www.blindfriendly.cz/doc/bfw.php>.
•
PILECKÁ, V. 2009. Vzájemné inspirace informační a kognitivní vědy. In
ProInflow [online]. 31.12.2009 [cit. 2010-08-29]. Dostupný z WWW:
<http://pro.inflow.cz/vzajemne-inspirace-informacni-kognitivni-vedy>. ISSN
1804–2406.
•
SLATIN, J.M., RUSH, S. 2003. Maximum Accessibility : Making Your Web Site
More Usable for Everyone. 1st ed. Boston : Addison-Wesley, 2003. 588 p. ISBN 0201-77422-4.
•
SOUČKOVÁ, M. 2003. Aspekty vztahu člověk-počítač s důrazem na uživatelské
rozhraní. Praha, 2003. iv, 89 s. Diplomová práce. Univerzita Karlova v Praze,
Filozofická fakulta, Ústav informačních studií 2003. Vedoucí diplomové práce
Richard Papík.
•
ŠPINAR, D. 2004. Tvoříme přístupné webové stránky. 1. vyd. Brno: Zoner Press,
2004. 360 s. ISBN 80-86815-11-0.
Strana 101
•
TIDWELL, J. 1999. Common Ground : A Pattern Language for Human-Computer
Interface Design [online]. Last modified May 17, 1999 [cit. 2010-08-29]. Dostupný
z WWW: <http://www.mit.edu/~jtidwell/common_ground_onefile.html>.
12 PRÁVO A INTERNET
12.1
Internet z hlediska práva
Je třeba pochopit co vlastně znamená internet z hlediska práva. Rozlišujeme konkrétní
subjekty práva – ISOC, IAB, provozovatelé jednotlivých sítí, poskytovatelé služeb,
uživatelé, atd., dále pak věci – hardware, tedy optická vlákna, kabely, telefonní linky,
servery, satelity, routery, atd. a práva a jiné majetkové hodnoty – práva užívání,
databáze, ochranné známky, autorská díla, osobní údaje, atd.
Klíčové aspekty internetu z hlediska práva
-
12.2
Trans-teritorialita
Dobrovolná normativita
Anonymita a nízké právní vědomí
Neexistence jednotné mezinárodní právní úpravy
Vymahatelnost a působnost práva na internetu
Právo chápeme jako normativní systém, tedy systém norem regulujících lidské chování,
jehož dodržování je vynucováno státem.
Otázka rozhodného práva a jurisdikce
Trestní právo
zákon č. 40/2009 Sb., trestní zákoník
(již neúčinný zákon č. 140/1961 Sb., trestní zákon)
§ 4 Zásada teritoriality
Strana 102
(1) Podle zákona České republiky se posuzuje trestnost činu, který byl spáchán na jejím
území.
(2) Trestný čin se považuje za spáchaný na území České republiky,
a) dopustil-li se tu pachatel zcela nebo zčásti jednání, i když porušení nebo ohrožení
zájmu chráněného trestním zákonem nastalo nebo mělo nastat zcela nebo zčásti v
cizině, nebo
b) porušil-li nebo ohrozil-li tu pachatel zájem chráněný trestním zákonem nebo mělli tu alespoň zčásti takový následek nastat, i když se jednání dopustil v cizině.
Civilní právo
mezinárodní právo soukromé – kolizní norma říká, podle práva jakého státu se bude právní
stav posuzovat, rozhodným prvkem může být:
-
patria – stát, jehož příslušníkem je subjekt
locus delicti – místo, kde došlo ke škodní události
locus solutionis – místo, kde byl nebo měl být splněn závazek
dohoda stran
Nařízení Rady (ES) č. 44/2001, článek 5
Osoba, která má bydliště na území některého členského státu, může být v jiném členském
státě žalována,
1.
a) pokud předmět sporu tvoří smlouva nebo nároky ze smlouvy, u soudu místa, kde
závazek, o nějž se jedná, byl nebo měl být splněn;
b) pro účely tohoto ustanovení a pokud nebylo dohodnuto jinak, je místem plnění
zmíněného závazku:
- v případě prodeje zboží místo na území členského státu, kam podle smlouvy zboží bylo
nebo mělo být dodáno,
- v případě poskytování služeb místo na území členského státu, kde služby podle smlouvy
byly nebo měly být poskytovány,
c) nepoužije-li se písmeno b), použije se písmeno a);
3. ve věcech týkajících se protiprávního jednání či jednání, které je postaveno na roveň
protiprávnímu jednání, u soudu místa, kde došlo nebo může dojít ke škodní události;
Nařízení Rady (ES) č. 44/2001, článek 23
1. Dohodnou-li se strany, z nichž alespoň jedna má bydliště na území členského státu, že v
již vzniklém nebo budoucím sporu z určitého právního vztahu má příslušnost soud nebo
soudy tohoto členského státu, je příslušný soud nebo soudy tohoto státu. Pokud se strany
nedohodnou jinak, je tato příslušnost výlučná. Taková dohoda o příslušnosti musí být
uzavřena
a) písemně nebo ústně s písemným potvrzením nebo
Strana 103
b) ve formě, která odpovídá zvyklostem zavedeným mezi těmito stranami, nebo
c) v mezinárodním obchodě ve formě, která odpovídá obchodním zvyklostem, které strany
znaly nebo musely znát a které strany smluv tohoto druhu v daném odvětví obchodu obecně
znají a pravidelně se jimi řídí.
2. Písemné formě jsou rovnocenná veškerá sdělení elektronickými prostředky, která
umožňují trvalý záznam dohody.
3. Uzavřou-li takovou dohodu strany, z nichž žádná nemá bydliště na území členského
státu, nemohou soudy ostatních členských států rozhodovat, ledaže by zvolený soud nebo
soudy příslušnost odmítly.
Správní právo
-
12.3
kritérium místa zdanitelného plnění
finanční právo
loterijní právo
Pojem duševního vlastnictví
Pojem autorských práv a duševního vlastnictví se vztahuje v rámci autorské práva na
dílo literární, umělecké a vědecké, databáze, počítačový program. Z hlediska
průmyslového práva se jedná o patenty, užitné a průmyslové vzory, vynálezy a
zlepšovací návrhy, ochranné známky…
12.4
Autorské dílo
Co je autorské dílo? (§ 2 autorského zákona)
Autorské dílo je
-
dílo literární a jiné dílo umělecké a dílo vědecké,
které je jedinečným výsledkem tvůrčí činnosti autora
a je vyjádřeno v jakékoli objektivně vnímatelné podobě (vysloveno nahlas,
napsáno, nakresleno, vymodelováno, pantomimicky naznačeno…),
bez ohledu na jeho rozsah, účel nebo význam
Autorským dílem je zejména
Strana 104
dílo slovesné vyjádřené řečí (proslov) nebo písmem (kniha, báseň, článek),
dílo hudební, dílo dramatické a dílo hudebně dramatické (balet),
dílo choreografické (choreografie baletu) a dílo pantomimické,
dílo fotografické a dílo vyjádřené postupem podobným fotografii,
dílo audiovizuální, jako je dílo kinematografické,
dílo výtvarné, jako je dílo malířské, grafické a sochařské,
dílo architektonické včetně díla urbanistického (soubor budov),
dílo užitého umění
dílo kartografické (mapa)
počítačový program
databáze, která je autorovým duševním výtvorem ve smyslu způsobu řazení či
výběru dat
Autorským dílem není
-
-
námět díla sám o sobě,
denní zpráva nebo jiný údaj sám o sobě,
myšlenka, postup, princip, metoda, objev, vědecká teorie, matematický a obdobný
vzorec, statistický graf a podobný předmět sám o sobě
Vedle práva autorů chrání autorský zákon i práva výkonných umělců (herců, zpěváků,
hudebníků, tanečníků, dirigentů, sbormistrů, režisérů, artistů).
Vyloučení z ochrany autorského zákona (§ 3 autorského zákona)
Ochrana se nevztahuje na
úřední dílo, jímž je právní předpis, rozhodnutí, opatření obecné povahy, veřejná
listina, veřejně přístupný rejstřík a sbírka jeho listin, jakož i úřední návrh úředního
díla a jiná přípravná úřední dokumentace, včetně úředního překladu takového díla,
sněmovní a senátní publikace, pamětní knihy obecní (obecní kroniky), státní
symbol a symbol jednotky územní samosprávy a jiná taková díla, u nichž je veřejný
zájem na vyloučení z ochrany,
- výtvory tradiční lidové kultury, není-li pravé jméno autora obecně známo a nejde-li
o dílo anonymní nebo o dílo pseudonymní (§ 7)
Užít takové dílo lze jen způsobem nesnižujícím jeho hodnotu.
-
Trvání majetkových práv (§ 27 autorského zákona)
Majetková práva trvají po dobu autorova života a 70 let po jeho smrti.
Bylo-li dílo vytvořeno jako dílo spoluautorů, počítá se doba 70 let od smrti spoluautora,
který ostatní přežil.
Strana 105
12.5
Zpřístupnění díla prostřednictvím internetu
Právo dílo užít (§ 12 autorského zákona)
Autor má neomezené právo své dílo užít nebo smlouvou dovolit jinému, aby jeho dílo užil
(tzv. licence). Takovou smlouvou ale nezaniká autorovo právo dílo užít, autor jen musí
strpět užití díla tím, komu to dovolil.
Další osoby smí dílo užít, jen pokud jim to dovoluje souhlas autora nebo autorský zákon.
Rozmnožování díla (§ 13 autorského zákona)
Rozmnožováním díla se rozumí zhotovování jakýchkoli rozmnoženin (kopií) díla:
dočasných nebo trvalých, přímých nebo nepřímých, celého díla nebo jeho části, jakýmikoli
prostředky a v jakékoli formě. Forma rozmnoženiny může být zejména tisková,
fotografická, zvuková, obrazová nebo zvukově-obrazová, stavba architektonického díla
nebo jiná trojrozměrná rozmnoženina anebo forma elektronická včetně vyjádření
analogového i digitálního.
Sdělování veřejnosti (§ 18 autorského zákona)
Sdělováním díla veřejnosti se rozumí zpřístupňování díla v nehmotné podobě, živě nebo ze
záznamu, po drátě nebo bezdrátově. Sdělováním díla veřejnosti je také zpřístupňování díla
veřejnosti způsobem, že kdokoli může mít k němu přístup na místě a v čase podle své
vlastní volby, zejména počítačovou nebo obdobnou sítí.
Citace (§ 31 autorského zákona)
Je dovoleno užít cizí, již dříve zveřejněné dílo v omezeném a odůvodněném rozsahu, který
odpovídá sledovanému účelu, v těchto případech:
výňatky děl jiných autorů ve svém díle,
výňatky z díla nebo drobná celá díla pro účely kritiky nebo recenze vztahující se k tomuto
dílu, vědecké či odborné tvorby za podmínky, že takové užití bude v souladu s poctivými
zvyklostmi,
Strana 106
při vyučování pro ilustrační účel nebo při vědeckém výzkumu, jejichž účelem není
dosažení hospodářského prospěchu.
Vždy je však nutno uvést, je-li to možné, jméno autora, název díla a pramen.
12.6
Stahování díla z internetu
tzv. volná užití (§ 30 autorského zákona)
Užití díla pro osobní potřebu fyzické osoby, jehož účelem není dosažení hospodářského
prospěchu, je možno činit zcela volně, protože není „užitím“ díla podle autorského zákona
(které je možné činit jedině se souhlasem autora díla).
Stejně tak není porušením autorského práva, pokud kdokoli pro svou osobní potřebu
zhotoví záznam (např. nahrávka živého koncertu), rozmnoženinu (např. kopie CD) nebo
napodobeninu (např. reprodukce obrazu) díla. Jakékoli šíření těchto záznamů, rozmnoženin
a napodobenin už ale autorské právo porušuje.
Výše uvedené se ale netýká:
užití počítačových programů a elektronických databází pro osobní potřebu a zhotovení
jejich rozmnoženiny pro osobní potřebu = počítačový program nebo hru nemohu
nainstalovat na více počítačích, než pro kolik je určena, ani CD/DVD s ní zkopírovat
zhotovení rozmnoženiny či napodobeniny architektonického díla stavbou = nemohu si
postavit kopii stavby navržené architektem bez jeho souhlasu
pořízení záznamu audiovizuálního díla při jeho provozování ze záznamu (typicky
promítání v kině) = zákaz pořizování tzv. kinoripů
12.7
P2P sítě a autorské právo
Technologie p2p
A&M Records, Inc. v. Napster, Inc., 239 F.3d 1004 (9th Cir. 2001)
The Pirate Bay trial, 2009 (Fredrik Neij, Gottfrid Svartholm, Peter Sunde, Carl Lundström)
Strana 107
12.8
Ochrana autorských práv
1. Civilní právo
= právo autora obrátit se na soud a žádat zákaz porušování autorského práva a zaplacení
peněžitých nároků
Práva autora jsou vypočtena v § 40 autorského zákona, jde o:
-
právo na náhradu škody včetně ušlého zisku
právo na vydání bezdůvodného obohacení
2. Správní právo (Přestupkové řízení)
= vede se u obecního úřadu, který věc vyšetří, uloží pokutu a případně i povinnost nahradit
škodu autorovi
§ 105a autorského zákona
(1) Fyzická osoba se dopustí přestupku tím, že
a) neoprávněně užije autorské dílo, umělecký výkon, zvukový či zvukově obrazový
záznam, rozhlasové nebo televizní vysílání nebo databázi,
b) neoprávněně zasahuje do práva autorského způsobem uvedeným v § 43 odst. 1
(obchází účinné technické prostředky ochrany práv) nebo 2 (drží, distribuuje nebo
propaguje zařízení a služby sloužící k obcházení účinných technických
prostředků) anebo v § 44 odst. 1 (odstraňuje nebo mění jakoukoli elektronickou
informaci o správě práv k dílu nebo takto upravené dílo distribuuje), nebo
c) jako obchodník, který se účastní prodeje originálu díla uměleckého, nesplní
oznamovací povinnost podle § 24 odst. 6 (oznámit kolektivnímu správci prodej
uměleckého díla za více než 1.500 eur).
(2) Za přestupek podle odstavce 1 písm. a) lze uložit pokutu do 150.000 Kč, za přestupek
podle odstavce 1 písm. b) pokutu do 100.000 Kč a za přestupek podle odstavce 1 písm.
c) pokutu do 50.000 Kč.
3. Trestní právo
= ochrana společnosti před závažným a systematickým porušováním autorských práv,
pachatele stíhá a vyšetřuje policie a před soudem stojí proti státnímu zástupci; autor je
v řízení v postavení poškozeného s právem na náhradu škody
- trestné činy proti průmyslovým právům a proti autorskému právu, obsažené v zákoně č.
40/2009 Sb., trestní zákoník, v platném znění, mezi trestnými činy hospodářskými
Strana 108
- trestní právo stíhá pouze rozsáhlé a závažné porušování autorských práv, protože podle
obecného ustanovení trestního zákoníku lze pachatele odsoudit a potrestat jen v případech
společensky škodlivých, ve kterých nepostačuje uplatnění odpovědnosti podle jiného
právního předpisu (například podle autorského zákona v občanskoprávním řízení)
§ 270 Porušení autorského práva, práv souvisejících s právem autorským a práv k databázi
(1) Kdo neoprávněně zasáhne nikoli nepatrně do zákonem chráněných práv k autorskému
dílu, uměleckému výkonu, zvukovému či zvukově obrazovému záznamu, rozhlasovému
nebo televiznímu vysílání nebo databázi, bude potrestán odnětím svobody až na dvě
léta, zákazem činnosti nebo propadnutím věci nebo jiné majetkové hodnoty.
(2) Odnětím svobody na šest měsíců až pět let, peněžitým trestem nebo propadnutím věci
nebo jiné majetkové hodnoty bude pachatel potrestán,
a) vykazuje-li čin uvedený v odstavci 1 znaky obchodní činnosti nebo jiného
podnikání,
b) získá-li takovým činem pro sebe nebo pro jiného značný prospěch (500.000 Kč
nebo více) nebo způsobí-li tím jinému značnou škodu (500.000 Kč nebo více),
nebo
c) dopustí-li se takového činu ve značném rozsahu.
(3) Odnětím svobody na tři léta až osm let bude pachatel potrestán,
a) získá-li činem uvedeným v odstavci 1 pro sebe nebo pro jiného prospěch velkého
rozsahu (5.000.000 Kč nebo více) nebo způsobí-li tím jinému škodu velkého
rozsahu (5.000.000 Kč nebo více), nebo
b) dopustí-li se takového činu ve velkém rozsahu.
12.9
Literatura
•
Telec, I., Tůma, B.: Autorský zákon. Komentář. 1. vydání, Praha: C.H.Beck. 2007
•
Holcová, I., Křesťanová V., Voborník, M.: Ochrana autorského práva, 1. vydání,
Olomouc: Univerzita Palackého v Olomouci, 2005
•
Čermák, J.: Internet a autorské právo, 2. vydání, Praha: Linde Praha a.s., 2003
•
Kříž, J., Holcová,I., Křesťanová, V., Kordač, J.: Autorský zákon. Komentář a
předpisy související, 2. vydání Praha: Linde Praha a.s., 2005
•
MacQueen, H., Waelde, Ch., Laurie, G.: Contemporary Intellectual Property, Law
and Policy, Oxford University Press, 2007
•
St. Laurent, Andrew: Understanding Open Source and Free Software Licensing,
O'Reilly Media, Inc., 2004
•
Rosen, Lawrence: Open Source Licensing, Prentice Hall Professional Technical
Reference, 2005
Strana 109
Strana 110

Získat - Informační věda

Transkript

Podobné dokumenty

čeština - Web we want

SANFRANCISKÁ DEKLARACE – HODNOCENÍ VÝZKUMU

Úvod do informačních zdrojů - Od rozvoje znalostí k inovacím

Rešeršní!strategie!a!informační!systémy!

Prezentace aplikace PowerPoint - Czech National Library of

Institute of Computer Science Academy of Sciences of the Czech

Celý sborník - Nejmenší z nás

Analytické dolování znalostí v reálném čase (OLAM)

PDF-Dokument - Geschichte der Burschenschaft

Akademický bulletin, rok 2013, číslo 6

EndNote Web

Výroční zpráva o činnosti ČVUT 2010

Modernizace bakalářského programu Informační studia a

journal citation reports

6. Scientometrie - Fyzikální ústav UK

Scientometrie - Fyzikální ústav UK

Bibliografické citace - Univerzitní knihovna

STÁHNOUT SOUBOR ()