ÚVOD 3 Pokročilé nástroje vyhledávání 6 Základní booleovské

Transkript

ÚVOD 3 Pokročilé nástroje vyhledávání 6 Základní booleovské
Obsah
ÚVOD
3
Význam vyhledávání na internetu
3
Průzkum
3
Metody vyhledávání na Internetu
4
Nejpoužívanější vyhledávače
4
Pro koho je příručka určena
5
Pokročilé nástroje vyhledávání
6
Ujasnit si problém, co nevíme
6
Formulace dotazu
8
Základní booleovské operátory
11
A AND B
11
A OR B
12
A NOT B
13
A XOR B
14
Proximitní booleovské operátory
15
* (hvězdička)
15
”” (uvozovky)
16
Speciální operátory pro využití v Google
17
intitle:A
17
filetype:A
18
-1-
define:A
19
link:A
20
inanchor:A 20
site:A
20
Převod měn
21
Jednoduché počty
21
Sociální sítě
23
Komerční databáze
25
Městská knihovna v Praze
26
Národní technická knihovna
27
Vysoká škola ekonomická v Praze
29
Vyhledávání v databázích
30
Klíčová slova
30
Deskriptory
31
Další tipy
31
Wolfram
31
Absolventské práce studentů vysokých škol
32
INTUTE
33
Závěrečné shrnutí
34
Citované informační zdroje
35
-2-
ÚVOD
V
e svých rukou právě držíte příručku, která by Vám měla pomoci
usnadnit každodenní honbu za informacemi. Pokud dopřejete
Vašim očím chvilku času, aby pročetly tuto stručnou příručku až do
konce, odnesete si mnoho zajímavých poznatků o problematice
vyhledávání informací na internetu
Význam vyhledávání na internetu
Dnešní doba je hektická. To způsobuje každodenní boj za
získávání informací. Této bitvy s neznalostí se účastní každý
z nás. Důležitými zbraněmi proti neinformovanosti, které lidstvo
vynalezlo, jsou média. Tato příručka se bude věnovat nejmladšímu
z nich, Internetu. Nutno podotknout, že se jedná o zbraň nejvíce
se rozvíjející. Důkazem toho je rozmach Internetu v posledních
několika letech.
Můžeme tvrdit, že Internet je v dnešní době nejvýznamnější
informační médium. Ve světě Internetu je možné najít prakticky
cokoliv. Někdy vedou k cíli cesty složité a dlouhé. Jindy cesty
jednoduché a přímočaré. Cílem této příručky je nabídnout uživateli
metody, díky nimž budou jeho cesty při bloudění Internetem za
hledanými informacemi co nejkratší a nejpřesnější.
Průzkum
Na počátku samotné příručky stál průzkum. Úkolem dotazníku
bylo zjistit, jak si stojí lidstvo ve svém boji v získávání informací, a
zdali také využívá všechny vymoženosti, které jim Internet nabízí.
Odpovědi sta oslovených respondentů poskytly několik podnětů,
které daly této příručce směr, kterým se bude ubývat. Výsledky jsou zajímavé, ačkoli ne překvapující. Způsob vyhledávání
jasně opanovala metoda použití několika klíčových slov, kterou
známe všichni a používáme ji. Pro zisk kvalitních informací je
však nutné čas od času požít metody složitější, jejichž výsledky
-3-
odpovídají přesněji vyhledávanému požadavku. Tyto metody se
však, jak z průzkumu vyplývá, používají mnohem méně. Znalost
těchto postupů je však silnou zbraní v rukou uživatele Internetu.
Podrobnější rozvržení sil jednotlivých metod zobrazuje následující
graf.
Metody vyhledávání na Internetu
Další zajímavostí ve výsledcích průzkumu je přehled
nejvyužívanějších
vyhledávačů.
S velkým
odstupem
je nejpoužívanějším nástrojem, jak vyplývá z grafu,
Google, dále následuje Seznam.cz a již nepatrné
množství dotázaných využívá primárně jiný vyhledávač.
-4-
Nejpoužívanější vyhledávače
Na základě výsledků průzkumu, které jsou zmíněny výše tedy
vyplývá, čemu se bude tato příručka věnovat především. Ano, je to
vyhledávač Google a pokročilé metody vyhledávání na internetu.
Znalost těchto nástrojů by Vám měla pomoci bojovat s neznalostí
určité problematiky tak, abyste na konci boje mohli být považování minimálně za vyrovnaného protivníka, nebo dokonce i vítěze.
Pro koho je příručka určena
Chcete se aktivně zdokonalit ve vyhledávání informací na internetu?
Pak je tato příručka právě pro vás. S vysokou pravděpodobností
patříte do skupiny studenti, pro které je příručka určená především.
Webové stránky tedy používáte jako velmi silný a častý zdroj
informací ke svému studiu. Internet je však velmi obsáhlý, a proto
vám tato příručka poskytne návody a metody, jak dosáhnout
relevantních informací v krátkém čase.
Pakliže nepatříte mezi studenty, určitě i vy zde najdete mnoho
zajímavých informací jak najít ty pravé informace v internetové
džungli. Na několika stránkách vás příručka provede možnostmi a
výhodami mocného Googlu, který je nejpoužívanějším nástrojem
na základě námi provedeného průzkumu. Avšak většina z těchto
lidí využívá pouze základní metody vyhledávání. K využití
rozmanitostí Googlu je potřeba využít i další metody vyhledávání,
se kterými budete podrobně seznámeni v následujících kapitolách.
-5-
Pokročilé nástroje vyhledávání
P
romyšlení vkládaných dotazů do vyhledávacích políček je velmi
často opomíjeným procesem a je též nutné před samotným
výkladem zmínit, že v případě nezvládnutí rešeršních strategií
může dojít k nalezení nulové rešerše nebo naopak (a to mnohem
častěji) k přetížení uživatele informacemi, jejichž relevance se
pak ztrácí (Informační chování ve věku online komunikace,
Papík). Proto je v této brožuře věnován i prostor tomu, co by mělo
přecházet samotnému vyhledávání.
Ujasnit si problém, co nevíme
Před samotným hledáním je dobré věnovat několik okamžiků
k zamyšlení se nad problémem. Je třeba si nejdříve uvědomit
některé aspekty, které ovlivňují průběh celého vyhledávání.
Jedním z těchto aspektů je povaha požadované informace, na níž
závisí výběr informačního zdroje. Povahu informace lze obecně
rozdělit do dvou kategorií:
1. informace obecného rázu
Od vyhledané informace se očekává stručné uvedení do
tématiky nebo informace vysoké aktuálnosti. Většinou postačí
běžné internetové vyhledávače (Google, Seznam,...) nebo
některé tématicky zaměřené portály či encyklopedie, které bývají
zpřístupněny zdarma
2. informace odborného rázu
Odborné informace jsou přednostním zdrojem pro čerpání při
studiu, tvorbě školních prací nebo ke komerčním účelům v rámci
firmy. Cílovými dokumenty je odborná literatura, výzkumné
-6-
zprávy, příspěvky z konferencí1 nebo jiné specifické informace.
Z nekomerčních zdrojů je vhodné obrátit se např. na službu Google
Scholar nebo na informační systémy komerčních distributorů.
Samotné formulaci dotazu je doporučováno věnovat též určitou
pozornost a nevkládat jednotlivá slova, jak přijdou na mysl. Příliš
široký dotaz vrátí příliš mnoho výsledků, stejně tak příliš úzký
pojem bude mít za následek, že vyhledávač vyhledá příliš málo
dokumentů a není výjimkou, že nebude vyhledán žádný dokument.
Analyticky lze při formulaci postupovat dvěma protichůdnými
strategiemi:
1. Strategie rostoucí perly
Strategie spočívá v definování nejužšího termínu (výsledkem
může být nulový počet nalezených záznamů). Následuje
postupné rozšiřování přidáváním klíčových slov, jejich reformulace
a rozšiřování tématu, dokud nedojde k uspokojení informační
potřeby. Příklad: tématem hledání je „dopad znečištění na stav
sladkovodních ryb v USA“ Prvním krokem mohou být přímo
spojení slov: „dopad znečištění“ AND „sladkovodní ryby“ AND
USA. V případě neuspokojivého výsledku pak lze rozložit zadané
termíny na obecnější pojmy.
2. Strategie osekávání
Nejprve je nutno definovat dotaz zeširoka (ve výsledku vyhledávání
se může objevit nepřeberné množství záznamů). Dalším
postupem je postupné zužování dotazu, které vede k redukci
vyhledaných dokumentů. Příklad: téma vyhledávání: „drogová
závislost mladistvých“ Základní dotaz by mohl být: drogy AND
závislost AND mladiství. Lze pak přidat některé omezující atributy,
které zúží množinu dokumentů např. Přidáním NOT (medicína OR
1 Příspěvky z konferencí vydávané ve sbornících konferencí – často podceňovaný zdroj informací. Konference však často odrážejí aktuální stav
v daném vědním oboru s kumulací článků společného (většinou úzce zaměřeného) tématu.
-7-
lékařství).
Jelikož formulace dotazu závisí na výběru informačního zdroje,
v další kapitole následuje stručný popis některých pokročilejších
možností, jak specifikovat dotaz. Nutno poznamenat, že není
v silách autorů ani v rozsahu publikace zmínit a detailně vysvětlit
všechny možnosti pokročilého hledání v Internetu.
Formulace dotazu
Před samotným zadáním klíčových slov do vyhledávače je nutné
tato klíčová slova důkladně promyslet, jelikož na tomto kroku závisí
uspokojení informačního deficitu nejvíce. Do výběru vstupuje
mnoho aspektů, jejichž výčet se pokaždé liší. Z nejčastějších
problémů však nutno zmínit následující:
• Volba jazyka
Pokud zadáme slova v českém jazyce, nelze očekávat, že budou
nalezeny dokumenty v angličtině. Hledáme-li problém vztahující
se výhradně k ČR (např. zákony), nemá smysl uvádět i cizí klíčová
slova. Pokud jsou požadovány dokumenty ve více jazycích, je
tomu přizpůsobit také klíčová slova – např.: hledáme „výzkum
schizofrenie“...je pravděpodobné, že jsou požadovány dokumenty
v češtině i angličtině...je tedy nutné vyhledat anglické ekvivalenty
k českým klíčovým slovům.
• Terminologie
Doporučuje se před vložením slov promyslet, zda se opravdu
používají v daném typu literatury – často hledáme pojem, pro
který existuje odborný termín. Příklad: hledáme změny nastavení
listů rotoru vrtulníku. – zde je největším problémem vrtulník.
Pokud terminologie používá více termínů (helikoptéra), je dobré
použít všechna slova v kombinaci. Před hledáním je dobré se
nad možnostmi zahrnutí synonymních slov důkladně zamyslet,
-8-
jelikož každý je vybaven jinou slovní zásobou, kterou odráží
v dokumentech, které vytváří.
Příklad: hledání informací o získávání informací o konkurenčních
podnicích. Častý problém, kdy dochází k vyhledávání pojmů, pro
které je definována přesná uznávaná terminologie. V tomto případě
je to např. business intelligence nebo competitive intelligence.
Nebude-li použito těchto termínů, bude značně snížena relevance
nalezených dokumentů.
Pozor při překladu termínů! Často nelze překládat termíny
doslovně – ‚competitive intelligence‘ není v češtině definováno
jako ‚konkurenční zpravodajství‘…je dobré odbornou terminologii
vyhledat....zároveň je nutné podotknout, že se vyskytují také
rozdíly mezi anglickou a americkou angličtinou (například ‚lorry‘
a ‚truck‘) nebo rozdíl mezi názvoslovím stejného pojmu z pohledu
různých profesí.
• Google
Jedná se o nejpopulárnější internetový vyhledávač současnosti.
Díky sofistikovaným algoritmům vyhledávání poskytuje poměrně
přesné výsledky. Zahrnuje extrémně široké spektrum indexovaných
dokumentů mnoha formátů bez ohledu na geografické, jazykové
nebo tématické omezení, nabízí české rozhraní a zobrazuje
výsledky v reálném čase.
Jelikož je Google trendem a znamená jakýsi monopol pro
vyhledávání, většina lidí jej hojně využívá a domnívá se, že umí
s tímto mocným vyhledávačem pracovat. Nejčastějším způsobem
vyhledávání je zadání několika klíčových slov, což patří do
základních nástrojů google. Výsledkem pak je často až několik
desítek tisíc (nezřídka se Google pohybuje i v řádech milionů)
nalezených odkazů, z nichž jsou v drtivé většině vybrány záznamy
v pořadí do pátého místa. Další odkazy jsou často ignorovány,
jelikož jejich relevance je oproti prvním odkazům považována
za mizivou. Proto následuje výčet a vysvětlení některých
nejdůležitějších operátorů, kterými lze hledání obohatit a zpřesnit
-9-
tak výsledek hledání. Optimalizovat tak vyhledávání v Googlu
nikoli pro vyhledání relevantních dokumentů v očích vyhledávače,
ale v očích lidské bytosti, která informaci hledá.
Nutno podotknout, že každý internetový vyhledávač se od ostatních
liší možnostmi vyhledávání a podporou operátorů.
- 10 -
Základní booleovské operátory
B
ooleovské operátory jsou hojně využívaným základním
nástrojem v mnoha vyhledávačích a většině databází. Dovolují
definovat vztahy mezi slovy a zpřesnit výsledek hledání. Jejich
pochopení je stěžejní pro efektivní vyhledávání na Internetu.
A AND B2
Vyhledání dokumentů obsahujících slova A a současně B
• Při zadání dotazu obsahujícího slova „A B“ vyhledávač sám
vyhodnocuje dotaz dle svých algoritmů a zobrazí výsledky
obsahující A, B, nebo A a zároveň B. Dochází tak k samovolnému
snížení přesnosti výsledku
• Je-li zadáno A AND B, vyhledávač následně nezobrazí výsledky,
které by obsahovaly pouze jedno z požadovaných slov
• Pozor: některé vyhledávače (včetně Google) operátor AND
používají automaticky, dojde li k vepsání více slov bez udání jiného
vzájemného vztahu
• Příkladem může posloužit následující: Hledání informací
o krevním tlaku. Byla zvolena klíčová slova ‚krevní‘ a
‚tlak‘. Níže je zobrazeno porovnání, jak dramaticky se
sníží počet vyhledaných dokumentů při použití operátorů.
Graficky lze funkci operátoru AND zobrazit jako průnik množin:
2 A, B – obecné označení, které lze v praxi zaměnit libovolným vyhledávaným slovem.
- 11 -
A OR B
Vyhledání dokumentů obsahujících alespoň slovo A nebo B
• Do zobrazených dokumentů zahrnuje i takové, které obsahují
oba termíny zároveň
• Pozor: dochází ke zvýšení počtu nalezených dokumentů
• dobré využívat například u podobných slov vyjadřujících stejný
pojem, např.: helikoptéra OR vrtulník
Graficky si můžeme operátor OR představit následovně:
- 12 -
A NOT B
Vyhledání dokumentů obsahujících slovo A a zároveň bez výskytu
slova B.
Opět pro představu grafické znázornění:
- 13 -
A XOR B
Vyhledání dokumentů obsahujících pouze slovo A nebo pouze B
• většina současných internetových vyhledávačů nepodporuje
tento příkaz – některé databáze však stále užívají operátor XOR.
• problémem je, že internetové vyhledávače mají své algoritmy,
na základě kterých posuzují požadavky uživatele. Pokud je
zadáno více slov a bez doplnění jejich vzájemných vazeb, pak
může dojít k tomu, že vyhledávač bude vazby dle svého v průběhu
vyhledávání měnit.
- 14 -
Proximitní booleovské
operátory
L
ze je využívat ke zpřesnění nebo zobecnění jednotlivých hledaných výrazů.
* (hvězdička)
Lze použít v případě hledání určité fráze.
• Pozor: Dojde ke zvýšení počtu nalezených dokumentů
• Příklad: Hledáme sousloví, přičemž víme, že jsou mezi
vyhledávaná slova občas vkládané i jiné pojmy nebo znaky
– např.: ‚Winston Churchill‘ – víme, že američané často
přijímají dvě křestní jména, proto: ‚Winston * Churchill‘
• Poznámka: operátor * lze používat i při vyhledávání v databázových
systémech. Je však nutné brát v potaz, že funkce tohoto znaku se
často liší. Někdy bývá zaměňován význam tohoto symbolu – často
je symbol hvězdičky používán pro náhradu libovolného počtu
písmen ve slově. Kromě operátoru * jsou ještě v databázích
používány operátory $ nebo ?. Jejich význam se často liší, proto
je doporučujeme se na dané operátory zaměřit v bázích, kde
vyhledávátě. Jelikož se v různých bázích a vyhledávačích tyto
- 15 -
symboly často liší, není v možnostech této brožury věnovat jim
dostatečný prostor a pravděpodobně nelze sepsat výčet odlišností
ve všech vyhledávačích.
”” (uvozovky)
Hledání přesné fráze.
• Pokud si je uživatel jistý přesnou frází, lze pak využít přesnějšího
vyhledávání. V případě, že fráze není uvedena v závorkách,
vyhledávač hledá výskyt všech slov v dokumentu nezávisle na
jejich vzájemné pozici v dokumentu. Uvedením fráze do závorek
vyhledávač značně zúží počet vyhledaných dokumentů. Slova ve
vyhledaných dokumentech se budou nacházet v zadaném pořadí.
• Pozn:. Počet dokumentů byl zredukován na cca. 1/5, ale stále
jich je tolik, že není možné je všechny projít. Hlavní změnou však
je, že jsme odfiltrovali dokumenty, kde se daná slova nevyskytují
v zadaném pořadí.
- 16 -
Speciální operátory pro využití
v Google
K
upřesnění požadavku lze využít také dalších operátorů, které
Google podporuje. Jejich aplikace je nesmírně výhodná –
umožňují upřesnit, ve které části má Google hledat, nebo jaký
typ souboru je požadován. Při správném použití těchto operátorů
dochází k výraznému snížení počtu a zvýšení relevance nalezených
dokumentů. Níže následují některé nejdůležitější z nich společně
s doplněným vysvětlením:
intitle:A
Výraz A se vyskytuje v názvu.
• pokud se hledaný výraz nevyskytuje v názvu dokumentu,
nebude zahrnut ve výsledku vyhledávání.
V následujících třech obrázcích je zobrazena kombinace operátoru
intitle: s uvedením fráze do závorky. Obrázky zobrazují rapidní
úbytek nalezených dokumentů:
Pozn.: Tím, že jsme zadali slova bez vyznačeného vztahu, nalezl
Gogole slova bez ohledu na jejich relativní nebo vzájemné umístění
v dokumentu. Pro nás je však důležité mít slova pohromadě, jelikož
se jedná o neměnný název.
- 17 -
Pozn.: Uvedením slov ve frázi byl jednoznačně definován těsný
vztah slov a jejich vzájemné pořadí. Byly tak eliminovány veškeré
dokumenty s jiným výskytem těchto slov.
Pozn.: Definicí intitle: byl výběr dokumentů zúžen na takové, kde
se požadovaná fráze vyskytuje pouze v některém z nadpisů.3
filetype:A
Hledání dokumentu ve formátu A
• Výhodné hledání, pokud uživatel hledá například prezentaci –
jednoduše odfiltruje všechny soubory jiného formátu zabývající se
daným tématem
• Většina nalezených dokumentů v prostředí Internetu bývá
s příponou html (jedná se o statické webové stránky4).
• Poznámka: Odborná literatura, oficiální dokumenty však bývají
často publikovány ve formátu pdf.5
3 Webové stránky bývají často rozděleny na několik rámců – proto se
může v jedné stránce vyskytovat více nadpisů.
4 Statické stránky se nemění. Oproti tomu formát PHP je formátem dat,
která jsou v Internetu často generována virtuálně a zobrazené stránky fyzicky
nejsou nikde uložené – např. výsledek hledání v Google.
5 Důvodem, proč se oficiální dokumenty a odborné články nacházejí
v PDF je akceptování formátu mnoha institucemi a jeho praktičnost, jelikož se
jedná o formát dokumentu připravený k tisku.
- 18 -
• Využijeme-li předchozího příkladu, lze ještě snížit počet
nalezených dokumentů, pokud zvolíme typ vyhledávaného
dokumentu – např.: pdf
Pozn.: Operátor intitle: byl popsán v předchozím příkladu. Definicí
dokumentu PDF byly z hledání vyloučeny všechny dokumenty
v jakémkoliv jiném formátu.
define:A
Vyhledá a zobrazí definici termínu A nebo zprostředkuje odkazy na
stránky, kde lze definici nalézt. Definice nedoporučujeme využívat
v oficiálních nebo školních dokumentech. Poskytují spíše rychlou
orientaci v problematice často s různými pohledy na věc.
- 19 -
link:A
Hledání stránek, které odkazují na dokumenty, jejichž internetová
adresa nebo název odkazu obsahují A
Například: Zajímám se o problematiku data miningu a hledám
literaturu. Na webu KDNuggets jsem nalezl doporučenou literaturu
ke studiu tématu (http://www.kdnuggets.com/publications/books.
html), hledám jiné stránky, které odkazují právě sem, jelikož
očekávám pokrytí stejné tématické výseče.
inanchor:A
Obdoda předchozího operátoru. Vyhledá dokumenty, kde se
nacházejí odkazy, jejichž adresa obsahuje A
site:A
Hledání dokumentů, které se nacházejí na stránkách A
• v případě hledání dokumentu, který se nachází na určitých
webových stránkách možno využít toho to operátoru pro zpřesnění
hledání.
• Příklad: Hledám stránku, na kterou jsem již někde narazil
a vím, na kterém portálu, jen nemohu najít cestu k souboru –
pamatuji si však nějakou frázi či slovní spojení, dle kterého hledat.
- 20 -
Převod měn
Pokud potřebujeme rychle přepočítat ceny z jedné měny do jiné,
jednoduše postačí vepsat do vyhledávacího řádku podle vzoru
příkladu:
Jednoduché počty
Nač složitě hledat kalkulačku, když potřebujete spočítat jednoduché
matematické operace. Jelikož většina lidí má při práci k dispozici
připojení k Internetu nebo přímo otevřené okno prohlížeče,
posloužit může opět Google:
- 21 -
Je dobré závěrem této kapitoly poznamenat, že použití jednotlivých
operátorů lze v jednom vyhledávacím dotazu kombinovat.
- 22 -
Sociální sítě
S
ociální sítě jsou jedním ze současných trendů moderní
elektronické
komunikace.
Opomeneme-li
samotnou
komunikaci, hlavním účelem existence sociálních sítí je sdílení.
V této publikaci se zaměříme především na sdílení znalostí.
Sociální sítě na Internetu v poslední době rostou v mnoha
podobách jako houby po dešti a není velký problém najít např.
fórum zaměřené na téma našeho problému. Komunita lidí
zaměřených na danou tématiku často navštěvuje fóra, aby sdílela
a řešila problémy, na které lidé narážejí. Výhoda spočívá v přímém
kontaktu a možnosti diskutovat konkrétní problémy se skupinou
zainteresovaných lidí. Často tak lze vyřešit problémy, o kterých se
v běžné odborné literatuře často nedočteme. (Informační chování
ve věku online komunikace, Papík).
Negativem sociálních sítí je však důvěryhodnost informací. Málo
dy se podaří dopátrat se citace zdroje, ze které byla informace
čerpána. Pokud například píšeme absolventskou práci, nebývají
citace fór příliš důvěryhodné.
Příklad: Kupuji počítač, je nevím, zda podporuje operační systém
založený na bázi Linux. Neznáme-li fórum, můžeme k hledání
použít tématických portálů nebo internetových vyhledávačů.
Použil jsem tedy Google.
Jak je vidět na výřezu, hned první odkaz nabízí komunitní fórum,
- 23 -
kde mohu hledat podobná témata, nebo přímo vznést vlastní
dotaz. Je však nutné brát v potaz zmíněná fakta – informace jsou
často aktuální, avšak jejich pravost nelze ověřit.
- 24 -
Komerční databáze
K
omerční databáze nabízejí většinou dokumenty s nejvyšším
stupněm odbornosti a důvěryhodnosti. Dostatek financí
zprostředkovává databázovým centrům možnost nakupovat
dokumenty (volně dostupné zdroje na Internetu nejsou zveřejňované
za účelem zisku). Tím, že jsou dokumenty zprostředkované za
úplatu, dochází k jejich selekci ze strany databázového centra.
Po zaplacení nemalé částky získáme přístup do databáze,
producenti bází také zpravidla nabízejí větší servis, např. vyšší
komfort vyhledávání, k čemuž se dostaneme.
Pro běžného studenta nebo odbornou veřejnost většinou nemá
smysl platit členství v komerčních databázových centrech. Zde
je však nutné zmínit fakt, že existují instituce, které platí ročně
podstatné částky za zpřístupnění veřejnosti. V následujících
řádcích jsou uvedeny instituce a jejich nabídka konsorciálního
přístupu ke komerčním databázím6. Na tomto místě považujeme za
nutnost sdělit čtenáři této publikaci, že povaha (především kvalita a
uspořádání) informací v komerčních databázích se značně liší od
informací běžně dostupných na Internetu. Studium vysoké školy
nebo členství v knihovně poskytuje člověku nesmírné možnosti,
které „běžnému smrtelníkovi“ zůstávají skryty, ba většina lidí neví,
že komerční databáze existují a přístup k nim není nemožný. Proto
vřele doporučujeme jejich využívání.
Tématické zaměření databází je různé a často se překrývá.
V rámci rozsahu této brožury není možné popisovat jednotlivé
báze dat. Proto je níže uveden pouze výčet hlavních možností, jak
se k bázím dat dostat a do jaké tématické oblasti zasahují.
6 Konsorciáln ípřístup = Paušálně předplacený přístup do databází pro
určitou instituci a její klienty a zaměstnance.
- 25 -
Městská knihovna v Praze
Městská knihovna nabízí čtenářům volný přístup do některých
komerčních databází. Tematický výběr není úzce specifikován –
jedná se především o globálně zaměřené báze.
Možnosti přístupu
Kde: http://www.mlp.cz/databaze2.htm
Odkud:
odkudkoliv
Podmínky přístupu: platný čtenářský průkaz (členství: 60,-
Kč ročně)
Databázy
zaměření
EBSCO
ekonomika,
management, finance,
účetnictví, obchod,
kultura, sociální vědy,
pedagogika
ProQuest5000
humanitní a
společenské obory,
obchod, ekonomika,
management, medicína,
aplikované přírodní
vědy, výpočetní a
telekomunikační technika
ekonomika, obchod,
výkladové
informatika, historie,
slovníky,
právo, věda,…
dějové linie,
životopisy
všeobecné
výkladový
slovník
Oxford Reference
Online
Co to je?
- 26 -
typy
dokumentů
články a
monografie,
disertační
práce,
sborníky
konferencí
články a
monografie,
disertační
práce,
sborníky
konferencí
Oxford Art Online
umění
Oxford Music
Online
hudba
Film Index
International
FIAF Plus
AFI Catalog
film
film
film (USA 1893-1971 a
2000-2008)
výkladový
slovník, učební
texty, dějové
linie, životopisy
výkladový
slovník, učební
texty, dějové
linie, životopisy
databáze filmů
a herců
články
obsahy a
náměty filmů
Národní technická knihovna
Díky zaměření na technickou literaturu je i tematický výběr databází
zacílen na komunitu odborníků a odbornou veřejnost.
Možnosti přístupu
Kde: http://www.techlib.cz/cs/katalogy-a-
databaze/elektronicke-zdroje/
Odkud:
odkudkoliv Podmínky přístupu: Databázy
ANL Full
platný čtenářský průkaz
zaměření
typy dokumentů
ekonomika, obchod,
články z novin v
humanitní vědy,
ČR
společenské vědy,
matematika, technika,…
- 27 -
Anopress IT
všeobecné
Directory of
Open Access
Journals
EBSCO
Všeobecné
EMERALD
Co to je?
ekonomika,
management, finance,
účetnictví, obchod,
kultura, sociální vědy,
pedagogika
ekonomika,
management,
informační věda,
management,…
všeobecné
články z českého
tisku, záznamy
pořadů rozhlasu
a televize,
encyklopedické
informace
články z volně
přístupných
periodik
články a
monografie,
disertační
práce, sborníky
konferencí
články, monografie
výkladový slovník
IEEE Computer
Digital library
elektronika, elektronické články, monografie
inženýrství, výpočetní
technika
IOP Institute of
Physics
fyzika
články, monografie
Knovel
přírodní a technické
vědy, matematika
faktografické
informace
OCLC
FirstSearch3
Všeobecné
ScienceDirect
přírodní vědy, technika,
medicína
vyhledávání
fyzických
dokumentů
články, monografie
- 28 -
SpringerLink
InterScience
přírodní vědy, technika,
humanitní vědy, právo,
informatika, informační
technologie
věda, technika,
medicína, chemie,
počítačová věda,
vzdělání, právo,
statistika, společenské
vědy,…
články, monografie
články, monografie
Vysoká škola ekonomická v Praze
Vysoká škola ekonomická zprostředkovává svým studentům a
zaměstnancům přístup k mnoha kvalitním databázím, které jsou
více či méně zaměřené na témata, která jsou na zmíněné instituci
přednášena. Jejich výčet zde však neuvádíme, jelikož škola
poskytuje službu 360 Search, která umožňuje vyhledávání ve všech
dostupných databázích zároveň. Nemusíme se pak tedy zaobírat
výběrem báze. Navíc škola také poskytuje poměrně rozsáhlý a
podrobný návod, jak zmíněnou službu využívat. Z tohoto důvodu
zde uvádíme pouze odkaz na stránky, kde lze nalézt tuto službu:
http://www.vse.cz/zdroje/. 7
7 Pro možnost vyhledávání v bázích VŠE je nutno stáhnout bezpečnostní certifikát školy a být studentem nebo zaměstnancem školy.
- 29 -
Vyhledávání v databázích
A
čkoliv se databáze na první pohled mohou velice lišit, základní
prvky jsou si i přes grafické a některé funkční odlišnosti
podobné. Pro laické uživatele je často novinkou existence
klíčových slov a deskriptorů, které můžeme v komerčních bázích
často použít.
Internetové vyhledávače umožňují vyhledávat pouze v plném textu
a jak jsme si ukázali v předchozích kapitolách, lze naše hledání
modifikovat, aby byla prohledávána jen určitá pole.
Komerční databáze většinou umožňují při vyhledávání specifikovat
mnohem více parametrů.
Klíčová slova
Tento pojem se často používá v souvislosti se slovy zadávanými při
vyhledávání v běžných internetových vyhledávačích. V prostředí
vyhledávání v databázích mají klíčová slova význam tématického
popisu dokumentu. Vyhledávání v klíčových slovech je tedy
přesnější než-li vyhledávání v plném textu.
Příklad: Pokud zadáme dotaz ‚blood pressure‘, pak vyhledávač
najde dokumenty, které kdekoliv obsahují tato dvě slova – jak už
víme z předchozích kapitol, tím, že je neuvedu jako frázi, bude
nalezen každý dokument, ve kterém se obě slova vyskytují nehledě
na jejich vzájemné umístění. Tématická relevance dokumentu je
tedy téměř nulová. Uvedením slov jako fráze zvýším relevanci
a snížím počet dokumentů. Pokud však budu vyhledávat frázi
v klíčových slovech, mohu si být jistý, že nalezené dokumenty
budou o zadaném tématu pojednávat.
Pozor: zadání slov do vyhledávacího políčka v databázovém
centru ještě nemusí znamenat vyhledávání v klíčových slovech
- 30 -
– je nutné klíčová slova většinou zadat do speciálního pole
často označovaného Keywords. Zadáme-li slova do základního
vyhledávacího políčka, bude vyhledávač provádět hledání ve
všech polích a výsledek bude zkreslený.
Deskriptory
Stejně jako klíčová slova deskriptory vyjadřují tématické
zaměření dokumentu. Rozdílem je však, že deskriptory jsou
voleny podle řízeného slovníku (tezauru)8. Tezaurus lze najít přímo
přes vyhledávací rozhraní databázového centra, je-li databází
podporován.
Tezaurus však můžeme použít i při práci v běžných
internetových vyhledávačích. Při formulování dotazu lze využít
tezauru k upřesnění termínů nebo ke zjištění jiných termínů
používaných pro dané pojmy a všeobecně uznaných v dané
oblasti.
Další tipy
V případě, že jste otevřeni novým technologiím a postupům
(pokud jste otevřeli tuto brožuru, pak o tom není pochyb), uvádíme
níže některé současné trendy a novinky, které mohou člověku
pomoci při orientaci v informacích a hledání správných informací.
Wolfram
Wolfram je projektem společnosti Microsoft původně zamýšlený
snad proti Gogolu jako pověstný David proti Goliášovi. Po uvedení
8 Tezaury, tzv. řízené slovníky, jsou vytvářené autoritami (odborné instituce, knihovny, vědecká centra). Ve slovnících jsou jasně formulované definice
termínů, jednoznačně vyjádřená hierarchie a provázanost termínů.
- 31 -
do provozu a zpřístupnění veřejnosti se však ukázalo, že Wolfram
nabízí diametrálně odlišnou službu – faktografické vyhledávání.
Tento vyhledávač neslouží k vyhledávání dokumentů, ale je
primárně zaměřen na zodpovídání matematických, statistických
technických aj. dat. Možností je mnoho. Hledáte základní informace
o životě některé osobnosti? Zadejte její jméno. Hledáte informace
o nějaké instituci? Zkuste zadat její jméno. Potřebujete vypočítat
matematickou rovnici a nakreslit graf? Podívejte se na Wolfram.
Negativem se může zdát sofistikovaná pravidla zadávání příkazů.
Na druhou stranu zde však existuje pomocná stránka s příklady
rozdělenými tématicky. Každý příklad je vysvětlený.
Zmíněný portál lze nalézt na následující adrese: http://www.
wolframalpha.com
Stránka nabízející témata příkladů se nalézá na: http://www.wolframalpha.com/examples
Absolventské práce studentů vysokých škol
Ačkoliv se nejedná o původní elektronický zdroj informací,
zmiňujeme tuto možnost, jelikož je mnoha lidmi často opomíjena.
Každým rokem končí své studium na vysoké škole tisíce studentů
bakalářskou nebo diplomovou prací. Tyto práce mohou být
zajímavým zdrojem, hledáme-li v rovině odborných informací.
Dalším pozitivem je často jejich srozumitelnost odborné veřejnosti
a dodržování etiky citovaných zdrojů.9
Výhodou absolventských prací je, že podle zákona musí být každá
práce minimálně 5 let archivována v knihovně příslušné vzdělávací
instituce. Proto vřele doporučujeme využít i hledání v knihovnách
vysokých škol, které mají často zpřístupněn katalog online. Pozor:
absolventské práce studentů jsou půjčovány pouze prezenčně!
9 V případě, kdy chceme dohledat literaturu, ze které autor čerpal, je
seznam citované literatury jediným vodítkem. Nehledě na fakt, že citovaná literatura bývá stejného tématického zaměření a může nám zprostředkovat další
informace a rozšíření povědomí o dané tématice.
- 32 -
INTUTE
Portál Intute je iniciativou sedmi univerzit ve Velké Británii
zprostředkující veřejnosti učební materiály, tutotiály a testy v
mnoha oborech lidského vědění. Vyhledávání na serveru je
členěnovelice přehledně a úroveň materiálů je na vysoké úrovni.
Jak se k takovému zdroji dostat? Je to velice jednoduché, na
domovské stránce (http://intute.ac.uk) je třeba se nejprve zdarma
zaregistrovat a přístup do ‘studnice moudrosti’ je váš.
- 33 -
Závěrečné shrnutí
I
nternet není centrálním mozkem lidstva, jako je tomu v televizním
seriálu Návštěvníci – proto nespoléhejte pouze na informace
uvedené na webu.
Promyslete hledání před samotným zadáním dotazu; položte si
pár otázek:
• Jaké informace hledám?
Podle toho volte, zda hledání provedete například v Googlu, na
nějakém fóru nebo v některé z komerčních databází.
• Jaké je téma hledaných informací?
Kde přesně budu hledat – jakou databázi použiji, aby vyhovovala
tématickým (popř. i jiným) požadavkům.
• Jak budu formulovat dotaz?
Jaká vybrat klíčová slova, zamyslet se nad problematikou
terminologie, vzájemné uspořádání slov. Podle toho, kde budu
vyhledávat, jaké mohu použít operátory nebo způsoby vyhledávání.
• Pro základní orientaci v tématu je dobré využít základní
vyhledávače, informační portály, mezi které patří například
Wikipedia.
• Při vyhledávání využívejte pozitiva zpětné vazby – pokud jste
nespokojeni s výsledkem vyhledávání, přeformulujte dotaz.
• Nezapomeňte, že přes kvantitu dat, které Internet nabízí, je pro
nás čím dál významnější jejich kvalita.
- 34 -
Citované informační zdroje
1.
Gogole [online]. c2009 [cit. 2009-10-23]. Dostupný z www:
<http://www.google.com>.
2.
HARTER, S. P.; PETERS, A. R. Online information retrieval:
Cocepts, Principles and Techniques. Florida (USA),
Academic Press, Inc.: 1986. 259p. ISBN 0123284554.
3.
Internetové databáze se vzdáleným přístupem [online].
Praha : Městská knihovna v Praze, [1998-], 29.6.2009
[cit. 2009-11-01]. Dostupný z www: <http://www.mlp.cz/
databaze2.htm/>.
4.
Intute: Helping you find the best websites for study and
research [online]. The Intute Consortium, c2006-2009. [cit.
2009-11-12]. Dostupný z www: <http://intute.ac.uk>.
5.
LONG, Johny. Google Hacking: for Penetration Testers
(Volume 2). Burlington (USA), Syngress Publishing, Inc:
2008, 526p. ISBN 978-1-59749-176-1.
6.
PAPÍK, Richard. Rešeršní strategie. (přednáška) Praha :
Univerzita Karlova v Praze, 2009.
7.
Seznam: najdu tam, co neznám [online]. c 2006-2009 [cit.
2009-10-23]. Dostupný z www: <http://www.seznam.cz>.
8.
PAPÍK, R.; PAPÍKOVÁ, V. Informační chování ve věku
online komunikace. In INFOS 2007 : Knižnice – piliere
vedomostnej spoločnosti : prínos pamäťových inštitúcií
k budovaniu vedomostnej spoločnosti : 34. medzinárodné
informatické sympózium, 16.-19. apríla 2007, Stará Lesná,
Slovenská republika [CD-ROM]. Bratislava : Spolok
slovenských knihovníkov, Albertina icome Bratislava, 2007.
ISBN 978-80-969674-0-7. Dostupný z WWW: <http://www.
infolib.sk/index/open_file.php?file=INFOS2007/Papik_
Richard_1.pdf>.
9.
Seznam elektronických zdrojů [online]. Praha : Národní
- 35 -
technická knihovna v Praze, 26.11.2009 [cit. 2009-11-26].
Dostupný z www: <http://www.techlib.cz/cs/katalogy-adatabaze/elektronicke-zdroje/>.
10.
- 36 -
WolframAlpha: computational knowledge engine [online].
A Wolfram Research Company, c2009. [cit. 2009-11-01].
Dostupný z www: <http://www.wolframalpha.com>.

Podobné dokumenty

Nakama jeden sešit

Nakama jeden sešit Další zdroje informací k maturitní zkoušce nejen z českého jazyka a literatury Chcete-li získat aktuální, důležité a hlavně oficiální informace o maturitní zkoušce ve školním roce 2013/2014, navšti...

Více

Lotus Notes 7.indd

Lotus Notes 7.indd navíc možnost automatického zpracování, která zajišťuje začlenění pozvánek do vašeho kalendáře i v případě, že dojde k časovému konfliktu. Později si můžete prohlédnout svůj kalendář a poznačit si, ...

Více

8. Systémy pro dobývání znalostí z databází

8. Systémy pro dobývání znalostí z databází 8. Systémy pro dobývání znalostí z databází Jako v jiných oblastech umělé inteligence, tak i v oblasti strojového učení se první programové systémy objevily v akademické sféře. Obvykle se jednalo o...

Více

Google pro pokročilé

Google pro pokročilé potřebovali příslušný program. Tento odkaz může sloužit i pro rychlý náhled na dokument bez nutnosti jej stahovat v originálním formátu. Vyhledávané termíny jsou v tomto případě v zobrazeném dokume...

Více

Elektronické zdroje informací_na web_05_2014

Elektronické zdroje informací_na web_05_2014 - partnerství významných výzkumných institucí a knihoven (zhruba 60 subjektů z celého světa) spolupracujících na zajištění dlouhodobého uchovávání a zpřístupňování kulturních záznamů. Digitální kni...

Více

Navigátor: Průvodce didaktikou cizích jazyků

Navigátor: Průvodce didaktikou cizích jazyků spolupráci učitelů cizích jazyků na všech úrovních vzdělávání). Jedním z úkolů Metodických poradenských center, která vznikla při řešitelských pracovištích tohoto projektu, je zdůraznění souvislost...

Více

digitální knihovny ve vědě a výzkumu

digitální knihovny ve vědě a výzkumu dlouhodobé archivace a ochrany digitálních materiálů (model OAIS). Praktická část předmětu zahrnuje přehled vybraných systémů digitálních knihoven nebo digitálních archivů, obsah jejich digitálních...

Více

Vysoká škola uměleckoprůmyslová v Praze Katedra dějin umění a

Vysoká škola uměleckoprůmyslová v Praze Katedra dějin umění a stresu, přesycení nebo téţ urban spamu je znepřehledněna neukotveností pojmů, a tedy i nejasného vymezení. Všechny výše zmíněné pojmy odkazují ke stejné tematice, kaţdý z nich však zdůrazňuje odliš...

Více