skenování

Transkript

skenování
SKENER
ZÁKLAD
Teoretický úvod:
- skener umožňuje získání digitálního výstupu
z papírové předlohy, případně diapozitivu či
filmu (lze to provést i digitálním
fotoaparátem, kvalita však bývá horší)
- použití:
o archivace starých dokumentů
o prezentace prostřednictvím
dataprojektoru (výuka, přednáška)
o tvorba webových stránek
o vkládání obrázků do textových
souborů
o apod.
- získat text, který by se dal zpracovat
v textovém editoru je možné pomocí OCR –
ale výstup může mít chyby
- skenery jsou samostatná zařízení nebo
součástí tiskárny, případně kopírky
Jak skener pracuje:
- nasvítí předlohu
- světlo projde sklem a odrazí se od předlohy - světlá plocha odrazí světlo více, tmavá
méně
- odražené světlo je pomocí zrcadel dopraveno do snímače – převede světlo na elektrický
proud a následně se ve snímači vytvoří digitální obraz
Postup:
- předlohu dát do skeneru
- spustit program
- podívat se na náhled
- vybrat oblast, kterou chceme skenovat (často se zbytečně skenuje místo malého obrázku
přednastavená A4 a trvá to dlouho)
- volba parametrů
o jednoduché rozhraní (pro běžného uživatele), pokročilejší rozhraní, když už tomu
trochu rozumíte
o barva nebo černobílý dokument
o rozlišení 75 – 600 DPI, to má vliv na kvalitu, objem dat, rychlost skenování
 DPI = počet bodů na palec (2,54 cm) - jak kvalitně chceme předlohu
snímat
 je důležité si promyslet, pro jaký účel je výstup určen, jinou kvalitu volíme
pro běžné prohlížení na monitoru a jinou pro tisk
 email 75 dpi
 tisk na tiskárně: 300 dpi
 umístění na WWW: 75 dpi
 OCR: 200 - 300 dpi (rozpoznávání textu)
 monitor má kolem100 bodů na palec, takže pokud skenujete pro
výstup na monitor, je zbytečné skenovat nad 150 dpi
- samotné skenování (může být časově náročné)
- prohlédnutí výsledku
-
případné úpravy (i v jakémkoli jiném programu – např. XnView)
uložení do svého adresáře
Pokud chceme dále upravovat skenovaný text:
- při skenování vybereme defaultní volbu OCR
- výsledný obrázek převedeme pomocí OCR softwaru – výsledek velmi závislý na kvalitě
předlohy – klasická A4 dopadne dobře, ale při obrázcích, textu ve sloupcích, atd. je to již
horší
Vysvětlivka: OCR neboli optické rozpoznávání znaků (z anglického Optical Character
Recognition) je metoda, která pomocí skeneru umožňuje digitalizaci tištěných textů, s nimiž pak
lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď
automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti
na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nerozezná
všechna písmena správně.
Na co si také dát pozor:
- udržujte čisté sklo, skleněná deska, na kterou se pokládá předloha, se lehce zašpiní a tyto
nečistoty či mastné otisky se mohou objevovat v naskenovaném obraze
- k čištění skla používejte jemné a nechlupaté hadříky, abyste sklo nepoškrábali a nezůstaly
na něm chloupky.
- zkontrolujte předlohu, před vlastním skenováním důkladně prohlédněte předlohu a v
rámci možností ji očistěte a narovnejte
- vložte do skeneru předlohu přesně
- vybírejte zdařilé a ostré obrázky, ke skenování se hodí pouze kvalitní snímky, jinak je s
nimi hodně práce a výsledek nemusí být vždy uspokojivý
Zajímavost: první fotografie byla naskenována do počítače již v roce 1957 v USA
ROZŠÍŘENÍ
-
-
dnešní skenery jsou většinou dobré skoro všechny, není třeba hledat nějakého
konkrétního výrobce
nejpoužívanějšími jsou deskové ploché stolní formátu A4 a A3, kde pod skleněnou
deskou se pohybuje snímač
skenery dnes mají velké rozlišení 600 dpi přesto není většinou potřeba skenovat na vyšší
rozlišení než 300 dpi, jednak proto, že většina tiskáren (alespoň donedávna větší rozlišení
stejně nedovedla vytisknout), ale také protože vyšší rozlišení je prostě zbytečné (knihy se
tisknou při rozlišení 300 dpi)
při nižším rozlišení než 300 dpi již zřejmě poznáte zhoršení kvality
SKENOVÁNÍ PRO TISK ČERNOBÍLÝCH DOKUMENTŮ
- černobílé dokumenty skenujeme ve stupních šedi
- skenujeme nejlépe do formátu PNG, který je bezztrátový a nerozostřuje text, naopak
formát JPG je sice úspornější ale text rozostřuje (když ale skener neumí PNG, tak i JPG
je použitelný)
- skenovací programy většinou dostanete se skenerem, nejsou ovšem tak kvalitní jako
software placený, který již umožňuje pokročilejší funkce např. tzv. křivky (pomocí
kterých můžeme ovlivňovat jas v různě temných místech dokumentu), nebo tzv.
histogram (ořežou se místa bílá i tmavá a ve výsledku je tedy pozadí čistě bílé a text
tmavší)
- i software dodávány se scannerem umí nastavit jas a kontrast, což nám umožní nastavit
skener tak, aby naskenovaná strana nebyla příliš tmavá nebo příliš světlá
-
naskenované obrázky může „vyčistit“ libovolný grafický editor, který pracuje s tzv.
histogramem a umožňuje upravovat jeho krajní hodnoty (např. XnView):
o posunutím těchto krajních hodnot, někdy také nazývaných černý a bílý bod
odstraňujete z naskenované stránky zbytečné informace
o posunem bílého bodu čistíte bílé plochy a odstraňujete slabší odstíny šedé barvy =
a odstraňujete tím tedy i nečistoty, nedokonalosti atd. (nesmíte to samozřejmě
přehnat, jinak ztratíte kresbu.)
o přidáváním hodnoty černého bodu ztmavujete písmo, text a kresbu (ani zde to
nesmíte přehnat, jinak vám ztmavnou i místa, která nechcete)
o vyzkoušejte tyto hodnoty: černý bod: 140 a bílý bod:200 (dle naskenované
předlohy se ale mohou lišit)
o
-
-
není to vždy nutné, ale pokud například naskenujete stránku nějaké knihy nebo jiného materiálu s
vazbou, tak uprostřed vám většina skeneru zanechá černý pruh. Ten je dobré smazat. V ideálním
případě je samozřejmě, když při skenování vůbec nevznikne a je tedy dobré předlohu dostatečně
ke skenovacímu “sklu” přitisknout. Po úpravě úrovní se černý pruh (pokud byla skenována kniha
či předloha s hřbetem) zmenší, nyní je tedy záhodno odstranit jeho zbytky. Případně můžete
vyčistit okraje a bílé plochy. Pokud je strana menší než skenovaný obraz, můžete ořezat
nadbytečnou volnou plochu. Pouze zabírá místo pro data a text bude při tisku zbytečně menší…
Použitelný je opět i “jednoduchý” program XnView, kdy doporučuji nastavit barvu pozadí na
bílou (Úpravy -> Barva pozadí; v menu XnView) a následně jednoduše označíte tažením myši
oblast a tlačítkem Delete ji smažete (do bíla). Typická může být i kresba skrčeného papíru, která
se naskenuje. Zde ji můžete jednoduše smazat. Nese zbytečné nepotřebné informace, a když
naskenovanou stranu vytisknete, nevypadá příliš dobře.
„vyčištěné“ obrázky můžete nyní vytisknout. Dále je možno obrázky dosud ve stupních
šedi převést pouze do režimu “černá a bílá”, to znamená, že se odstraní všechny polotóny
a velikost souboru se zmenší cca na % (ale kupodivu se také někdy ztuční text, tento krok
tedy nejdříve vyzkoušejte).
příklad: výše uvedeným postupem naskenovaná jedna A4 strana lékařské zprávy měla
v PNG formátu 3 MB, po vyčištění velikost klesla někde kolem 0,8 MB a následným
uložením pouze do “černé a bílé” se velikost zredukovala na 0,3 MB
ZDROJE:
http://cs.wikipedia.org/wiki/Scanner
http://cs.wikipedia.org/wiki/OCR
http://dust.xixao.com/skenovani-dokumentu-jak-skenovat-text/
http://radja.cz/129/jak-skenovat-a-upravit-text-i-do-pdf/
http://www.cbvk.cz/files/regionfce/vzdelavani/skenovani.pdf
http://commons.wikimedia.org/wiki/File:Skener_UMAX_PowerLook_II,_otevřený.JPG