skenování
Transkript
skenování
SKENER ZÁKLAD Teoretický úvod: - skener umožňuje získání digitálního výstupu z papírové předlohy, případně diapozitivu či filmu (lze to provést i digitálním fotoaparátem, kvalita však bývá horší) - použití: o archivace starých dokumentů o prezentace prostřednictvím dataprojektoru (výuka, přednáška) o tvorba webových stránek o vkládání obrázků do textových souborů o apod. - získat text, který by se dal zpracovat v textovém editoru je možné pomocí OCR – ale výstup může mít chyby - skenery jsou samostatná zařízení nebo součástí tiskárny, případně kopírky Jak skener pracuje: - nasvítí předlohu - světlo projde sklem a odrazí se od předlohy - světlá plocha odrazí světlo více, tmavá méně - odražené světlo je pomocí zrcadel dopraveno do snímače – převede světlo na elektrický proud a následně se ve snímači vytvoří digitální obraz Postup: - předlohu dát do skeneru - spustit program - podívat se na náhled - vybrat oblast, kterou chceme skenovat (často se zbytečně skenuje místo malého obrázku přednastavená A4 a trvá to dlouho) - volba parametrů o jednoduché rozhraní (pro běžného uživatele), pokročilejší rozhraní, když už tomu trochu rozumíte o barva nebo černobílý dokument o rozlišení 75 – 600 DPI, to má vliv na kvalitu, objem dat, rychlost skenování DPI = počet bodů na palec (2,54 cm) - jak kvalitně chceme předlohu snímat je důležité si promyslet, pro jaký účel je výstup určen, jinou kvalitu volíme pro běžné prohlížení na monitoru a jinou pro tisk email 75 dpi tisk na tiskárně: 300 dpi umístění na WWW: 75 dpi OCR: 200 - 300 dpi (rozpoznávání textu) monitor má kolem100 bodů na palec, takže pokud skenujete pro výstup na monitor, je zbytečné skenovat nad 150 dpi - samotné skenování (může být časově náročné) - prohlédnutí výsledku - případné úpravy (i v jakémkoli jiném programu – např. XnView) uložení do svého adresáře Pokud chceme dále upravovat skenovaný text: - při skenování vybereme defaultní volbu OCR - výsledný obrázek převedeme pomocí OCR softwaru – výsledek velmi závislý na kvalitě předlohy – klasická A4 dopadne dobře, ale při obrázcích, textu ve sloupcích, atd. je to již horší Vysvětlivka: OCR neboli optické rozpoznávání znaků (z anglického Optical Character Recognition) je metoda, která pomocí skeneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nerozezná všechna písmena správně. Na co si také dát pozor: - udržujte čisté sklo, skleněná deska, na kterou se pokládá předloha, se lehce zašpiní a tyto nečistoty či mastné otisky se mohou objevovat v naskenovaném obraze - k čištění skla používejte jemné a nechlupaté hadříky, abyste sklo nepoškrábali a nezůstaly na něm chloupky. - zkontrolujte předlohu, před vlastním skenováním důkladně prohlédněte předlohu a v rámci možností ji očistěte a narovnejte - vložte do skeneru předlohu přesně - vybírejte zdařilé a ostré obrázky, ke skenování se hodí pouze kvalitní snímky, jinak je s nimi hodně práce a výsledek nemusí být vždy uspokojivý Zajímavost: první fotografie byla naskenována do počítače již v roce 1957 v USA ROZŠÍŘENÍ - - dnešní skenery jsou většinou dobré skoro všechny, není třeba hledat nějakého konkrétního výrobce nejpoužívanějšími jsou deskové ploché stolní formátu A4 a A3, kde pod skleněnou deskou se pohybuje snímač skenery dnes mají velké rozlišení 600 dpi přesto není většinou potřeba skenovat na vyšší rozlišení než 300 dpi, jednak proto, že většina tiskáren (alespoň donedávna větší rozlišení stejně nedovedla vytisknout), ale také protože vyšší rozlišení je prostě zbytečné (knihy se tisknou při rozlišení 300 dpi) při nižším rozlišení než 300 dpi již zřejmě poznáte zhoršení kvality SKENOVÁNÍ PRO TISK ČERNOBÍLÝCH DOKUMENTŮ - černobílé dokumenty skenujeme ve stupních šedi - skenujeme nejlépe do formátu PNG, který je bezztrátový a nerozostřuje text, naopak formát JPG je sice úspornější ale text rozostřuje (když ale skener neumí PNG, tak i JPG je použitelný) - skenovací programy většinou dostanete se skenerem, nejsou ovšem tak kvalitní jako software placený, který již umožňuje pokročilejší funkce např. tzv. křivky (pomocí kterých můžeme ovlivňovat jas v různě temných místech dokumentu), nebo tzv. histogram (ořežou se místa bílá i tmavá a ve výsledku je tedy pozadí čistě bílé a text tmavší) - i software dodávány se scannerem umí nastavit jas a kontrast, což nám umožní nastavit skener tak, aby naskenovaná strana nebyla příliš tmavá nebo příliš světlá - naskenované obrázky může „vyčistit“ libovolný grafický editor, který pracuje s tzv. histogramem a umožňuje upravovat jeho krajní hodnoty (např. XnView): o posunutím těchto krajních hodnot, někdy také nazývaných černý a bílý bod odstraňujete z naskenované stránky zbytečné informace o posunem bílého bodu čistíte bílé plochy a odstraňujete slabší odstíny šedé barvy = a odstraňujete tím tedy i nečistoty, nedokonalosti atd. (nesmíte to samozřejmě přehnat, jinak ztratíte kresbu.) o přidáváním hodnoty černého bodu ztmavujete písmo, text a kresbu (ani zde to nesmíte přehnat, jinak vám ztmavnou i místa, která nechcete) o vyzkoušejte tyto hodnoty: černý bod: 140 a bílý bod:200 (dle naskenované předlohy se ale mohou lišit) o - - není to vždy nutné, ale pokud například naskenujete stránku nějaké knihy nebo jiného materiálu s vazbou, tak uprostřed vám většina skeneru zanechá černý pruh. Ten je dobré smazat. V ideálním případě je samozřejmě, když při skenování vůbec nevznikne a je tedy dobré předlohu dostatečně ke skenovacímu “sklu” přitisknout. Po úpravě úrovní se černý pruh (pokud byla skenována kniha či předloha s hřbetem) zmenší, nyní je tedy záhodno odstranit jeho zbytky. Případně můžete vyčistit okraje a bílé plochy. Pokud je strana menší než skenovaný obraz, můžete ořezat nadbytečnou volnou plochu. Pouze zabírá místo pro data a text bude při tisku zbytečně menší… Použitelný je opět i “jednoduchý” program XnView, kdy doporučuji nastavit barvu pozadí na bílou (Úpravy -> Barva pozadí; v menu XnView) a následně jednoduše označíte tažením myši oblast a tlačítkem Delete ji smažete (do bíla). Typická může být i kresba skrčeného papíru, která se naskenuje. Zde ji můžete jednoduše smazat. Nese zbytečné nepotřebné informace, a když naskenovanou stranu vytisknete, nevypadá příliš dobře. „vyčištěné“ obrázky můžete nyní vytisknout. Dále je možno obrázky dosud ve stupních šedi převést pouze do režimu “černá a bílá”, to znamená, že se odstraní všechny polotóny a velikost souboru se zmenší cca na % (ale kupodivu se také někdy ztuční text, tento krok tedy nejdříve vyzkoušejte). příklad: výše uvedeným postupem naskenovaná jedna A4 strana lékařské zprávy měla v PNG formátu 3 MB, po vyčištění velikost klesla někde kolem 0,8 MB a následným uložením pouze do “černé a bílé” se velikost zredukovala na 0,3 MB ZDROJE: http://cs.wikipedia.org/wiki/Scanner http://cs.wikipedia.org/wiki/OCR http://dust.xixao.com/skenovani-dokumentu-jak-skenovat-text/ http://radja.cz/129/jak-skenovat-a-upravit-text-i-do-pdf/ http://www.cbvk.cz/files/regionfce/vzdelavani/skenovani.pdf http://commons.wikimedia.org/wiki/File:Skener_UMAX_PowerLook_II,_otevřený.JPG