Návod ke cvičení v prostředí Idrisi Selva

Transkript

Návod ke cvičení v prostředí Idrisi Selva
Vysoká škola báňská – Technická univerzita Ostrava
Hornicko-geologická fakulta
DÁLKOVÝ PRŮZKUM ZEMĚ
(Analýza hlavních komponent)
Tomáš Peňáz
Ostrava, 2014
Vysoká škola báňská – Technická univerzita Ostrava
Hornicko-geologická fakulta
DÁLKOVÝ PRŮZKUM ZEMĚ
(Analýza hlavních komponent)
Tomáš Peňáz
Ostrava, 2014
Obsah
1
Úvod .................................................................................................................................... 2
2
Cíle cvičení ......................................................................................................................... 2
3
Data a programové vybavení .............................................................................................. 2
4
Časová náročnost ................................................................................................................ 3
5
Geografické vymezení území.............................................................................................. 3
6
Postup zpracování ............................................................................................................... 4
7
Úkoly pro samostatnou práci .............................................................................................. 6
1
Úvod
Při práci digitálními obrazovými záznamy získanými z družice je celkem obvyklým jevem
vysoký stupeň korelace mezi různými pásmy. Takové korelace indikuje, že pokud je
odrazivost určité oblasti v jednom pásmu vysoká, bude vysoká i v jiném pásmu, v ideálním
případě (vysoká korelace) nesou tato pásma identickou informaci. Je tedy možno konstatovat,
že multispektrální obraz, snímaný například v devíti pásmech (digitální obrazové záznamy
Landsat 7 ETM+) nese mnohem méně informací, než činí devítinásobek informační hodnoty
jednoho pásma.
Vyvstává tedy otázka, zdali by pro charakteristiku odrazivosti zemského povrchu nebylo
možno využít méně vlnových pásem. Abychom mohli na tuto otázku odpovědět, podívejme
se na charakteristiky digitálních obrazových záznamů Landsat 7 ETM+, pomocí analýzy
hlavních komponent (Principal Components Analysis – PCA).
2
Cíle cvičení
Absolvováním cvičení budou dosaženy následující cíle:
● seznámíte se s praktickou stránkou využití techniky nazývané analýza hlavních
komponent,
● naučíte se základní kroky, nutné ke zpracování multispektrálních obrazových dat touto
metodou,
● získáte základní zkušenosti při volbě parametrů, ovlivňujících výpočet syntetických
pásem, tzv. hlavních komponent,
● vyzkoušíte si transformaci multispektrálních dat na syntetický vícepásmový obraz.
3
Data a programové vybavení
Analýzu hlavních komponent si vyzkoušíte v prostředí programu IDRISI Selva, který je
vynikajícím nástrojem pro výuku zpracování obrazových dat v dálkovém průzkumu Země.
Pro zpracování využijeme digitální obrazový záznam L71189025_02520030421, získaný
systémem Landsat 7, jehož skener ETM+ vytváří obrazová data v 9 pásmech. Tato obrazová
data z 21. 4 2003, pokrývají území o rozměrech 191x185 km. Předzpracování dat zahrnuje
pouze systémové korekce. Data jsou doplněna o georeferenční údaje, které umožňují tzv.
předběžnou geometrickou transformaci prováděnou při zobrazování ve vhodném
programovém prostředí.
Analýzou hlavních komponent budeme zpracovávat data pokrývající oblast o rozměrech
11,6 x 9 km, s rozlohou přesahující 100 km2. Cvičná data pro toto cvičení jsou připravena
jako výřez z původní scény 189-25. Pro klasifikaci budeme nadále používat pouze pásma
1,2,3,4,5 a 7, která jsou vybrána ve výřezu.
4
Časová náročnost
Cvičení by mělo být zpracováno v průběhu 45 minut. Aktivity cvičení jsou připraveny tak,
abyste je mohli provádět samostatně a to jak pod dohledem pedagoga, tak v jeho
nepřítomnosti. Části, které nestihnete provést ve vymezeném časovém limitu v počítačové
laboratoři, můžete dokončit samostatně. Předpokládá se, že zpracování samostatné části
cvičení bude vyžadovat 45 minut.
5
Geografické vymezení území
Oblast, kterou se pokusíme klasifikovat na základě dat ze systému Landsat 7 ETM+, se
nachází v Moravskoslezském kraji. Ve výřezu se nacházejí obce Dolní Benešov, Háj ve
Slezsku, Bolatice, Jilešovice, Kozmice a další. V území je zastoupena především zemědělská
krajina a lesní plochy (obrázek 1). Významnou součást krajiny tvoří trvale zastavěné území
sídel, letiště a průmyslových objektů a dále též povrchové vodní objekty (rybníky, zatopené
štěrkovny a vodní toky).
Obrázek 1 Ukázka zájmového území na syntéze v pravých barvách
6
Postup zpracování
Analýza hlavních komponent je příbuzná faktorové analýze (Factor Analysis). Může být
využita k transformaci multispektrálního obrazového záznamu (v našem případě se 6 pásmy
v 6 různých intervalech vlnových délek) do nového multispektrálního obrazového záznamu se
syntetickými pásmy, označovaných jako hlavní komponenty - components) tak, že informace
v nových pásmech spolu nekorelují a pásma jsou seřazena podle množství rozptylu, který
vysvětlují. Komponenty jsou vytvořeny statistickou abstrakcí rozptylu obsaženého
v originální sadě pásem.
Protože každá komponenta vytvořená touto transformací není korelovaná s jinými, každá
obsahuje nové informace. Protože komponenty jsou seřazeny podle množství informace, které
obsahují, první z celé sady ponese maximální množství informace původní sady, zatímco ty
další již popisují pouze menší variance (odchylky). Jednou možností využití této analýzy je
komprimace dat - je možno uchovat pouze několik prvních komponent, které nesou největší
množství informace, méně důležité komponenty není nutno uchovávat.
S růstem diskové kapacity a rychlosti procesoru je komprimace dat méně významným
důvodem. Většina klasifikátorů dovoluje vstup mnoha pásem a je běžné použít všechna pásma
ke klasifikaci bez ohledu na to, zda jsou či nejsou korelovaná. Avšak jedna z neřízených
klasifikačních technik, kterou vyzkoušíme v pozdějším cvičení je omezena na vstup 3 pásem.
PCA může být použita pro identifikaci 3 pásem, které nesou nejvíce původní informace z celé
sady. Navíc pomocí PCA se naučíme více o charakteristice dat Landsat 7 ETM+ nesoucích
multispektrální obrazovou informaci.
● Zobrazte si vyrez_Idrisi4.rst (blízké infračervené pásmo) s paletou Grey256
a Equal Interval autoscaling. Stejným způsobem si prohlédněte všechna ostatní
pásma.
Kontrolní otázka
1) Vypadá nějaké pásmo podobně jako pásmo 4 (vyrez_Idrisi4.rst)?
Které?
● Spusťte PCA z menu Analysis/Image Processing/Transformation. Vložte informace o
tom, že si přejete přímý výpočet kovariance, že vkládáte 6 pásem multispektrálního
obrazu. Klikněte do seznamu Image Band Name, klikněte na tlačítko výběru ze
seznamu a vyberte vyrez_Idrisi1.rst. Totéž opakujte pro každé ze sedmi
pásem. Zadejte, že si přejete extrahovat 6 nových komponent. Vložte
vyrez_Idrisi jako prefix nově vytvořených výstupních souborů. Specifikujte, že
si přejete použít nestandardizované proměnné.
● Analýza bude pokračovat výpočtem transformačních rovnic a výsledkem bude 6
nových komponent s názvy vyrez_IdrisiCMP1 až vyrez_IdrisiCMP6
Jakmile modul PCA dokončí výpočty, výsledek se objeví na monitoru v podobě sumární
tabulky. Pokud si přejete tabulku vytisknout, vyberte ikonu tiskárny v jejím pravém rohu.
Kontrolní otázka
2) Prohlédněte si korelační matici. Nalézáte nějakou podobnost? Která pásma
korelují nejvíce s pásmem 1? Koreluje nějaké pásmo s pásmem 4? Jak se
odpovědi liší od odpovědi na otázku č. 1?
● Nyní si prohlédněte sumární tabulku komponent, ve které jsou uvedeny vlastní
hodnoty (eigenvalues) a vlastní vektory (eigenvectors) pro jednotlivé komponenty.
Vlastní hodnoty (vlastní hodnoty matice) popisují množství rozptylu pro každou
komponentu a vlastní vektory jsou transformační rovnice. Jednotky těchto veličin jsou
procenta vysvětleného rozptylu (% var).
Kontrolní otázka
3) Jaké množství rozptylu je popsáno zvlášť komponentami 1, 2 a 3? Jaké
množství rozptylu je popsáno celkem u komponent 1a 2 (sečtěte)? Jaké
množství rozptylu je popsáno celkem u komponent 1, 2 a 3?
4) jaké množství informace si udržíte v případě archivace pouze komponent
1, 2 a 3? Jaké je to množství originálních dat (fyzický objem dat)? Jakého
množství informace byste se zbavili? Jakého množství původních dat byste
se zbavili?
● Nyní se podívejte na tabulku saturací (loadings). Tato tabulka udává stupeň korelace
mezi novými komponentami (sloupce) a původními vlnovými pásmy (řádky).
Kontrolní otázka
5) Které pásmo má nejvyšší stupeň korelace s komponentou 1? Je tato
korelace vysoká?
6) Které pásmo má nejvyšší stupeň korelace s komponentou 2?
Pokud jste si tabulku nevytiskli, toto okno nezavírejte (pouze ho minimalizujte), protože zde
obsažené informace budeme později potřebovat.
● Znázorněte komponentu 1 (vyrez_IdrisiCMP1) s Equal interval autoscaling a
s paletou Grey256. Postupně dále zobrazte se stejnými parametry obrázky
vyrez_IdrisiCMP4, vyrez_IdrisiCMP2 a vyrez_IdrisiCMP3.
Uspořádejte tyto obrázky tak, abyste je viděli na monitoru vedle sebe všechny
současně.
Kontrolní otázka
7) Jak se komponenta 1 podobá obrazu v infračerveném pásmu? Jak se
podobá komponenta 2 obrazu v červeném pásmu?
● Zobrazte nyní komponentu 6 (vyrez_IdrisiCMP6) s funkcí autoscale.
Kontrolní otázka
8) Jak tato komponenta koreluje s původními sedmi vlnovými pásmy (viz
tabulka saturací nebo graf saturací (loadings chart))? Co si myslíte, že tato
komponenta obsahuje? Kolik informace ztratíte, nebudete-li již tuto
komponentu používat (smažete-li ji)?
Vztahy, které jsme mohli pozorovat při tomto cvičení, budou rozdílné v jiném typu krajiny,
avšak nejsou příliš neobvyklé. Pokud si musíte vybrat pouze jedno pásmo, ve kterém budete
pracovat, tak často blízké infračervené pásmo (ETM+ pásmo 4) nese největší množství
informace. Druhým nejdůležitějším bývá pásmo viditelných červených vlnových délek. Dále
již se informační hodnota liší, avšak je možno říci, že kandidátem na 3. místo může být pásmo
viditelných zelených vlnových délek (ETM+ pásmo 2) nebo pásmo středních infračervených
vlnových délek (ETM+ pásmo 5).
Vrátíme-li se k naší původní otázce, je možno říci, že tři pásma mohou nést enormní množství
informace. Dále vidíme, že vybraná pásma používaná ke klasické kompozici v nepravých
barvách (zelená, červená, infračervená) nesou většinu informací z celé datové sady. Pro
potřeby neřízené klasifikace, o které budeme hovořit v následujícím cvičení, použijeme pouze
informace ze tří vlnových pásem.
Nyní můžete vymazat šest hlavních komponent (vyrez_IdrisiCMP1-6), které již dále
nebudeme potřebovat.
7
Úkoly pro samostatnou práci
● Prostudujte elektronickou nápovědu a další zdroje informací, které jsou k dispozici pro
ArcGIS. Najděte modul pro zpracování multispektrálních obrazových dat metodou
analýzy hlavních komponent. Zjistěte, kolik vstupních pásem současně umožňuje
tento modul zpracovat. Je možno touto metodou v ArcGIS zpracovat hyperspektrální
data, zahrnující desítky až stovky obrazových pásem?
● Metodou analýzy hlavních komponent proveďte v prostředí ArcGIS zpracování
digitálního obrazového záznamu L71189025_02520030421, který jste získali
v předchozím cvičení nazvaném Digitální obrazový záznam, jednoduché techniky
zpracování.
Autor
Název
Vydavatel
Rozsah
Rok
Copyright
Zdroj financování
Ing. Tomáš Peňáz, Ph.D.
Dálkový průzkum Země
VŠB-TU Ostrava
9 stran
2014
© Tomáš Peňáz, 2014
Financováno z projektu CZ.1.07/2.2.00/28.0308 Inovace bakalářských a
magisterských studijních oborů na Hornicko-geologické fakultě VŠB-TUO,
spolufinancovaného Evropským sociálním fondem a státním rozpočtem České
republiky

Podobné dokumenty

Dělitel a násobek

Dělitel a násobek 48 je dělitelné 6 Číslo 38 je dělitelné 3 Číslo 99 je dělitelné 7 Číslo 78 je dělitelné 6 Číslo 180 je dělitelné 9 Číslo

Více

Návod pro cvičení Idrisi Andes

Návod pro cvičení Idrisi Andes Jinou cestou k ocenění popisných souborů je jejich vykreslení na dvoupásmovém rozptylogramu (scatterplot nebo scattergram). Rozptylogram ukazuje rozmístění všech pixelů ve dvou pásmech v grafu, kd...

Více

Kamerový systém PTZ řady AutoDome® 200

Kamerový systém PTZ řady AutoDome® 200 inteligentních, výměnných modulů, které umožňují rychlou a finančně úspornou aktualizaci funkcí kamer. Vzhledem k použití společných komponentů je možné nejprve nainstalovat základní kamerový systé...

Více

Program LabTutor Firmy ADI

Program LabTutor Firmy ADI přehrávání, analýzu a manipulaci s nimi. Technologie je odvozena do vybavení jako je Ludwigův bubínkový kymograf (Marriottův bubínek) zaznamenávající data na otáčející se válec. Ten byl později nah...

Více

Česká pravidla ke hře Scrabble Original

Česká pravidla ke hře Scrabble Original vyznačené bodové hodnoty, které můžete použít místo jakéhokoliv písmene. Jakmile tento kámen použijete, není možné jeho význam během hry měnit. PŘÍPRAVA Nasypte všechny hrací kameny do plátěného sá...

Více

Návod pro cvičení Bilko

Návod pro cvičení Bilko V tomto cvičení si ukážeme posloupnost nejdůležitějších kroků řízené spektrální klasifikace, které se provádějí v rámci trénovací a klasifikační etapy. Vyzkoušíme si řízenou klasifikaci digitálního...

Více

Nedbalost, či neznalost

Nedbalost, či neznalost Statistický problém. Václav Klaus tvrdí, že přehlížím nemalý statistický problém, protože se změnily statistické systémy, struktura ekonomik a tak dále. Nepřehlížím. Přesně touto statistickou probl...

Více

Analýza Krušnohorské lyžařské magistrály na území Karlovarského

Analýza Krušnohorské lyžařské magistrály na území Karlovarského techniku nebo pro bruslení. Odpovídá to také změnám ve vybavení běžkařů. Současné lyže, vázání i boty jsou mimo kvalitní stopy jen omezeně použitelné. Výraz lyžařská magistrála nebo také Krušnohors...

Více