Zpracování dat v ekologii společenstev

Transkript

Zpracování dat v ekologii společenstev
ZPRACOVÁNÍ DAT
V EKOLOGII SPOLEČENSTEV
David Zelený
OSNOVA PŘEDNÁŠKY
Typy sbíraných dat


Zpracování dat v ekologii společenstev
alfa, beta a gamma diverzita, akumulační druhová křivka, rarefaction
Design ekologických experimentů


lineární regrese, Ellenbergovy indikační hodnoty
Indexy druhové bohatosti


hierarchická vs nehierarchická, aglomerativní vs divisivní
Regrese, kalibrace


lineární vs unimodální, přímá vs nepřímá
Klasifikace


indexy podobnosti a vzdálenosti mezi vzorky
Ordinace


čištění dat, odlehlé body, transformace, standardizace, EDA
Ekologická podobnost


kategoriální vs kvantitativní, pokryvnosti, frekvence
Příprava dat pro numerické analýzy


David Zelený

manipulativní experimenty vs přírodní experimenty (pozorování)
Případové studie na použití jednotlivých metod
2
LITERATURA
David Zelený
Doporučená (najdete na bit.ly/zpradat v sekci Studijní materiály)

Lepš J. & Šmilauer P. (2001) Mnohorozměrná analýza ekologických dat

Zpracování dat v ekologii společenstev

v anglické verzi vyšlo v nakladatelství Cambridge v roce 2003 jako Multivariate Analysis of
Ecological Data using CANOCO
Herben T. & Münzbergová Z. (2003) Zpracování geobotanických dat v příkladech.
Část 1. Data o druhovém složení
Pro fajnšmekry

Wildi O. (2010) Data Analysis in Vegetation Ecology. Wiley-Blackwell.

Gotelli N.J. & Ellison A.M. (2004) A Primer of Ecological Statistics. Sinauer
Associates.

Oksanen J. (2004) Multivariate Analysis in Ecology, Lecture Notes.


Palmer M. – Ordination methods for ecologists, website


http://cc.oulu.fi/~jarioksa/opetus/metodi/notes.pdf
http://ordination.okstate.edu/
Legendre P. & Legendre L. (2012) Numerical Ecology (Third English Edition).
Elsevier.
3
SOFTWARE

PC-ORD 5 – numerické klasifikace, ordinační analýzy, analýza
odlehlých bodů

STATISTICA 12 – regresní analýzy, klasifikace, ordinace
Zpracování dat v ekologii společenstev
CANOCO 5 – ordinační analýzy, kreslení ordinačních diagramů a
odpovědních křivek druhů
David Zelený

Kde co sehnat:


CANOCO 5 a PC-ORD – instalace z webových stránek předmětu
(http://bit.ly/zpradat, záložka Software)
STATISTICA – licenci je třeba získat po přihlášení na http://inet.sci.muni.cz v sekci
Nabídka software
4
DALŠÍ INFORMACE
Webové stránky předmětu: www.bit.ly/zpradat


Cvičení




probíhat bude v počítačové učebně v druhé půlce semestru a zaměřené bude na analýzu
dat a jejich vizualizaci v programu CANOCO 5
tři čtyřhodinové bloky
v případě zájmu o program R je možné (v liché roky) zapsat si souběžně předmět Analýza
dat v ekologii společenstev v programu R (Bi7550)
Domácí úkol


přednášky, software, příklady ke cvičení, studijní materiály
některé sekce vyžadují přihlášení
Zpracování dat v ekologii společenstev

David Zelený

dobrovolný, zadání bude sděleno v průběhu semestru
Zkouška



vypracování závěrečné práce (pokyny viz webové stránky předmětu, sekce Závěrečná
práce)
půlhodinová diskuze nad závěrečnou prací, doplněná o rozšiřující otázky týkající se
probírané látky
možné dělat zároveň se zkouškou z předmětu Bi7550
5
David Zelený
Zpracování dat v ekologii společenstev
TYPY SBÍRANÝCH DAT
PŘÍPRAVA DAT PRO ANALÝZY
DATA V EKOLOGII SPOLEČENSTEV
popisují společenstvo, případně i jeho prostředí

ekologická data obsahují více proměnných (multivariate data) a dají
se vyjádřit maticí dat (data matrix)

společenstvo je typicky sledováno na určité ploše (v případě rostlin
a některých málo mobilních živočichů) nebo např. inventarizací
jedinců (např. ulovených v pastech v případě mobilních živočichů)

složení živého společenstva je popsáno přítomností jednotlivých
druhů daného typu organismů, na jedné ploše (v jedné pasti) se
většinou vyskytuje více než jeden druh

prostředí je popisováno jednou nebo více proměnnými, o kterých se
předpokládá, že ovlivňují studovaný typ organismů
Zpracování dat v ekologii společenstev

David Zelený
Společenstvo je skupina druhů,
které se vyskytují společně v
prostoru a v čase.
(Begon 2007)
7
TYPY PROMĚNNÝCH
Kategoriální (kvalitativní, nominální, prezenčně-absenční)


Ordinální (semikvantitativní)



např. geologický substrát, půdní typy, binární proměnné (přítomnost-absence druhu)
kategorie jsou unikátní (každý jedinec/pozorování spadá právě do jedné z nich) a
nelze je smysluplně seřadit
Zpracování dat v ekologii společenstev

David Zelený

např. Braun-Blanquetova stupnice pro odhad pokryvnosti druhů
jednotlivé stupně (kategorie) lze seřadit, rozdíly mezi stupni jsou různě velké
Kvantitativní


0
diskrétní (počty jedinců, měření s malou přesností) x kontinuální (přesná měření)
relativní stupnice (relative-scale) x intervalová stupnice (interval-scale)
30
0
8
relativní stupnice – nula znamená,
že charakteristika chybí
intervalová stupnice – nula je stanovena arbitrárně
TYPY PROMĚNNÝCH
ALTERNATIVNÍ TŘÍDĚNÍ
binární (dvoustavový, presence-absence)
přítomnost nebo absence
druhu
Zpracování dat v ekologii společenstev
Příklady
David Zelený
Typ proměnné
mnohostavový
neseřazený
geologický substrát
seřazený
semikvantitativní (ordinální)
stupnice pokryvností druhy
kvantitativní (měření)
diskontinuální (počty, diskrétní)
počet jedinců
kontinuální
teplota, hloubka půdy
9
Legendre & Legendre 1998
PRIMÁRNÍ DATA
David Zelený
Zpracování dat v ekologii společenstev
10
PRIMÁRNÍ DATA
David Zelený
Zpracování dat v ekologii společenstev
11
Zadávání primárních dat

Uchování a zpřístupnění primárních dat




Zpracování dat v ekologii společenstev

spreadsheet, metadata
David Zelený

http://www.cggveritas.com/data//1/rec_i
mgs/5152_Tapes-small.jpg
PRIMÁRNÍ DATA
problematika dlouhodobé archivace a nosičů dat (nejlepší je stále papír)
zpřístupnění primárních dat (některé časopisy, např. Ecological Monographs,
Journal of Ecology aj., to mají jako podmínku zveřejnění článku)
uložení dat ve veřejně dostupných repositoriích (např. Dryad Digital Repository,
www.datadryad.org) nebo databázích (např. Česká Národní Fytocenologická
Databáze)
Kontrola a čištění dat





sloučení taxonomické nomenklatury
chyby a chybějící data (možnosti nahrazení chybějících dat)
analýza odlehlých bodů (outlier analysis)
někdy i vyloučení vzácných druhů (odstranění šumu v datech)
EDA – exploratory data analysis
12
David Zelený
Zpracování dat v ekologii společenstev
Programátorka Madeleine Carey s 60.000 děrnými štítky, na kterých
byl uložen program využívaný americkou leteckou obranou.
13
Zdroj: Failures to Compute, Science 342 (6160) 800-801
KONFIRMAČNÍ VS. EXPLORAČNÍ ANALÝZA DAT
(hypothesis-driven vs data-driven science)
David Zelený
Konfirmační analýza dat (confirmatory data analysis, CDA)
testuje hypotézy a generuje odhady parametrů

např. regrese, ANOVA, testy signifikance
Zpracování dat v ekologii společenstev

Explorační analýza dat (exploratory data analysis, EDA)

průzkum dat a hledání hypotéz, které stojí za to testovat

slouží také k tzv. „vytěžování“ dat (data mining, data
dredging)

grafická EDA slouží k


odhalení odlehlých bodů (outlier analysis)
distribuce dat (normalita) a nutnost transformace
John Tukey
(1915-2000)
14
EDA – EXPLORATORY DATA ANALYSIS
ANALÝZA ODLEHLÝCH BODŮ
– BOX-PLOT & HISTOGRAM
David Zelený
XERSSW
-6
-4
-2
0
2
4
Zpracování dat v ekologii společenstev
-8
Median
25%-75%
Range
Outliers
50
Frequency
40
30
20
10
0
-8
-7
-6
-5
-4
-3
-2
-1
0
XERSSW (head index)
1
2
3
4
15
EDA – EXPLORATORY DATA ANALYSIS
ANALÝZA ODLEHLÝCH BODŮ - SCATTERPLOT
David Zelený
3
2
1
Zpracování dat v ekologii společenstev
-1
-2
-3
-4
-5
-6
-7
-3
-2
-1
0
1
2
3
4
5
3.0
6
XERSW
2.5
2.0
1.5
XERSSW
XERSSW
0
1.0
0.5
0.0
-0.5
16
-1.0
-3
-2
-1
0
1
XERSW
2
3
4
5
DETAILY KE KRABICOVÝM GRAFŮM (BOXPLOT)
David Zelený
Klasický boxplot
(střední hodnota = medián)
Definice odlehlých bodů a
extrémů (STATISTICA)
Zpracování dat v ekologii společenstev
maximální hodnota
Q3 – horní kvartil
Q2 - medián
Q1 – spodní kvartil
minimální hodnota
17
outlier (hodnota nižší než spodní kvartil a interkvartilový rozsah)
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Transformace dat

Zpracování dat v ekologii společenstev
mění relativní vzdálenosti mezi jednotlivými
hodnotami a tím i tvar jejich distribuce
Proč data transformovat?

protože škála měření je arbitrární a nemusí
odpovídat ekologickému významu proměnné


protože (některé) statistické testy vyžadují, aby
data



deset prstů => používání desítkové soustavy
byla normálně rozložená (normal distribution)
měla homogenní varianci (homoskedasticita, mezi
průměrem a směrodatnou odchylkou není žádný vztah)
protože lineární vztahy se interpretují lépe než
vztahy nelineární
18
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Na co si dát při transformaci pozor?
aby transformace rozložení dat ještě nezhoršila a nevytvořila nové
odlehlé body

abychom při komentování výsledků používali netransformované
hodnoty proměnných
Zpracování dat v ekologii společenstev

Typy transformace

lineární




přičtení konstanty nebo vynásobení konstantou
nemění výsledky statistického testování nulových hypotéz
např. převod teploty měřené ve stupních Celsia na stupně Fahrenheita
nelineární


log transformace, odmocninová transformace atd.
může změnit výsledky statistického testování
19
600
500
400
0
100
200
200
300
symetrické
(symetrical)
2
4
6
8
10
12
negativně
(doleva)
zešikmené
(left skewed)
0
0
50
50
100
100
150
200
150
0
-8
-3
-2
-1
0
1
2
-6
-4
-2
0
2
3
* ekologická data jsou často zešikmená pozitivně (doprava), protože jsou omezená
nulou na začátku
20
Zpracování dat v ekologii společenstev
pozitivně
(doprava)
zešikmené*
(right skewed)
David Zelený
700
ROZDĚLENÍ DAT (DATA DISTRIBUTION)
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený

Logaritmická transformace
(log transformation)
pro data s výrazně pozitivně (doprava) šikmou
distribucí (right skewed), u kterých existuje vztah mezi
směrodatnou odchylkou a průměrem (lognormální
rozložení)
Zpracování dat v ekologii společenstev

Y* = log (Y), případně Y* = log (a*Y + c)





zdroj: wikipedia.org
na základě logaritmu nezáleží (10, 2, e)
konstanta a = 1; pokud je Y z intervalu <0;1>, potom a
>1
konstanta c se přidává, pokud proměnná Y obsahuje
nuly
c může být např. 1, nebo arbitrárně zvolené malé
číslo (0,001)
na konstantě c může záležet výsledek analýz
(ANOVA), a proto je dobré vybírat takové číslo, aby
transformovaná proměnná byla co nejvíce symetrická
21
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Odmocninová transformace (square-root transformation)

Zpracování dat v ekologii společenstev
vhodná pro mírně doprava zešikmená data (right skewed), např. počty
druhů (Poisson distribution)
Y* = √ Y, případně Y* = √ (Y + c)



konstanta c se přičítá, pokud soubor obsahuje nuly
c může být např. 0,5, nebo 3/8 (0,325)
třetí a vyšší odmocnina je účinnější na více zešikmená data (čtvrtá
odmocnina se používá pro abundance druhů s mnoha nulami a několika
vysokými hodnotami)
Mocninná transformace (power transformation)

vhodná pro data negativně (doleva) sešikmená (left skewed)
Y* = Yp

pokud p < 1 - odmocninová transformace (p = 0,5 – druhá odmocnina, p = 0,25 – čtvrtá
odmocnina atd.)
22
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Zpracování dat v ekologii společenstev
odmocninová
logaritmická
Legendre & Legendre (1998)
23
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Zpracování dat v ekologii společenstev
24
Münch. Med. Wschr. 124, 1982
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Transformace pomocí arcsin (angular transformation)

vhodná pro procentické hodnoty (a obecně podíly)
Zpracování dat v ekologii společenstev
Y* = arcsin Y nebo Y* = arcsin √ Y


použitelná pro hodnoty v intervalu <-1; 1>
transformované hodnoty jsou v radiánech
Reciproká transformace (reciprocal transformation)

vhodná pro poměry (například výška/hmotnost, počet dětí v populaci
na počet žen atd.)
Y* = 1/Y
25
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
TRANSFORMACE
David Zelený
Box-Cox transformace (zobecněná mocniná transformace)


Zpracování dat v ekologii společenstev

zobecněná parametrická transformace
iterativní hledání parametru λ (lambda), pro které je rozdělení transformované
proměnné nejblíže normálnímu rozdělení
používá se v případě, že nemáme a priori představu, jakou transformaci použít
Neparametrické metody transformace

např. metoda Omnibus pro ordinální data
26
Legendre &
Legendre 1998
MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ?
GRAFICKÁ ANALÝZA
Q-Q diagram
(Quantile-Quantile plot)
35
Zpracování dat v ekologii společenstev
3
30
2
Oček. normál. hodnoty
Počet pozorování
David Zelený
Histogram s křivkou
normálního rozdělení
25
20
15
10
5
1
0
-1
-2
0
-10
0
10
20
30
40
50
60
70
-3
-10
80
Soil depth

vizuální zhodnocení normality dat

Kolmogorovův-Smirnovův test
0
10
20
30
40
50
60
70
Pozorovaný kvantil

porovnání rozdělení dvou proměnných, vynáší
proti sobě kvantily jednotlivých proměnných

jedna proměnná může být teoretická distribuce
(v tomto případě normální rozdělení –
rankitový diagram)

na stejném principu pracuje Shapiro-Wilk test
27
MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ?
GRAFICKÁ ANALÝZA
-1
0
1
2
3
150
100
Frequency
0
0
-2
50
100 200 300 400 500
Frequency
150
100
50
0
Frequency
600
200
200
negativně zešikmené
Zpracování dat v ekologii společenstev
-3
David Zelený
pozitivně zešikmené
normální rozdělení
0
2
4
8
10
12
-8
-6
-4
variable
-2
0
2
variable
-2
-1
0
1
Sample quantiles
2
3
2
1
0
-1
Theoretical quantiles
-3
0
-3
-2
2
1
0
-1
-3
-2
Theoretical quantiles
2
1
0
-1
-2
-3
Theoretical quantiles
3
3
3
variable
6
5
10
15
Sample quantiles
20
-5
-4
-3
-2
-1
Sample quantiles
0
1
28
BIMODÁLNÍ DATA
David Zelený
20
15
0
5
10
Frequency
15
10
Frequency
5
0
6.0
6.5
7.0
7.5
8.0
6.0
6.5
7.0
7.5
8.0
Soil pH
7.0
29
6.0
6.5
6.5
7.0
Soil pH
7.5
7.5
8.0
8.0
Soil pH
Soil pH
Zpracování dat v ekologii společenstev
20
transformace nepomůže, možnost rozdělit na dva podsoubory
6.0

600
650
700
750
800
850
Annual precipitation [mm]
900
950
600
650
700
750
800
850
Annual precipitation [mm]
900
950
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
STANDARDIZACE PROMĚNNÝCH
David Zelený
Centrování

výsledná proměnná má průměr roven nule
Zpracování dat v ekologii společenstev
Yi* = Yi – průměr (Y)
Standardizace v úzkém slova smyslu

výsledná proměnná má průměr roven nule a směrodatnou odchylku
rovnu jedné

„synchronizuje” proměnné měřené v různých jednotkách a na různých
stupnicích
Yi* = (Yi – průměr (Y)) / směrodatná odchylka (Y)
Změna rozsahu hodnot (ranging)

výsledná proměnná je v rozsahu 0 až 1
Yi* = Yi / Ymax nebo
Yi* = (Yi – Ymin) / (Ymax – Ymin)
30
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
STANDARDIZACE MATICE SPOLEČENSTVA
David Zelený
Standardizace v případě matice společenstva (vzorky x druhy)

standardizace po druzích (by species)


dává velkou váhu vzácným druhům
ne vždy smysluplná (pokud se druh vyskytuje vzácně v jednom snímku,
standardizace po druzích dá tomuto snímku velkou váhu)
Zpracování dat v ekologii společenstev

standardizace po vzorcích (by samples)


pokud je analýza zaměřená na relativní proporce mezi druhy, ne jejich absolutní
abundance
vhodné v případě, že výsledné abundance závisí na důkladnosti, s jakou sbíráme
data (např. při odchytu živočichů doba strávená na ploše nebo počet pastí)
31
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
STANDARDIZACE MATICE SPOLEČENSTVA
David Zelený
původní matice
Druhy
druh 1
druh 2
druh 3
vzorek 1
1
3
5
vzorek 2
2
6
10
vzorek 3
10
30
50
standardizace po druzích
standardizace po vzorcích
Druhy
Druhy
Vzorky
druh 1
druh 2
druh 3
Vzorky
druh 1
druh 2
druh 3
vzorek 1
-0.68
-0.68
-0.68
vzorek 1
-1
0
1
vzorek 2
-0.47
-0.47
-0.47
vzorek 2
-1
0
1
vzorek 3
1.15
1.15
1.15
vzorek 3
-1
0
1 32
Zpracování dat v ekologii společenstev
Vzorky
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
matematická funkce, jejíž
argumenty nejsou odvozené z
dat, na která je transformace
aplikovaná (data independent)

nejčastější důvod je změnit tvar
rozložení proměnné, případně
zajistit homoskedasticitu
STANDARDIZACE

mění data pomocí statistiky,
která je spočtená na datech
samotných, např. průměr,
součet, rozsah aj. (data
dependent)

nejčastější důvod použití je
vyrovnat rozdíly v relativním
významu (váze) jednotlivých
ekologických proměnných,
druhů nebo vzorků

ve své podstatě je to další typ
transformace
Zpracování dat v ekologii společenstev

David Zelený
TRANSFORMACE
33
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
KÓDOVÁNÍ DAT (DATA CODING)
David Zelený

Dummy variables

Zpracování dat v ekologii společenstev

metoda, jak převést kvalitativní (kategoriální) proměnnou na kvantitativní (binární)
proměnné použitelné v analýzách
pokud má kategoriální proměnná n stavů (hodnot), pro její vyjádření stačí n-1
dummy proměnných (jedna z proměnných je vždy lineárně závislá na ostatních)
dummy proměnné
hodnoty
KAMB
kambizem
1
litozem
LITO
RANK
FLUVI
0
0
0
0
1
0
0
ranker
0
0
1
0
fluvizem
0
0
0
1
34
PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY
KÓDOVÁNÍ DAT (DATA CODING)
David Zelený

např. nahrazení kódů u alfa-numerických stupnic, např. BraunBlanquetovy stupnice dominance-abundance


Br.-Bl.:
ordinální hodnoty:
střední hodnoty procent:
Zpracování dat v ekologii společenstev

r + 1 2 3 4 5
1 2 3 4 5 6 7
1 2 3 15 38 63 88
35
SOUBORY S VELKÝM POČTEM NUL
(ANEB VÝZNAM NULY V EKOLOGII)
dva možné významy nuly:
1.
hodnota může být ve skutečnosti nenulová, ale díky našim možnostem měření jsme
ji naměřili jako nulovou (například koncentrace látky v roztoku)
hodnota je skutečná nula – například absence druhu
Zpracování dat v ekologii společenstev
2.

David Zelený

data obsahující „pravé nuly“ obsahují dva typy informace:
1.
2.
druh chybí nebo je přítomen?
pokud je druh přítomen, jaká je jeho abundance?

v datech obsahujících velké množství „pravých nul“ je většina
informace prvního typu

problém „pravých“ nul při logaritmické transformaci – soubor s
velkým počtem „pravých“ nul není vhodné logaritmicky
transformovat (přičítat k nim konstantu c), ale lépe ji nahradit binární
proměnnou (prezence-absence)
36
99.0
98.5
98.0
97.5
Zpracování dat v ekologii společenstev
více než 90% hodnot tvoří nuly, u
velkých souborů až 99%
David Zelený
(SPARSE MATRIX, ŘÍDKÁ
MATICE)
97.0
EKOLOGII SPOLEČENSTEV
Zastoupení nul v matici [%]
MATICE „VZORKY × DRUHY“ V
100
2000
4000
6000
8000
vzorky
Počet vegetačních snímků v matici
37
druhy
David Zelený
(ECOLOGICAL RESEMBLANCE)
Zpracování dat v ekologii společenstev
EKOLOGICKÁ PODOBNOST
EKOLOGICKÁ PODOBNOST
David Zelený
jedinec
společenstvo
Zpracování dat v ekologii společenstev
jedinci stejného druhu
39
EKOLOGICKÁ PODOBNOST
David Zelený
Zpracování dat v ekologii společenstev
40
EKOLOGICKÁ PODOBNOST
David Zelený
Zpracování dat v ekologii společenstev
41
EKOLOGICKÁ PODOBNOST
Q VS R ANALÝZA
David Zelený
Vzorky
druh 1
druh 2
druh 3
vzorek 1
0
1
1
vzorek 2
1
0
0
vzorek 3
0
4
4
vztahy mezi druhy
(nebo obecně mezi deskriptory)
R analýza
vztahy mezi vzorky
Q analýza
42
Zpracování dat v ekologii společenstev
Druhy
PODOBNOSTI
X VZDÁLENOSTI (Q ANALÝZA)
David Zelený
Indexy podobnosti
slouží k vyjádření podobnosti mezi vzorky, ne k jejich umístění do
mnohorozměrného prostoru (například ordinace)

nejnižší hodnota 0 – vzorky nesdílejí žádný druh

nejvyšší hodnota (1 nebo jiná) – vzorky jsou identické
Zpracování dat v ekologii společenstev

Vzdálenosti mezi vzorky

slouží k umístění vzorků v mnohorozměrném prostoru

nejnižší hodnota 0 – vzorky jsou identické (ve stejné lokaci)

hodnota se zvyšuje se zvyšující se nepodobností mezi vzorky
43
INDEXY PODOBNOSTI
David Zelený
kvalitativní vs kvantitativní
kvalitativní – pro presenčně-absenční data

kvantitativní – pro data vyjadřující abundance, počty aj.
Zpracování dat v ekologii společenstev

symetrické vs asymetrické

dvojité nepřítomnosti („double-zero“) – počet druhů, které chybí
zároveň v obou vzorcích, v kontrastu s počtem druhů které se
vyskytují zároveň v obou vzorcích

symetrické – dvojité nepřítomnosti hodnotí stejně jako dvojité
přítomnosti (totiž že vyjadřují podobnost mezi vzorky); v ekologii se
prakticky nepoužívají

asymetrické – dvojité nepřítomnosti ignorují; nejčastější typ indexů
podobnosti v ekologii
44
PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS)
David Zelený
Skutečnost, že druh chybí zároveň v obou snímcích, může znamenat,
že:
vzorky leží mimo ekologickou niku druhu


Zpracování dat v ekologii společenstev

nemůžeme ale říci, zda oba vzorky leží na stejné straně ekologického gradientu
mimo niku druhu (a jsou si tedy docela podobné) nebo na stranách opačných (a jsou
pak úplně odlišné)
vzorky leží uvnitř ekologické niky druhy, ale druh se ve vzorku
nevyskytuje, protože



se tam nedostal (dispersal limitation)
jsme ho přehlédli a nezaznamenali (sampling bias)
nachází se právě v dormantním stadiu a není proto vidět (jednoletky, geofyty)
45
vlhkomilný
druh 2
mezický
druh 1
mezický
druh 2
suchomilný
druh 1
suchomilný
druh 2
1
1
0
0
0
0
vzorek 2
0
1
1
1
1
0
vzorek 3
0
0
0
0
1
1

vzorky 1 až 3 jsou seřazeny podle vlhkosti stanoviště – vzorek 1 je
nejvlhčí, vzorek 3 nejsušší

vzorek 1 a 3 neobsahují ani jeden mezický druh – vzorek 1 je pro
tyto druhy příliš vlhký, vzorek 3 příliš suchý

symetrické indexy podobnosti: dvojitá nepřítomnost mezických
druhů bude zvyšovat podobnost vzorků 1 a 3

asymetrické indexy: dvojité nepřítomnosti budou ignorovány
Zpracování dat v ekologii společenstev
vzorek 1
David Zelený
vlhkomilný
druh 1
PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS)
46
INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA
přítomen
nepřítomen
přítomen
a
b
nepřítomen
c
d
Zpracování dat v ekologii společenstev
ve vzorku č. 2
David Zelený
ve vzorku č. 1
druh je
a – počet druhů přítomných v obou vzorcích
b, c – počet druhů přítomných jen v jednom vzorku
d – počet druhů, které chybí v obou vzorcích („double zeros“)
Pokud nebereme v úvahu druhy
nepřítomné v obou vzorcích (d),
lze zobrazit i pomocí Vennova
diagramu 
c
a
b
47
vzorek č. 1
vzorek č. 2
INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA
Jaccardův koeficient

Sørensenův koeficient S = 2a / (2a + b + c)

J = a / (a + b + c)
přítomnosti druhu v obou vzorcích (a) přisuzuje dvojnásobnou váhu
Simpsonův koeficient

Zpracování dat v ekologii společenstev

David Zelený

Si = a / [a + min (b,c)]
vhodný pro vzorky velmi odlišné počtem druhů
c
a
b
48
vzorek č. 1
vzorek č. 2
INDEXY PODOBNOSTI PRO KVANTITATIVNÍ DATA
David Zelený

zobecněný Sørensenův koeficient (procentická podobnost,
percentage similarity)





Zpracování dat v ekologii společenstev
PS = [2 Σ min (xi, yi)] / Σ (xi + yi)
xi, yi ... kvantita i-tého druhu ve srovnávaných vzorcích
má rozsah od 0 do 1
pro presenčně absenční data přechází v 2a / (2a + b + c)
velmi vhodný pro ekologická data
percentage dissimilarity (PD, Bray-Curtis index) = 1 – PS
49
VZDÁLENOSTI MEZI VZORKY
(DISTANCE MEASURES)
David Zelený

všechny indexy podobnosti (kvalitativní i kvantitativní) lze převést na
distance



Zpracování dat v ekologii společenstev
D = 1 – S, nebo D = √ (1 – S)
kde D je vzdálenost (distance) a S je podobnost (similarity)
odmocninový převod se používá například pro Sørensenův koeficient
neplatí obráceně (ne všechny vzdálenosti se dají převést na podobnosti – např.
Euklidovská vzdálenost)
50
VZDÁLENOSTI MEZI VZORKY
(DISTANCE MEASURES)
David Zelený

Euklidovská vzdálenost (Euclidean distance)
ED = √ Σ (xi – yi)2



tětivová vzdálenost (chord distance, relativized Euclidean distance)



rozsah: od 0 (identické vzorky), horní mez není dána
rozsah hodnot výrazně záleží na použitých jednotkách
míra citlivá na odlehlé body - nevhodná pro ekologická data
Zpracování dat v ekologii společenstev

Euklidovská vzdálenost použitá na datech standardizovaných přes vzorky (by
sample norm)
rozsah: od 0 (identické vzorky) do √2 (vzorky nesdílí žádný druh)
Chi-kvadrát vzdálenost (chi-square distance)


málokdy se používá přímo na výpočet vzdálenosti mezi vzorky
vyjadřuje vzdálenost mezi vzorky v unimodálních ordinačních metodách (např. v
korespondenční analýze, CA)
51
EUKLIDOVSKÁ VZDÁLENOST
PARADOX
David Zelený

Druhy
Vzorky
druh 1
druh 2
druh 3
vzorek 1
0
1
1
vzorek 2
1
0
0
vzorek 3
0
4
4
1,732
4,243
Eucl (vzorek 1, vzorek 2) = √ (0-1)2 + (1-0)2 + (1-0)2 = 1,732
Eucl (vzorek 1, vzorek 3) = √ (0-0)2 + (1-4)2 + (1-4)2 = 4,243
52
Zpracování dat v ekologii společenstev
může se stát, že dva vzorky, které sdílí některé druhy (vzorky 1 a 3),
budou mít větší vzdálenost než dva vzorky, které nesdílí ani jeden
druh (vzorky 1 a 2)
INDEXY PODOBNOSTI MEZI DRUHY (R ANALÝZA)
V kolika vzorcích je ...

Diceův index



přítomen
nepřítomen
přítomen
a
b
nepřítomen
c
d
Zpracování dat v ekologii společenstev
druh č. 2
David Zelený
druh č. 1
Dice = 2a / (2a + b + c)
stejný jako Sørensenův index pro podobnost mezi vzorky
uveden dříve než Sørensen (Dice 1945 vs Sørensen 1948)
Pearsonův korelační koeficient r

není vhodný pro data s velkým počtem nul, ani po transformaci
53
MATICE PODOBNOSTÍ (VZDÁLENOSTÍ) MEZI VZORKY (NEBO
DRUHY)

diagonála obsahuje pouze nuly (matice vzdáleností) nebo pouze
jedničky (matice podobností)
1
2
3
4
5
6
7
8
9
10
1
0
12.37
11.70
17.92
13.86
10.58
11.92
10.54
13.82
15.59
2
12.37
0
11.14
13.34
16.58
13.96
9.64
13.56
13.64
13.42
3
11.70
11.14
0
14.42
16.16
11.53
10.34
13.71
14.90
13.78
4
17.92
13.34
14.42
0
18.36
15.78
9.64
17.03
14.42
7.48
5
13.86
16.58
16.16
18.36
0
13.71
14.49
9.00
14.04
15.46
6
10.58
13.96
11.53
15.78
13.71
0
11.31
11.87
10.54
12.85
7
11.92
9.64
10.34
9.64
14.49
11.31
0
13.82
12.77
9.43
8
10.54
13.56
13.71
17.03
9.00
11.87
13.82
0
10.95
14.35
matice Euklidovských vzdáleností mezi 10 vzorky
9
13.82
13.64
14.90
14.42
14.04
10.54
12.77
10.95
0
10.39
Zpracování dat v ekologii společenstev
je symetrická (podobnost mezi 2. a 3. snímkem = podobnost mezi 3.
a 2. snímkem)
David Zelený

10
15.59
13.42
13.78
7.48
15.46
12.85
9.43
14.35
10.39
0
54
David Zelený
Zpracování dat v ekologii společenstev
ORDINAČNÍ ANALÝZA
KONCEPCE MNOHOROZMĚRNÉHO PROSTORU
David Zelený
Prostor může být definován:
Zpracování dat v ekologii společenstev
druhy (species space)
vzorky (sample space)
56
Zuur et al. (2007)
ORDINACE
RŮZNÉ FORMULACE PROBLÉMU
najdi skryté gradienty v druhovém složení (ordinační osy)
2)
rozmísti vzorky v zobrazitelném prostoru (ordinační prostor)
David Zelený
1)
Zpracování dat v ekologii společenstev
57
http://ordination.okstate.edu/
NEPŘÍMÁ VS PŘÍMÁ ORDINACE
UNCONSTRAINED VS CONSTRAINED ORD.
ordinační osy – směry největší
variability dat

popisu dat a generování
hypotéz

ordinační osy – variabilita dat
vztažená k daným proměnným

testování hypotéz
vzorky
druhová matice a matice
proměnných prostředí
proměnné
prostředí
druhy
Přímá ordinace

druhová
matice
druhová
matice
+
vzorky

Zpracování dat v ekologii společenstev
pouze druhová matice
vzorky
Nepřímá ordinace

David Zelený
druhy
matice
proměnných
prostředí
58
MODELY ODPOVĚDI DRUHŮ NA GRADIENT PROSTŘEDÍ
David Zelený
unimodální
Zpracování dat v ekologii společenstev
abundance
1.5
1.0
abundance
2.0
lineární
0.0
0.2
0.4
0.6
gradient
0.8
gradient
59
LINEÁRNÍ MODEL ODPOVĚDI DRUHU
JEN PŘI KRÁTKÉM EKOLOGICKÉM GRADIENTU
David Zelený
abundance druhu
abundance druhu
dlouhý ekologický gradient
Zpracování dat v ekologii společenstev
krátký ekologický gradient
gradient prostředí (pH, nadm. výška)
gradient prostředí (pH, nadm. výška)
60
Lepš & Šmilauer (2003) Multivariate analysis of ...
ZÁKLADNÍ TYPY ORDINAČNÍCH TECHNIK
(ZALOŽENÝCH NA PRIMÁRNÍCH DATECH)
nepřímá
ordinace
(unconstrained)
PCA
(Principal Component Analysis,
analýza hlavních komponent)
CA
(Correspondence Analysis,
korespondenční analýza)
DCA
(Detrended Correspondence
analysis, detrendovaná
korespondenční analýza)
přímá ordinace
(constrained)
RDA
(Redundancy Analysis,
redundanční analýza)
CCA
(Canonical Correspondence
Analysis, kanonická
korespondenční analýza)
Zpracování dat v ekologii společenstev
unimodální odpověď druhů
David Zelený
lineární odpověď druhů
61
David Zelený
Zpracování dat v ekologii společenstev
NEPŘÍMÁ ORDINAČNÍ ANALÝZA
NEPŘÍMÁ ORDINACE
PRINCIP

první ordinační osa (ordination axis) a skóre vzorků na této ordinační
ose (sample scores)

odhad optima (odpovědi) jednotlivých druhů na této ose (species
scores)

druhá a vyšší ordinační osy – musejí být lineárně nezávislé na všech
nižších ordinačních osách
Zpracování dat v ekologii společenstev
hledání skryté proměnné (gradientu), který nejlépe reprezentuje
chování všech druhů podél tohoto gradientu
David Zelený

63
PRINCIP VÝPOČTU PCA (ANALÝZA HLAVNÍCH KOMPONENT)
2
1
samp2
3
4
samp3
5
0
samp4
7
6
samp5
9
2
samp4
sp2
samp1
Zpracování dat v ekologii společenstev
sp2
David Zelený
sp1
samp2
samp5
samp1
samp3
sp1
a)
b)
c)
d)
rozmístění vzorků v
prostoru
definovaném druhy
výpočet těžiště
shluku
centrování os
rotace os
64
Legendre & Legendre (1998)
PRINCIP VÝPOČTU PCA (ANALÝZA HLAVNÍCH KOMPONENT)
David Zelený
Zpracování dat v ekologii společenstev
3D
2D
65
http://cnx.org
Příklad: rozeznávání písmen v
analýze obrazu pomocí PCA
David Zelený
Zpracování dat v ekologii společenstev
A
B
C
D
E
F
.
.
.
X
Y
Z
a11 a12 a13 a14 a15 a21 a22 a23 a24 a25 a31 a32 a33 a34 a35 a41 a42 a43 a44 a45 a51 a52 a53 a54 a55
0
1
1
1
0
1
0
0
0
1
1
1
1
1
1
1
0
0
0
1
1
0
0
0
1
1
1
1
1
0
1
0
0
0
1
1
1
1
1
0
1
0
0
0
1
1
1
1
1
0
0
1
1
1
1
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
1
0
0
0
1
1
0
0
0
1
1
0
0
0
1
1
1
1
1
0
1
1
1
1
1
1
0
0
0
0
1
1
1
0
0
1
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
0
0
1
0
0
0
0
1
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
0
0
0
1
0
1
0
1
0
0
0
1
0
0
0
1
0
1
0
1
0
0
0
1
1
0
0
0
1
0
1
0
1
0
0
0
1
0
0
0
0
1
0
0
0
0
1
0
0
1
1
1
1
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
1
1
1
1
66
Inspired by work of François Labelle (http://www.cs.mcgill.ca/~sqrt/dimr/dimreduction.html)
David Zelený
PCA1
(O-X)
PCA2
(H-I)
Zpracování dat v ekologii společenstev
vztah proměnných
A11 a A12
výsledek PCA
(1. a 2. PCA osa)
67
David Zelený
PCA1
(O-X)
PCA2
(H-I)
Zpracování dat v ekologii společenstev
vztah proměnných
A11 a A12
výsledek PCA
(1. a 2. PCA osa)
68
KTERÉ OSY PCA JSOU DŮLEŽITÉ?
David Zelený
Summary Table:
Statistic
Eigenvalues
Explained variation (cumulative)
Axis 1
0.242
24.2
Axis 2
0.2002
44.22
Axis 3
0.1608
60.3
Axis 4
0.0843
68.73
Axis 5
0.0608
74.81
Axis 6
0.0501
79.82
Axis 7
0.0389
83.71
Axis 8
0.0369
87.4
...
...
...
Axis 23
0.0002
99.99
Axis 24
0.0001
100
Zpracování dat v ekologii společenstev
25
% eigenvalue
Broken stick model
15
10
5
PC24
PC23
PC22
PC21
PC20
PC19
PC18
PC17
PC16
PC15
PC14
PC13
PC12
PC11
PC10
PC9
PC8
PC7
PC6
PC5
PC4
PC3
PC2
0
PC1
% variation
20
69
PODSTATA MODELU „ZLOMENÉ HOLE“ (BROKEN-STICK MODEL)
David Zelený
10
20
30
40
Zpracování dat v ekologii společenstev
0
hůl
hůl se po pádu na zem rozpadne
na 6 různě dlouhých částí
70
PCA: circle of equilibrium
contribution
(kruh rovnovážného příspěvku
proměnné)
poloměr = 𝑑/𝑝
kde d = počet os v zobrazení,
p = počet všech os v PCA
(rovno počtu deskriptorů)
vektory =
deskriptory
body =
vzorky
Legendre P. & Legendre L. (2012)
Numerical Ecology, p. 447
Interpretace: deskriptory (druhy
n. jiné proměnné) s vektory
delšími než poloměr kruhu
výrazně přispívají k interpretaci
daných ordinačních os (v tomto
případě první a druhé)
71
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
5 výpočetních kroků
1.
3.
Zpracování dat v ekologii společenstev
2.
začni s arbitrárním (náhodným) skóre vzorků (xi)
vypočti nové skóre pro jednotlivé druhy (species score, yi) jako
průměr skóre vzorků xi vážený abundancí druhu ve vzorcích
vypočti nové skóre pro jednotlivé vzorky (sample score, xi) jako
průměr skóre druhů yi vážený abundancí druhů ve vzorku
4.
standardizuj skóre jednotlivých vzorků (natáhni osu)
5.
pokud se skóre nemění, zastav, pokud ano, pokračuj krokem 2
72
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
Zpracování dat v ekologii společenstev
73
Lepš & Šmilauer (2003) Multivariate analysis of ...
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
Zpracování dat v ekologii společenstev
74
Lepš & Šmilauer (2003) Multivariate analysis of ...
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
Zpracování dat v ekologii společenstev
75
Lepš & Šmilauer (2003) Multivariate analysis of ...
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
Zpracování dat v ekologii společenstev
76
Lepš & Šmilauer (2003) Multivariate analysis of ...
PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA)
David Zelený
Zpracování dat v ekologii společenstev
77
Lepš & Šmilauer (2003) Multivariate analysis of ...
CA2
CA2
CA1
pravidelné
rozložení
bodů na
konci
procesu
CA2
CA2
Zpracování dat v ekologii společenstev
CA1
David Zelený
náhodné
rozložení
bodů na
začátku
iterativního
procesu
78
CA1
CA1
SIMULOVANÁ DATA
JEDEN EKOLOGICKÝ GRADIENT

300 druhů s unimodální odpovědí, různými šířkami nik

500 vzorků náhodně rozmístěných podél gradientu
Zpracování dat v ekologii společenstev
simulovaný gradient dlouhý 5000 jednotek
David Zelený

79
SIMULOVANÁ DATA
ARTEFAKTY
David Zelený
PCA - podkova
CA - oblouk
Zpracování dat v ekologii společenstev
o vzorky
+ druhy
80
ARTEFAKTY V ORDINACÍCH
PŘÍČINY
důsledek algoritmu (lineární nezávislost všech os)

důsledek projekce (nelineární vztahy mezi druhy -> lineární prostor)
David Zelený

Zpracování dat v ekologii společenstev
http://ordination.okstate.edu
82
ORDINAČNÍ DIAGRAMY
David Zelený
Zpracování dat v ekologii společenstev
lineární metoda
unimodální metoda
83
DETRENDOVANÁ KORESPONDENČNÍ ANALÝZA (DCA)
PROCES ODSTRANĚNÍ TRENDU
David Zelený
Krok 1 – rozdělení první osy na několik segmentů
Zpracování dat v ekologii společenstev
http://ordination.okstate.edu
Krok 2 – vycentrování druhé osy každého segmentu kolem nuly
85
DETRENDED CORRESPONDENCE ANALYSIS
PROCES ODSTRANĚNÍ TRENDU
David Zelený
Krok 3 – nelineární přeškálování první osy
Zpracování dat v ekologii společenstev
http://ordination.okstate.edu
Výsledek škálování:
• osy naškálované v jednotkách směrodatné odchylky (SD)
• celé druhové složení se obmění na 4 SD
86
ROZDÍL MEZI CA A DCA NA STEJNÝCH DATECH
David Zelený
CA
CA
1
DCA
DCA
0
-4
-2
-3
-1
-2
CA2
DCA2
-1
1
0
2
Zpracování dat v ekologii společenstev
-1
0
1
CA1
2
3
4
-2
-1
0
1
2
3
DCA1
87
DCA – ROZDÍLNÉ VÝSLEDKY PŘI POUŽITÍ RŮZNÉHO POČTU
DETRENDOVACÍCH SEGMENTŮ
David Zelený
DCA, # segments = 15
0
DCA2
-1
0
-2
-1
-2
-1
0
1
2
3
-2
-1
0
1
DCA1
DCA1
DCA, # segments = 26
DCA, # segments = 40
2
3
2
3
-2
0
-2
-1
-1
0
DCA2
1
1
2
2
-2
DCA2
Zpracování dat v ekologii společenstev
DCA2
1
1
2
2
3
DCA, # segments = 5
-2
-1
0
1
DCA1
2
3
-2
-1
0
1
DCA1
88
DCA NA SIMULOVANÝCH DATECH (JEDEN GRADIENT)
David Zelený
Zpracování dat v ekologii společenstev
o vzorky
+ druhy
89
VÝBĚR ORDINAČNÍ METODY NA ZÁKLADĚ DCA
LINEÁRNÍ NEBO UNIMODÁLNÍ?
David Zelený
Pokud je délka 1. osy DCA
menší než 3 SD – homogenní data - lineární metoda

větší než 4 SD – heterogenní data - unimodální metoda

v rozmezí 3-4 SD – obě techniky pracují rozumně
Zpracování dat v ekologii společenstev

Platí jen pro detrendování po segmentech a délku první osy!
90
David Zelený
Zpracování dat v ekologii společenstev
91
ANALÝZA HLAVNÍCH KOORDINÁT (PCOA)
(PRINCIPAL COORDINATE ANALYSIS)

alternativní metoda nepřímé ordinace

vstupní data – matice nepodobností mezi vzorky

výpočet matice nepodobností – jakýkoliv index nepodobnosti


Zpracování dat v ekologii společenstev
syn. MDS – Metric Dimensional Scaling
David Zelený

pokud zvolím Euklidovskou vzdálenost -> identické s PCA
pokud zvolím Chi-kvadrát vzdálenost -> obdoba CA
92
PCOA – PŘÍKLAD NA VZDÁLENOSTECH MEZI MĚSTY
1000
Copenhagen
Hamburg
Hook of Holland
Calais Cologne
Brussels
Cherbourg
Paris
0
204
583
206
966
677
2256
597
...
...
...
...
...
...
...
...
...
...
...
...
Lisbon
Lyons
Geneva
Marseilles Milan
Madrid
Gibraltar
Munich
Vienna
Barcelona
-1000
1318
1326
1294
1498
2218
803
1172
2018
...
Brussels
PCoA2
Barcelona
Stockholm
Zpracování dat v ekologii společenstev
Barcelona
Brussels
Calais
Cherbourg
Cologne
Copenhagen
Geneva
Gibraltar
Hamburg
...
Athens
3313
2963
3175
3339
2762
3276
2610
4485
2977
...
David Zelený
Vzdálenosti mezi městy (km)
Rome
Athens
-2000
-1000
0
1000
2000
PCoA1
93
NMDS (NON-METRIC MULTIDIMENSIONAL SCALING)
ORDINACE ZALOŽENÁ NA DISTANCÍCH

vstupní data – matice nepodobností mezi vzorky

výpočet matice nepodobností – jakýkoliv index nepodobnosti

iterativní algoritmus, který nemusí pokaždé dojít ke stejnému
výsledku (lokální optima)

nutno určit počet dimenzí, se kterými bude metoda pracovat

při větším množství dat VELMI časově náročná
Zpracování dat v ekologii společenstev
nemetrická varianta PCoA
David Zelený

94
NMDS
NON-METRIC MULTIDIMENSIONAL SCALING
David Zelený
Zpracování dat v ekologii společenstev
náhodné rozmístění vzorků v
prostoru
rozmístění vzorků v prostoru
respektuje jejich nepodobnost
95
Ukázka datového souboru (kódy A,B,C,D,E):
Rothkopfův experiment s
morseovkou
-.-.
-..
.
0
167
169
159
180
167
0
96
79
163
169
96
0
141
166
159
79
141
0
172
180
163
166
172
0
Zpracování dat v ekologii společenstev
50
100
. -
--
NMDS2
0
-.
..
-50
•
598 účastníkům byly přehrány
všechny dvojice kódů a pokaždé měli
rozhodnout, jestli jsou shodné nebo
jiné
matice nepodobností = počet odpovědí
„různé“
-...
David Zelený
•
.-...
-.-.
-..
.
.-
-100
.-
----.----.---.-----.----..
-.--..
.--.
.-..---.-.-.---...
.-.
-.. .-..
-... -.....-..-. -....
..- ....
...- .......
.....
--. ---
-50
0
NMDS1
50
96
NMDS – SHEPARDŮV DIAGRAM
David Zelený
2.5
1.0
1.5
2.0
< 0.05 – vynikající
< 0.1 – výborný
< 0.2 – dobrý
> 0.3 – špatný
0.5
(Clarke & Warwick 2001)
0.0
vzdálenost mezi vzorky v
ordinačním
Distance
Ordination diagramu
Pro stress-value přibližně
platí:
Non-metric fit, R2 = 0.968
Linear fit, R2 = 0.852
Zpracování dat v ekologii společenstev
3.0
stress-value = 0.18
50
100
150
nepodobnost
vzorky
Observed mezi
Dissimilarity
97
POROVNÁNÍ METOD DCA A NMDS
David Zelený
DCA
NMDS
Zpracování dat v ekologii společenstev
98
data z údolí Vltavy, klasifikace metodou TWINSPAN (Zelený & Chytrý 2007)
POROVNÁNÍ METOD DCA A NMDS
David Zelený
DCA
NMDS
Zpracování dat v ekologii společenstev
99
při větším počtu vzorků tvoří trojúhelník
nebo pěticípou hvězdu (artefakt)
má tendenci jakákoliv data zobrazit
jako kouli
POROVNÁNÍ METOD DCA A NMDS
SIMULOVANÁ DATA (JEDEN GRADIENT)
David Zelený
DCA
NMDS
Zpracování dat v ekologii společenstev
o vzorky
+ druhy
100
SIMULOVANÁ DATA
DVA RŮZNĚ DLOUHÉ GRADIENTY
David Zelený
Gradient 2 (kratší)
Zpracování dat v ekologii společenstev
Gradient 1 (delší)
101
SIMULOVANÁ DATA
DVA RŮZNĚ DLOUHÉ GRADIENTY
NMDS
Zpracování dat v ekologii společenstev
PCA
David Zelený
DCA
CA
102
SIMULOVANÁ DATA
DVA STEJNĚ DLOUHÉ GRADIENTY
NMDS
Zpracování dat v ekologii společenstev
PCA
David Zelený
DCA
CA
103
SIMULOVANÁ DATA
DVA RŮZNĚ DLOUHÉ GRADIENTY
David Zelený
krátké gradienty
dlouhé gradienty
Zpracování dat v ekologii společenstev
104
TŘI ALTERNATIVNÍ PŘÍSTUPY K NEPŘÍMÉ ORDINAČNÍ ANALÝZE
David Zelený
(a) Klasický přístup
Zpracování dat v ekologii společenstev
(b) Transformace dat (např. Hellingerova) (tb-PCA)
(c) Přes matici nepodobností (PCoA, NMDS)
105
Legendre & Legendre (2012)
POUŽITÍ PROMĚNNÝCH PROSTŘEDÍ V ORDINACI
DVA ALTERNATIVNÍ POSTUPY
vzorky
ordinační
osy
korelace, regrese
proměnné prostředí
přímé srovnání
oba přístupy jsou
relevantní a navzájem
se doplňují!
vzorky
vzorky
matice:
Y – druhové složení
X – proměnné prostředí
přímá ordinace
106
Legendre & Legendre (1998)
Zpracování dat v ekologii společenstev
nepřímé srovnání
druhy
vzorky
David Zelený
proměnné prostředí
druhy
PASIVNĚ POUŽITÉ FAKTORY PROSTŘEDÍ V NEPŘÍMÉ
ORDINACI
David Zelený
DCA2
Zpracování dat v ekologii společenstev
DCA1
107
Proměnné prostředí v nepřímé ordinaci
skóre vzorků na první a
druhé ose DCA
...
sam2
...
sam2
sam2
sam3
...
sam3
sam3
sam4
...
sam4
sam4
...
...
...
...
...
sam1
...
...
SOILDPT
korelace
sam1
PH
DCA
DCA2
DCA1
...
spe4
spe3
spe2
spe1
matice druhových dat
proměnné
prostředí
...
...
sam1
...
r1
ordinační diagram DCA
vztah proměnných prostředí
(vektory) a ordinačních os
SOILDPT
r2
PH
DCA2
DCA2
DCA1
DCA1
r1
r3
DCA2
r2
r4
korelace
proměnných
prostředí a
ordinačních os
108
David Zelený
Zpracování dat v ekologii společenstev
PŘÍMÁ ORDINAČNÍ ANALÝZA
10
60
5
15
20
25
30
sam 7
20
10
15
gradient
sam 3
25
30
sam 2
sam 3
sam 4
sam 5
-20
sam 4
20
0
5
species 1 (residual)
0
residuály
20
40
sam 1
sam 2
sam 6
sam 5
sam 6
sam 7
spe 3
sam 6
gradient
0
env 2
env 1
sam 1
spe 3
sam 5
40
species 1
sam 7
spe 2
sam 4
0
sam 6
spe 2
sam 5
spe 1
40
sam 3
80
sam 4
sam 2
60
80
100
sam 3
species 1 (predicted)
sam 2
sam 1
20
regrese
abundance druhu
na proměnné
prostředí
sam 1
predikované
hodnoty
0
spe 3
spe 2
spe 1
100
matice vzorky × druhy
spe 1
PRINCIP PŘÍMÉ ORDINAČNÍ ANALÝZY (RDA)
matice s
vysvětlujícími
proměnnými
sam 7
0
5
10
15
gradient
20
25
30
Princip přímé ordinační analýzy - pokračování
ordinační osy s omezením
(constrained axes)
spe 3
spe 2
spe 1
matice predikovaných
hodnot
počet ordinačních os
s omezením
=
počet vysvětlujících
proměnných
sam 2
PCA
ordinace
sam 3
RDA2
sam 1
sam 4
sam 5
sam 6
sam 7
spe 3
spe 2
spe 1
RDA1
(pokud je vysvětlující
proměnná kategoriální,
počet os je roven počtu
kategorií minus 1)
sam 2
sam 3
PCA
ordinace
PCA2
sam 1
sam 4
sam 5
sam 6
sam 7
matice residuálů
PCA1
ordinační osy bez omezení
(unconstrained axes)
111
Nepřímá a přímá ordinační analýza – PCA a RDA na datech z Vltavy (log + Hellinger)
Total variation is 55.45736, supplementary variables account for
(adjusted explained variation is
5.8%)
Axis 1
0.1149
11.49
0.4470
Axis 2
0.0871
20.20
0.5316
7.8%
Axis 3
0.0672
26.92
0.2164
Axis 4
0.0455
31.48
0.1728
Zpracování dat v ekologii společenstev
Summary Table:
Statistic
Eigenvalues
Explained variation (cumulative)
Pseudo-canonical correlation (suppl.)
David Zelený
Method: PCA with supplementary variables
(modře označená pole v PCA se objeví jen pokud jsou do analýzy přidány pasivní proměnné prostředí a
ukazují, kolik by tyto proměnné vysvětlily v přímé ordinační analýze)
Method: RDA
Total variation is 55.45736, explanatory variables account for
(adjusted explained variation is
5.8%)
Summary Table:
Statistic
Eigenvalues
Explained variation (cumulative)
Pseudo-canonical correlation
Explained fitted variation (cumulative)
Axis 1
0.0470
4.70
0.7638
60.39
Permutation Test Results:
On All Axes
pseudo-F=4.0, P=0.002
Axis 2
0.0308
7.79
0.6880
100.00
7.8%
Axis 3
0.0983
17.61
0.0000
Axis 4
0.0716
24.77
0.0000
113
TŘI ALTERNATIVNÍ PŘÍSTUPY K PŘÍMÉ ORDINAČNÍ ANALÝZE
David Zelený
(a) Klasický přístup: RDA zachovává euklidovské distance, CCA chi-kvadrát distance
Zpracování dat v ekologii společenstev
(b) Transformace dat (tb-RDA): používá distance vzniklé
transformací dat (např. Hellingerova distance)
(c) Přes matici nepodobností (db-RDA): zachovává
distance použité ve vstupní distanční matici
114
Legendre & Legendre (2012) podle Legendre & Gallagher (2001)
POČTY ORDINAČNÍCH OS
David Zelený
Nepřímá ordinační analýza
počet os = počet vzorků – 1
Zpracování dat v ekologii společenstev
= počet druhů (pokud počet vzorků > počet druhů)
Přímá ordinační analýza
počet všech os = stejný jako v případě nepřímé ordinace
počet os s omezením ≤ počet kvantitativních proměnných
= počet kategorií faktoru - 1
115
Nepřímá a přímá ordinační analýza – PCA a RDA na datech z Vltavy (log + Hellinger)
RDA s vysvětlujícími
proměnnými prostředí
David Zelený
PCA s pasivně
promítnutými
proměnnými prostředí
Zpracování dat v ekologii společenstev
116
ORDINAČNÍ DIAGRAMY
KONVENCE
-> body
zobrazení druhů
-> šipky (lineární metody)
-> body, centroidy (unimodální metody)

zobrazení ordinačních os



zobrazení proměnných prostředí



vodorovná bývá osa vyššího řádu (např. první)
orientace os je arbitrární
šipky (kvantitativní proměnné)
centroidy (kategoriální proměnné)
typ ordinačního diagramu:



scatterplot - 1 typ dat (vzorky nebo druhy)
biplot - 2 typy dat (např. vzorky a druhy)
triplot - 3 typy dat (např. vzorky, druhy a proměnné
prostředí)
117
Zpracování dat v ekologii společenstev

David Zelený
zobrazení vzorků
Lepš & Šmilauer (2003) Multivariate analysis of ...

ORDINAČNÍ DIAGRAMY
David Zelený
Zpracování dat v ekologii společenstev
přímá
ordinace
118
Lepš & Šmilauer (2003) Multivariate analysis of ...
nepřímá
ordinace
unimodální metoda
lineární metoda
HISTORICKÉ ORDINAČNÍ DIAGRAMY
BRAY & CURTIS 1957 - NEPŘÍMÁ GRADIENTOVÁ ANALÝZA
David Zelený
Zpracování dat v ekologii společenstev
119
Bray & Curtis (1957): An ordination of the upland forest communities of Southern Wisconsin. Ecological Monographs 27: 326-349
KOEFICIENT DETERMINACE V REGRESI
David Zelený
celková suma
čtverců
residuální suma
čtverců
Zpracování dat v ekologii společenstev
120
http://en.wikipedia.org/wiki/Coefficient_of_determination
David Zelený
vysvětlená variabilita
VYSVĚTLENÁ VARIABILITA (R2)
● R2
○ R2Adj
Zpracování dat v ekologii společenstev
počet vysvětlujících
proměnných
počet vzorků v
datovém souboru

vysvětlená variabilita stoupá s počtem vysvětlujících proměnných
(i když jsou náhodné) a klesá s počtem vzorků v datovém souboru

platí pro přímou (kanonickou) ordinační analýzu i mnohonásobnou
regresi
Peres-Neto et al. (2006) Ecology
121
● R2
○ R2Adj
Zpracování dat v ekologii společenstev
počet vysvětlujících
proměnných

David Zelený
vysvětlená variabilita
VYSVĚTLENÁ VARIABILITA (R2) A ADJUSTOVANÝ R2
počet vzorků v
datovém souboru
adjustovaný R2 se nemění s počtem vysvětlujících proměnných a
počtem vzorků v souboru
122
Peres-Neto et al. (2006) Ecology
Výpočet adjustovaného R2 pomocí Ezekielovy formule (RDA)
n ... počet vzorků
p ... počet vysvětlujících proměnných
R2Y|X ... vysvětlená variabilita bez adjustace
Výpočet adjustovaného R2 permutačním modelem (RDA, CCA)
2
𝑅perm
variabilita vysvětlená
proměnnými prostředí
po jejich znáhodnění
R2
variabilita vysvětlená
proměnnými prostředí
𝑅2
𝑅 2 adj
o kolik variability
vysvětlí proměnné
prostředí víc než by
vysvětlily náhodné
proměnné?
2
𝑅adj
= 1−
1
1 − 𝑅2
2
1 − 𝑅perm
123
VYSVĚTLENÁ VARIABILITA A ADJUSTOVANÝ R2

i náhodná proměnná vysvětlí nenulové množství variability (při
následném testování signifikance ale bude neprůkazná)

množství vysvětlené variability stoupá s počtem vysvětlujících
proměnných (i když tyto jsou třeba úplně náhodné)

nelze srovnávat variabilitu vysvětlenou modelem s různým počtem
vysvětlujících proměnných (čím víc proměnných, tím víc vysvětlené
variability)

možné řešení – použití tzv. adjustovaného R2, tzn. vysvětlené variability
ošetřené o variabilitu, kterou by vysvětlil stejný počet náhodných
proměnných

adjustovaný R2 je možné spočítat pro lineární ordinační metody, pro
unimodální je třeba použít metody založené na permutacích
Zpracování dat v ekologii společenstev
nelze srovnávat vysvětlenou variabilitu v analýzách založených na
různém počtu vzorků a druhů
David Zelený

124
PŘÍMÁ ORDINAČNÍ ANALÝZA
MONTE-CARLO PERMUTAČNÍ TEST

test první kanonické osy – vliv jen jedné kvantitativní proměnné

test všech kanonických os – vliv všech proměnných, nebo vliv jedné
kategoriální proměnné s více kategoriemi (počet os = počet kategorií – 1)

testová statistika – Fdata (pseudo-F)
Zpracování dat v ekologii společenstev
testuje nulovou hypotézu, že druhové složení je nezávislé na jedné nebo více
vysvětlujících proměnných
David Zelený

P – hladina signifikance
nx – počet permutací, kde Fperm >= Fdata
N – celkový počet permutací
125
PŘÍMÁ ORDINAČNÍ ANALÝZA
MONTE-CARLO PERMUTAČNÍ TEST
David Zelený
Zpracování dat v ekologii společenstev
126
Herben & Münzbergová (2001)
PŘÍMÁ ORDINAČNÍ ANALÝZA
MONTE-CARLO PERMUTAČNÍ TEST
David Zelený
Zpracování dat v ekologii společenstev
randomizace ploch bez
omezení (unrestricted
randomization)
randomizace ploch v blocích
(randomization within blocks
defined by covariables)
127
Herben & Münzbergová 2001
POSTUPNÝ VÝBĚR VYSVĚTLUJÍCÍCH PROMĚNNÝCH
FORWARD SELECTION

v každém kroku testuje zvlášť vliv jednotlivých proměnných (MonteCarlo permutační test)

vybere tu proměnnou, která vysvětlí nejvíce variability a zároveň je
signifikantní; tuto proměnnou pak do modelu zahrne jako kovariátu

v dalším kroku znovu testuje vliv jednotlivých proměnných na
druhová data (s odstraněním vlivu kovariát) a opakuje předchozí
kroky

testy signifikance jsou zatíženy mnohonásobným porovnáním, a jsou
proto poměrně liberální (počet signifikantních proměnných je často
nerealisticky vysoký a vyžaduje např. Bonferroniho korekci)
Zpracování dat v ekologii společenstev
ze souboru vysvětlujících proměnných umožňuje vybrat jen ty, které
mají průkazný vliv
David Zelený

128
PROBLÉM MNOHONÁSOBNÉHO POROVNÁNÍ
David Zelený
Simulace:
25 náhodně vygenerovaných
proměnných

otestování průkaznosti
korelace každé proměnné s
každou (čtvercová matice)

průkazné korelace (p < 0.05)
jsou označeny červeně

dohromady 300 analýz, z
nich je 16 průkazných
Zpracování dat v ekologii společenstev

129
PARCIÁLNÍ ORDINACE
PARTIAL ORDINATION

následně se přímou nebo nepřímou ordinací analyzuje zbytková
variabilita

„nezajímavé“ proměnné se definují jako kovariáty

pokud následuje přímá ordinace – ordinační osy představují čistý vliv
ostatních vysvětlujících proměnných bez vlivu kovariát

pokud následuje nepřímá ordinace – ordinační osy zachycují
zbytkovou variabilitu v druhových datech po odstranění vlivu kovariát
Zpracování dat v ekologii společenstev
odstraňuje část variability vysvětlené proměnnými, které jsou pro nás
nezajímavé (například vliv umístění ploch do bloků)
David Zelený

130
ROZKLAD VARIANCE
VARIANCE PARTITIONING
Zpracování dat v ekologii společenstev
vysvětlená variabilita sdílená proměnnou 1
a proměnnou 2
David Zelený
variabilita vysvětlená
proměnnou 1
variabilita vysvětlená
proměnnou 2
Borcard et al. 1992, Ecology 73: 1045–1055
zbytková variabilita
131
ROZKLAD VARIANCE
VARIANCE PARTITIONING
vysvětlená
variabilita
1a2
není
[a]+[b]+[c]
1
2
[a]
2
1
[c]
[d]
[a]
proměnná 1
[b]
Zpracování dat v ekologii společenstev
kovariáta
David Zelený
vysvětlující
proměnná
[c]
proměnná 2
sdílená variabilita [b] = ([a]+[b]+[c]) – [a] – [c]
nevysvětlená variabilita [d] = Total inertia – ([a]+[b]+[c])
[a]+[b] – celkový (marginal) vliv proměnné 1
[a] – čistý (partial, conditional) vliv proměnné 1 (bez vlivu prom. 2)
Borcard et al. 1992, Ecology 73: 1045–1055
132
NEVYSVĚTLENÁ VARIABILITA [d]
variance nevysvětlená modelem (složka D) ve skutečnosti obsahuje
variabilitu, která by mohla být vysvětlena některou z proměnných, pokud
by se data chovala podle teoretického modelu

varianci nevysvětlenou modelem tedy nelze interpretovat jen jako
zbytkovou variabilitu, která je dána šumem v datech a tím, že ne
všechny proměnné prostředí byly měřeny

Total inertia proto není měřítkem celkové variability v druhových datech,
ale variability, kterou je možné zachytit pomocí zvoleného modelu
(lineárního nebo unimodálního)

variabilita vysvětlená danou proměnnou prostředí a vypočtená jako
eigenvalue / total inertia je proto podhodnocená

vedle procenta vysvětlené variability (eigenvalue / total inertia) uvádějte
také relativní množství variability, kterou daná proměnná vysvětlí z
celkové variability vysvětlené všemi proměnnými prostředí
133
Zpracování dat v ekologii společenstev

David Zelený
ordinační metody jsou založené na modelu (lineární nebo unimodální)
odpovědi druhu na gradient prostředí, který je velkým zjednodušením
skutečnosti
Økland (1999) J. Veg.Sci. 10: 131-136

JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD?
procento variability vysvětlené hlavními osami





CANOCO: cummulative percentage variance of species data
vypočte se také jako eigenvalue / total variance
ukazuje, jak úspěšný byl celý proces ordinace
čím více jsou jednotlivé druhy korelované, tím více variability bude vysvětleno
několika málo hlavními osami
má smysl srovnávat vysvětlenou variabilitu hlavních os různými ordinačními
technikami na stejných datech
nemá smysl srovnávat vysvětlenou variabilitu hlavních os stejnými ordinačními
technikami na různých datech (eigenvalues jsou závislé na počtu hráčů ve hře –
druhů, vzorků)
Zpracování dat v ekologii společenstev


David Zelený

skóre (souřadnice) závisle proměnných (druhů) na osách


u lineárních technik skóre = regresní koeficient, v ordinačních diagramech
zobrazeny jako šipky
u unimodálních technik skóre = optimum druhu, v ordinačních diagramech
zobrazeny jako body
134
JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD?
skóry vzorků (snímků) na osách

skóry nezávislých (vysvětlujících proměnných) *


v ordinačních diagramech vzorky zobrazeny jako body (lineární i unimodální
techniky)
vzdálenost mezi body v ordinačním prostoru odpovídá nepodobnosti mezi vzorky
(ne ale nepodobnosti celého floristického složení, ale jenom té části, která je
vyjádřena zobrazenými ordinačními osami)
Zpracování dat v ekologii společenstev


David Zelený

regresní koeficienty, důležitá jsou jejich znaménka
test signifikance (Monte-Carlo permutační test) *

ukazuje na statistickou významnost použitých vysvětlujících proměnných
135
* jen přímé ordinační techniky
JEDNOTLIVÉ PROMĚNNÉ
TERMINOLOGIE
vysvětlované / závislé proměnné

vysvětlující / nezávislé proměnné, prediktory *



CANOCO: proměnné prostředí (environmental variables)
měřené nebo odhadované proměnné
vzorky, objekty, případy (cases)


CANOCO: druhy (species)
Zpracování dat v ekologii společenstev

David Zelený

CANOCO: snímky (samples)
kovariáty, nezajímavé vysvětlující / nezávislé proměnné *


CANOCO: kovariáty (covariables)
proměnné, jejichž vliv nás nezajímá a chceme ho z analýzy odstranit
136
* jen přímé ordinační techniky
PŘÍKLAD NA ROZKLAD VARIANCE
SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH
pH
Ca
cond
Mg
Na
…
Zpracování dat v ekologii společenstev
Otázka: Je druhové složení společenstev
měkkýšů na slatiništích ovlivněno více
druhovým složením vegetace, nebo
stanovištními podmínkami?
David Zelený
druhové
složení
společenstev
měkkýšů
druhové
složení
slatiništní
vegetace
měřené
proměnné
prostředí
(ve vodě)
138
Horsák M. & Hájek M. (2003)
PŘÍKLAD NA ROZKLAD VARIANCE
SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH

druhové složení vegetace –> DCA (krátký gradient) -> PCA

postupný výběr proměnných (RDA) na měkkýších



Zpracování dat v ekologii společenstev
druhové složení měkkýšů (Hellingerova transformace) -> RDA
David Zelený

mezi PCA osami reprezentujícími vegetaci
mezi proměnnými prostředí reprezentujícími stanovištní podmínky
výsledek


z vegetačních dat nejlépe vysvětlí měkkýše první dvě osy PCA
z proměnných prostředí je nejlepší obsah vápníku a konduktivita slatiništní vody

rozklad variance mezi vegetaci a proměnné prostředí

test marginálních a parciálních frakcí vysvětlené variability
139
PŘÍKLAD NA ROZKLAD VARIANCE
SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH
David Zelený
6%
p < 0.01
proměnné prostředí
[Ca + conduct]
20%
Zpracování dat v ekologii společenstev
vegetace
[PC1 + PC2]
2%
p = 0.072
[d] = 72%
140
ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A
PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY
David Zelený
Zpracování dat v ekologii společenstev
141
ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A
PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY
David Zelený
Zpracování dat v ekologii společenstev
142
PCNM
(PRINCIPAL COORDINATES OF NEIGHBOUR MATRICES)
ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A
PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY
David Zelený
Zpracování dat v ekologii společenstev
144
ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A
PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY
David Zelený
Zpracování dat v ekologii společenstev
145
PŘEHLED METOD ORDINAČNÍ ANALÝZY
raw-data-based
(založené na primárních datech)
transformationbased
linear
unimodal
(lineární)
(unimodální)
(založené na
transformovaných
primárních datech)
CA, DCA
tb-PCA
distancebased
(založené na
distanční matici)
(analýza hlavních
koordinát)
PCoA
unconstrained
(nepřímé)
constrained
(přímé)
PCA
(analýza hlavních
komponent)
RDA
(redundanční analýza)
(korespondenční a
detrendovaná
korespondenční
analýza)
(analýza hlavních
komponent na
transformovaných
primárních datech)
NMDS
(nemetrické
mnohorozměrné
škálování)
CCA
tb-RDA
db-RDA
(kanonická
korespondenční
analýza)
(redundanční analýza na
transformovaných
primárních datech)
(redundanční analýza
založená na distanční
matici)
146
MANTEL TEST
KORELACE MEZI MATICEMI NEPODOBNOSTÍ
David Zelený
Zpracování dat v ekologii společenstev
147
Legendre & Legendre 1998
MANTEL TEST
David Zelený
De
proměnná prostředí
1
0
1
4.5
2
0.4
0
2
4.1
3
0.3
0.1
0
3
4.2
4
0.7
0.4
0.3
0
4
3.8
1
2
3
4
druhová data
Dsp
sp1
sp2
1
0
1
0
3
2
1.41
0
2
1
2
3
0.3
0.1
0
3
1
2
4
0.7
0.4
0.3
0
4
2
1
1
2
3
4
(eucl.)
De
Dsp
0.4
1.41
0.3
1.41
0.1
0
0.7
2.5
0.4
1.41
0.3
1.41
Zpracování dat v ekologii společenstev
pH
r = 0.965
p = 0.015
148
SHRNUTÍ
David Zelený
Zpracování dat v ekologii společenstev
149
Legendre & Legendre 1998
POUŽÍVÁNÍ ORDINAČNÍCH METOD A SOFTWARE
(VEGETAČNÍ STUDIE)
David Zelený
Zpracování dat v ekologii společenstev
150
von Wehrden et al. (2009) JVS
PCA – PŘÍKLAD
TRENDY V NÁZVECH ČLÁNKŮ V EKOLOGICKÝCH ČASOPISECH
David Zelený
Zpracování dat v ekologii společenstev
151
Nobis & Wohlgemuth (2004) Oikos
David Zelený
Zpracování dat v ekologii společenstev
152
Nobis & Wohlgemuth (2004) Oikos
DCA – PŘÍKLAD
FLORISTICKÁ DATA Z
NP PODYJÍ
David Zelený
Zpracování dat v ekologii společenstev
skóre pro jednotlivé
kvadráty z 1. a 2. osy
DCA (na základě jejich
floristického složení) byly
promítnuty do síťové
mapy
153
Chytrý et al. (1999) Preslia
PCA – PŘÍKLAD
Zpracování dat v ekologii společenstev
Výrazný úbytek druhové bohatosti
bylinného (E1) a keřového (E2) patra v
posledních 50ti letech. Data jsou
založená na zopakování
fytocenologických snímků na plochách
snímkovaných Jaroslavem Horákem v
šedesátých letech.
David Zelený
ZMĚNY V DRUHOVÉM SLOŽENÍ PÁLAVSKÝCH DUBOHABŘIN
(R. HEDL 2005, DISERTAČNÍ PRÁCE)
Změna v druhovém složení vegetace
v průběhu 50ti let samovolné sukcese
(PCA diagram).
154
NMDS PŘÍKLAD
VLIV SUCHA NA SLOŽENÍ SPOLEČENSTEV V EXPERIMENTÁLNÍ
David Zelený
STUDII
Zpracování dat v ekologii společenstev
155
Chase (2007) PNAS
NMDS PŘÍKLAD
ZOBRAZENÍ ZMĚN V DRUHOVÉM SLOŽENÍ V PROSTORU NA
David Zelený
PŘÍKLADU TRVALÝCH PLOCH V TROPICKÉM LESE
Zpracování dat v ekologii společenstev
157
Baldeck et al. (2013)
RDA – PŘÍKLAD
VLIV ZÁSAHU NA KLÍČENÍ SEMENÁČŮ
David Zelený
RDA: počet semenáčů jednotlivých druhů v ploškách 10×10 cm jako závislá proměnná, zásah
jako vysvětlující proměnná; eig. 1. osy: 0,046, eig. 4. osy: 0,331, MC test 1. osy: p < 0,01
Zpracování dat v ekologii společenstev
158
Špačková et al.(1998) Folia Geobotanica
CCA – PŘÍKLAD
ROZDÍL MEZI PRADÁVNÝMI A DRUHOTNÝMI LESY
David Zelený
Zpracování dat v ekologii společenstev
Vojta (2007) Preslia
159
CCA – PŘÍKLAD
STANOVENÍ EKOLOGICKÉHO OPTIMA JEDNOTLIVÝCH
David Zelený
DRUHŮ MĚKKÝŠŮ PODÉL EKOLOGICKÝCH GRADIENTŮ
Zpracování dat v ekologii společenstev
160
Horsák et al. (2007) Acta Oecologica
David Zelený
Zpracování dat v ekologii společenstev
NUMERICKÁ KLASIFIKACE
PROČ MÁ SMYSL VĚCI KLASIFIKOVAT?
Zpracování dat v ekologii společenstev
http://wfc3.gsfc.nasa.gov
David Zelený
vlnová délka (~ ekologický gradient)
162
PROČ MÁ SMYSL VĚCI KLASIFIKOVAT?
Zpracování dat v ekologii společenstev
http://wfc3.gsfc.nasa.gov
David Zelený
vlnová délka (~ ekologický gradient)
163
PROČ MÁ SMYSL VĚCI KLASIFIKOVAT?
David Zelený
Zpracování dat v ekologii společenstev
164
http://www.existentialennui.com/
Knihovna Ústavu botaniky a zoologie, PřF MU v
Brně. Knihy rozklasifikované podle velikosti hřbetu.
KLASIFIKACE
David Zelený
O klasifikaci obecně platí:
smyslem je najít diskontinuity v jinak kontinuální realitě, které
můžeme pojmenovat – například proto, abychom si usnadnili
komunikaci

cílem je seskupit podobné objekty (vzorky, druhy) do skupin, které
jsou vnitřně homogenní, dobře popsatelné a zároveň dobře
odlišitelné od ostatních skupin
Zpracování dat v ekologii společenstev

O klasifikaci ekologických dat platí:

pokud analyzuji vzorky – daná skupina obsahuje vzorky s podobným
druhovým složením (např. podobná stanoviště)

pokud analyzuji druhy – daná skupina obsahuje druhy s podobným
ekologickým chováním
165
KLASIFIKACE
OBECNÉ ROZDĚLENÍ
neřízená (unsupervised, bez učitele)


cílem je vytvořit novou klasifikaci pomocí datového souboru
výslednou klasifikaci můžeme ovlivnit pouze výběrem metody (kombinace
klasifikačního algoritmu a míry podobnosti), případně požadovaného počtu shluků
numerické metody klasifikace (cluster analysis, TWINSPAN)
Zpracování dat v ekologii společenstev


David Zelený

řízená (supervised, s učitelem)



cílem je aplikovat již existující klasifikaci („danou učitelem“) na datový soubor
klasifikační systém musíme nejdříve naučit, jak má vypadat výsledná klasifikace
(training), a systém ji pak reprodukuje na dalších vzorcích
ANN – artificial neural networks, klasifikační stromy, náhodné lesy (random forests),
COCKTAIL
167
KLASIFIKACE
OBECNÉ ROZDĚLENÍ
subjektivní vs objektivní

v době rozkvětu metod numerické klasifikace se věřilo, že numerické metody
přinášejí klasifikaci založenou na objektivních kritériích, tedy tu která „skutečně
existuje“ (narozdíl od té subjektivní, která je „výmyslem badatele“)
všechny klasifikace jsou ale z principu subjektivní – v případě, že Bůh není, pak není
nikdo, kdo by řekl, která klasifikace je jediná správná
Zpracování dat v ekologii společenstev


David Zelený

neformalizovaná vs formalizovaná

formalizovaná klasifikace je taková, která je provedena na základě jasných kritérií a
díky tomu je možné ji znovu reprodukovat – opakem je klasifikace založená na
neformálních kritériích (například pocitu), kterou pak není snadné zopakovat
168
OTÁZKY, KTERÉ BYCH SI MĚL POLOŽIT PŘED TÍM, NEŽ
ZAČNU NĚCO KLASIFIKOVAT
David Zelený

Pro jaký účel klasifikaci dělám?
chci klasifikovat můj datový soubor (srovnat knihy v mojí domácí
knihovničce)
 chci vytvořit obecný klasifikační systém, který bude použitelný i na další
soubory (vytvořit knihovnický systém kategorizace knih, používaný i v
jiných knihovnách)

Zpracování dat v ekologii společenstev

Podle jakých kritérií budu objekty klasifikovat?
kritérium, podle kterého budu posuzovat, jestli si jsou objekty více či
méně podobné (knihy budu třídit podle obsahové podobnosti nebo např.
podle velikosti)
 odpovídá výběru indexu podobnosti mezi vzorky


Jak stanovím hranice mezi jednotlivými skupinami?
pravidla, podle kterých budu přiřazovat objekty do skupin
 odpovídá výběru klasifikačního algoritmu

169
KLASIFIKACE
David Zelený
klasifikační
metody
Zpracování dat v ekologii společenstev
nehierarchické
(K-means
clustering)
hierarchické
divisivní
(TWINSPAN)
aglomerativní
(klasická cluster
analysis)
170
KLASIFIKACE
David Zelený
klasifikační
metody
Zpracování dat v ekologii společenstev
nehierarchické
(K-means
clustering)
hierarchické
divisivní
(TWINSPAN)
aglomerativní
(klasická cluster
analysis)
171
KLASIFIKACE
HIERARCHICKÁ A AGLOMERATIVNÍ
David Zelený
Shluková analýza (cluster analysis )

hierarchická metoda

aglomerativní metoda


shluky jsou hierarchicky uspořádány
Zpracování dat v ekologii společenstev

shluky jsou tvořeny ‘odspodu’, tzn. postupným shlukováním jednotlivých vzorků do
větších skupin
základní volby:


míra nepodobnosti mezi vzorky (distance measure)
shlukovací (klastrovací) algoritmus (clustering algorithm)
172
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
David Zelený
Zpracování dat v ekologii společenstev
Výsledek shlukové analýzy je ovlivněn celou
řadou rozhodnutí, které provádíme
na různých úrovních
zpracování dat
výsledná
klasifikace
matice
nepodobností
primární data
sběr dat
• transformace
• strandardizace
• míra
nepodobnosti
(Euklidovská,
Bray-Curtis atd.)
• volba důležitostní
hodnoty (pokryvnost,
početnost)
• výběr klastrovacího
algoritmu (single
linkage, complete
linkage atd.)
173
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
SHLUKOVACÍ ALGORITMY
páry vzorků seřazené
podle podobností
174
výsledný dendrogram
Zpracování dat v ekologii společenstev
Legendre & Legendre 1998
matice podobností
David Zelený
Metoda jednospojná (single linkage)
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
SHLUKOVACÍ ALGORITMY
David Zelený
Metoda jednospojná (single linkage, nearest neighbour)
vzorky se pojí ke shluku, ve kterém je jim nejpodobnější vzorek

přidám se ke skupině, ve které je ten, kdo je mí nejvíc sympatický
Zpracování dat v ekologii společenstev

Metoda všespojná (complete linkage, farthest neighbour)

vzorky se připojí ke shluku až v okamžiku, kdy shluk obsahuje
všechny podobné vzorky

přidám se ke skupině ve které je ten, kdo je mi nejmíň nesympatický
single linkage
complete linkage
175
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
DENDROGRAM

nezáleží na tom, který vzorek (skupina) je vpravo a který vlevo
9
8
3
4
12
13
20
15
16
14
19
17
18
11
10
2
7
6
5
1
0.0 0.5 1.0 1.5 2.0 2.5
Zpracování dat v ekologii společenstev
distance
záleží na tom, které vzorky jsou spojeny na které úrovni
David Zelený

176
METODA JEDNOSPOJNÁ VS VŠESPOJNÁ
David Zelený
Bray-Curtis distance / Complete linkage
Zpracování dat v ekologii společenstev
metoda jednospojná se výrazně řetězí
14
15
20
6
7
4
3
8
9
13
12
2
10
5
11
18
16
8
9
5
6
7
4
3
10
2
15
20
11
18
16
13
12
14
19
1
1
17
17
19
Bray-Curtis distance / Single linkage
177
METODA JEDNOSPOJNÁ
VLIV TRANSFORMACE DRUHOVÝCH DAT
David Zelený
Single linkage / Euclidean distance / LOG transformation
Zpracování dat v ekologii společenstev
1
8
19
2
9
3
5
15
20
11
18
16
6
7
15
20
7
10
6
5
18
11
13
12
10
4
16
14
2
14
12
17
19
13
8
3
17
4
9
1
Single linkage / Euclidean distance / no transformation
transformace dat (např. logaritmická) může výrazně ovlivnit
výsledný dendrogram – v případě euklidovských vzdáleností a
jednospojné metody obzvlášť
178
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
SHLUKOVACÍ ALGORITMY
4
8
3
13
12
9
14
15
20
5
7
16
přidám se ke skupině, ve které jsou mi
všichni v průměru nejvíc sympatičtí
1

11
18
UPGMA (unweighted pair-group method
using arithmetic averages) – vzorek se
připojí ke shluku, ke kterému má
největší (neváženou) průměrnou
podobnost se všemi jeho vzorky
2
10
17
19

6
zahrnuje řadu metod, které stojí mezi
single a complete linkage a v ekologii
jsou smysluplnější
Euclidean distance / UPGMA
Zpracování dat v ekologii společenstev

David Zelený
Average linkage (např. UPGMA)
179
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
SHLUKOVACÍ ALGORITMY
4
9
8
3
16
15
20
13
12
14
1
neměla by se kombinovat se Sørensenovým
(Bray-Curtis) indexem podobnosti
11
18

2
10
6
5
7
17
19
ke shluku se připojí vzorek, jehož
vzdálenost od centroidu shluku je nejmenší
(počítáno přes čtverce vzdáleností mezi
vzorky a centroidy shluků)
Euclidean distance / Ward's method
Zpracování dat v ekologii společenstev

David Zelený
Wardova metoda (Ward’s minimum
variance method)
180
SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS)
SHLUKOVACÍ ALGORITMY

nejvíc se řetězí pro β ~ 1,
nejméně pro β = -1

optimální reprezentace
vzdáleností mezi vzorky je při
β = -0,25
Zpracování dat v ekologii společenstev
nastavení parametru β ovlivňuje
řetězení dendrogramu
David Zelený

Legendre & Legendre 1998
Flexible clustering (beta flexible)
181
KLASIFIKACE
David Zelený
klasifikační
metody
Zpracování dat v ekologii společenstev
nehierarchické
(K-means
clustering)
hierarchické
divisivní
(TWINSPAN)
aglomerativní
(klasická cluster
analysis)
182
KLASIFIKACE
HIERARCHICKÁ A DIVISIVNÍ
David Zelený
TWINSPAN (Two Way INdicator Species ANalysis)

divisivní metoda

polytetická metoda


začíná dělením celého souboru vzorků a postupuje směrem dolů
Zpracování dat v ekologii společenstev

každé dělení závisí na několika (indikačních) druzích (x monotetická
metoda – dělení ovlivňuje jediný druh)
metoda velmi oblíbená mezi vegetačními ekology

ale – algoritmus je poměrně složitý, s řadou arbitrárních kroků, a proto má
také řadu zarytých odpůrců

vzorky jsou uspořádány podle první osy korespondenční analýzy (CA,
DCA) a podle ní jsou rozděleny do dvou shluků (vzorky s pozitivním
skóre a negativním skóre)

metoda ošetří vzorky, které leží blízko středu osy, a které tak mají
velkou pravděpodobnost, že budou špatně klasifikovány
183
KLASIFIKACE
HIERARCHICKÁ A DIVISIVNÍ
David Zelený
TWINSPAN (Two Way INdicator Species ANalysis)

pseudospecies
Zpracování dat v ekologii společenstev
metoda primárně funguje pro kvalitativní data
 kvantitativní informace se dodává rozdělením druhů na pseudospecies
podle abundance (cut levels)

184
Lepš & Šmilauer (2003)
KLASIFIKACE
HIERARCHICKÁ A DIVISIVNÍ
David Zelený
TWINSPAN (Two Way INdicator Species ANalysis)

pseudospecies
Zpracování dat v ekologii společenstev
metoda primárně funguje pro kvalitativní data
 kvantitativní informace se dodává rozdělením druhů na pseudospecies
podle abundance (cut levels)


výsledkem je (mimo jiné) tabulka podobná fytocenologické

snímky z určitých klastrů a druhy s vysokou fidelitou k dané skupině jsou
seskupeny dohromady

metoda vhodná v případě, že jsou data strukturovaná podle jednoho
výrazného gradientu

vhodné na hledání (několika málo) ekologicky interpretovatelných
skupin v datech

PC-ORD, JUICE
185
TWINSPAN
David Zelený
Zpracování dat v ekologii společenstev
186
MODIFIKOVANÝ TWINSPAN
(ROLEČEK ET AL. 2009)

algoritmus se po každém
dělení na dvě skupiny
rozhoduje, kterou ze skupin
bude dále dělit – vybere tu,
která je více „heterogenní“ na
základě její betadiverzity

míru betadiverzity je nutné
zvolit (např. Jaccardův index
podobnosti)

JUICE
Zpracování dat v ekologii společenstev
na rozdíl od původního
algoritmu (a) umožňuje
modifikovaný TWINSPAN (b)
dopředu stanovit cílový počet
skupin
David Zelený

187
KLASIFIKACE
David Zelený
klasifikační
metody
Zpracování dat v ekologii společenstev
nehierarchické
(K-means
clustering)
hierarchické
divisivní
(TWINSPAN)
aglomerativní
(klasická cluster
analysis)
188
NEHIERARCHICKÁ
(shlukování metodou K-průměrů)
nehierarchická metoda – všechny shluky jsou si rovny

analogie Wardovy metody - minimalizuje sumy čtverců vzdáleností
vzorků od centroidů shluku

na začátku uživatel zvolí počet shluků (k)

iterativní metoda, začne od náhodného přiřazení vzorků do shluků,
postupně přehazuje vzorky mezi shluky a hledá optimální řešení

výsledek do určité míry záleží na počátečním rozmístění shluků do
vzorků a je proto dobré proces mnohokrát zopakovat (najít stabilní
řešení), protože metoda má tendenci nacházet lokální minima

STATISTICA, SYN-TAX 2000, R
Zpracování dat v ekologii společenstev

David Zelený
K-means clustering
Legendre & Legendre 1998
KLASIFIKACE
189
INTERPRETACE VÝSLEDKŮ NUMERICKÉ KLASIFIKACE

porovnání skupin na základě externích kritérií (např. měřených
proměnných prostředí)

porovnání skupin na základě druhového složení – stanovení
charakteristických druhů
Zpracování dat v ekologii společenstev
promítnutí výsledků do ordinačního diagramu
David Zelený

190
PROMÍTNUTÍ VÝSLEDKŮ NUMERICKÉ KLASIFIKACE DO
ORDINAČNÍHO DIAGRAMU
David Zelený
DCA + TWINSPAN
NMDS (Bray-Curtis) +
TWINSPAN
Zpracování dat v ekologii společenstev
Je vhodné, aby míra nepodobnosti mezi vzorky byla v obou
metodách (numerické klasifikaci i ordinační analýze) stejná (ze
zvolených příkladů ten vlevo je vhodné řešení, vpravo nevhodné)
data z údolí Vltavy, klasifikace metodou TWINSPAN (Zelený & Chytrý 2007)
191
SILHOUETTE DIAGRAM
Borcard et al. (2011) Numerical Ecology with R
Zpracování dat v ekologii společenstev
192
David Zelený
• hodnotí stupeň
podobnosti daného
vzorku ke klastru, do
kterému byl zařazen, a
srovnává ho s jeho
podobností k nejbližšímu
jinému klastru
• negativní hodnoty – tyto
vzorky byly s velkou
pravděpodobností
špatně klasifikovány (ve
skutečnosti patří jinam)
HEAT MAP
David Zelený
(intenzita barvy se
zvyšuje s abundancí
druhu ve vzorku)
Zpracování dat v ekologii společenstev
193
Borcard et al. (2011) Numerical Ecology with R
HEAT MAP
David Zelený
Zpracování dat v ekologii společenstev
194
Borcard et al. (2011) Numerical Ecology with R
David Zelený
Zpracování dat v ekologii společenstev
195
STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY
David Zelený
Analýza indikačních druhů (Dufrêne & Legendre 1997) - IndVal
bere v potaz dva parametry:
specificita𝑘𝑗 =
Zpracování dat v ekologii společenstev

průměrná abundance druhu 𝑗 uvnitř shluku 𝑘
součet průměrných abundancí druhu 𝑗 uvnitř ostatních shluků
fidelita 𝑘𝑗 =
počet vzorků ve shluku 𝑘 obsahující druh 𝑗
celkový počet vzorků ve shluku 𝑘
IndVal𝑘𝑗 = specificita𝑘𝑗 * fidelita 𝑘𝑗 (pro druh j ve shluku k)
IndVal𝑗 = max (IndVal𝑘𝑗 ) (pro druh j celkově)


možnost testování signifikance Monte-Carlo permutačním testem
dostupné v PC-ORD
196
STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY
David Zelený
Analýza indikačních druhů (Dufrêne & Legendre 1997) - IndVal
Zpracování dat v ekologii společenstev
(příklad z knihy
Legendre &
Legendre 2013)
197
STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY
David Zelený
Fidelita (věrnost) druhu ke vzorku (Chytrý et al. 2002)

Zpracování dat v ekologii společenstev
Phi koeficient asociace (analogie Pearsonova korelačního
koeficientu r)
ϕ = (ad – bc) / √ (a + b)(c + d)(a + c)(b + d)




Počet vzorků
ve shluku A
mimo shluk A
obsahující daný druh
a
b
neobsahující daný druh
c
d
rozsah <-1, 1>, 0 při shodné frekvenci uvnitř a vně shluku
v JUICE možnost standardizace na velikost skupiny
exaktní Fisherův test pro testování signifikance
dostupné v programu JUICE
198
David Zelený
Zpracování dat v ekologii společenstev
REGRESE VS KALIBRACE
METODY GRADIENTOVÉ ANALÝZY
Apriorní znalost
vztahů mezi druhy
a prostředím?
Použijeme:
Dostaneme:
počet
druhů
1, n
1
ne
regrese
závislost druhu na
prostředí
žádné
n
ano
kalibrace
odhady hodnot
charakteristik prostředí
žádné
n
ne
nepřímá
ordinace
osy variability v druhovém
složení
1, n
n
ne
přímá
ordinace
variabilita ve druhovém
složení vysvětlená
charakteristikami prostředí
Zpracování dat v ekologii společenstev
počet
charakteristik
prostředí
David Zelený
Data, která máme:
200
Lepš & Šmilauer (2003) Multivariate analysis of...
REGRESE VS KALIBRACE
•
odhad směrnice
regresní přímky
metoda nejmenších
čtverců
•
odhad hodnoty
proměnné prostředí
metoda váženého
průměrování (váhy =
směrnice regresních
přímek)
nepoužívá se
•
•
kalibrace
•
•
•
•
•
•
Zpracování dat v ekologii společenstev
unimodální model
David Zelený
regrese
lineární model
odhad optima druhu
na gradientu prostředí
metoda váženého
průměrování
odhad hodnoty
proměnné prostředí
metoda váženého
průměrování (váhy =
abundance druhu ve
vzorku)
používá se často
201
REGRESE
UNIMODÁLNÍ ODPOVĚĎ DRUHU
David Zelený
Odhad optima druhu váženým průměrováním
𝑛
𝑗=1 Env𝑗 × Abund𝑗
𝑛
𝑗=1 Abund𝑗
Zpracování dat v ekologii společenstev
WA Sp =
Env 𝑗 – hodnota gradientu prostředí ve vzorku j
Abund 𝑗 – abundance druhu ve vzorku j
n – celkový počet vzorků v souboru
abundance druhu

abundance druhu v
jednotlivých vzorcích
vypočtený vážený průměr
202
gradient prostředí
KALIBRACE
UNIMODÁLNÍ ODPOVĚĎ DRUHU

ignoruje toleranci druhu
abundance druhu
WA Samp =
Zpracování dat v ekologii společenstev
odhad hodnoty gradientu pro vzorek je stanoven průměrem optim
jednotlivých druhů, vážených jejich abundancí
David Zelený

𝑠
𝑖=1 IV𝑖 × Abund𝑖
𝑠
𝑖=1 Abund𝑖
IV𝑖 – indikační hodnota druhu i
Abund 𝑗 – abundance druhu i ve vzorku
s – celkový počet druhů ve vzorku
Druh 3
Druh 4
Druh 2
Druh 1
204
gradient prostředí
KALIBRACE
UNIMODÁLNÍ ODPOVĚĎ DRUHU
David Zelený
Příklady použití:
saprobní index v limnologii (založený na rozsivkách)

použití v paleoekologii k rekonstrukci ekologických poměrů v
minulosti na základě fosilních nálezů

Ellenbergovy (nebo jiné) indikační hodnoty pro rostlinné druhy (viz
dále)

CWM (community-weighted mean) – počítá vážený průměr
funkčních vlastností druhů pro vzorek (functional traits)
Zpracování dat v ekologii společenstev

205
David Zelený
ELLENBERGOVY INDIKAČNÍ HODNOTY
Zpracování dat v ekologii společenstev
2
5
3 2 6 6
ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH)

hodnoty na ordinální škále (1-9, případně 1-12 pro vlhkost)

optima stanovená na základě terénních pozorování, v některých
případech upřesněna experimentálně

hodnoty tabelované původně pro Německo, ale používané i v
okolních zemích, pro vzdálenější státy (Anglie, Itálie, Řecko) byly tyto
hodnoty překalibrovány, jinde (Maďarsko, Švýcarsko) se používají
alternativní hodnoty od jiných autorů (Borhidi, resp. Landolt)

tabulky obsahují pouze údaje o druhových optimech, ne o šířkách
druhové niky

v případě, že nemám měřená data o proměnných prostředí,
průměrné EIH nabízejí ekologicky intuitivní odhad stanovištních
podmínek
Zpracování dat v ekologii společenstev
optima druhů rostlin na gradientu živin, vlhkosti, půdní reakce,
kontinentality, teploty, světla a salinity (salinita se ve Střední Evropě
nepoužívá)
David Zelený

207
ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH)
POUŽITÍ PRO KALIBRACI
David Zelený
1
2
3
6
7
7
4
7
5
3
2
1
2
3
1
0
1
0
1
0
1
0
1
0
0
0
1
0
1
1
0
1
1
1
0
1
0
1
1
0
0
1
0
1
0
1
0
Zpracování dat v ekologii společenstev
Mycelis muralis
Moehringia trinervia
Mercurialis perennis
Lathyrus vernus
Myosotis sylvatica
Milium effusum
Melica nutans
Melampyrum pratense
Myosotis ramosissima
Lychnis viscaria
Melittis melissophyllum
EIV pro
půdní reakci
4.8
průměr
208
ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH)
POUŽITÍ PRO KALIBRACI
David Zelený
1
2
3
6
7
7
4
7
5
3
2
1
2
3
1
0
1
0
1
0
1
0
1
0
0
0
1
0
1
1
0
1
1
1
0
1
0
1
1
0
0
1
0
1
0
1
0
průměrná
hodnota:
4.8
3.9
4.6
Zpracování dat v ekologii společenstev
Mycelis muralis
Moehringia trinervia
Mercurialis perennis
Lathyrus vernus
Myosotis sylvatica
Milium effusum
Melica nutans
Melampyrum pratense
Myosotis ramosissima
Lychnis viscaria
Melittis melissophyllum
EIV pro
půdní reakci
209
VÝPOČET PRŮMĚRNÝCH EIH
David Zelený
Empirická zkušenost
s ekologií druhů

průměrné
Ellenbergovy
indikační
hodnoty
Zpracování dat v ekologii společenstev
H. Ellenberg
Data o druhovém
složení
průměrná EIH pro daný vegetační snímek obsahuje dvojí informaci:
1.
2.
ekologicky relevantní informaci o charakteru stanoviště, a to díky použití
tabelovaných druhových EIH, které jsou založeny na empirických pozorování
ekologických nároků druhů v terénu
informaci o podobnosti druhového složení daného snímku k ostatním snímkům v
datovém souboru, která je v nich „uložena“ díky způsobu, jak jsou průměrné EIH
počítány
211
VÝPOČET PRŮMĚRNÝCH EIH
David Zelený
Empirická zkušenost
s ekologií druhů

průměrné
Ellenbergovy
indikační
hodnoty
Zpracování dat v ekologii společenstev
H. Ellenberg
Data o druhovém
složení
díky způsobu jak jsou počítány, obsahují průměrné EIH informaci o
podobnosti v druhovém složení mezi vegetačními snímky


vegetační snímky s úplně stejným druhovým složením budou mít přesně stejné
průměrné EIH – pro měřené faktory toto ale neplatí
malý rozdíl v druhovém složení mezi vegetačními snímky povede jen k malému
rozdílu v jejich průměrných EIH
212
VÝPOČET PRŮMĚRNÝCH EIH
David Zelený
Empirická zkušenost
s ekologií druhů
průměrné
Ellenbergovy
indikační
hodnoty
Zpracování dat v ekologii společenstev
H. Ellenberg
Data o druhovém
složení
‼

problém nastává v okamžiku, kdy jsou průměrné EIH analyzovány
současně s daty o druhovém složení, ze kterých jsou vypočteny
213
VYTVOŘENÍ PRŮMĚRNÝCH EIH, KTERÉ NEOBSAHUJÍ
EKOLOGICKOU INFORMACI
David Zelený
Zpracování dat v ekologii společenstev
průměrné reálné EIH
pro půdní reakci:
průměrné znáhodněné EIH
pro půdní reakci:

průměrné reálné EIH – obsahují ekologicky relevantní informaci a
informaci o podobnosti v druhovém složení

průměrné znáhodněné EIH – obsahují pouze informaci o podobnosti
v druhovém složení (ekologicky relevantní informace byla zničena
promícháním druhových EIH mezi druhy)
214
KORELACE PRŮMĚRNÝCH EIH SE SKÓRY SNÍMKŮ NA
OSÁCH DCA
David Zelený
Počet signifikantních korelací mezí osami
DCA a průměrnými znáhodněnými EIH
(šedé sloupečky) nebo náhodnými čísly
(bílé sloupečky) – 1000 opakování
Zpracování dat v ekologii společenstev
průměrná EIH bude s velkou
pravděpodobností signifikantně
korelovaná s DCA, i když
neobsahuje ekologickou
informaci!
215
PRŮMĚRNÉ EIH V NEPŘÍMÉ ORDINACI
David Zelený
DCA2
R2
Porig
Pmodif
Světlo
0,477
0,879
0,600
< 0,001
0,004
Teplota
0,350
0,937
0,471
< 0,001
0,011
Kontinentalita
0,726
0,688
0,148
0,004
0,452
Vlhkost
-0,925
0,381
0,897
< 0,001
< 0,001
Živiny
-0,998
0,066
0,831
< 0,001
< 0,001
Půdní reakce
-0,653
0,757
0,429
< 0,001
0,032
Zpracování dat v ekologii společenstev
DCA1
216
+
+
+
+
+
+
+ +
+ +
3
+
+
4
3
2
1
+
2
+
3.5
náhodná
čísla
5
++ + +
+
+
+
++
++
+ ++
+
+
+ ++
+
+ +++ +
++
+
++
+
+
++ +
+
+ + +
+
+
+
+
+
+
+
+ +
++ + +
+
+ +
+ +
+
+ +
++
+
+
++
+
průměrné
znáhodnéné EIH
+
+
++
průměrné reálné EIH
6
+
náhodná
čísla
+
+
měřené pH
+
++
[%]
Explained variability
variabilita
vysvětlená
[%]
Ellenberg
Mean
půdní reakci
proreaction
EIH
průměrná
Zpracování dat v ekologii společenstev
5
7
4
David Zelený
POROVNÁNÍ MĚŘENÉHO PŮDNÍHO PH A VYPOČTENÉ
PRŮMĚRNÉ EIH PRO PŮDNÍ REAKCI
VYSVĚTLUJÍCÍ PROMĚNNÉ V CCA
0
4.0
4.5
měřené pH
Measured soil pH
5.0
real pH
měřené
pH
Ellenberg reaction
EIH pro půdní
reakci
Průměrná EIH pro půdní reakci vysvětlí víc variability než měřené
pH, i když obě proměnné jsou spolu těsně korelované
217
PRŮMĚRNÉ ELLENBERGOVY INDIKAČNÍ HODNOTY
PRAVIDLA POUŽITÍ

pokud jsou k dispozici relevantní měřené faktory prostředí, není třeba
používat zároveň i průměrné EIH jen proto, že je tak snadné je
vypočíst

průkaznost jejich vztahu s jinými proměnnými, které jsou odvozeny
ze stejných druhových dat, by měla být testována modifikovaným
permutačním testem, který bere v potaz skutečnost, že testované
proměnné na sobě nejsou nezávislé

průměrné EIH by neměly být bez dalšího statistického ošetření
srovnávány s analogickými měřenými faktory prostředí, protože se
oproti nim mohou neoprávněně jevit lepšími, než ve skutečnosti jsou
(například tím, že jsou lépe korelované nebo častěji a více průkazné)
Zpracování dat v ekologii společenstev
použití průměrných EIH v analýze spolu s jinými proměnnými
vypočtenými z těchto dat může vést k závěrům, které jsou
optimističtější, než by ve skutečnosti měly být
David Zelený

219
PŘÍKLADY NA POUŽÍTÍ PRŮMĚRNÝCH EIH
David Zelený
Zpracování dat v ekologii společenstev
Použití na floristická data z NP Podyjí
– ekologické gradienty v krajině
(Chytrý et al. 1999, Preslia)
220
David Zelený
Zpracování dat v ekologii společenstev
Ekologická
kalibrace
vegetačních
jednotek v přehledu
Vegetace ČR
(Chytrý [ed.] 2007)
221
David Zelený
Zpracování dat v ekologii společenstev
INDEXY DIVERZITY
ALFA, BETA A GAMA DIVERZITA
Alfa diverzita


druhová bohatost vzorku
Beta diverzita (species turnover)
změna v druhovém složení mezi vzorky
Zpracování dat v ekologii společenstev


David Zelený

Gama diverzita

celková druhová bohatost regionu
Robert Harding
Whittaker
(1920-1980)
© Cornel University Library
Jurasinski et al. (2009)
223
David Zelený
Zpracování dat v ekologii společenstev
http://ordination.okstate.edu/
ALFA, BETA A GAMA DIVERZITA
224
MÍRY ALFA DIVERZITY
DRUHOVÁ BOHATOST VS VYROVNANOST

vyrovnanost (evenness, equitability) vyjadřuje relativní zastoupení
jednotlivých druhů ve vzorku (nejvyšších hodnot dosahuje při
rovnoměrném relativním zastoupením všech druhů)

jednotlivé indexy alfa diverzity (např. Shannonův nebo Simpsonův)
se liší právě tím, jestli kladou větší důraz na bohatost (Shannon)
nebo vyrovnanost (Simpson)

alfa a gama diverzita se někdy označují jako inventární diverzita
(inventory diversity) – podstata je pro obě míry stejná (vyjádřené
počty druhů, případně indexem diverzity), liší se ale škálou (alfa je
diverzita na lokální škále, gama na regionální)

beta diverzita je výrazně odlišný koncept – jiná filozofie, jiné jednotky
Zpracování dat v ekologii společenstev
druhová bohatost (species richness) vyjadřuje počet druhů ve
vzorku
David Zelený

225
n
MÍRY ALFA DIVERZITY
SHANNONŮV INDEX
H′ = −
pi × ln(pi )
i=1
David Zelený
pi ... relativní abundance druhu i
n ... počet druhů ve společenstvu
označovaný také jako Shannon-Wiener index (nesprávně jako ShannonWiever)

odvozen z informační teorie (entropie systému - s rostoucí entropií vzrůstá
neuspořádanost systému, očekávatelná míra překvapení)

vyjadřuje nejistotu, se kterou jsem schopen předpovědět, jakého druhu
bude náhodně vybraný jedinec ze vzorku; nejistota klesá s klesajícím
počtem druhů a s klesající vyrovnaností (více dominantních druhů)

hodnoty v ekologických datech většinou v rozmezí 1,5 – 3,5

maximální velikost indexu pro počet druhů S nastane, pokud mají všechny
druhy stejnou relativní frekvenci:
Zpracování dat v ekologii společenstev

H’max = ln (S)

efektivní počet druhů (kolik druhů by se vyskytovalo ve vzorku s diverzitou
H, pokud by se všechny druhy vyskytovaly se stejnou frekvencí):
eH‘

vyrovnanost odvozená ze Shannonova indexu (Shannon’s evenness)
J = H’ / H’max = H’ / ln (S)
226
n
MÍRY ALFA DIVERZITY
SIMPSONŮV INDEX
D=
pi2
𝑆𝐷 = 1 − 𝐷
i=1
vyjadřuje pravděpodobnost, že dva náhodně vybraní jedinci
budou patřit ke stejnému druhu

jeden z nejlepších (z hlediska interpretace) indexů diverzity

se zvyšující se diverzitou hodnota indexu klesá – proto se častěji
používá komplementární (1-D) nebo reciproká forma indexu (1/D)

zdůrazňuje dominanci druhu (při počtu druhů > 10 záleží jeho
velikost prakticky už jen na dominanci druhů)

efektivní počet druhů:

vyrovnanost odvozená ze Simpsona (Simpson’s evenness):
E = (1/D) / S
Zpracování dat v ekologii společenstev

David Zelený
pi ... relativní abundance druhu i
n ... počet druhů ve společenstvu
1/(1-SD) = 1/D
(efektivní počet druhů/reálný počet druhů)
227
PŘÍKLAD – EFEKTIVNÍ POČET DRUHŮ
Simpson
efektivní
druhů
index
počet druhů
1122334455
5
0,81)
5,03)
Spol. 2:
1111112345
5
0,62)
2,54)
Zpracování dat v ekologii společenstev
Spol. 1:
David Zelený
počet
Výpočet:
1)
1 – ∑ p2 = 1 - 5*(2/10) 2 = 1 – 5*0,04 = 1 – 0,2 = 0,8
2)
1 – ∑ p2 = 1 – ((6/10)2 + 4*(1/10)2) = 1 – (0,36 + 0,04) = 0,6
3)
1/(1-SD) = 1/(1-0,8) = 5
4)
1/(1-SD) = 1/(1-0,6) = 2,5
228
MÍRY ALFA DIVERZITY
ad hoc doporučení:


nemá smysl počítat velké množství indexů alfa diverzity a všechny je používat –
vhodnější je rozhodnout se hned na začátku, který z aspektů alfa diverzity (bohatost
nebo vyrovnanost) mě zajímá, a podle toho vybrat index
nejjednodušší volba je použítí druhové bohatosti (počtu druhů)
Simpsonův index je intuitivně interpretovatelný, naopak interpretace Shannonova
indexu je obtížná a je lépe ho nepoužívat (i když je populární)
Zpracování dat v ekologii společenstev


David Zelený

kde spočítat:


EstimateS (R. Colwell, http://viceroy.eeb.uconn.edu/estimates)
BioDiversityPro (Neil McAleece,
http://www.sams.ac.uk/research/software/research/software/bdpro.zip)
229
MÍRY BETA DIVERZITY
David Zelený

popisuje rozdílnost v druhovém
složení mezi vzorky
Zpracování dat v ekologii společenstev
Dva základní typy beta diverzity:
turnover (obrat druhů podél
ekologického, prostorového nebo
časového gradientu)
1.

Kolik nových druhů přibude a kolik jich
ubude, když se pohybuji podél
gradientu?
variation (variabilita v druhovém
složení mezi vzorky, bez ohledu
na směr nějakého gradientu)
2.


Opakují se v různých vzorcích pořád ty
samé druhy?
Jak moc celkový počet druhů v regionu
přesahuje průměrnou druhovou
bohatost vzorku?
230
Anderson et al. (2011)
MÍRY BETA DIVERZITY
KLASICKÉ INDEXY

Whittakerova beta diverzita (multiplikativní míra):
Zpracování dat v ekologii společenstev
klasické indexy neberou v potaz druhové složení, ale jen počty druhů
na lokální (alfa) a regionální (gamma) úrovni
David Zelený

βw = (γ / α’) - 1
α’ ... průměrná druhová bohatost vzorků
 kolikrát bohatost regionu přesahuje průměrnou bohatost vzorku

Additivní míra beta diverzity:
βAdd = γ – α‘
 průměrný počet druhů, které chybí v jednom náhodně vybraném vzorku/ploše
 výhodou je, že jednotkami jsou počty druhů

Multiplikativní míra, která bere v potaz vyrovnanost:
βShannon = Hγ / Hα
 místo počtu druhů používá Shannonův index diverzity vypočtený pro regionální a
lokální druhovou bohatost
231
MÍRY BETA DIVERZITY
MNOHOROZMĚRNÉ INDEXY

používá indexy podobnosti (případně nepodobnosti) v druhovém
složení mezi páry vzorků/ploch



Zpracování dat v ekologii společenstev
mnohorozměrné indexy pracují přímo s druhovým složením a hledají
rozdíly v druhovém složení dvou a více vzorků/ploch
David Zelený

Bray-Curtis, Jaccard, Sorensen, Euclidovská vzdálenost atd.
beta diverzita skupiny vzorků/ploch se spočte jako průměrná hodnota těchto
podobností
délka první osy DCA také vyjadřuje beta diverzitu (v jednotkách SD)
232
MÍRY BETA DIVERZITY
MNOHOROZMĚRNÉ INDEXY
David Zelený
Rozdíly v interpretaci beta diverzity založené na Bray-Curtis indexu
nepodobnosti a Euklidovské vzdálenosti
Anderson et al. (2011)

na příkladu rozdílu v druhovém složení korálových útesů (Indonésie) v letech 1981,
1983 a 1985 (zásah El Nino v roce 1982)
NMDS ordinace
Zpracování dat v ekologii společenstev

233
MÍRY BETA DIVERZITY
MNOHOROZMĚRNÉ INDEXY
Roleček et al. (2009) J. Veg. Sci.
234
Zpracování dat v ekologii společenstev
Průměrná
Jaccardova nebo
Sorensenova
nepodobnost
mezi páry
vzorkůindexy nezávislé
na počtu vzorků
David Zelený
Whittakerova beta
a Total inertia indexy závislé na
počtu vzorků
INDEXY FUNKČNÍ DIVERZITY

druhová bohatost se často považuje za odhad funkční diverzity, ale
nepřesný – dva různé druhy mohou ve společenstvu plnit stejnou
funkci (mít stejnou kombinací funkčních typů)

Rao index (Lepš et al. 2006 Preslia)

Zpracování dat v ekologii společenstev
funkční diverzita – zohledňuje diverzitu funkčních typů (functional
traits), které se ve vzorku vyskytují
David Zelený

FD = ∑i ∑j dij pi pj
dij ... nepodobnost mezi druhem i a j
pi, pj ... relativní abundance druhu i a j
zobecněná forma Simpsonova indexu diversity
235
AKUMULAČNÍ DRUHOVÁ KŘIVKA
SPECIES ACCUMULATION CURVE

zvláštním typem je species-area curve (ale jen v případě, že plocha
narůstá v rámci určitého území, neplatí pro ostrovy)

čte se zleva doprava

může být extrapolována (zvýší intenzita průzkumu celkový počet
nalezených druhů?)
Zpracování dat v ekologii společenstev
vynáší kumulativní počet druhů S v závislosti na intenzitě vzorkování n
(počet jedinců, počet ploch, čas)
David Zelený

236
RAREFAKČNÍ KŘIVKA
RAREFACTION CURVE

porovnání druhové bohatosti mezi společenstvy s různým počtem
jedinců/vzorků

čte se zprava doleva

rozdíl mezi sample based a individual based rarefaction
Zpracování dat v ekologii společenstev
cílem je zjistit, jaká by byla druhová bohatost, pokud bychom v daném
společenstvu nasbírali menší počet jedinců/vzorků (to rarefy – rozředit)
David Zelený

237
Michalcová et al. (2011) Journal of Vegetation Science
David Zelený
Zpracování dat v ekologii společenstev
238
SOFTWARE
(MIMO R, VE KTERÉM SPOČTETE VŠECHNO)
indexy alfa diverzity (Shannon, Simpson atd.) a beta diverzity



Biodiversity Pro (Neil McAleece, http://www.sams.ac.uk/research/software)
EstimateS (Robert Colwell, http://viceroy.eeb.uconn.edu/estimates)
PC-ORD 5
JUICE
Zpracování dat v ekologii společenstev


David Zelený

species accumulation curve a rarefaction


PC-ORD 5
EstimateS (Robert Colwell, http://viceroy.eeb.uconn.edu/estimates)
239
David Zelený
Zpracování dat v ekologii společenstev
TESTOVÁNÍ PRŮKAZNOSTI A
POUŽÍVÁNÍ HODNOTY P
ZÁKLADNÍ DEFINICE
David Zelený
Hodnota P (P value)


Zpracování dat v ekologii společenstev

pravděpodobnost, že bychom získali stejně velkou nebo větší hodnotu testové
statistiky za předpokladu platnosti nulové hypotézy
čím menší je hodnota P, tím silnější je argument ukazující na neplatnost nulové
hypotézy
ale pozor – vysoké hodnoty P nejsou důkazem, že nulová hypotéza je pravdivá!
(např. pokud nemůžete najít statisticky signifikantní rozdíl mezi dvěma druhy,
neznamená to, že můžete tvrdit, že oba druhy jsou stejné)
V případe porovnání dvou výběrů (např. t-test) se hodnota P



snižuje pokud se skutečný rozdíl mezi průměry výběrů zvýší
snižuje se zvyšujícím se počtem opakování
zvyšuje s variabilitou v datech
241
P HODNOTA – DŮKAZ, KTERÝ EXISTUJE PROTI PLATNOSTI
NULOVÉ HYPOTÉZY
David Zelený
Zpracování dat v ekologii společenstev
P hodnota
náznak důkazu, ale
přesvědčivý
nepřesvědčivý
středně silný
ne
máme důkaz proti platnosti
nulové hypotézy?
Ramsey & Schaffer (2002)
242
DOPORUČENÍ

Neklást důraz na binární rozhodnutí (signifikantní vs nesignifikantní)

Spolu s hodnotou P je třeba uvádět i tzv. velikost účinku (effect size),
(např. R2 u regrese, Pearsonův korelační koeficient r u korelace)

Vhodné je testovaný vztah vizualizovat (boxploty pro porovnání výběrů,
bodový diagram závislosti dvou proměnných aj.), a pokud není vztah z
obrázku patrný, věc důkladně prošetřit (není třeba průkaznost
způsobena výskytem jednoho odlehlého – a vlivného – pozorování?)

Obecně platí, že k výsledkům by měly být dostupná i primární data (v
elektronické podobě v příloze, případně na vyžádání), a detailní postup,
jak byla analyzována (např. R skript). Sdílení dat a detailní popis
metodiky je základem transparentního výzkumu a umožňuje zopakování
analýz a případné odhalení chyb.
Zpracování dat v ekologii společenstev
P hodnoty by měly být posuzovány jako důvěryhodnost důkazu, který
máme proti platnosti nulové hypotézy (Dá se rozdílu věřit? Je důkaz
důvěryhodný?)
David Zelený

243
David Zelený
EKOLOGICKÝCH EXPERIMENTŮ
“To call in the statistician after the experiment is done may be
no more than asking him to perform a post mortem
examination: he may be able to say what the experiment died
of.”
Sir Ronald Fisher, Indian Statistical Congress, Sankhya 1939
Zpracování dat v ekologii společenstev
DESIGN
ZÁKLADNÍ OTÁZKA: CO CHCI EXPERIMENTEM ZJISTIT?
David Zelený
Jaká je variabilita proměnné Y v čase nebo prostoru?


Zpracování dat v ekologii společenstev

pattern description
nejčastější otázka v ekologických observačních studiích
Má faktor X vliv na proměnnou Y?



hypothesis testing, otázka pro manipulativní experiment
může platit i pro některé přírodní experimenty, ale výsledky těchto testů jsou
podstatně slabší (nemáme kontrolu nad vlivem ostatních faktorů, které mohou
výsledky ovlivnit)
Chová se proměnná Y tak, jak předpovídá hypotéza H?




klasická konfrontace mezi teorií a reálnými daty
platí pro data získaná jak manipulativním tak přírodním experimentem
ne vždy je snadné najít správnou hypotézu
Jaký model nejlépe vystihuje vztah mezi faktorem X a proměnnou
Y?


experimentem sbíráme podklady pro matematické modelování
245
MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY
Manipulativní experimenty


uměle manipulujeme vysvětlující proměnnou (X) a sledujeme reakci vysvětlované
proměnné (Y)
umožňuje přímé testování hypotéz
známe směr vztahu mezi příčinou a důsledkem - kauzalita
Zpracování dat v ekologii společenstev


David Zelený

Přírodní experimenty (pozorování, observační studie)



vysvětlující proměnnou „manipuluje“ sama příroda
slouží spíše ke generování než testování hypotéz
neznáme směr vztahu mezi příčinou a důsledkem - korelace
246
MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY
SROVNÁNÍ TESTOVANÝCH HYPOTÉZ
David Zelený
Příklad: na ostrovech v Karibiku sledujeme vztah mezi počtem ještěrek
na určité ploše a počtem pavouků (Gotelli & Ellison 2004)
Zpracování dat v ekologii společenstev
Manipulativní experiment

Provedení:


Nulová hypotéza:


v jednotlivých plochách (klecích) je uměle ovlivněn počet ještěrek a sledováno
množství pavouků
počet ještěrek nemá vliv na počet pavouků v klecích
Alternativní hypotéza:

se vzrůstající hustotou ještěrek klesá počet pavouků (ještěrky žerou pavouky)
247
MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY
SROVNÁNÍ TESTOVANÝCH HYPOTÉZ
David Zelený
Přírodní experiment (pozorování, observační studie)

Provedení:

na vybraných plochách je sledován počet ještěrek a počet pavouků
Zpracování dat v ekologii společenstev

Možné hypotézy:
1.
2.
3.
4.
počet ještěrek (negativně) ovlivňuje počet pavouků (ještěrky žerou pavouky)
počet pavouků má vliv na počet ještěrek (draví pavouci napadají mláďata
ještěrek)
počet ještěrek i pavouků je ovlivňován neměřeným faktorem prostředí (třeba
vlhkostí)
některý faktor prostředí ovlivňuje sílu vztahu mezi ještěrkami a pavouky (třeba
zase vlhkost)
248
MANIPULATIVNÍ EXPERIMENT
„PRESS“ VS „PULSE“ EXPERIMENT
David Zelený
„Press“ experiment (experiment „pod stálým
tlakem“)

zásah je proveden na začátku experimentu a pak znovu
v pravidelných intervalech
měří resistenci systému na experimentální zásah – jak
je systém (společenstvo) schopné odolávat, případně se
přizpůsobit změnám v podmínkách prostředí
Zpracování dat v ekologii společenstev

závisle proměnná

čas
„Pulse“ experiment (pulzní experiment, „jednou
a dost“)


zásah je proveden jen jednou, obvykle na začátku
experimentu
měří resilienci systému – jak pružně je systém
(společenstvo) schopné reagovat na experimentální
zásah
závisle proměnná

249
čas
PŘÍRODNÍ EXPERIMENT (POZOROVÁNÍ)
„SNAPSHOT“ VS „TRAJECTORY“ EXPERIMENT
„Snapshot“ experiment (momentka)



opakuje se v prostoru, ale ne v čase
sběr vzorků provedu na několika (mnoha) lokalitách v relativně krátkém čase (týden,
sezóna, dva roky sběru dat pro diplomku ...)
představuje většinu přírodních experimentů v ekologii
zahrnuje i sukcesní studie, kdy sledujeme zároveň různá sukcesní stadia
Zpracování dat v ekologii společenstev


David Zelený

„Trajectory“ experiment (sledujeme trajektorii procesu v čase)



opakuje se v čase (a případně i v prostoru)
sběr vzorků se na daných (většinou pevně vymezených plochách) opakuje
několikrát za sebou
sukcesní studie prováděné několik let, trvalé plochy v lesních porostech opakovaně
měřené jednou za x let
250
MANIPULATIVNÍ EXPERIMENT
ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH
kompletně znáhodněný design

nebere v úvahu heterogenitu prostředí
ne vždy je nejvhodnější
Zpracování dat v ekologii společenstev


David Zelený

znáhodněné bloky




vlastní bloky jsou vnitřně homogenní
(pokud možno)
počet bloků = počet opakování
bloky jsou umístěné podle gradientu
prostředí
v každém bloku je právě jedna replikace
každého zásahu
251
gradient prostředí
MANIPULATIVNÍ EXPERIMENT
ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH
David Zelený

latinský čtverec

gradient 1
252
Zpracování dat v ekologii společenstev

gradient 2

předpokládá přítomnost dvou gradientů v
prostředí
každý sloupec a každý řádek obsahuje
právě jednu variantu zásahu
možno použít i několik latinských čtverců
MANIPULATIVNÍ EXPERIMENT
NEJČASTĚJŠÍ CHYBY
David Zelený

pseudoreplikace

Zpracování dat v ekologii společenstev

testovat lze jen rozdíly v průměrech
jednotlivých bloků
plochy se stejným zásahem jsou umístěny
blízko sebe, a mají proto větší
pravděpodobnost, že si budou podobné i
bez vlivu vlastního zásahu
gradient prostředí

neúplně znáhodněný design

v podstatě pseudoreplikace, jen méně
zřejmá
gradient prostředí
253
MANIPULATIVNÍ EXPERIMENT
NEJČASTĚJŠÍ CHYBY
David Zelený
správně
gradient prostředí
Zpracování dat v ekologii společenstev
gradient prostředí
design se znáhodněnými bloky – špatná orientace bloků
gradient prostředí

špatně
špatně
254
MANIPULATIVNÍ EXPERIMENT
S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU
David Zelený

faktoriální design


ano
Zpracování dat v ekologii společenstev

každá hladina prvního faktoru je
kombinovaná s každou hladinou druhého
faktoru (případně třetího atd.)
například kombinace
 koseno vs nekoseno
 hnojeno vs nehnojeno
jednotlivé kombinace mohou být
rozmístěny v prostoru např. v rámci
latinského čtverce
ne
koseno
255
hnojeno
MANIPULATIVNÍ EXPERIMENT
S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU
David Zelený

split-plot design

N
C
C
N
P
P
P
C
N
C
N
C
P
N
N
P
Zpracování dat v ekologii společenstev

faktory jsou strukturovány hierarchicky (nested)
například plochy hnojené různými hnojivy (C, N, P) v rámci bloků umístěných na
vápenci (modrá) a žule (červená barva)
P
C
256
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
plán zásahů
letecký pohled
Zpracování dat v ekologii společenstev
Silvertown et al. (2006) J. Ecol.
David Zelený
ROTHAMSTED (ENGLAND) – PARK GRASSLAND
EXPERIMENT (ZALOŽEN 1843)
257
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
ROTHAMSTED (ENGLAND) – PARK GRASSLAND EXP.
David Zelený
Zpracování dat v ekologii společenstev
258
Třídění bylinné biomasy do druhů (kolem roku 1930) (http://www.rothamsted.ac.uk)
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
KOMPETICE O SVĚTLO V EXPERIMENTÁLNÍM PROSTŘEDÍ
David Zelený
Zpracování dat v ekologii společenstev
Při vyšším přísunu živin rostou
rostliny rychleji a začnou si
konkurovat o světlo – tak proč
jim trochu nepřisvítit?
259
Hautier et al. (2009) Science 324: 636-638
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
KOMPETICE O SVĚTLO V EXPERIMENTÁLNÍM PROSTŘEDÍ
David Zelený
Zpracování dat v ekologii společenstev
260
Hautier et al. (2009) Science 324: 636-638
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
STANOVENÍ POTENCIÁLNÍ STANOVIŠTNÍ PRODUKTIVITY V
David Zelený
DOUBRAVÁCH PĚSTOVÁNÍM ŘEDKVIČEK VE SKLENÍKU
Zpracování dat v ekologii společenstev
261
Veselá et. al (2008): Bioassay experiment for assessment of site productivity in oak forests. - 17th International
Workshop European Vegetation Survey, Brno, Czech Republic, 1-4. 5. 2008.
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
MEZOKOSMOVÝ EXPERIMENT S HMYZEM A PREDÁTORY
David Zelený
Zpracování dat v ekologii společenstev
na začátku
experimentu ...
Kádě, které samy o sobě nejsou
obsazeny predátory (larvy vážek a
pstruzi), ale jsou v blízkosti kádí s
predátory, jsou pro létající hmyz kladoucí
vajíčka stejně neatraktivní jako vlastní
kádě s predátory.
http://nwdragonflier.blogspot.cz
http://www.jjphoto.dk
Wessner et al. (2012) Ecology 93: 1674-1682
262
MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE
VLIV HERBIVORNÍCH RYB NA DRUHOVÉ SLOŽENÍ
David Zelený
KORÁLOVÝCH ÚTESŮ
na začátku
experimentu ...
řídká klec – zabrání
jen velkým rybám
... a po čtyřech
měsících pod klecí
Atol Agatti
(Lakedivy, Indie)
263
Autor: Nicole Černohorská (v rámci disertační práce)
Zpracování dat v ekologii společenstev
hustá klec – zabrání
všem rybám
detailní pohled na korálový útes s nárostem řas
(autor: Nicole Černohorská)
David Zelený
Zpracování dat v ekologii společenstev
264
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Preferenční
Zpracování dat v ekologii společenstev
265
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Systematické rozmístění v síti (lattice)
Zpracování dat v ekologii společenstev
266
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Systematické rozmístění v síti (grid)
Zpracování dat v ekologii společenstev
267
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Systematické rozmístění na transektu
Zpracování dat v ekologii společenstev
268
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Náhodné rozmístění
Zpracování dat v ekologii společenstev
269
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
Preferenční rozmístění


statistické hledisko: snímky nejsou náhodným výběrem, což limituje jejich použití
při statistických analýzách (Lajer 2007, Folia Geobotanica)
hledisko vegetačního ekologa: popisují maximální variabilitu vegetace
praktické důsledky: snímky bývají druhově bohatší, obsahují větší počet
diagnostických nebo vzácných druhů
Zpracování dat v ekologii společenstev


David Zelený

Náhodné (a systematické) rozmístění



statistické hledisko: snímky jsou náhodným výběrem v reálném prostoru (ne ale v
ekologickém hyperprostoru)
hledisko veg. ekologa: nezachytí celou variabilitu vegetace - chybí maloplošné a
vzácné vegetační typy, převládají velkoplošné a běžné typy, zahrnují řadu špatně
klasifikovatelných vegetačních přechodů
praktické důsledky: snímky odrážejí reálnou strukturu a bohatost vegetace v
krajině, ale metoda je neúměrně pracná
270
PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE)
ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH
David Zelený

Stratifikované náhodné rozmístění
Zpracování dat v ekologii společenstev
271
STRATIFIKACE
KRAJINY V GIS
Teplota
David Zelený
Srážky
Zpracování dat v ekologii společenstev
Půdní
typy
Stratifikované jednotky
272
Austin et al. 2000
PROSTOROVÁ AUTOKORELACE
David Zelený

bližší plochy jsou si podobnější
Zpracování dat v ekologii společenstev
273
PROSTOROVÁ AUTOKORELACE

běžná vlastnost prakticky všech reálných ekologických dat – příroda
se nechová podle zákonů statistiky

může být pozitivní (bližší vzorky jsou si podobnější než by
odpovídalo jejich náhodnému výběru) nebo negativní (sousední
vzorky jsou si méně podobné než kdyby byly vybrány náhodou, např.
v důsledku tzv. Janzen-Connellovy hypotézy)
Zpracování dat v ekologii společenstev
vlastnosti určitého pozorování (vzorku) mohou být do určité míry
odvozeny z pozorování v jeho okolí – jednotlivá pozorování na sobě
nejsou nezávislá
David Zelený

„Vše souvisí se vším, ale bližší věci spolu souvisejí více
než ty vzdálené“
Waldo Tobler (1969), První zákon geografie
274
PROSTOROVÁ AUTOKORELACE
David Zelený
Co způsobuje prostorovou autokorelaci biologických dat?
omezené možnosti disperze, genetický tok nebo klonální růst – sousedé
jsou si podobnější

organismy jsou omezeny ekologickými faktory (například vlhkost nebo
teplota), které jsou samy o sobě prostorově autokorelovány
Zpracování dat v ekologii společenstev

Jak se prostorová autokorelace projevuje při analýze dat?

pozitivní PA zvyšuje pravděpodobnost chyby prvního druhy (Type I
error), totiž že zamítneme nulovou hypotézu, která platí (statistické
testy vycházejí průkazněji než by měly)

negativní PA způsobuje opačný efekt

problém je v počtu stupňů volnosti (degrees of freedom): pokud si
stupně volnosti představíme jako množství informace, kterou každý
nový vzorek přináší, pak každý nový nezávislý vzorek přináší jeden
stupeň volnosti, ale prostorově autokorelovaný vzorek přináší méně
275
PROSTOROVÁ AUTOKORELACE
David Zelený
Příklad: Vliv nadmořské výšky na vegetaci, studovaný pomocí
transektů vedených podél nadmořské výšky
prostorově autokorelované
transekty
(paralelně vedle sebe na jedné hoře)
×
276
Zpracování dat v ekologii společenstev
prostorově neautokorelované
transekty
(každý transekt na různé hoře)
PROBLÉM PROSTOROVÉ ŠKÁLY
(SCALE OF THE STUDY)

rozsah (extent) – velikost studovaného území, zachycení různých
ekologických faktorů

interval – vzdálenost mezi vzorkovanými plochami
Zpracování dat v ekologii společenstev
zrno (grain size) – velikost nejmenší studované jednotky, zpravidla
vzorkované plochy, dána vlastností a velikostí studovaných organismů
David Zelený

Platí pravidlo, že
studie malého
rozsahu jsou hůře
zobecnitelné
277
Legendre & Legendre (1998)
TVAR PLOCHY
David Zelený
obdélníková
kruhová
čtverec
obdélník
kruh
celková plocha
100 m2
100 m2
100 m2
rozměr tvaru
10 × 10 m
20 × 5 m
poloměr ≈ 5,64 m
obvod
40 m
50 m
Zpracování dat v ekologii společenstev
čtvercová
~ 35 m
278
VLIV TVARU A ORIENTACE PLOCHY NA ZAZNAMENANOU
DRUHOVOU BOHATOST
David Zelený

obdélníkové plochy mohou mít vyšší druhovou bohatost než
čtvercové plochy (o stejné ploše)
gradient prostředí
Zpracování dat v ekologii společenstev
280
Stohlgren et al. (1995) Vegetatio 117:113-121; Condit et al. (1996) J.Ecol. 84: 549-562;
Keeley & Fotheringham (2005) J.Veg.Sci. 16: 249-256.
VELIKOST PLOCHY
STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ
David Zelený
Zpracování dat v ekologii společenstev
281
VELIKOST PLOCHY
STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ
David Zelený
Vztah mezi velikostí snímku a počtem
druhů ve snímku – bělokarpatské louky ve
srovnání s jinými typy travinné vegetace
Zpracování dat v ekologii společenstev
Jongepierová [ed.](2008): Louky Bílých Karpat.
282
VELIKOST PLOCH
SPOLEČNÁ ORDINACE PLOCH O RŮZNÉ VELIKOSTI
David Zelený
Zpracování dat v ekologii společenstev
Otýpková & Chytrý (2006), J.Veg.Sci. 17: 465-472
283

Podobné dokumenty

ehttp cc

ehttp cc může platit i pro některé přírodní experimenty, ale výsledky těchto

Více

Konfirmační analýza dat

Konfirmační analýza dat probíhat bude v počítačové učebně blokově v dohodnutých termínech a zaměřené bude na analýzu dat a jejich vizualizaci v programu CANOCO 5 tři čtyřhodinové bloky v případě zájmu o program R je možné...

Více