Lineární systémy a modely časových řad

Transkript

Lineární systémy a modely časových řad
Lineární systémy a modely časových řad
Daniel Schwarz
Investice do rozvoje vzdělávání
Cíl, motivace
Popis a identifikace systémů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Cíl, motivace
Popis a identifikace systémů
BLACK BOX
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Cíl, motivace
Popis a identifikace systémů
z-1
z-1
c1
z-1
c2
z-1
cq-11
cq
+
Analýza, Simulace, Predikce, Monitoring, Diagnostika, Řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Co nás čeká
•
Systémy obecně a jejich důležité vlastnosti.
•
Princip superpozice
superpozice, konvoluce
konvoluce, impulsní charakteristika systémů
•
Fourierovy řady, DTFT, frekvenční charakteristika systémů
•
Z transformace
transformace, přenosová funkce,
funkce nulové body a póly
•
FIR, IIR AR, MA, ARMA a překryvy v terminologii
•
Modely časových řad – Boxova
Boxova-Jenkinsova
Jenkinsova metodologie pro tvorbu „předpovědí
„předpovědí“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
1. Lineární systémy
6
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy: definice
SSystém
té je
j množinou
ži
prvků,
ků
které jsou spolu ve vzájemných vztazích
a které tvoří určitý celek.
vstupní signál
Systém
výstupní signál
Za systém považujeme jakoukoli sadu procesů,
které ovlivňují povahu signálu.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Příklad systému
Hranový detektor
„druhá diference“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů
vstupní signál
Systém
výstupní signál
kauzální - nekauzální
časově invariantní - časově proměnné
linearní - nelineární
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: kauzalita
Systém je kauzální, pokud jeho výstup závisí pouze
na minulých a současných vstupních hodnotách
hodnotách.
• Všechny fyzikální systémy v reálném čase jsou kauzální, protože
„čas
čas běží pouze dopředu“
dopředu“.
• Kauzalita se netýká systémů s prostorově závislými proměnnými.
• Kauzalita se netýká systémů zpracovávající nahrané signály.
• Pozn.: derivace signálu v čase t je přirozeně nekauzálním výpočtem.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: kauzalita
kauzální x nekauzální
kauzální
nekauzální
nekauzální
kauzální
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: časová invariantnost
Neformálně:
Systém je časově invariantní (time invariant - TI),
pokud jeho chování nezávisí na tom, „kolik je zrovna hodin“.
Matematicky:
Systém x[n] ->> y[n] je časově invariantní,
invariantní
když pro jakýkoli vstupní signál x[n] a jakékoli časové posunutí n0 platí:
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: časová invariantnost
časově invariantní x časově proměnné systémy :
časově invariantní
časově proměnný
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Vlastnosti systémů: linearita
Lineární systém je takový systém,
v němž lze uplatnit princip superpozice.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy
Lineární časově invariantní systémy (LTI):
• disponují elegantními matematickými vztahy mezi jejich vstupy a výstupy.
• lze určit výstupní odezvu systému na jakýkoli vstup
• lze také určit vstup systému při pozorování jeho výstupu
Selský rozum:
„Znám-li odezvu LTI systému na velmi krátký
vstupní signál, mohu pomocí těchto velmi
krátkých signálů seskládat libovolný vstupní signál
a odezvu LTI systému na něj pak seskládat ze
známé odezvy na velmi krátký signál.“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy
lineární systém
Hledáme bázové signály tak, aby:
bylo možné reprezentovat libovolné signály jako
lineární kombinaci těchto bázových signálů
odezva LTI systémů na tyto bázové signály byla jednoduchá
a zároveň
á
ň aby
b umožňovala
žň l d
dostatečně
č ě hluboký
hl b ký vhled
hl d
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Reprezentace DT signálů jednotkovými impulsy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Reprezentace DT signálů jednotkovými impulsy
Pozn.: Filtrační vlastnost Diracovy distribuce (jednotkového impulsu):
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Odezva systému
systému na jednotkový impuls
x[n]
LTI
systém
y[n]
Lineární systém:
… je odezvou systému na:
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Odezva systému
systému na jednotkový impuls
x[n]
LTI
systém
y[n]
Lineární a časově invariantní systém s odezvou h[n] na
jednotkový impuls:
konvoluční suma
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
LTI systémy: konvoluce
x[n]
LTI
systém
y[n]
IMPULSNÍ CHARAKTERISTIKA SYSTÉMU
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy
Fourierova reprezentace diskrétních signálů
x[n] – periodický signál se základní periodou N.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy
„zesílení“
amplituda
fáze
LTI systém nevytváří nové frekvenční složky,
ale pouze zesiluje nebo potlačuje frekvenční komponenty
existující ve vstupním signálu
signálu.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Periodické signály a LTI systémy
Frekvenční charakteristika:
G(ω) =
…… je periodická funkce vyjádřena Fourierovou řadou s koeficienty h.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Frekvenční charakteristika
PŘÍKLAD: vyhlazovací systém
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace
• z je komplexní proměnná.
• nejčastěji uvažujeme jednostrannou transformaci: sumace od n=0.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace - vlastnosti
Linearita:
Posun:
Útlum:
Konvoluce:
Subst: m=n-i
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
pro
platí, že H(z) = H(jω)
Přenosová (systémová) funkce vyjadřuje na jednotkové kružnici
|z|=1 frekvenční charakteristiku diskrétní soustavy.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
Přenosová (systémová) funkce vyjadřuje na jednotkové kružnici
|z|=1 kmitočtovou charakteristiku diskrétní soustavy.
soustavy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
H(z) vyjádřená pomocí racionálně lomené funkce:
bi .z-i
,
A=b0/a0.
ai .z-i
zi jsou NULY racionálně lomené funkce
pi jsou PÓLY racionálně lomené funkce
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
|A| .
n – vzdálenosti mezi bodem ωT na jednotkové kružnici a NULAMI přenosové funkce.
r – vzdálenosti
dálenosti me
mezii bodem ωT na kr
kružnici
žni i a PÓLY přenoso
přenosovéé ffunkce.
nk e
|A| – zesílení systému
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
n – vzdálenosti mezi bodem ωT na jednotkové kružnici a NULAMI přenosové funkce.
r – vzdálenosti mezi bodem ωT na kružnici a PÓLY přenosové funkce.
. |A|
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Z transformace – přenosová funkce
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací
Mějme LTI systém s přenosovou funkcí ve tvaru racionálně lomené
funkce:
bi .z-ii
ai .z-i
kde A = a0/b0, zi jsou nuly a pi jsou póly racionálně lomené funkce.
ai .z-i
bi .z-i
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
Lineární systémy a modely časových řad
zpětná
Z transformace
Z-transformace,
věta o linearitě
a posunu,
a0=1.
=1
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
Interpretace rovnice: diskrétní soustava / systém uchovává v paměti
starší vzorky vstupního i výstupního signálu.
Klouzavý
průměr
MA
Autoregresní
člen
AR
Ovlivňuje rychlost
odezvy, charakter
jejího zanikání,
zanikání
stabilitu soustavy.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Popis diskrétní soustavy s ZZ-transformací
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
Zpoždění
p
o
jeden vzorek
Realizace soustavy / filtru / programu přímou formou:
b0
b1
-a
aL
Lineární systémy a modely časových řad
b2
-a
aL-1
L1
bM-1
bM
-a
a1
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou
FIR – finite impulse response
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
pouze člen MA
(moving average)
Lineární systémy a modely časových řad
nerekurzivní
k i í realizace
li
(většinou, ale nemusí vždy)
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou
FIR PŘÍKLAD: hranový detektor
h[n] =
-1
{δ [n − 1] − 2δ [n] + δ [n + 1]}
0
1
n
FIR PŘÍKLAD: „vyhlazovací“ systém
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s konečnou impulsní charakteristikou
FIR – finite impulse response
bi .z-k
M −1
yn = b0 . xn + b1 . xn −1 + b2 . xn − 2 + ... + bM −1 . xn − M +1 = ∑ bk . xn − k
k =0
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou
IIR – infinite impulse response
Autoregresní
člen
AR
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
vždy
žd rekurzivní
k i í realizace
li
Klouzavý
průměr
MA
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou
IIR PŘÍKLAD: „vyhlazovací“ systém
z-1
H(z) = az/(z-a). Pro a>1 je filtr nestabilní.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Systémy s nekonečnou impulsní charakteristikou
IIR :
smyčku, jsou vždy rekurzivní
- vyžadují alespoň jednu zpětnovazební smyčku
- přenosová funkce = podíl polynomů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR,
IIR, FIR,
FIR, MA,
MA, AR
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
FIR filtry: ai=0, pro všechna i.
Označovány také jako „moving average“ nebo „all-zero“ filtry.
IIR filtry:
fil
ai<>0,
0 pro alespoň
l
ň jjedno
d i.i
Zahrnují:
• autoregresivní (AR) filtry
• moving-average,
moving average autoregresivní (ARMA) filtry
AR filtry: bi=0, kromě b0 .
Výstup závisí pouze na aktuální hodnotě na vstupu
a na konečném počtu starších vzorků výstupního signálu.
O načovány také jako:
Označovány
„all-pole“, „purely recursive“, „autoregressive“
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR,
IIR, FIR,
FIR, MA,
MA, AR
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
FIR filtry: ai=0, pro všechna i.
Označovány také jako „moving average“ nebo „all-zero“ filtry.
IIR filtry:
fil
ai<>0,
0 pro alespoň
l
ň jjedno
d i.i
Zahrnují:
• autoregresivní (AR) filtry
• moving-average,
moving average autoregresivní (ARMA) filtry
ARMA filtry: ai , bi nenulové
Označovány také jako:
„pole-zero“,
„pole
ero , „autoregressive, moving
moving-average
average “
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Terminologie: IIR,
IIR, FIR,
FIR, MA,
MA, AR
M
L
i =0
i =1
yn = ∑ bi .xn −i −∑ ai . yn −i
DOPORUČENÍ:
• pro filtry a lineární systémy používat označení FIR, IIR
• označení AR, MA, ARMA používat pro popis či modely stochastických procesů,
které generují data náhodné povahy
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
2. Modely časových řad
46
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Časové řady
Definice časové řady: uspořádaná posloupnost hodnot závislé
proměnné měřené v ekvidistantních časových intervalech.
intervalech
355
350
koncen
ntrace CO2
345
340
335
330
325
1974
1976
1978
1980
1982
1984
1986
1988
č
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Signály vs. časové řady
1-D DISKRÉTNÍ SIGNÁLY ≈ ČASOVÉ ŘADY
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Časové řady
Definice časové řady: uspořádaná posloupnost hodnot závislé
proměnné měřené v ekvidistantních časových intervalech.
intervalech
Využití modelů časových řad je dvojí:
1. porozumění procesu, který vyprodukoval pozorovaná data
2. předpovídání budoucích hodnot, případně i jejich ovlivňování -> řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita
Stacionarita je obvyklým předpokladem většiny technik analýzy časových řad.
Definice stacionárního procesu: jedná se o náhodný proces jehož rozdělení
pravděpodobnosti
p
p
se v čase nemění. V důsledku toho se nemění ani
parametry jeho pravděpodobnostní funkce (např. střední hodnota, rozptyl).
Autokorelační funkce stacionárního procesu závisí pouze na rozdílu svých
argumentů.
Předpokladem stacionarity rozumějme
ty časové řady či signály, které jsou bez
trendu,, majíj s měnícím se časem
stejný rozptyl a stejnou podobu
autokorelační funkce.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita
V případě nestacionárních časových řad lze provést:
1
1.
diferencování dxi = xi-xxi-1
2. odstranění trendu odečtením proloženého polynomu
3. stabilizace rozptylu logaritmizací čtverce řady.
355
350
koncentrace CO
O2
345
340
335
330
325
1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita
V případě nestacionárních časových řad lze provést:
1
1.
diferencování dxi = xi-xxi-1
2. odstranění trendu odečtením proloženého polynomu
3. stabilizace rozptylu logaritmizací čtverce řady.
2.5
2
dife
erence koncentra
ace CO2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Stacionarita
V případě nestacionárních časových řad lze provést:
1
1.
diferencování dxi = xi-xxi-1
2. odstranění trendu odečtením proloženého polynomu
3. stabilizace rozptylu logaritmizací čtverce řady.
355
4
data 1
linear
y = 1.5*x - 2.5e+003
3
350
ressidua koncentrace C
CO2
2
koncentrace CO2
345
340
335
1
0
-1
-2
-3
330
-4
325
1974
1976
1978
1980
1982
1984
čas
Lineární systémy a modely časových řad
1986
1988
-5
1974
1976
1978
1980
1982
1984
1986
čas
© Institute of Biostatistics and Analyses
1988
Sezónnost
Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu.
• Detekce periodické složky pomocí:
pomocí
• sezónní vizualizace v případě, že periodu složky známe
• autokorelační funkce signálu
• spektra signálu
355
koncentrace CO2
350
345
340
335
330
325
1974
1976
1978
1980 1982
čas
1984
Lineární systémy a modely časových řad
1986
1988
© Institute of Biostatistics and Analyses
Sezónnost
Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu.
• Detekce periodické složky pomocí:
pomocí
• sezónní vizualizace v případě, že periodu složky známe
• autokorelační funkce signálu
• spektra signálu
355
1
08
0.8
345
0.6
340
acf
a
koncenttrace CO2
350
0.4
335
0.2
330
325
1974
1976
1978
1980 1982
čas
1984
Lineární systémy a modely časových řad
1986
1988
0
-200
-100
0
zpoždění
100
© Institute of Biostatistics and Analyses
200
Sezónnost
Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu.
• Detekce periodické složky pomocí:
pomocí
• sezónní vizualizace v případě, že periodu složky známe
• autokorelační funkce signálu
• spektra signálu
800
4
400
0
200
acf
a
residua koncentrace CO2
600
2
-2
0
-200
-4
-6
1974
-400
1976
1978
1980
1982
čas
1984
Lineární systémy a modely časových řad
1986
1988
-600
-200
-100
0
zpoždění
100
© Institute of Biostatistics and Analyses
200
Sezónnost
Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu.
• Detekce periodické složky pomocí:
pomocí
• sezónní vizualizace v případě, že periodu složky známe
• autokorelační funkce signálu
• spektra signálu
1
2
0.5
0
acf
a
residua koncentrace CO2
4
0
-2
-0.5
-4
-6
1974
1976
1978
1980
1982
čas
1984
Lineární systémy a modely časových řad
1986
1988
-1
-40
-20
0
zpoždění
20
© Institute of Biostatistics and Analyses
40
Sezónnost
Sezónní složka popisuje periodické změny v signálu či časové řadě.
• Je-li sezónní složka v datech přítomna, musí být zahrnuta do modelu.
• Detekce periodické složky pomocí:
pomocí
• sezónní vizualizace v případě, že periodu složky známe
• autokorelační funkce signálu
• spektra signálu
perioda
12 měsíců
Lineární systémy a modely časových řad
perioda
6 měsíců
© Institute of Biostatistics and Analyses
Modely časových řad
Jakoukoli stacionární časovou řadu či signál s náhodnou složkou generuje
stochastický proces, kterému lze přiřadit jeden z těchto modelů:
•
•
•
•
čistě rekursivní model
nerekursivní model s klouzavým průměrem
kombinovaný model
bílý šum
Lineární systémy a modely časových řad
AR – autoregressive
MA – moving average
ARMA
ν
© Institute of Biostatistics and Analyses
Bílý šum
Náhodný proces označujeme za bílý šum, pokud jeho střední hodnota a
autokorelační funkce splňují tyto podmínky:
Diracova
distribuce
μν = Ε{ν (t )} = 0 ,
Rνν (t1 , t 2 ) = Ε{ν (t1 )ν (t 2 )} =
N0
δ (t1 − t 2 ).
2
1000
0.4
800
0.2
600
Rww(t1
1,t2)
w(tt)
0.6
0
-0.2
-0.4
400
200
0
-0.6
0
20
40
60
t
Lineární systémy a modely časových řad
80
100
-200
-100
-50
0
t1-t2
50
© Institute of Biostatistics and Analyses
100
Autoregresní (AR) model
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n
xn…………… časová řada / signál
ν n……………bílý šum
p …………… řád AR modelu
ai…………… parametry modelu
355
koncentrace CO2
350
Odhad
parametrů
345
340
335
330
325
1974
1976
1978
1980 1982
čas
1984
xn
νn
+
z-1
z-1
a1
z-1
a2
xn
1986
1988
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ap
(MA) model s klouzavým průměrem
xn =ν n + c1ν n−1 + c2ν n−2 + ...+ cqν n−q
xn…………… časová řada / signál
ν n……………bílý šum
q …………… řád MA modelu
μ …………… střední hodnota náhodného procesu
ci…………… parametry modelu
νn
355
koncentrace CO2
350
Odhad
parametrů
345
340
335
330
325
1974
1976
1978
1980 1982
čas
1984
z-1
z-1
c1
z-1
c2
z-1
cq-11
xn
1986
+
1988
Lineární systémy a modely časových řad
cq
© Institute of Biostatistics and Analyses
xn
ARMA model
ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n −
− c1ν n−1 − c2ν n−2 − ...− cqν n−q
Boxova-Jenkinsonova metodologie
g zahrnuje:
j
• identifikaci modelu,
• odhad modelu,
• validaci modelu
modelu.
Určení řádů
p, q
Výpočet
parametrů
ai, ci
Kontrola
rozložení residuí
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
1.
2.
Je časová řada / signál stacionární?
Vykazuje časová řada / signál sezónnost?
ANO
NE
zjištění periody T,
T zahrnutí
členu AR(T) nebo MA(T)
do modelu, případně
sezónní diference
ARIMA
(autoregressive integrated moving average model)
Identifikace, odhad, validace ARMA modelu na diferencovaných
datech a následná úprava modelu.
Př. model AR(2): yn = -0.406yn-1-0.146yn-2-0.00521 = xn-xn-1
xn-xn-1=-0406(xn-1-xn-2)-0.164(xn-2-xn-3)-0.00521
xn=0.594x
=0 594xn-1+0.242x
+0 242xn-2+0.164x
+0 164xn-3-0.00521
0 00521
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Určení řádů p a q
a) na základě zkušenosti a experimentování
b) spektrum: každé výrazné maximum v rozsahu <0,fvz/2>
/ vyžaduje jeden pár
pólů, což zvyšuje řád o 2.
c) kritéria na základě autokorelační funkce (ACF) a parciální autokorelační
funkce (PACF)
Srovnávání teoretických
průběhů ACF, PACF procesů
známých řádů s ACF
ACF, PACF
naměřených řad / signálů
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
xn
Příklad: AR(1) proces
νn
xn + axn −1 = ν n
z-1
+
-a1
xn = ν n − axn −1 =
= ν n − a (ν n −1 − axn − 2 ) =
= ν n − aν n −1 + (− a ) ν n − 2 + ... + (− a )
n −1
2
(ν n−1 − ax0 )
a=+0.9
a=-0.9
2
1.5
1
1
x(n)
x(n)
0.5
0
0
-0.5
-1
-1
-1.5
0
50
100
n
Lineární systémy a modely časových řad
150
-2
0
50
100
150
n
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Příklad: AR(1) proces
xn + axn −1 = ν n
xn = ν n − axn −1 =
= ν n − a (ν n −1 − axn − 2 ) =
= ν n − aν n −1 + (− a ) ν n − 2 + ... + (− a )
n −1
2
(ν n−1 − ax0 )
|a|<1:
1 − (− a )
E{xn } = μ = μν
,
1+ a
1
≈ μν
1+ a
n
Lineární systémy a modely časových řad
{ }
D{xn } = E xn2 − μ 2 =
{
}
σ ν2
1− a
,
2
Rxx ( k ) = E xn xn − k = (− a ) .
k
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Příklad: AR(1) proces
{
}
Rxx ( k ) = E xn xn − k = (− a ) .
xn + axn −1 = ν n
k
1
a=+0.9
a=-0.9
0.8
0.6
0.4
Rxx(kk)
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
1
0
Lineární systémy a modely časových řad
5
10
15
k
20
25
30
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Tvar ACF
Exponenciála klesající k nule.
Změny kladných a záporných hodnot,
postupný pokles k nule.
Model
AR(p) model. Pro určení p se vychází z
PACF.
Jeden nebo několik vrcholů, zbytek
zanedbatelný nulový
zanedbatelný,
nulový.
MA model. Řád odpovídá hodnotě
zpoždění od které je ACF nulová
zpoždění,
nulová.
Průběh klesající až po několika
zpožděních
ARMA
Vše zanedbatelné, nulové
Data jsou náhodná.
Vysoké hodnoty ve stejných
i t
intervalech
l h
Zahrnout AR člen s řádem
odpovídajícím
d íd jí í periodě.
i dě
Neklesá k nule
Nejedná se o stacionární řadu / signál.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
355
1
4
data 1
linear
y = 1.5*x - 2.5e+003
3
350
koncentrace CO2
345
340
335
0.5
1
0
acf
residua koncentrace CO2
2
-1
0
-2
-0.5
05
-3
330
-4
325
1974
1976
1978
1980
1982
1984
1986
1988
-5
1974
čas
1976
1978
1980
1982
čas
1984
1986
1988
-1
-40
-20
0
zpoždění
20
Perioda 12 vzorků
Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
40
ARMA model: identifikace
Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní
Se
ó
d
diferencování:
e e co á
sezónní diference nad detrendovanou řadou
1000
800
600
400
d12(rx(n)))
200
0
-200
-400
400
-600
-800
-1000
1974
1976
1978
1980
1982
1984
1986
1988
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní
Se
ó
d
diferencování:
e e co á
Výběrová ACF sezónně diferencované řady
1
0.8
0.6
0.4
Rxx
0.2
0
-0.2
-0.4
-0.6
-0.8
-1
0
50
100
150
k
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model: identifikace
Zbývá identifikovat ještě nesezónní komponenty signálu / řady.
Sezónní
Se
ó
d
diferencování:
e e co á
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model
ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n −
− c1ν n−1 − c2ν n−2 − ...− cqν n−q
Odhad p
parametrů modelu
- iterační algoritmy:
- nelineární metoda nejmenších čtverců
- odhad na základě maximální věrohodnosti (MLE)
Vhodnější tvar rovnice (pro SW nástroje):
xn + a1xn−1 + a2 xn−2 + ...+ ap xn− p =ν n + c1ν n−1 + c2ν n−2 + ...+ cqν n−q
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA model
ARMA(p, q) kombinuje AR(p) a MA(q) modely.
xn = a1xn−1 + a2 xn−2 + ...+ ap xn− p +ν n −
− c1ν n−1 − c2ν n−2 − ...− cqν n−q
Odhad p
parametrů modelu
- iterační algoritmy:
- nelineární metoda nejmenších čtverců
- odhad na základě maximální věrohodnosti (MLE)
Výsledný AR(2) model (pro detrendovaná a sezónně diferencovaná data)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely
Validace modelu
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
sezónní diference nad detrendovanou řadou
1000
-Zpětné ověření předpokladů kladených
na náhodné chyby, tj. analýza residuí
800
600
400
RESIDUA = CHYBY PREDIKCE
d12(rx(n
n))
200
0
-200
-400
-600
- Residua byy měla p
představovat bílýý šum.
-800
-1000
1974
1976
1978
1980
1982
1984
čas
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
1986
1988
ARMA modely
Validace modelu AR(2)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
Validace modelu AR(4)
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely
Validace modelu AR(2)
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
Validace modelu ARMA(4,4)
xn + 2.345⋅ xn−1 + 2.581⋅ xn−2 +1.645⋅ xn−3 + 0.5163⋅ xn−4 =
=ν n − 3.789⋅ν n−1 + 5.397⋅ν n−2 − 3.425⋅ν n−3 + 0.8168⋅ν n−4
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
yy1. ((1-step
pp
pred))
dat; measured
arx2; fit: 82.14%
800
600
400
y1
200
Model:
AR(2)
H i
Horizont
predikce:
dik
1
Shoda:
82.1 %
0
-200
-400
-600
-800
-1000
20
40
60
80
100
120
Lineární systémy a modely časových řad
140
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
xn +1.745⋅ xn−1 + 0.8745⋅ xn−2 =ν n
yy1. ((5-step
pp
pred))
dat; measured
arx2; fit: -0.8268%
800
600
400
y1
200
Model:
AR(2)
H i
Horizont
predikce:
dik
5
Shoda:
<1%
0
-200
-400
-600
-800
20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n
yy1. (1-step
(
pp
pred))
dat; measured
arx4; fit: 91.95%
800
600
400
y1
200
Model:
AR(4)
H i
Horizont
predikce:
dik
1
Shoda:
92.0 %
0
-200
-400
-600
-800
20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
xn + 2.943⋅ xn−1 + 3.765⋅ xn−2 + 2.494⋅ xn−3 + 0.728⋅ xn−4 =ν n
yy1. ((5-step
pp
pred))
dat; measured
arx4; fit: 3.26%
800
600
400
y1
200
Model:
AR(4)
H i
Horizont
predikce:
dik
5
Shoda:
3.3 %
0
-200
-400
-600
-800
20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
x n + 2 . 345 ⋅ x n − 1 + 2 . 581 ⋅ x n − 2 + 1 . 645 ⋅ x n − 3 + 0 . 5163 ⋅ x n − 4 =
=ν
n
− 3 . 789 ⋅ ν
n −1
+ 5 . 397 ⋅ ν
n−2
− 3 . 425 ⋅ ν
n−3
+ 0 . 8168 ⋅ ν
n−4
yy1. ((1-step
pp
pred))
dat; measured
amx44; fit: 98.55%
800
600
400
y1
200
Model:
ARMA(4,4)
H i
Horizont
predikce:
dik
1
Shoda:
98.6 %
0
-200
-400
-600
-800
20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
ARMA modely
Posouzení kvality předpovídání
- aplikace modelu na řadu zkrácenou o m pozorování,
- předpověď hodnot xn-m+1, xn-m+2,…,xn
- porovnání
x n + 2 . 345 ⋅ x n − 1 + 2 . 581 ⋅ x n − 2 + 1 . 645 ⋅ x n − 3 + 0 . 5163 ⋅ x n − 4 =
=ν
n
− 3 . 789 ⋅ ν
n −1
+ 5 . 397 ⋅ ν
n−2
− 3 . 425 ⋅ ν
n−3
+ 0 . 8168 ⋅ ν
n−4
yy1. ((5-step
pp
pred))
dat; measured
amx44; fit: 23.86%
800
600
400
y1
200
Model:
ARMA(4,4)
H i
Horizont
predikce:
dik
5
Shoda:
23.9 %
0
-200
-400
-600
-800
20
40
60
80
100
Lineární systémy a modely časových řad
120
140
© Institute of Biostatistics and Analyses
LTI systém a jeho popis
yn = xn −1.745⋅ yn−1 − 0.8745⋅ yn−2
yn
xn
+
z-1
z-1
-1.7
-0.9
Magnitude (dB)
M
40
20
0
-20
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
Normalized Frequency (×π rad/sample)
1.8
2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
Normalized Frequency (×π rad/sample)
1.8
2
Phase (degrees)
200
100
0
-100
-200
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
Shrnutí
Popis a identifikace systémů a procesů
z-1
z-1
c1
z-1
c2
z-1
cq-11
cq
+
Analýza, Simulace, Predikce, Monitoring, Diagnostika, Řízení
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses
;
ffgf
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
5. letní škola Matematické biologie
je podporována projektem
ESF č. CZ.1.07/2.2.00/07.0318
„VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE“
Otázky ?
87
Lineární systémy a modely časových řad
© Institute of Biostatistics and Analyses

Podobné dokumenty

Možnosti vyhodnocení časových řad v softwaru STATISTICA

Možnosti vyhodnocení časových řad v softwaru STATISTICA Tlačítkem Souhrn získáme výslednou tabulky rozložených komponent.

Více

VII. přednáška

VII. přednáška – televizním výstupem • Kromě televizního výstupu mají některé gra-fické karty také integrovaný video vstup pro připojení např. videopřehrávače, kamery, … • Existují j ig grafické karty, y, které j...

Více

Výtok kapaliny otvorem ve dně nádrže (výtok kapaliny z danaidy)

Výtok kapaliny otvorem ve dně nádrže (výtok kapaliny z danaidy) Pro zvolenou nebo zadanou výtokovou trubici o průměru d je konstantní součin

Více

2011katalog

2011katalog přátel. Pro Vaše maličké je kontakt s dalšími dětmi velmi důležitý, je podmínkou jeho sociálního rozvoje. Již v raném kojeneckém období se u dětí projevuje rostoucí zájem o jiné děti. Ještě před do...

Více

4 Analýza dluhopisových podílových fondů

4 Analýza dluhopisových podílových fondů stejné vlastnosti jako řady akcií a zda je pro jejich modelování vhodné použít modely vytvořené pro akcie, burzovní indexy nebo směnné kurzy, je hlavním tématem této práce. Pozornost je věnována ne...

Více

ŠIMPACH, Ondřej (2013). Nestejný trend v očekávaném vývoji

ŠIMPACH, Ondřej (2013). Nestejný trend v očekávaném vývoji modelování nesezónních či sezónních časových řad (viz Hamilton, 1994). Význam znaků je: S = Seasonal – [sezónní], AR = Auto Regressive – [autoregresivní], I = Integrated – [integrovaný], MA = Movin...

Více

metodika tvorby adaptační strategie sídel na změnu klimatu

metodika tvorby adaptační strategie sídel na změnu klimatu tým musí být legitimní a musí mít podchycené alespoň některé místní nebo přespolní znalce situace (např. vodohospodáře, správce toků, správce větších lesních celků, správce komunikací, apod.) a jej...

Více