Classification, identification and statistical analysis of non

Transkript

Classification, identification and statistical analysis of non
Proceedings of International Scientific Conference of FME
Session 4: Automation Control and Applied Informatics
Paper 26
Klasifikace, identifikace a statistická analýza
nestacionárních náhodných procesů
MORÁVKA, Jan1
1
Ing., Ph.D.,
TŘINECKÉ ŽELEZÁRNY inženýring, a.s., Středisko elektro, MaR a ASŘ,
739 70 Třinec,
[email protected],
http://www.trz.cz
Abstrakt: V ekonomické i technologické praxi se často setkáváme s nestacionárními
náhodnými procesy. Pro korektní analýzu dat těchto procesů je třeba znát moderní výsledky a
metody, které umožňují správnou klasifikaci, identifikaci a statistickou analýzu. V opačném
případě dochází k různým problémům a chybám, mezi něž zejména patří jev zdánlivé
korelace. Mezi moderní výsledky patří klasifikace procesů na typy DS/TS, testování tzv.
jednotkových kořenů, kointegrace a kotrendová analýza nestacionárních časových řad.
Klíčová slova: nestacionární náhodné procesy typu DS/TS, zdánlivá korelace, klasifikace,
identifikace, statistická analýza
1 Úvod
Nestacionární náhodné procesy (časové řady) se poměrně hojně vyskytují jak
v ekonomických systémech [CIPRA, T. 1986], [ARLT, J. 1999], tak i v systémech
technologických. V technologii tyto procesy vznikají hlavně jako výstupy integračních
soustav, tj. zásobníků, nádrží, homogenizačních hromad, skládek apod. [MORÁVKA, J. 1999].
Pro korektní statistickou analýzu nestacionárních náhodných procesů (klasifikace,
identifikace, zjišťování závislostí, regresní analýza) je třeba znát moderní metody [ARLT, J.
1999]. Regresní analýza s nestacionárními veličinami naráží na známý jev (problém) tzv.
zdánlivé korelace [SWOBODA, H. 1977], [SEGER, J., HINDLS, R. & HRONOVÁ, S. 1998]. Pro
systémy obsahující nestacionární procesy byl pro odlišení zdánlivých vazeb zaveden pojem
kointegrace [JOHANSEN, S. 1997], [BIERENS, H. 1999a], [ARLT, J. 1999]. Pro definování
nelineárních vazeb mezi nestacionárními veličinami byla rozpracována tzv. kotrendová
analýza [BIERENS, H. 1999b].
2 Klasifikace nestacionárních signálů
V literatuře jsou nestacionární procesy definovány jako procesy u kterých se s časem mění
jejich charakteristiky 1. a 2.řádu, tj. střední hodnota, rozptyl, autokovariance i autokorelace (a
tím i spektrum). V teorii i praxi se nejčastěji uvažují dvě skupiny nestacionárních procesů s proměnlivou střední hodnotou a s proměnlivým rozptylem, autokovariancí a autokorelací.
Podle terminologie Box-Jenkinsovy metodologie jsou nestacionární procesy označovány jako
ARIMA – AutoRegressive Integrated Moving Average [CIPRA, T. 1986], [LJUNG, L. 1987],
[TŮMA, J. 1998], [ARLT, J. 1999]. Z hlediska hlubší statistické analýzy je však nutné
nestacionární procesy rozdělit na procesy DS – diferenčně stacionární a TS – trendově
stacionární [ARLT, J. 1999]. V tab.1 jsou přehledně uvedeny jejich vlastnosti, označení a
rozdíly. DS proces lze stacionarizovat diferencováním, TS proces očištěním od
deterministického trendu. V běžné literatuře přitom není definováno kritérium volby způsobu
stacionarizace [LJUNG, L. 1987], [TŮMA, J. 1998], což nakonec vede na nejednoznačnou a
heuristickou volbu.
Tab. 1. Základní klasifikace nestacionárních procesů
Integrovaný
Nestacionarita Proces
Box-Jenkins
proces
I(d)
ARIMA(p,d,q)
v rozptylu,
AR(1) : ϕ 1 = 1
autokovarianci a
DS
I(1)
autokorelaci
ARIMA(0,1,0)
ve střední
TS
I(1)+MA(1) ARIMA(0,1,1)
hodnotě
Jiné
označení
Běžné
označení
náhodná
procházka
drift
trend
U procesů ARIMA(p,d,q) ~ I(d), kde d znamená řád diferencování procesu. Odhad tohoto
řádu lze získat buď testováním postupně diferencované řady na bílý šum pomocí ACF/PACF
[ARLT, J. 1999], nebo hledáním minimálního rozptylu této řady [CIPRA, T. 1986]. Náhodná
procházka je mezním případem procesu AR(1) s koeficientem autoregrese ϕ 1 = 1. Pro nulové
počáteční podmínky v čase t = 0 je také označována jako Brownův, či Wienerův proces
[TŮMA, J. 1998]. Integrované procesy typu I(0) tvoří procesy AR(p), MA(q), ARMA(p,q) a
proces bílého šumu (BŠ), tj. AR(0) = ARMA(0,0).
Modely (diferenční rovnice) nestacionárních procesů DS / TS včetně diferenčních
rovnic jejich prvních zpětných diferencí a rovnic procesů s odstraněným lineárním trendem
(Tt) mají následující tvar:
• DS procesy
! náhodná procházka s konstantou ~ I(1)
(1)
X t = c + X t −1 + ε t , X t = 0 = X 0 ,
(2)
X t = c + ϕ 1 X t −1 + ε t , X t = 0 = X 0 ~ AR(1) : ϕ 1 = 1 ,
t
(3)
X t = X 0 + ct + ∑ ε i ,
i =1
∆X t = X t − X t −1 = c + ε t
~ bílý šum N (c, σ ε ) ,
t
X t − Tt = X t − ( X 0 + ct ) = ∑ ε i
~ tzv. stochastický trend .
(4)
(5)
i =1
! proces ARIMA(p,d,q) ~ I(d)
X t = δ + X t −1 + ψ ( B)ε t , X t = 0 = X 0 ,
t
X t = X 0 + δt + ψ ( B ) ∑ ε i ,
(6)
(7)
i =1
∆X t = δ + ψ ( B)ε t
~ ARMA( p, q) ,
t
X t − Tt = X t − ( X 0 + δt ) = ψ ( B)∑ ε i ~ I (d ) .
(8)
(9)
i =1
• TS procesy
TS proces s lineárním trendem ~ I(1) + MA(1)
X t = a + bt + ε t , X t = 0 = X 0 = a ,
!
∆X t = X t − X t −1 = b + ε t − ε t −1 = b + ∆ε t ~ MA(1) ⇒
X t = b + X t −1 + ε t − ε t −1 ~ I (1) + MA(1) / ARIMA(0,1,1) ,
X t − Tt = X t − (a + bt ) = ε t ~ bílý šum N (0, σ ε ) .
(10)
(11)
(12)
(13)
3 Identifikace nestacionárních signálů
Identifikaci nestacionárních signálů je možné provést jak pomocí klasické analýzy časových
řad, tak jejími moderními metodami prostřednictvím testů tzv. jednotkových kořenů.
3.1 Identifikace pomocí klasické analýzy časových řad
Ze srovnání rovnic diferencí procesů a rovnic procesů s odstraněným lineárním trendem je
zřejmé, že pro identifikaci jejich typů lze použít Box-Jenkinsovu metodologii (ACF, PACF a
identifikační body [CIPRA, T. 1986]). Pro názornost byly v programu Matlab vygenerovány
procesy xds (typu DS / I(1) – náhodná procházka) a xts (typu TS) s parametry: n=100,
seed=12345, σ ε =1, pro xds platí: xds0=5, c=0.5 a pro xts je a=5, b=0.6 – obr. 1.
xds
60
xts
50
40
30
20
10
0
10
20
30
40
50
60
70
80
90
100
Obr. 1. Průběhy nestacionárních procesů xds(t) a xts(t) (čárkovaně)
Jenom vizuálním posouzením zřejmě nebude možné rozlišit oba typy procesů. Po provedení
Box-Jenkinsovy identifikace původních hodnot, jejich diferencí (funkce diff) a trendově
očištěných hodnot procesů (funkce detrend) dostaneme výsledky (tab.2-Statgraphics) a
algoritmus (obr.2) korespondující s dříve odvozenými vztahy.
Tab. 2. Základní klasifikace generovaných nestacionárních procesů xds(t) a xts(t)
Procesy
Hodnoty
Model
Závěr
xds
AR(1) / I(1)
procesy nelze rozlišit!
původní
xts
AR(1) / I(1)
bílý šum (BŠ)
diff xds
diferencované
xds je DS / I(1) proces
diff xts
MA(1)
AR(1) / I(1)
očištěné od lineárního detrend xds
xts je TS proces
trendu (Tt)
bílý šum (BŠ)
detrend xts
+
DS / I(1)
TS
TS
Z
Z
∆Xt = Xt - Xt-1
eXt = Xt - T t
ACF, PACF
ACF, PACF
∆Xt = BŠ ?
-
MA(1)
AR(1) / I(1)
TS
eXt = BŠ ?
+
TS
K
K
Obr. 2. Algoritmy určení typů procesů pomocí analýzy časových řad
Pozn.: Rozlišení modelů AR(1) a I(1) umožňují až tzv. testy jednotkových kořenů (testují
hypotézu H0: ϕ 1 = 1).
Závěr: Na základě výsledků a uvedených vztahů lze tedy jednoznačně uskutečnit základní
identifikaci nestacionárních procesů na procesy DS a TS včetně jejich zařazení do podskupin
integrovaných procesů I(0), I(1) a I(d).
3.2 Identifikace pomocí testů tzv. jednotkových kořenů
Identifikaci a rozdělení nestacionárních procesů lze provést pomocí testů tzv. jednotkových
kořenů (unit-roots) [ARLT, J. 1999]. Testy vycházejí z diferenční rovnice modelu AR(1) a
testují H0, zda autoregresní koeficient 1. řádu ϕ1 = 1. V případě nezamítnutí této nulové
hypotézy jde o proces typu DS / I(1), při jejím zamítnutí je proces TS – viz obr. 3.
TS
Z
Testy jedn. kořenů
+
DS
H0 ?
-
TS
K
Obr. 3. Algoritmus určení procesů DS/TS pomocí testů jednotkových kořenů
3.2.1 Nestacionární procesy typu DS / I(1)
Tyto procesy jsou nejčastěji chápány jako integrované procesy 1. řádu I(1) a jsou popsány
modelem, či procesem tzv. náhodné procházky (random walk process) s konstantou:
(14)
X t = c + X t −1 + ε t , X t = 0 = X 0 .
Jako příklad pro testování jednotkových kořenů použijeme 2 procesy x1(t) a x2(t) – viz obr. 4,
které byly vygenerovány v programu Matlab s parametry: n=100, seed=12345, σ ε =1,
x10=x20= 5, c=0 pro x1(t) a c=0.5 pro x2(t).
*+,-./0123425678&96:41/+,;6<&8-9=6<"8-9
)!
$!
(!
#!
'!
"!
&!
!
!
"!
#!
$!
%!
&!!
Obr. 4. Průběhy nestacionárních I(1)/DS procesů x1(t) a x2(t) (horní graf)
Z obrázku lze vidět, že proces x2(t) má na pohled spíše charakter TS procesu, zatímco proces
x1(t) má téměř stacionární průběh. Objektivní charakterizaci procesů lze provést pouze
pomocí testů tzv. jednotkových kořenů a to testů nestacionarity i stacionarity – tab. 3.
Tab. 3. Výsledky testů nestacionarity a stacionarity DS procesů (EasyReg)
Testy nestacionarity
Testy stacionarity
Proces
ADF
BG
KPSS
PP
x1(t)
-1.956 > -3.45 -11.946 > -21.5 3.829 < 12.71 0.135 < 0.146
x2(t)
-1.956 > -3.45 -11.946 > -21.5 3.829 < 12.71 0.135 < 0.146
Pozn.: ADF ... Rozšířený (Augmented) Dickey-Fullerův test, PP ... Phillips-Perronův
neparametrický test, BG .. test autorů Bierens-Guo, KPSS ... test autorů Kwiatkowski,
Phillips, Schmidt a Shin. U testů jsou uvedeny testační statistiky a kritické hodnoty pro
hladinu významnosti α = 0.05. Pro testy nestacionarity je nulová hypotéza H0: jednotkový
kořen s driftem, alternativní hypotéza H1: lineární TS proces – pro testy stacionarity jsou
hypotézy obrácené.
Závěr: Z tabulky lze vidět, že oba testy stacionarity dávají na uvedené hladině významnosti
nesprávné závěry – neodhalily DS procesy a považují je za TS. Na hladině významnosti
α =0.10 však už správně odmítají nulovou hypotézu.
3.2.2 Nestacionární procesy typu TS
Tyto procesy jsou popsány jednoduchým modelem s explicitně vyjádřeným lineárním
trendem:
(15)
X t = a + bt + ε t , X t = 0 = X 0 = a .
Je logické, že při regresi s procesy tohoto typu bude regresorem i proměnná t - čas, nebo
pořadí (jako relativní, normovaný čas). Na obr. 5 je uveden příklad TS procesů x1(t) a x2(t)
vygenerovaných v programu Matlab s parametry: n=100, seed=12345, σ ε =1, a=5, b=0.0 pro
x1(t) a b=0.6 pro x2(t).
*+,-./01234256>?6:41/+,;6<&8-9=6<"8-9
)!
$!
(!
#!
'!
"!
&!
!
!
"!
#!
$!
%!
&!!
Obr. 5. Průběhy nestacionárních TS procesů x1(t) a x2(t) (horní graf)
Identifikaci procesů lze uskutečnit pomocí testů jednotkových kořenů (testů nestacionarity a
stacionarity) – tab. 4.
Tab. 4. Výsledky testů nestacionarity a stacionarity TS procesů (EasyReg)
Testy nestacionarity
Testy stacionarity
Proces
ADF
BG
KPSS
PP
-1.909 > -3.45 -100.7 < -21.5 0.152 < 12.71 0.096 < 0.146
x1(t)
-1.912 > -3.45 -101.8 < -21.5 0.129 < 12.71 0.095 < 0.146
x2(t)
Závěr: Z tabulky lze vidět, že pro dané procesy test ADF dává nesprávné závěry – neodhalil
TS procesy a považuje je za DS.
Závěr: Z obou tabulek testů DS a TS procesů vyplývá, že nejspolehlivějším testem
z uvedených je neparametrický Phillips-Perronův test.
3.3 Důsledky záměny typů procesů DS/TS
Při záměně, nerozlišování, nebo nesprávné identifikaci typů nestacionárních procesů DS/TS
dochází k určitým nesnázím [ARLT, J. 1999]:
A. Použitím modelu TS při odstraňování trendu z DS procesu dochází k následujícím vážným
problémům a chybám:
1. Index determinace R2 pro DS proces s c = 0 se pohybuje okolo hodnoty 0.44 bez
ohledu na délku časové řady. Pro c≠0 se hodnota R2 zvyšuje s rostoucí délkou časové
řady a dosahuje limitní hodnoty 1 bez ohledu na hodnotu konstanty, či variability
časové řady
2. Rezidua získaná z tohoto modelu mají rozptyl v průměru ve výši 14% skutečného
2
rozptylu σ ε a to bez ohledu na hodnotu konstanty c, či délku časové řady
3. Průměrné hodnoty ACF reziduí jsou funkcí délky časové řady T a hodnoty oscilují
s periodou asi (2/3)T, tzn. že tato funkce indikuje zdánlivý dlouhý cyklus. Tento
výsledek nezávisí na tvaru ACF procesu ε t
4. Pro testování parametru u časové proměnné v modelu TS je t-test velmi slabý – v 87%
případů dojde k zamítnutí správné nulové hypotézy b = 0 a v 73% dojde k zamítnutí
při použití náhodné složky typu AR(p).
B. Použití modelu DS na časovou řadu tvořenou procesem TS:
V tomto případě je situace podstatně lepší. Odhad parametru c MNČ je nestranný a má
přibližně normální (nebo Studentovo t) rozdělení. Snížení vydatnosti tohoto odhadu není
vážný problém, pokud je současně modelována autokorelace nesystematické (náhodné)
složky.
Závěr: Z uvedeného vyplývá, že očištění obou typů časových řad diferencováním je
univerzálnější a méně „nebezpečné”, než odstranění trendu. Z tohoto důvodu lze
diferencování obecně použít na nestacionární procesy, i když neznáme jejich typ.
4 Problém zdánlivé korelace a regrese
Definice: O zdánlivé korelaci mezi dvěma proměnnými (veličinami, časovými řadami,
náhodnými procesy) mluvíme v případě, kdy mezi proměnnými skutečná závislost neexistuje,
ale zdá se, že existuje. (Tento jev je duálním jevem ke zdánlivé nonkorelaci). Ve statistické
literatuře se kromě názvu zdánlivá korelace (spurious correlation) používají ještě názvy
klamná, pseudo, nepravá, iluzorní, nesmyslná (nonsense), náhodná a podmíněná (conditional)
korelace.
Vznik a rozčlenění: Podle příčin vzniku lze zdánlivou korelaci rozdělit v podstatě na tři
skupiny, které se mohou i vzájemně kombinovat (kuriózní a zábavné příklady jsou z knihy
[SWOBODA, H. 1977]):
1. Nesmyslná / náhodná / nevysvětlená korelace: žádná závislost nemůže z principu existovat
(nebo o ní nevíme), ale jenom náhodně mají obě proměnné podobný průběh.
Například: „čím kratší sukně, tím vyšší burzovní kurzy”, „čím větší dovoz pomerančů,
tím větší počet úmrtí na rakovinu”, „lidé trpící ledvinovými kameny mají oblíbenou barvu
zelenou”
2. Podmíněná korelace: zdánlivá závislost je způsobena vlivem společné třetí proměnné,
společného faktoru (který na obě sledované proměnné nějak působil). Nejčastěji je
společnou (třetí) proměnnou: čas, pořadí, trend (u časových řad a náhodných procesů),
teplota, tlak, referenční/vztažná veličina, akční veličina, funkce svazující obě veličiny.
Například: „s přibývajícím věkem ženy kladou chodidla více k vnější straně” (vliv
výchovy na přelomu 19. a 20. století), „mezi podílem kuřáků a nekuřáků existuje výrazná
záporná korelace” (procentní podíly se navzájem doplňují na 100 %), „čím mají děti vyšší
tělesnou váhu, tím jsou zručnější” (korelace obou znaků s věkem: starší děti jsou
šikovnější i těžší v poměru k mladším).
3. Nesprávně interpretovaná korelace: zdánlivá korelace pochází buď z nesprávného
výkladu skutečně existující korelace, nebo je zaměněna orientace kauzality (obrácení
příčiny a účinku).
Například: „mezi tělesnou váhou a četnými nemocemi existuje kladná korelace.
Obézní budou proto zdravější, budou-li užívat odtučňovací tablety”, „nepoměrně více lidí
umírá v posteli než na ulici, na moři nebo ve vykřičené krčmě. Postel je proto
prokazatelně nejnebezpečnější místo pobytu!”.
Nebezpečí zdánlivé korelace spočívá v tom, že vede na ukvapené a nesprávné závěry (včetně
obrácení orientace kauzality), nebo podporuje manipulované interpretace (v politice, reklamě
apod.).
Detekce: Indikaci zdánlivé korelace lze uskutečňovat:
! pro průřezová data pomocí srovnání znamínek a velikostí hodnot korelační a parciální
korelační matice [HEBÁK, P. & HUSTOPECKÝ, J. 1990], [MELOUN, M. & MILITKÝ, J.
1994]
! u časových řad (náhodných procesů) pomocí srovnání výsledků regrese původních a
upravených (stacionarizovaných / očištěných, nebo doplněných o společný faktor) dat.
Pokud je lineární regresní člen pro původní data statistický významný a pro upravená data
statisticky nevýznamný, pak jde o zdánlivou korelaci a regresi [SEGER, J., HINDLS, R. &
HRONOVÁ, S. 1998]
! u nestacionárních integrovaných DS / I(d) procesů byl zaveden pojem kointegrace, která
slouží k odlišení jejich zdánlivé a skutečné korelace.
Řešení zdánlivé korelace obecně spočívá ve:
! vyloučení společného faktoru (pomocí stacionarizace: odstranění trendu, cykličnosti,
sezónnosti / odstranění driftu - diferencováním) [BAKYTOVÁ, H. AJ. 1979], [CYHELSKÝ, L.
AJ. 1986], [SEGER, J., HINDLS, R. & HRONOVÁ, S. 1998] a následné testování korelace
mezi nepravidelnými (náhodnými) složkami analyzovaných dat, nebo
! vyjádření společného faktoru (jeho zavedením do regresní rovnice) [KAŇOKOVÁ, J. 1989],
[BIERENS, H. 1999c], [HEBÁK, P. & HUSTOPECKÝ, J. 1990], [MELOUN, M. & MILITKÝ, J.
1994].
Pozn.: V předchozí kapitole bylo konstatováno, že diferencování je poměrně obecnější způsob
stacionarizace nestacionárních procesů, než odstranění deterministického trendu. Tento
způsob má však omezení: u systému nestacionárních procesů existuje mnohem univerzálnější
a účinnější způsob testování i řešení vzájemných vazeb pomocí kointegrace (nebo pomocí
nelineární kotrendové analýzy).
Příklad zdánlivé korelace dvou TS procesů je uveden např. v [SEGER, J., HINDLS, R. &
HRONOVÁ, S. 1998]: „V luxusní francouzské restauraci jednoho pražského hotelu byla
v deseti dnech za sebou sledována tržba za poledního provozu (obědy Xt – tis. Kč) a za
večerního provozu (večeře Yt – tis. Kč). Je třeba zjistit, jak je silná závislost mezi vývojem
tržeb v poledním a večerním provozu, nebo jinak řečeno – zda by se dalo z vývoje poledních
tržeb usuzovat na očekávanou výši tržeb večerních”. Časové řady jsou zobrazeny na obr. 6,
odkud se nám jeví, že spolu poměrně těsně souvisí – mají podobný trend.
Graf průběhu tržeb
190
46
188
44
186
184
42
182
40
180
POLEDNE (L)
VEČER (R)
38
178
176
36
0
2
4
6
8
DEN
Obr. 6. Průběhy tržeb v poledne a večer (v tis. Kč)
10
174
A. Průřezová (prostorová) data – korelace:
I když je známo, že obě veličiny jsou časové řady, přesto kvůli demonstraci bude zajímavé
pohlížet na ně jako na průřezová data a otestovat jejich vzájemné korelační vztahy (nakonec i
samotní renomovaní autoři [SEGER, J., HINDLS, R. & HRONOVÁ, S. 1998] zvolili právě tento
přístup). Pro otestování přítomnosti zdánlivé korelace je třeba vypočíst matici výběrových
(párových) korelačních koeficientů a matici výběrových parciálních korelačních koeficientů
[HEBÁK, P. & HUSTOPECKÝ, J. 1990], [MELOUN, M. & MILITKÝ, J. 1994]. Parciální korelační
koeficient je korelační koeficient počítaný mezi dvěma veličinami s vyloučením vlivu
ostatních proměnných [ANDĚL, J. 1985]. Umožňuje tedy odhalit souvislosti, které by jinak
zůstaly skryté v souvislostech „všeho se vším”, anebo naopak se ukáže, že nějaká zdánlivě
výrazná souvislost (zdánlivá korelace), indikována korelačním koeficientem, je vlastně jen
zprostředkována jinými proměnnými (společnou třetí proměnnou) [KOSCHIN, F. AJ. 1992].
Porovnání hodnot obou typů korelačních koeficientů lze také využít k určení parazitních a
významných proměnných při vícenásobné regresi [MELOUN, M. & MILITKÝ, J. 1994].
Pro dané veličiny – tržby v poledne (P), večer (V) a čas, dny (D) - dostaneme následující
matice párových (horní hodnoty) a parciálních (dolní hodnoty) korelačních koeficientů (tab. 5
– QC Expert):
Tab. 5. Matice korelačních koeficientů
veličiny
P
V
D
P
1
+0.73
V
1
(-0.06)
+0.79
+0.94
D
1
(+0.45) +0.86
Pozn.: Hodnoty koeficientů byly zaokrouhleny na 2 desetinná místa, hodnoty v závorkách
jsou statisticky nevýznamné na hladině významnosti α =0.05. Kritická hodnota párových
korelačních koeficientů r(n=10, α =0.05) = 0.63 a parciálních korelačních koeficientů r’(9,
0.05) = 0.67 [ANDĚL, J. 1985]. Nevýznamnost parciálního korelačního koeficientu r’
proměnných P, D je pravděpodobně způsobena malým rozsahem výběru (n=10).
Z tabulky je zřejmé, že statisticky nevýznamná hodnota i jiné znaménko (než u párového)
parciálního korelačního koeficientu veličin P,V indikuje zdánlivou (podmíněnou,
zprostředkovanou) korelaci. Stejnou hodnotu lze dostat po výpočtu párového korelačního
koeficientu pro veličiny očištěné od lineárního trendu (korelační matice pouze proměnných
P,V) [SEGER, J., HINDLS, R. & HRONOVÁ, S. 1998]. Situaci při zdánlivé korelaci
analyzovaných veličin znázorňuje obr. 7.
P
r = +0.73
V
akce v
čase
společný faktor
V
P
neuvažován
(=> zdánlivá korelace)
uvažován
r' = (-0.06)
Obr. 7. Schéma zdánlivé a skutečné korelace mezi veličinami P a V
B. Časové řady – regrese:
Výsledky lineární regrese pro původní data jsou uvedeny v tab.6, přičemž lineární statický
regresní model byl uvažován ve tvaru:
(16)
Yt = b0 + b1 X t + ε t , t = 1, 2, ... 10 .
Tab.6. Výsledky lineární regrese pro původní neupravená data (EasyReg)
b1
F
R2 [%]
DW
JB
BP
Pozn.
b0
136.7
1.093
9.01
53
1.99
1.044
0.044
vše OK
Pozn.: F ... Fisherova statistika modelu, DW ... statistika Durbin-Watsonova testu
autokorelace reziduí, JB ... statistika Jarque-Beraova testu normality reziduí, BP ... statistika
Breusch-Paganova testu homoskedasticity reziduí. Hladina významnosti α = 0.05.
Model je po všech stránkách naprosto korektní i významný a tak by se zdálo, že hypotéza
o závislosti večerních a poledních tržeb je prokázána. Podezření na zdánlivou korelaci však
vyplývá z několika skutečností:
- věcná úvaha o reálnosti výsledku: není důvod očekávat silnější vztah mezi polední a
večerní tržbou, čili asi jde o nesmyslnou korelaci,
- zřejmě působil společný trendový faktor např. začátek sezóny, vliv reklamy apod., takže
jde také o podmíněnou korelaci,
- fakt, že skutečná korelace se projevuje mezi nesystematickými (náhodnými) složkami
časových řad a ne mezi složkami systematickými (trend, cykličnost, sezónnost).
Existuje více možností úprav dat: v případě, že jde o procesy DS (po otestování jednotkových
kořenů) použijeme pro regresi diferencované řady. Pokud však umíme otestovat kointegraci,
tak ji u těchto řad napřed použijeme a rozhodneme o dalším postupu. Pokud jde o procesy TS,
pak buď provedeme očištění od trendu, nebo trendovou proměnnou (datum, čas, pořadí)
zařadíme do modelu. Pokud mají řady smíšený DS/TS charakter, nebo charakter neznáme,
pak použijeme diferencované řady.
Za předpokladu nepoužití (neznalosti) testů jednotkových kořenů a kointegrace,
provedeme regresní analýzu s daty očištěnými od lineárního trendu, se zavedením relativního
času (pořadí, dny) a také s diferencovanými hodnotami. Výsledky jsou uvedeny v tab.7,8,9
(hodnoty v závorkách jsou statisticky nevýznamné na hladině α = 0.05).
Tab. 7. Výsledky regrese s daty očištěnými od lineárního trendu (Statgraphics, EasyReg)
b0
b1
F
R2 [%]
DW
JB
BP
(0.000)
(-0.050)
(0.027)
(0.3)
2.015
0.117
0.311
Model s trendově očištěnými veličinami (odchylkami od trendů) měl tvar:
(17)
e y = b0 + b1e x + ε t ⇒ (Yt − T y ) = b0 + b1 ( X t − Tx ) + ε t .
Lineární trendové funkce pro obě veličiny byly nalezeny ve formě:
(18)
T y = 173.933 + 1.394t ,
(19)
Tx = 36.800 + 0.782t .
Výsledky signalizují, že model je korektní, ale statisticky nevýznamný včetně svých
parametrů. Tato skutečnost znamená, že mezi veličinami je pouze zdánlivá (nesmyslná)
korelace.
Tab. 8. Výsledky lineární regrese se zavedenou další proměnnou – časem (EasyReg)
b0
b1
bt
F
R2 [%]
DW
JB
BP
1.433
(-.050)
175.8
25.49
88
2.015
0.117
0.996
Při této regresi byl uvažován model:
(20)
Yt = b0 + b1 X t + bt t + ε t .
Model je naprosto korektní, ale lineární koeficient b1 vyjadřující závislost na poledních
tržbách je statisticky nevýznamný. Srovnáním s výsledky modelu pro původní data lze tedy
konstatovat, že jde o zdánlivou (podmíněnou) korelaci.
Tab. 9. Výsledky lineární regrese pro diferencované časové řady (EasyReg)
b0
b1
F
R2 [%]
DW
JB
BP
(1.625)
(-0.325)
(1.16)
(14)
2.695
0.826
2.520
Byl uvažován model s diferencemi veličin:
(21)
∆Yt = b0 + b1 ∆X t + ε t , t = 1, 2, ... 9 ,
přičemž z výsledků vyplývá, že model je korektní (kritická hodnota Durbin-Watsonovy
statistiky pro negativní autokorelaci je 4-dL( α =0.05, n=9, k=1) = 3.176 [CYHELSKÝ, L. AJ.
1986]), ale přitom statisticky nevýznamný i se svými koeficienty. Závislost mezi řadami je
tedy pouze zdánlivá.
5 Kointegrace
Pojem kointegrace jako první teoreticky popsal Granger (1981), který se zajímal o zdánlivou
závislost mezi nestacionárními procesy. Princip kointegrace je jednoduchý: i když se procesy
chovají individuálně (jsou nestacionární), přesto mezi nimi může existovat vztah, který se
chová ustáleně (je stacionární).
Jinak řečeno: proměnné se nazývají integrovanými, pokud jejich trend může být
odstraněn diferencováním. Integrované proměnné jsou kointegrované, když existuje jejich
lineární kombinace, která nemá stochastický trend [BENKWITZ, A. AJ. 1999].
Odborně řečeno: i když všechny komponenty vektorového náhodného procesu zt mají
jednotkové kořeny (tj. když zt je vícenásobný integrovaný proces typu I(1)), přesto mohou
existovat lineární kombinace ξTzt bez jednotkového kořene (tj. jsou stacionárními I(0)
procesy). Tyto lineární kombinace mohou být interpretovány jako dlouhodobé vztahy mezi
komponentami zt, nebo podle ekonometrické terminologie jako statická ekvilibria [BIERENS,
H. 1999a].
Princip kointegrace je ústřední myšlenkou modelování integrovaných časových řad, protože:
1.
Střední hodnotu stacionární lineární kombinace integrovaných časových řad I(d) je
možné chápat jako (dlouhodobé) ekvilibrium (rovnovážný vztah), které spojuje
uvažované časové řady.
Analýza vztahů mezi procesy I(d) má smysl pouze tehdy, jsou-li tyto kointegrované, tj.
2.
jsou-li spjaté společným stochastickým stacionárním trendem. Není-li tomu tak, každý
proces má jiný směr vývoje. Potom při zkoumání vztahů mezi nimi pomocí regresní
analýzy vzniká stav tzv. zdánlivé regrese. Test kointegrace procesů je tedy současně
metodou pro rozlišení mezi pravou a zdánlivou regresí (i korelací).
3.
Skupinu kointegrovaných časových řad lze popsat modelem korekce chyby (ECM –
Error Correction Model), jehož prostřednictvím lze odlišit dlouhodobé a krátkodobé
vztahy mezi časovými řadami. Může být prostředkem řešení rozporu mezi statistickým a
ekonometrickým přístupem modelování nestacionárních časových řad. Oba přístupy
použité izolovaně jsou problematické. ECM umožňuje spojit přístup statistický
(zkoumající vlastnosti stacionarizovaných diferencovaných časových řad, ale zbavující
se důležitých informací obsažených v původních nestacionarizovaných časových
řadách) a přístup ekonometrický (kladoucí důraz na ekvilibrium časových řad, ale
přehlížející problém zdánlivé regrese).
Systém kointegrovaných procesů se nejčastěji popisuje pomocí k-rozměrného vektorového
autoregresního modelu řádu p - VAR(p) typu I(1), který lze vyjádřit v diferenční formě tzv.
modelu korekce chyb – ECM (Error Correction Model) [ARLT, J. 1999].
Model ECM obsahuje jak krátkodobé vztahy mezi procesy (tj. vztahy mezi
stacionarizovanými, diferencovanými procesy), tak i vztahy dlouhodobé (tj. vztahy mezi
nediferencovanými procesy). Informace o těchto vztazích jsou obsaženy v parametrické
matici Π. Konstrukce modelu EC umožňuje oddělit oba druhy vztahů a zkoumat je
samostatně, přičemž mohou nastat tři situace:
1. h(Π) = r = k, tj. matice Π má plnou hodnost (počet kointegračních vektorů r je roven
počtu procesů k). To znamená, že k-rozměrná časová řada je generována stacionárním
vektorovým procesem {Xt}(systém obsahuje pouze procesy typu I(0) a ne I(1)).
2. 0 < h(Π) = r < k, v tomto případě nezmizí nediferencovaný člen modelu EC, ale současně
nelze vektorový proces {Xt} považovat za stacionární. Protože matice Π je nenulová, lze
najít mezi časovými řadami dlouhodobý vztah a stacionarizaci jejich individuálním
diferencováním bez ztráty informace nelze provést. Prakticky to znamená, že některé
časové řady lze stacionarizovat jejich diferencováním, neboť nejsou obsaženy v žádném
dlouhodobém vztahu s jinými. Některé časové řady však nemohou být stacionarizovány
diferencováním, neboť jejich lineární kombinace s jinými časovými řadami již stacionární
jsou – tyto řady jsou kointegrované. Touto situací se detailně zabývá Grangerova věta
(1987), která dokazuje, že kointegrovaný systém časových řad může být vyjádřen ve třech
formách: ve formě modelu VAR, EC a VMA.
3. h(Π) = r = 0, tzn. že matice Π je nulová a model EC neobsahuje nediferencovaný člen. Krozměrná časová řada je generována nestacionárním vektorovým procesem {Xt} a její
stacionarizaci lze provést individuálním diferencováním jednotlivých časových řad.
Diferencováním nedochází ke ztrátě informace o dlouhodobém vztahu mezi časovými
řadami, neboť žádný neexistuje.
Kointegraci lze definovat taktéž v jednorovnicových modelech. Princip kointegrace byl
detekován a aplikován v oblasti ekonometrie (makroekonomicko-finanční aplikace), jeho
rozpracování a aplikace v oblasti technometrie (jakožto průniku matematiky, matematické
statistiky a technologie) je teprve v počáteční fázi.
5.1 Ekonometrický pohled
V příspěvku [JOHANSEN, S. 1997] je uveden jednoduchý a přehledný systém kointegrovaných
procesů Yt, Zt ve tvaru:
(22)
Yt = (1 − a )Yt −1 + aZ t −1 + ε 1t ,

Z t = aYt −1 + (1 − a ) Z t −1 + ε 2 t ,
přičemž pro koeficient vazby platí, že a ∈<0, 1>. Pro a = 0 jsou oba procesy typu náhodná
procházka (integrované procesy řádu I(1)) a nejsou vzájemně kointegrované. Pro tento případ
však může nastat jev zdánlivé korelace (zvláště pro větší počet hodnot) [BIERENS, H. 1999c].
Pro a = 1 jsou procesy prakticky totožné (proces je roven druhému zpožděnému procesu
s přídavným šumem). Schéma vazeb vektorového systému je znázorněna na obr. 8.
Y0
ε1t
Σ
a
Yt
1-a
z-1
Z0
a
ε2t
Σ
Zt
z-1
1-a
Obr. 8. Blokové schéma kointegrovaných procesů Yt, Zt (Johansen)
V programu Matlab lze vytvořit M-funkci, např. Coin2_J se vstupními parametry: {n, seed,
µ ε 1 , µ ε 2 , σ ε 1 , σ ε 2 , a, Y0, Z0} a s výstupy {Yt, Zt} včetně jejich grafického průběhu a uložení
hodnot do ASCII souboru. Pro parametry n = 100, seed = 13579463,
µ ε 1 = µ ε 2 = 0 , σ ε 1 = σ ε 2 = 1, a = 0 (tj. procesy jsou nezávislé, nekointegrované), Y0 = 15
a Z0 = 5 byly vygenerovány integrované procesy a jejich průběhy jsou znázorněny na obr.9.
4
e1t
3
e2t
2
1
0
-1
-2
0
10
20
Yt
30
40
50
60
70
80
90
100
40
50
60
70
80
90
100
Zt
20
10
0
10
20
30
Obr. 9. Průběhy integrovaných procesů Yt (horní průběh), Zt při zdánlivé korelaci (a = 0)
Při vizuálním „expertním” posouzení průběhů se zdá, že mezi procesy existuje poměrně těsná
záporná korelace, což nakonec celkem „potvrdí” i korelační diagram (obr. 10).
12
Zt x Yt
10
8
6
4
2
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Obr. 10. Korelační diagram procesů Yt a Zt (při zdánlivé korelaci)
Pokud uskutečníme tzv. naivní regresní analýzu (tj. bez předchozího ověření předpokladů),
dostaneme pro model Zt = a + b.Yt výsledky (tab. 10), které nám „potvrdí” zdánlivou korelaci
jako korelaci skutečnou - model i koeficienty jsou statisticky významné, tj. mezi veličinami
existuje lineární závislost.
Tab. 10. Základní výsledky jednoduché lineární regrese (Statgraphics)
Parametr / statistika
Hodnota
Poznámka / závěr
absolutní člen a
18.108
statisticky významný
lineární člen b
-0.545
statisticky významný
Fisherův F-test modelu
38.895
statisticky významný
koeficient determinace R2
0.284
statisticky významný
Pozn.: Uvažovaná hladina významnosti α = 0.05, celkový F-test modelu je v tomto případě
ekvivalentní testu koeficientu determinace, výsledky byly zaokrouhleny na 3 desetinná místa.
Teprve při analýze reziduí (tab.11) vyplyne nekorektnost modelu způsobena výraznou
pozitivní autokorelaci reziduí (kritická hodnota Durbin-Watsonovy statistiky dL(α=0.05,
n=100, k=1) je 1.65).
Tab. 11. Analýza reziduí jednoduché lineární regrese (EasyReg)
Vlastnost
Test
Hodnota
Poznámka / závěr
0.193
pozitivní autokorelace
autokorelace
Durbin – Watson
normalita
Jarque – Berra
5.368
akceptována
homoskedasticita
Breusch – Pagan
0.596
akceptována
Autokorelace reziduí signalizuje nesprávný model, který však nemá význam hledat prostředky
vhodnými pro statistickou analýzu stacionárních časových řad. Při analýze nestacionárních
procesů, nejprve otestujeme tzv. jednotkové kořeny (pro odlišení TS/DS procesů) a v případě
integrovaných procesů (DS, I(1)-náhodné procházky) testujeme jejich kointegraci (tab.12,13).
Tab. 12. Výsledky testů jednotkových kořenů (EasyReg)
Test
Proces
Poznámka / závěr
ADF
PP
Yt
-2.177 > -3.45
-8.852 > -21.5
nestacionární proces ~ I(1)
Zt
-2.061 > -3.45
-6.895 > -21.5
nestacionární proces ~ I(1)
Pozn.: ADF ... Rozšířený (Augmented) Dickey-Fullerův test, PP ... Phillips-Perronův
neparametrický test. U testů jsou uvedeny testační statistiky a kritické hodnoty pro α = 0.05.
Nulová hypotéza H0: jednotkový kořen s driftem, alternativní hypotéza H1: lineární TS
proces.
Tab. 13. Výsledky testů kointegrace (EasyReg)
Řád VAR systému
Ekvilibrium
Poznámka / závěr
p=1
p=2
konstanta
r=0
r=0
r = 0 => procesy nejsou
konstanta +
kointegrované
r=0
r=0
lineární trend
Pozn.: VAR ... Vector AutoRegressive. Počet kointegrovaných vektorů r byl stanoven podle
Johansenova přístupu.
Závěr: Oba procesy jsou nestacionární typu I(1) (náhodná procházka) a nejsou kointegrované,
tj. neexistuje mezi nimi dlouhodobý vztah (ekvilibrium). Testování kointegrace lze využít pro
rozlišení mezi skutečnou a zdánlivou korelací mezi nestacionárními procesy typu DS / I(1).
Nekointegrované procesy lze jednotlivě stacionarizovat diferencováním. Mezi diferencemi
procesů Yt a Zt, tj. mezi procesy ε1t a ε2t se už žádným způsobem (vizuálně, ani klasickou
regresní analýzou) nepodaří zjistit korelaci – viz horní graf obr. 9.
5.2 Technometrický pohled
Nevýhodou ekonometrického přístupu pro techniky jsou těžko interpretovatelné, umělé a
nevhodné modely pro signály dynamických soustav technologických procesů. V následující
části budou definovány diskrétní modely soustav Si1 a Sp1, jako i způsob testování jejich
rozlišení (identifikace) na základě vstupních a výstupních signálů.
5.2.1 Diskrétní modely soustav Si1 a Sp1
Základním zdrojem nestacionarity technologických procesů jsou integrační (astatické)
soustavy – např. různé zásobníky, nádrže, hromady apod. V dalším budeme uvažovat základní
integrační soustavu s astatismem 1. řádu (Si1) se spojitým přenosem
(23)
1
GS ( s) =
,
TI s
kde TI je integrační časová konstanta soustavy. Ze spojitých přenosů lze získat tzv. celkové
diskrétní přenosy - invariantní vzhledem k přechodové funkci, nebo jinak přenosy
s uvažovaným A-Č převodníkem na vstupu (vzorkovač) a Č-A převodníkem na výstupu
(vzorkovač a tvarovač 0. řádu) - pomocí vztahu uvedeného např. ve [VÍTEČEK, A. 1988]:
(24)
G (s)
G SC ( z ) = (1 − z −1 ) Z {L−1 { S } t = kT } ,
s
kde t = k.T je diskrétní čas v násobcích k = {0, 1, 2, ...} periody vzorkování T. Pro
uvažovanou integrační soustavu tak dostaneme celkový diskrétní přenos (model)
(25)
T z −1
G SC ( z ) =
TI 1 − z −1
s odpovídající diferenční rovnicí:
(26)
T
y t = a1 y t −1 + b1u t −1 = y t −1 + u t −1 ,
TI
odkud je zřejmé, že pro koeficienty platí:
(27)
T
.
a1 ≡ 1, b1 =
TI
Pro diferenci výstupního signálu platí vztah odpovídající rovnici přímky procházející
počátkem
(28)
T
∆y t = y t − y t −1 = b1u t −1 = u t −1 ,
TI
ze kterého je zřejmá jeho použitelnost (ve smyslu výsledků lineárního regresního modelu) pro
parametrickou identifikaci soustavy Si1, tj. určení její integrační časové konstanty (perioda
vzorkování T je obecně známá)
(29)
T
TI ≈ .
b1
Další soustavou, která může být aproximací integrační soustavy 1.řádu, je
proporcionální soustava se setrvačností 1.řádu (Sp1) se spojitým přenosem
(30)
k1
G S (s) =
,
T1 s + 1
kde k1 je koeficient přenosu a T1 časová konstanta soustavy. Tato soustava má celkový
diskrétní přenos:
T
(31)
−
k1 (1 − c) z −1
T1
G SC ( z ) =
c
e
,
(
0
,
1
)
=
∈
1 − cz −1
a odpovídající diferenční rovnici:
(32)
y t = a1 y t −1 + b1u t −1 = cyt −1 + k1 (1 − c)u t −1 ,
odkud je zřejmé, že pro koeficienty platí:
T
(33)
−
T1
a1 = c = e ∈ (0, 1), b1 = k1 (1 − c) > 0 .
Odhady parametrů soustavy z odhadů regresních koeficientů lze získat pomocí vztahů:
~
~
(34)
b
T
k1 = 1 , T1 = −
.
1 − a1
ln(a1 )
Pro tzv. kvazidiferenci (viz např. [GARAJ, V. & ŠUJAN, I. 1980]) výstupního signálu platí také
vztah odpovídající rovnici přímky procházející počátkem
~ y = y − cy = k (1 − c)u ,
(35)
∆
1
t
t
t −1
t −1
odkud lze vidět, že kvazidiference pro c = 1 přechází na diferenci procesu. Ze srovnání
diferenčních rovnic je zřejmé, že obě soustavy mají velice podobné diskrétní modely (obr.11).
ut
b1
z-1
k1(1-c)
y0
Σ
b1
z-1
T/TI
y0
Σ
yt
a1
a1
c
yt
ut
z-1
a1 = c = e-T/T 1 ε (0, 1)
1
z-1
a1 = 1
Obr. 11. Diskrétní modely soustav Sp1 (vlevo) a Si1 (vpravo)
Z hlediska klasifikace procesů podle moderních a klasických metod analýzy časových řad
bude mít výstup yt soustavy Sp1 charakter stacionárního procesu I(0) / AR(1) a výstup
soustavy Si1 charakter nestacionárního procesu I(1) / ARIMA(0,1,0) – za předpokladu, že na
vstupy soustav bude působit signál ut typu náhodný Gaussovský proces (bílý šum).
Pokud zobrazíme závislost koeficientů diferenční rovnice a1, b1 diskrétního modelu
soustavy Sp1 na parametrech soustavy k1, T1 a modelu T, dostaneme pro normovaný poměr
časových parametrů T1/T následující průběhy (obr. 12):
1
1.5
b1( 0.5, T1, T )
1
b1( 1 , T1, T )
a1( T1, T ) 0.5
b1( 1.5, T1, T ) 0.5
0
0.1
1
10
100
0
0.1
1
10
T1
T1
T
T
100
Obr. 12. Závislosti koeficientů a1(T1,T) a b1(k1,T1,T) na poměru T1/T
Z obrázku je jasné, že pro poměr časových parametrů T1/T > 10 (čili pro časovou konstantu
T1 řádově větší než perioda vzorkování T) se hodnota koeficientu a1 → 1 a soustava Sp1 se
přibližuje svým chováním soustavě Si1. Pro uvedený velký poměr časových parametrů budou
pravděpodobně selhávat testy typů procesů DS/TS (vycházející z klasické analýzy časových
řad) a testy jednotkových kořenů, které zřejmě nerozliší stacionární a nestacionární procesy
výstupních signálů těchto soustav. Podobnost výstupních procesů diskrétních modelů soustav
DSi1 a DSp1 se v případě a1 = c → 1, TI >> T projeví i na jejich diferencích
(36)
T
∆y t = u t −1 → 0 ,
TI
(37)
∆y t = k1 (1 − c)u t −1 → 0 .
5.2.2 Identifikace soustav Si1 a Sp1
Identifikace uvedených soustav bude uskutečněna pomocí testování nestacionarity a typů
procesů jejich výstupních signálů. Pro další analýzu budou vygenerovány odezvy soustav Si1
a Sp1 na stejný vstupní stacionární signál typu Gaussovský náhodný proces (bílý šum)
s nenulovou střední hodnotou. Budou prozkoumány možnosti určení typů výstupních
nestacionárních procesů (DS/TS) a určení typů soustav (Si1/Sp1), ze kterých procesy
pocházejí (vycházejí).
V programu Matlab lze vytvořit M-funkce pro diskrétní modely soustav Si1 a Sp1,
např. DSi1 se vstupními parametry: {n, u, TI, T, y0} s výstupem yI, DSp1 se vstupními
parametry: {n, u, k1, T1, T, y0} s výstupem yP, včetně jejich grafického průběhu a uložení
hodnot do ASCII souboru. Pro parametry simulace: n=100, T=1, parametry vstupního
stacionárního náhodného procesu s nenulovou střední hodnotou ut: seed=135791,
µ u = 5, σ u = 1, byly vygenerovány: výstupní proces yI soustavy Si1 s parametry: TI=500,
yI0=12 a výstupní proces yP soustavy Sp1 s parametry: k1=2.3, T1=100, yP0=10. Konfigurace
diskrétních modelů soustav je znázorněna na obr.13.
yIt
DSi1
ut
yPt
DSp1
Obr. 13. Konfigurace modelů soustav DSi1 a DSp1
Průběhy vstupního stacionárního a výstupních nestacionárních procesů lze sledovat na obr.14.
9
ut
8
7
6
5
4
3
0
13
10
yI
20
30
40
50
60
70
80
90
100
30
40
50
60
70
80
90
100
yP
12
11
10
0
10
20
Obr. 14. Průběhu vstupního (ut) a výstupních procesů (yI a yP)
Výstupní procesy soustav lze testovat a identifikovat pomocí:
- klasické analýzy časových řad,
- moderní metody testování jednotkových kořenů
- regresní a korelační analýzy (tj. pomocí regresních rovnic a korelačních grafů).
A. Klasická analýza časových řad:
Při testování procesů pomocí klasické analýzy časových řad testujeme původní, diferencované
a trendově očištěné procesy – podle dříve uvedené metodiky ověřované na generovaných DS
a TS procesech. Výsledky analýzy jsou uvedeny v tab. 14 (Statgraphics).
Tab. 14. Základní klasifikace nestacionárních procesů yI(t) a yP(t)
Procesy
Hodnoty
Model
Závěr
yI
I(1)
procesy nelze rozlišit!
původní
yP
I(1)
bílý šum (BŠ) diferencované procesy
diff yI
diferencované
nelze rozlišit!
bílý šum (BŠ)
diff yP
AR(1) / I(1)
trendově očištěné
očištěné od lineárního detrend yI
procesy nelze rozlišit!
trendu (Tt)
detrend yP
AR(1) / I(1)
Závěr: Jak je z tabulky zřejmé, pomocí klasické analýzy časových řad nelze rozlišit typy
výstupních procesů DS/TS soustav Si1 a Sp1!
B. Moderní analýza časových řad:
Pokud použijeme testy jednotkových kořenů (a to testy nestacionarity i stacionarity) pro
původní, diferencované a trendově očištěné procesy, dostaneme výsledky uvedené v tab. 15.
Tab. 15. Výsledky testů nestacionarity a stacionarity výstupních procesů (EasyReg)
Testy nestacionarity
Testy stacionarity
Proces
Poznámka
ADF
PP
BG
KPSS
TS
yI
DS
DS
DS
procesy nelze rozlišit!
TS
yP
DS
DS
DS
TS
diff yI
DS
TS
TS
diferencované procesy
nelze rozlišit!
TS
diff yP
DS
TS
TS
TS
detrend yI
DS
DS
DS
trendově očištěné procesy
nelze rozlišit!
TS
detrend yP
DS
DS
DS
Pozn.: Testy PP a KPSS jsou silnější než testy ADF a BG. Pomocí testů PP a KPSS bylo
možné odlišit pouze diferencované procesy (které se jevily jako procesy TS) od původních a
trendově očištěných procesů (které měly charakter procesů DS, tj. náhodných procházek typu
I(1)).
Závěr: Z výsledků v tabulce je možné učinit závěr, že pomocí testů jednotkových kořenů také
nelze rozlišit výstupní procesy uvedených soustav Si1 a Sp1!
C. Regresní a korelační analýza časových řad:
Pro otestování (identifikaci) typů soustav (Si1/Sp1) zkusíme použít regresní a korelační
analýzu (tj. regresní rovnice a korelační grafy). Můžeme přitom využít buď:
! výše uvedené vztahy pro (kvazi)diference výstupních signálů soustav ve formě výpočtů
regresních rovnic odpovídajících diskrétnímu modelu soustavy Si1
! nebo regresní rovnice odpovídající diskrétnímu modelu soustavy Sp1.
1) Regresní rovnice typu Si1
a) Pro testování použijeme nejprve příslušný lineární regresní model bez absolutního členu
(který však přesně odpovídá pouze modelu soustavy DSi1)
(38)
∆y t = b1u t −1 + ε t ,
kde ε t označuje rezidua. Výsledky regrese jsou uvedeny v tab. 16.
Tab. 16. Výsledky regrese pro model bez absolutního členu (Statgraphics, EasyReg)
R2 [%] DW
JB
Homoskedasticita
Poznámka
Procesy
b1
2.823 1.662
+
perfektní model
100
∆yI, ut-1 0.0020
33
2.078 2.594
+
korektní model
∆yP, ut-1 0.0028
Závěr: Oba modely jsou statisticky významné i korektní (správné), přičemž model pro
výstupní signál ze soustavy DSi1 je perfektní (R2 = 100 %). Z této skutečnosti můžeme
usoudit, že signál yI pochází z integrační soustavy.
b) Pokud uskutečníme výpočet pro umělý (neodpovídající modelům dynamických soustav)
lineární regresní model s absolutním členem, dostaneme výsledky uvedené v tab.17. Regresní
model má v tomto případě tvar
(39)
∆y t = a 0 + b1u t −1 + ε t .
Pro soustavu DSi1 dostaneme rezidua ε t odečtením rovnice diskrétního modelu soustavy od
uvedené regresní rovnice
(40)
ε t = −a0 ,
odkud je vidět, že rezidua jsou nezávislá na vstupní (vysvětlující) proměnné ut-1 i na výstupní
(vysvětlované) proměnné ∆yI , mají charakter Gaussovského náhodného procesu se střední
hodnotou blízkou nule. To dále znamená, že absolutní člen a0 by měl být statisticky
nevýznamný.
Pro soustavu DSp1 upravíme nejprve rovnici diskrétního modelu na tvar s diferencí
výstupního signálu na levé straně
(41)
∆y t = y t − y t −1 = (c − 1) y t −1 + k1 (1 − c)u t −1 = (c − 1) y t −1 + b1u t −1 ,
odkud rezidua ε t dostaneme odečtením této rovnice od uvažované regresní rovnice
s absolutním členem
(42)
ε t = (c − 1) y t −1 − a0 .
V tomto případě je zřejmé, že rezidua jsou závislá na zpožděné (o jeden krok) výstupní
(vysvětlované) proměnné yIt-1, z čehož vyplývá jejich autokorelace 1.řádu. Jejich obecně
nenulová hodnota je závislá ne velikosti poměru časových parametrů T1/T. Absolutní člen a0
bude nenulový a zřejmě i statisticky významný.
Tab. 17. Výsledky regrese pro model s absolutním členem (Statgraphics, EasyReg)
b1
R2 [%] DW
JB
BP
Poznámka
Procesy
a0
absolutní člen je
2.823 1.669 0.078
100
∆yI, ut-1 (3.10-9) 0.002
nevýznamný
autokorelace,
98.6 (0.016) (8.760) 0.245
∆yP, ut-1 -0.107 0.023
nenormalita!
Závěr: Model pro výstupní signál yP ze soustavy DSp1 je statisticky významný, ale není
korektní (správný) – rezidua vykazují významnou pozitivní autokorelaci a nejsou normálně
rozdělena. Koeficient b1 pro tento model je asi o jeden řád větší, než v modelu bez
absolutního členu. Tato skutečnost také podporuje závěr, že s modelem pro yP není něco
v pořádku. Model pro výstupní signál yI ze soustavy DSi1 je perfektní (R2 = 100 %) a
korektní (správný). Z této skutečnosti můžeme znovu usoudit, že signál yI pochází
z integrační soustavy.
Uvedené skutečnosti můžeme podchytit v algoritmu identifikace typu soustav / jejich procesů
(obr. 15).
TS
Z
∆yt = (a0) + b1ut-1 + ε
Si1
+
perfektní
model ?
Sp1
K
Obr. 15. Algoritmus testování typů soustav (jejich výstupních procesů)
Pro vizuální posouzení lze zobrazit korelační diagramy (bodové X-Y grafy) pro odpovídající
proměnné (signály) – viz obr. 16.
Obr. 16. Korelační diagramy diferencí výstupů a zpožděného vstupu soustav
Závěr: Z grafů a předchozích vztahů je zřejmé, že přesná lineární závislost mezi diferencí
výstupního signálu a o jeden krok zpožděným vstupním signálem odpovídá pouze integrační
soustavě Si1. Tato skutečnost je tedy kritériem pro rozlišení typů soustav a tím i typů signálů.
Výstupní signál yI z integrační (astatické) soustavy Si1 je pravým nestacionárním signálem,
zatímco výstupní signál yP z proporcionální (statické) soustavy Sp1 je kvazinestacionárním
signálem, který se po uplynutí přechodového děje stává signálem stacionárním. Je
samozřejmé, že v praxi budou výstupy soustav zatíženy poruchami a výsledky nebudou tak
jednoznačné. Přesto lze předpokládat, že uvedeným způsobem půjde odlišit výstupní signály a
tím i soustavy Si1 a Sp1.
2) Regresní rovnice typu Sp1
a) Pro testování použijeme nejprve příslušný lineární regresní model bez absolutního členu,
který přesně odpovídá oběma diskrétním modelům soustav DSi1 (a1=1) i DSp1 (a1<1)
(43)
y t = a1 y t −1 + b1u t −1 + ε t ,
kde ε t označuje rezidua. Výsledky regrese jsou uvedeny v tab. 18.
Tab. 18. Výsledky regrese pro model bez absolutního členu (Statgraphics, EasyReg)
Procesy
a1
b1
R2 [%] DW
JB
Homoskedasticita
Poznámka
yI, ut-1 1.000 0.002
100
2.823 1.67
+
perfektní model
yP, ut-1 0.990 0.023
100
2.815 2.83
+
perfektní model
Závěr: Oba modely jsou statisticky významné, korektní (správné) a perfektní (R2 = 100 %).
Podle velikosti koeficientu a1 lze jednoznačně posoudit příslušnost signálů k typům soustav
(pro a1 = 1 jde o výstup z integrační soustavy). Tato úvaha výrazně koresponduje s myšlenkou
testování tzv. jednotkových kořenů procesů DS/TS používanými v moderní analýze časových
řad (v ekonometrii).
b) Pokud uskutečníme výpočet pro umělý (neodpovídající modelům dynamických soustav)
lineární regresní model s absolutním členem, dostaneme výsledky uvedené v tab.19. Regresní
model má v tomto případě tvar
(44)
y t = a 0 + a1 y t −1 + b1u t −1 + ε t .
Tab. 19. Výsledky regrese pro model s absolutním členem (Statgraphics, EasyReg)
a1
b1 R2 [%] DW
Dh
JB
BP
Poznámka
Procesy
a0
perfektní model
yI, ut-1 (0.000) 1.000 0.002 100 2.823 (-4.10) 1.68 0.60
perfektní model
yP, ut-1 (0.000) 0.990 0.023 100 2.813 (-4.02) 3.05 1.60
Pozn.: Oba modely jsou statisticky významné, korektní (správné) a perfektní (R2 = 100 %).
Durbinova h statistika (Dh) sice vykazuje statisticky významnou hodnotu (vzhledem
k N(0,1)) a signalizuje zápornou autokorelaci reziduí, avšak vzhledem ke statisticky
nevýznamné hodnotě DW a ke korektně definovanému modelu je tento údaj nevhodný a
matoucí. Absolutní člen regresní rovnice a0 je v obou případech nulový a statisticky
nevýznamný.
Závěr: Podle velikosti koeficientu a1 lze opět jednoznačně posoudit příslušnost signálů k
typům soustav.
Uvedené skutečnosti můžeme jednoduše podchytit (pro uvažovaný teoretický případ)
v algoritmu identifikace typu soustav a jejich výstupních procesů (obr. 17).
TS
Z
yt = (a0) + a1yt-1 + b1ut-1 + ε
Si1
-
a1 < 1 ?
+
Sp1
K
Obr. 17. Algoritmus testování typů soustav (a jejich výstupních procesů)
Je logické, že v praktických případech mohou jednoznačnost identifikace ztížit jak aditivní
šum na vstupech/výstupech soustav, tak mimořádně velké časové konstanty T1 soustav Sp1.
Závěr: Přehledné výsledky možnosti a úspěšnosti identifikace soustav Si1 a Sp1 na základě
jejich vstupně/výstupních signálů (proměnných, veličin, procesů) jsou uvedeny v tab. 20.
Tab. 20. Možnosti identifikace soustav Si1 a Sp1 na základě jejich vstupů a výstupů
Metoda
Data / model
Rovnice
Závěry
KAČR původní, diferencované,
nelze identifikovat, rozlišit!
trendově očištěné
MAČR původní, diferencované,
nelze identifikovat, rozlišit!
trendově očištěné
∆y t = b1u t −1 + ε t
OK: yI, R2 = 100%
DSi1
∆y t = a 0 + b1u t −1 + ε t
OK: yI, a0 = 0, R2 = 100%
RA
y t = a1 y t −1 + b1u t −1 + ε t
OK: yI, a1 = 1
Dsp1
yt = a 0 + a1 yt −1 + b1u t −1 + ε t
OK: yI, a1 = 1
Pozn.: KAČR ... klasická analýza časových řad, MAČR ... moderní analýza časových řad, RA
... regresní analýza.
Shrnutí: Z předchozích dílčích závěrů shrnutých do tabulky lze konstatovat, že
nejspolehlivější identifikační metodou soustav Si1 a Sp1 je statistická identifikace pomocí
regresní analýzy s vhodnými modely.
Identifikace pomocí klasické a moderní analýzy časových řad se ukázala jako
nevhodná a nepoužitelná, což je v rozporu s předchozími výsledky, kdy byl tento způsob
identifikace nestacionárních procesů typu DS/TS naopak velice vhodný.
Toto konstatování jenom dále dotvrzuje závěr, že pro technometrickou analýzu signálů
dynamických soustav technologických procesů nelze automaticky použít všechny výsledky
teoretických přístupů ekonometrie a moderní i klasické analýzy časových řad.
6 Závěr
Náplní výzkumu v oblasti řízení technologických procesů v hutnictví je [MORÁVKA, J. 1999a],
[MORÁVKA, J. 1999b], [MORÁVKA, J. 2000]:
- nejprve analýza (deterministická i statistická) struktury, kauzality a závislostí (vazeb,
interakcí) mezi veličinami,
- pak jejich (sub)optimální řízení.
Cíle optimalizace technologických procesů jsou výrobně-ekonomické, týkají se procesu
výroby i samotných výrobků a patří mezi ně zejména:
- minimalizace poruch, nestacionarit technologického procesu (např. zastavení
aglomeračního pásu, průvalů na ZPO apod.)
- maximalizace životnosti technologických agregátů / minimalizace jejich opotřebení (např.
Cu vložek krystalizátorů na ZPO apod.)
- maximalizace (optimalizace) kvality výrobků (např. aglomerátu, předlitků apod.)
- minimalizace vad (reklamací) výrobků
- maximalizace výrobnosti zařízení
- minimalizace nákladů na výrobky (zvýšení konkurenční schopnosti produktů na trhu).
Technologické procesy (např. v hutnictví) jsou přitom obecně dynamické systémy
vícerozměrné, nelineární, stochastické, spojitě-diskrétní s rozloženými parametry – typu
MIMO (Multiple Input Multiple Output).
Pokud obsahují integrační subsystémy a proporcionální setrvačné subsystémy
s velkými časovými konstantami (což je v hutnických systémech velice běžné), pak se
v systémech vyskytují nestacionární vstupní, stavové a výstupní procesy (typu DS, ale i TS).
Klasifikace, identifikace a statistická analýza jednotlivých (jednorozměrových)
nestacionárních procesů je už poměrně dobře zvládnutá. Analýza systémů nestacionárních
procesů pomocí P, V a H kanonických struktur víceparametrových systémů [ŠULC, B. 1999] a
aplikace těchto poznatků je však teprve ve stadiu zkoumání a rozpracování.
Je tedy celkem logické, že uvedené náročné úkoly výzkumu řízení technologie se
neobejdou bez znalostí a použití moderních metod statistické analýzy (i) nestacionárních
náhodných procesů v mnohorozměrových dynamických systémech technologických procesů.
7 Literatura
ANDĚL, J. 1985. Matematická statistika. 2.vyd. Praha : SNTL/ALFA, 1985. 352 s.
ARLT, J. 1999. Moderní metody modelování ekonomických časových řad. 1.vyd. Praha: Grada
Publishing, s.r.o., 1999. 312 s. ISBN 80-7169-539-4.
BAKYTOVÁ, H. AJ. 1979. Základy štatistiky. 2.vyd. Bratislava : ALFA, 1979. 392 s.
BENKWITZ, A. AJ. 1999. Multiple Time Series Analysis, Co-Integration. [online]. Humboldth
University, Berlin, Germany, 1999.
Dostupné z <URL: http://www.xplore~stat.de/tutorials/mtsnode5.html> 6 s.
BIERENS, H. 1999a. Cointegration Analysis [online]. Pensylvania State University, PA, 1999.
Dostupné z <URL: http://econ.la.psu.edu/~hbierens/> 29 s.
BIERENS, H. 1999b. Nonparametric Nonlinear Co-Trending Analysis, With an Application to
Interest and Inflation in the U.S. [online]. Pensylvania State University, PA, 1999.
Dostupné z <URL: http://econ.la.psu.edu/~hbierens/> 39 s.
BIERENS, H. 1999c. Free Econometrics Software for Easy Regression Analysis [online].
Pensylvania State University, PA, 1999.
Dostupné z <URL: http://econ.la.psu.edu/~hbierens/>.
CIPRA, T. 1986. Analýza časových řad s aplikacemi v ekonomii. 1.vyd. Praha : SNTL/ALFA,
1986. 248 s.
CYHELSKÝ, L. AJ. 1986. Teorie statistiky. 2.upravené vyd. Praha : SNTL/ALFA, 1986. 344 s.
GARAJ, V. & ŠUJAN, I. 1980. Ekonometria. 1.vyd. Bratislava : ALFA/SNTL, 1980. 288 s.
HEBÁK, P. & HUSTOPECKÝ, J. 1990. Průvodce moderními statistickými metodami. 1.vyd.
Praha : SNTL, 1990. 296 s. ISBN 80-03-00534-5.
JOHANSEN, S. 1997. Mathematical and Statistical Modelling of Cointegration. In Sborník EUI
(European University Institute) Florence, Italy : Working Paper ECO No. 97/14, 1997,
16 s.
KAŇOKOVÁ, J. 1989. Teorie statistiky pro řízení a plánování. 1.vyd. Praha/Bratislava:
SNTL/ALFA, 1989. 398 s.
KOSCHIN, F. AJ. 1992. STATGRAPHICS aneb statistika pro každého. 1.vyd. Praha : Grada,
1992. 349 s. ISBN 80-85424-70-3.
LJUNG, L. 1987. System Identification : Theory for the User. 1. vyd. Englewood Cliffs New
Jersey : PTR Prentice Hall, 1987. 519 s. ISBN 0-13-881640-9.
MELOUN, M. & MILITKÝ, J. 1994. Statistické zpracování experimentálních dat. 1.vyd. Praha :
PLUS, 1994. 839 s. ISBN 80-85297-56-6.
MORÁVKA, J. 1999a. Ekologická optimalizace provozu A2 SP4. (Analytická studie projektu č.
5098030). Třinec : TŽi a.s. SA - Středisko automatizace, červen-říjen 1999. 40 s.
MORÁVKA, J. 1999b. Hierarchický distribuovaný systém řízení aglomeračního procesu.
Disertační práce. Ostrava : KATŘ FS VŠB-TU Ostrava, září 1999. 170 s.
MORÁVKA, J. 2000. Základní rozbor možností statistického zpracování technologických dat
ZPO 1. Úvodní studie 1.etapy projektu č.5100004 “Statistické zpracování
technologických dat ZPO 1”. Třinec : SPPČ TŽi, a.s., březen 2000. 18 s.
SEGER, J., HINDLS, R. & HRONOVÁ, S. 1998. Statistika v hospodářství. 1.vyd. Praha : ETC,
1998. 636 s. ISBN 80-86006-56-5.
SWOBODA, H. 1977. Moderní statistika. I.vyd. Praha : Svoboda, 1977. 352 s.
ŠULC, B. 1999. Teorie automatického řízení s počítačovou podporou. 1.vyd. Praha : skripta
FS ČVUT Praha, 1999. 154 s. ISBN 80-01-01974-8.
TŮMA, J. 1998. Složité systémy řízení I. – Regulace soustav s náhodnými poruchami. 1.vyd.
Ostrava : skripta FS VŠB-TU Ostrava, 1998. 158 s.
VÍTEČEK, A. 1988. Matematické metody automatického řízení (Transformace L a Z). 1.vyd.
Ostrava : skripta FSE VŠB Ostrava, 1988. 156 s.

Podobné dokumenty

T - Publi.cz

T - Publi.cz U tohoto přístupu se zpravidla předpokládá, že časová řada je slabě stacionární.. Základním prvkem při konstrukci modelu je reziduální složka. Uvedeme dva typické příklady modelu: • model klouzavý...

Více

ventilátory

ventilátory * cena za jednotku vč. DPH 19 % ** cena za jednotku (při odběru 3 ks/jednotek) bez DPH IP X4 v ČR

Více

Vektorové autoregrese

Vektorové autoregrese Pokud bychom na tyto modely použili MNČ, důsledky by byly následující: - nekonzistence odhadové funkce MNČ, nemožnost použít běžné postupy statistické indukce, výsledky t-testů a F-testů neodpovída...

Více

KARDIOPULMONÁLNÍ RESUSCITACE PO TONUTÍ Jana ŠEBLOVÁ

KARDIOPULMONÁLNÍ RESUSCITACE PO TONUTÍ Jana ŠEBLOVÁ • Evropa ve středověku – metoda „barrel-roll“ – změny v intrathorakálním a intraabdominálním tlaku – vliv na cirkulaci • Hippokrates (460 – 370 BC) – užití „trubičky do trachey“ • Asklepiades (128 ...

Více

insights insights

insights insights zvýšeným tempem inovací. Nyní přichází s novým vysoce výkonným pětiosým CNC obráběcím centrem C 42 U dynamic, které je nejen prakticky orientovaným rozšířením úspěšné konstrukční řady C, ale také v...

Více

Stáhnout v pdf - Czech National Trust

Stáhnout v pdf - Czech National Trust Výsledek hospodaření z hlavní činnosti organizace, je zisk ve výši 1 155 998,70 Kč. Nejvýznamnější výnosy, a to ve výši 1 516 498,56 Kč, byly příjmy z darů určených na hlavní činnost organizace. Da...

Více

Program workshopu

Program workshopu WORKSHOP: TONUTÍ A ZÁCHRANA TONOUCÍHO 2. června 2016, Panorama Hotel Prague, Praha

Více