Modelování hydrogramů průtokových vln v říčním systému s využitím

Transkript

Modelování hydrogramů průtokových vln v říčním systému s využitím
Modelování hydrogramů průtokových vln v říčním systému s využitím
neuronových sítí
1.1. Úvod
Ochrana lidských životů před přírodními katastrofami, jako jsou povodně, hurikány, požáry,
sopečná činnost a mnoho dalších je jednou ze základních povinností lidské společnosti.
V důsledku globálního oteplování dochází zejména v posledních dvaceti letech k
významnějšímu nárůstu výkyvů počasí, zejména teplotních výkyvů, intenzity atmosférických
poruch (hurikány, tornáda, sucho) a četnosti výskytu povodňových událostí, které jsou pouze
důsledkem sílící srážkové činnosti doprovázející tyto jevy.
V České republice po katastrofální povodni v roce 1997 a 2002 vzrostl zájem obyvatelstva
o řešení otázky protipovodňové ochrany v postižených oblastech.
V důsledku povodňových událostí v uplynulých letech vzrostly obavy obyvatelstva před
případnými dalšími povodňovými událostmi. Kombinace uplynulých povodňových událostí a
vyšší informovanosti obyvatelstva ze strany médií o případné hrozící povodňové či jiné
katastrofě může mít pozitivní vliv na snížení ztrát lidských životů v případě výskytu další
přírodní katastrofy.
Hlavním zdrojem informací o výskytu meteorologických a hydrologických situací je
v České republice hlásná a předpovědní služba Českého hydrometeorologického ústavu
(ČHMÚ). Hlásná a předpovědní služba ČHMÚ sestává z tzv. meteoprognózy a hydroprognózy.
Hlavním úkolem meteoprognózy je vydávání předpovědí počasí a varovných zpráv o výskytu
nebezpečných meteorologických situací. Jedním z hlavních úkolů hydroprognózy je vydávávání
předpovědí průtoků v systému hlásných stanic na tocích na území České republiky a varovných
zpráv o případném hrozícím nebezpečí v důsledku vzestupu hladin vodních toků.
1.2.
Hlavní cíle projektu
Tato část výzkumu se zabývá předpovědními simulacemi hydrogramů průtokových vln ve
vybraných říčních úsecích v povodí Berounky aplikací metody neuronových sítí založené na
vstupně – výstupním vztahu.
Cílem řešení metodou neuronových sítí bylo:
a) prokázat vhodnost použití této metody založené na hodnocení vstupně-výstupních vztahů při
odvozování hydrogramů průtoků v předpovědních profilech ze známých údajů pozorovaných
veličin ve vstupních profilech a mezipovodí jako alternativu k dosud používaným metodám
b) ověřit možnost odhadu průtoku (vodního stavu) způsobem založeným na tzv. hydrometrických
metododách (metodě tendencí a metodě odpovídajících si průtoků) a metodě
hydrometeorologické předpovědi na základě znalosti předchozího průběhu průtoku (vodního
stavu) v řešeném profilu a vstupních profilech a znalosti předchozích, současné a budoucích
hodnot srážkového úhrnu.
c) analyzovat vliv jednotlivých komponent (zejména hydrogramů průtoků či průběhu vodních
stavů ve vstupních profilech a srážek) na výsledné hydrogramy ve výstupním profilu
2. Metodika
Hlavní pozornost je zaměřena zejména na vyšetření optimálního počtu vstupů a typu
komponent ovlivňujících významným způsobem simulovaný průběh hydrogramů průtokových
vln metodou umělých neuronových sítí.
2.1. Základy metody neuronových sítí
2.1.1. Charakteristiky umělých neuronových sítí
Za umělou neuronovou síť se obecně uvažuje taková struktura pro distribuované paralelní
zpracování dat, která se sklásá z jistého, obvykle velmi vysokého, počtu vzájemně propojených
výkonných prvků. Každý z nich může současně přijímat libovolný konečný počet různých dat.
Na další výkonné prvky může předávat libovolný konečný počet shodných informací o stavu
svého jediného, avšak velmi rozvětveného výstupu. Každý výkonný prvek transformuje vstupní
data na výstupní podle jisté přenosové funkce. Přitom se též může uplatnit obsah jeho lokální
paměti.
Funkci umělé neuronové sítě můžeme chápat jako jistou transformaci T vstupního signálu X na
výstupní signál
_
_
Y = T (X ) .
Cestu k obecnějšímu poznání transformační funkce ukázali R. Hecht-Nielsen a K. Hornik. Ta
vede ke Komogorově teorému o řešení tzv. třináctého Hilbertova problému. Třináctý Hilbertův
problém se týká možnosti reprezentace spojitých funkcí n proměnných pomocí konečného součtu
a superpozice spojitých funkcí jedné proměnné. Hilbert vyslovil domněnku, že kořeny rovnice
x 4 + ax 3 + bx 2 + cx + 1 = 0
nelze vyjádřit jako funkce koeficientů a, b, c konečnými součty spojitých funkcí pouze dvou
proměnných. Teprve po 57 létech dokázal Kolmogorov, že tato domněnka není správná a že
každou reálnou spojitou funkci f, mající n proměnných definovanou v n-rozměrné krychli o
hranách (0,1) lze vyjádřit jako
f ( x1 ,..., x n ) =
2 n +1
n
q =1
p =1
∑ψ q (∑φ pq ( x p )),
kde ψq a φpq jsou spojité funkce jedné proměnné a
p = 1,…,n q = 1,…,(2n+1).
Přitom pro danou funkci jsou specifické pouze ψq, zatímco funkce φpq jsou pro dané n a f
nezávislé. Hecht-Nielsen ukázal, že tuto univerzální vlastnost funkcí φpq lze využít též pro
reprezentaci funkcí s hodnotami v prostoru vyšších rozměrů.
Kolmogorův teorém doplňovali v pozdějších letech někteří další autoři, např. Lorenz, který
dokázal, že je možno vystačit pouze s jedinou funkcí ψ a D.A. Sprecher, který našel podmínky
pro to, aby funkce ψq měly tvar λpφq, kde λp jsou konstanty.
Aplikace Kolmogorovova teorému na problematiku neuronových sítí vede k poznatku, že
k tomu, aby bylo transformační funkcí T neuronové sítě možno aproximovat libovolnou funkci f
postačí, aby příslušná neuronová síť měla alespoň tři vrstvy o odpovídajících počtech neuronů (
výkonných prvků ) v jednotlivých vrstvách.
Funkci T lze implementovat jako transformační funkci neuronové sítě, která má nejméně tři
vrstvy s dopřednou vzájemnou vazbou, z nichž první vstupní vrstva má n výkonných prvků,
uskutečňujících pouze distribuci vstupních signálů xi, druhá (vnitřní, skrytá) vrstva má 2n+1
výkonných prvků a výstupní vrstva má m výkonných prvků.
Výkonný prvek umělé neuronové sítě
Výkonným prvkem umělé neuronové sítě je formální neuron, který zpravidla vstupní
údaje zpracovává podle vztahu.
N
y = S (∑ wi xi + Θ)
i =1
kde
xi jsou vstupy neuronu a jejich celkem N
wi jsou synaptické váhy
S je obvykle nelineární přenosová funkce neuronu
Θ je práh
Výraz v závorce je vnitřní potenciál neuronu.
Obr. 1. Základní model jednoduchého neuronu
Obr. 2. Možné varianty přenosových funkcí
Nelineární přenosová funkcí
Přenosová funkce označovaná též jako funkce aktivační převádí vnitřní potenciál neuronu
do definovaného oboru výstupních hodnot. Nejčastější přenosové funkce jsou čtyři: lineární,
skoková omezená a sigmoida. Nejčastěji je obor výstupních hodnot omezen intervalem [0,1].
Sigmoida nebo logistická funkce má potom tvar zpravidla
f (ξ ) =
kde λ je parametr strmosti.
1
1 + e − λξ
Alternativní variantou sigmoidní funkce ( která je monotónní a neklesající ) je pro obor
výstupních hodnot [-1,1] hyperbolická tangenta. Přenosová funkce kromě jiného určuje, zda je
výkonný prvek binární nebo spojitý.
Pracovní fáze umělé neuronové sítě
Rozlišujeme 2 fáze – adaptivní, kde se síť učí a aktivní, kde vykonává naučenou činnost –
vybavuje si. Paměť je nejčastěji reprezentována hodnotami váhových koeficientů jednotlivých
vstupních neuronů. Umělá neuronová síť je tzv. asociativní pamětí, ve které jsou uloženy různé
vzory a která si tyto vzory vybavuje. Možné jsou prostorové (jednoduché statické) vzory a
časoprostorové vzory ( posloupnosti statických obrazů ). Též vybavování může mít jednu ze dvou
variant: při autoasociativním vybavování se z paměti čtou vektory X 1 ,..., X m . Umělá neuronová
síť je heteroasociativní, pokud jsou v ní uloženy páry vzor-obraz ( X 1 , Y1 ),..., ( X m , Ym ).
Učení
Učení se v umělé neuronové síti realizuje nastavováním vah mezi uzly. V praxi se vahám
přisoudí počáteční hodnoty, které mohou být buďto náhodně zvolené, nebo vybrané podle
nějakého podobného případu. Pak se do sítě přivede trénovací vstup. Síť poskytne výstup,
odezvu. Rozeznáváme dva typy učení: s učitelem a bez učitele.
Při učení s učitelem existuje nějaké vnější kritérium určující, který výstup je správný a
v síti se nastavují váhy pomocí zpětné vazby podle toho, jak blízko je výstup kritériu. Vypočítává
se rozdíl mezi žádaným a skutečným výstupem. Váhy se nastavují podle nějakého algoritmu,
který zabezpečuje snižování chyby mezi skutečným a žádaným výstupem. Velikost změn vah je
obvykle malá. Pak se síti předloží nový výstup a celý proces se zopakuje. Po provedení velkého
počtu pokusů se síť naučí vydávat stabilní výstup jako reakci na vstupy, které přijímá. Odvozena
a dokázána byla celá řada teorémů o konvergenci a stabilitě učících algoritmů.
Při učení s učitelem se umělá neuronová síť učí srovnáváním aktuálního výstupu
s výstupem požadovaným a nastavováním vah synapsí tak, aby se snížil rozdíl mezi skutečným a
žádaným výstupem. Metodika snižování rozdílu je určena učícím algoritmem.
Jednou z metod učení s učitelem je Back-propagation, která bude nejvíce použita v rámci
disertační práce. Dále existují metody: učení s korekcí chyby, posilové učení, stochastické učení
atd.
Učení bez učitele nemá žádné vnější kritérium správnosti. Algoritmus učení je navržen
tak, že hledá ve vstupních datech určité vzorky se společnými vlastnostmi. Mnoho algoritmů
učení bez učitele jsou paralelní implementace „hroznových“ algoritmů. Učení bez učitele se také
říká samoorganizace.
Mezi metody učení bez učitele patří: Hebbovské učení, diferenciální Hebbovské učení,
min-max učení a kompetice.
Učící proces probíhá většinou v živých organismech, než je zapamatován. Existuje ale
také učení jednorázové – systém si pamatuje hned napoprvé předložený vzor. V praxi ji mají
spíše jen modely neuronových sítí, např. Hopfieldova síť. Neuronové sítě se mohou učit nejen
změnou synaptických vah, ale i přizpůsobováním přenosové ( prahové ) funkce, počtu neuronů
sítě popřípadě i topologickým uspořádáním sítě.
Vybavování
Aktivní fáze následuje za fází adaptivní a zpracovávají se v ní vstupní data. Na základě
vstupu dat vznikne ve vstupní vrstvě nerovnovážný stav. V neuronech zapamatované hodnoty se
začnou působením ostatních neuronů přes spoje měnit ( aktualizovat ) a mění se tak dlouho,
dokud opět nenastane stabilní rovnovážný stav. Na jejich výstupech je pak požadovaná odezva
sítě na tento vstup. Časově se obě fáze mohou překrývat.
Základní pojmy
Umělé neuronové sítě mají některé výhodné vlastnosti. Jsou schopné realizovat nad
vstupními daty libovolnou transformaci, jsou tedy univerzální. Neuropočítač postavený na bázi
neuronové sítě tedy není zapotřebí programovat, protože se ke správnému chování naučí pomocí
předkládaných příkladů. Neuronové sítě jsou díky velkému množství neuronů a spojů a díky
tomu, že informace je v celé síti rozprostřena, robustní. Poruchy neuronů vedou jen k postupné
degradaci sítě. Mají schopnost zobecnění ( generalizace ), schopnost abstrakce, tj. schopnost
stejně reagovat na jistou množinu vstupních dat, nikoli jen na prvky z této množiny.
Predikce znamená předpovídání výstupní hodnoty jisté veličiny na základě jejího průběhu
v minulosti. Při predikci jde o to, abychom v průběhu nějaké známé číselné řady, jejíž hodnoty se
mění v závislosti na některém nezávisle proměnném parametru sledovaného jevu ( může být
fyzikální veličina i čas ) nalezli co nejpravděpodobnější průběh závislé proměnné. Predikce je
vlastně speciálním případem extrapolace, tou se rozumí odvození nebo závěr plynoucí z chování
funkce uvnitř známého oboru pro její chování mimo tento obor.
Rozpoznávání je rozhodováním na základě vstupního vektoru o tom, do které kategorie předmět,
daným vektorem popsaný zařadit. Někdy se hovoří o klasifikaci.
Asociace je klasifikaci podobná, ale umělá neuronová síť se v tomto případě učí na bezchybných
datech a klasifikuje data poškozená.
Filtrace vyhlazuje průběh vstupního signálu. Podstatou filtrace je získání úplného, šumem
nezatíženého výstupního signálu ze signálu vstupního. Ten produkují vstupní senzory, čidla.
Jejich technické řešení a funkce závisí na konkrétní aplikaci, pro kterou jsou určeny. Mohou to
být například optické snímače ( při zpracování obrazové informace ) nebo ultrazvukové detektory
( ve zpracování dat ze sonaru ). Filtrace však není předmětem disertační práce a proto jí nebude
dále věnována pozornost.
Optimalizace slouží k určení optimální hodnoty nějaké optimální hodnoty nějaké proměnné, např.
k minimalizaci délky cesty.
Adaptace – schopnost umělé neuronové sítě k samoorganizaci. Realizuje se obvykle změnami
vah během učení.
Architektura – struktura sítě výkonných prvků, jejich vzájemné propojení.
Back – propagation ( zpětné šíření ) – učící algoritmus vícevrstvých dopředných (nerekurentních)
neuronových sítí. Při něm se chyba výstupní vrstvy zpětně přepočítává do předchozích vrstev (
zpětně se šíří ) a podle její hodnoty se upravují jednotlivé váhy.
Dopředná (nerekurentní) síť – moderní vícevrstvá a částečně samoorganizující se síť. Samostatně
klasifikuje vsupní vektory tak, že jim přiřazuje odpovídající výstupní hodnoy. Je v ní
jednoznačně definován informační tok. V takové síti neexistují spoje mezi neurony z vyšších
vrstev zpět do vrstev nižších, dokonce ani spojení mezi neurony v téže vrstvě.
Energetická funkce – energie je mírou naučenosti, tedy odchylky mezi skutečnými a
požadovanými hodnotami výstupů neuronové sítě pro danou trénovací množinu.
Kohonnenova síť – samoorganizující se síť, nepotřebuje k trénování učitele.
Neuron – buňka nervového systému. Neuron je anatomicky i funkčně základním stavebním
kamenem nervového systému a posloužil jako vzor pro výkonný prvek v umělých neuronových
sítích.
Neuronová síť – počítačová architektura podobná mozku. Proti klasickým počítačům má výhody:
je odolná proti chybám, má schopnost učit se, dovede abstrahovat i generalizovat.
Perceptron – jednoduchá dopředná síť bez skrytých vrstev. To znamená, že jednu vrstvu této sítě
lze učit. Klasickou hranicí schopností perceptronu je XOR-problém.
Práh – hodnota, kterou musí součet všech vážených vstupů neuronu překročit, aby se stal
aktivním.
Přeučování – učící proces, ve kterém se maže jistý počet vah. V kontrastu k normálnímu učení už
při přeučování síť jistý objem vědomostí obsahovala.
Rozpoznávání vzorů, obrazů- - rozpoznávání naučených vzorů v zašuměných vstupních datech.
Vstupní i výstupní data se obvykle prezentují vektorovou formou.
Rozpoznávání znaků – interpretace vizuálních symbolů. Rozpoznávání číslic, alfabetických
znaků nebo jiných, třeba i ručně psaných, symbolů. Jde o klasický, ale velmi složitý problém.
Topologie – popisuje druh a počet výkonných prvků sítě a strukturu (graf) jejich propojení.
Učící fáze – časový interval, během kterého se podle nějakého učícího algoritmu mění parametry
sítě a tyto se do sítě nahrávají.
Učící krok – reálné číslo mezi 0 a 1, který udává, jak silně se jednotlivý učící krok ve změně vah
projeví. K tomu, aby se naučený vzor zrušil, lze použít negativní hodnoty tohoto parametru.
Učící pravidlo (algoritmus) – předpis, který udává, jak se budou síti předkládat vzory k učení a
jak se budou vypočítávat změny vah.
Váha – hodnotou vyjádřená míra vazby mezi dvěma spojenými výkonnými prvky. Jejím
prostřednictvím se v síti předávají informace. Paměť sítě představují právě tyto váhy, resp. jejich
velikosti.
Vážený vstup – součin výstupního signálu jiného neuronu a váhy tohoto spoje. Tento příspěvek
vstupuje v součtu s ostatními váženými vstupy konkrétního neuronu a vytváří s nimi jeho nový
vnitřní potenciál.
Vrstva – základní komponenta architektury neuronové sítě. Vrstvu tvoří jistý počet stejných
buněk majících v síťové struktuře identickou funkci.
Vybavovací fáze – časový interval, ve kterém neuronová síť na základě předchozího naučení
generuje výstupní data jako odezvu na vstupní data.
Výstupní funkce ( přenosová ) funkce – část výkonného prvku zajišťující výstup vnitřního
potenciálu na další neurony. Někdy je vnitřní potenciál a výstup neuronu identický.
2.1.2. Základní typy neuronových sítí a učící algoritmy
Mezi nejvíce používané sítě patří:
Hopfieldova síť
ART síť
Vícevrstvá perceprtonová síť
Kohonenova síť
RBF ( Radial Basic Function )
Lineární síť
Vzhledem k faktu, že v této práci nebyly použity všechny typy sítí a tedy předmětem
zájmu byly pouze některé z výše uvedených typů modelů neuronových sítí, budou následně
popsány právě použité typy neuronových sítí. Podrobným popisem např. Hopfieldovy sítě a ART
sítě a Kohonenovy sítě se zabývá ve skriptu Šnorek, Jiřina.
Vícevrstvé perceptronové sítě
Vícevrstvé perceptronové sítě (Multilayer Perceptron Neural Network – MLP) patří mezi
nejznámější a nejpoužívanější neuronové sítě, které již aplikovala řada odborníků při řešení řady
problémů v oblasti vodního hospodářství (viz. Starý, Fošumpaur a další). Základním prvkem sítě
je tzv. perceptron. Aktivační funkcí perceptronu je právě zde nejčastěji již zmíněná logistická
funkce – sigmoida. MLP je síť s učitelem – trénovací vzory musí kromě vstupních hodnot
obsahovat i hodnoty příslušných odpovídajících výstupů. Použití této sítě je vhodné zejména pro
regresní úlohy a predikce, ale též i pro klasifikace. MLP se skládá z několika vrstev perceptronů,
viz. obr. Bude doplněn
Každý perceptron ve vstupní vrstvě je propojen s každým perceptronem v první skryté vrstvě,
obdobně je tomu mezi skrytými vrstvami a mezi skrytou a výstupní vrstvou. Počty skrytých
vrstev a počtů neuronů ve skrytých vrstvách závisí na charakteru řešené úlohy. Například pro
perceptronovou síť se dvěma skrytými vrstvami a výstupní vrstvou se v první skryté vrstvě volí
o něco více perceptronů, než je vstupů, a v druhé vrstvě se volí počet perceptronů jako
aritmetický průměr počtu perceptronů v první skryté vrstvě a počtu výstupů. Pokud je počet
perceptronů malý, síť nedokáže postihnout všechny závislosti v trénovacích datech. Pokud je
naopak počet perceptronů velký, zvyšuje se doba učení a navíc vlivem nadměrného počtu
trénovacích dat má síť špatnou schopnost generalizace způsobenou přeučením (overfiting,
overtraining).
Problém lokálního minima, metody zlepšující chování sítě
Vzhledem k faktu, že vícevrstvá perceptronová síť využívá při učení gradientní metodu,
může se stát, že při pohybu po chybové funkci, se síť dostane do nežádoucího minima, ve kterém
uvázne. To je způsobeno tím, že není možné pokračovat ve směru minimalizace chybové funkce.
V literatuře je doporučeno proto zvětšit počet skrytých neuronů a snížit hodnotu parametru učení.
Velikost parametru učení η
Ta může významně ovlivnit chování sítě, zejména rychlost učení a konvergenci k řešení.
Při malé hodnotě parametru učení klesá chyba jen pomalu. Naopak při velké hodnotě je sice
učení rychlejší, ale síť může divergovat. Literatura doporučuje tento parametr nastavit na začátku
učení malý a postupně ho zvyšovat. Někdy je nutné zopakovat celý proces učení znova pro jiné
počáteční hodnoty vah.
Moment
Přidání momentu do rovnice pro adaptaci vah je nejrozšířenější způsob ochrany proti
uváznutí v lokálním minimu.
Potom platí
∆wij (t ) = −η
∂E
+ α∆wij (t − 1),
∂wij
kde α je parametr momentu, 0<α<1. Hodnota parametru se volí blízko jedné. Moment
představuje jednokrokovou ,,setrvačnost”, se kterou se pohybujeme po chybové funkci. Mířímeli k lokálnímu minimu, lze ho překonat tím, že ho překročíme právě o jeden krok, jehož velikost
je dána velikostí předchozího kroku upravenou parametrem momentu.
RBF sítě ( Radial Basic Function )
Síť RBF navrhli D. S. Broomheadem a D. Lowem jako samostatnou neuronovou síť
v roce 1988. Struktura – viz. obr. níže. Síť má jednu vstupní, jednu skrytou a jednu výstupní
vrstvu čili počet skrytých vrstev není libovolný. Neurony ve skryté vrstvě jsou radiálního typu, tj.
počítá se vzdálenost vstupního vektoru od vektoru vah. Počet neuronů ve skryté vrstvě je
volitelný. Aktivační funkce skrytých neuronů má nejčastěji charakter Gaussovy křivky. Potom
platí, že vzory, které jsou daleko od centra (neuronu) mají nižší vliv na chování sítě. Výstupy ze
skryté vrstvy vedou do všech výstupních neuronů, které jsou perceptronového typu s tím
rozdílem, že aktivační funkce těchto neuronů je lineární či identita.
Váhy v první vrstvě (mezi vstupní a skrytou vrstvou) se nastavují na začátku učení a jsou
pevné po celou dobu učení. Hodnoty vektorů vah vedoucích k jednotlivým skrytým neuronům
jsou reprezentovány centry shluků ve vstupních datech. Kvalita nastavení center ovlivňuje
chování sítě. Pro nastavení center se nejčastěji používají metody shlukové analýzy, ale i jiné.
Literatura uvádí, že nejjednodušší způsob výběru center je náhodný způsob výběru z trénovací
množiny. Toto řešení se ukazuje pro řadu jednoduchých úloh dostačující, protože je
pravděpodobný výběr vzorů z oblastí se zvýšenou koncentrací dat – shluků.
Váhy v druhé vrstvě (mezi skrytou a výstupní vrstvou) se nastavují buď stejným
způsobem jako u MLP ( na náhodné hodnoty) pokud je použit pro učení klasický iterační
algoritmus jako u MLP, nebo se tyto váhy mohou určit přímo (regresí).
Princip RBF sítě spočívá v pokrytí dat oblastmi, které mohou být připodobněny ke
kruhům v dvourozměrném prostoru a obecně k hyperkoulím ve vícedimenzionálním prostoru,
přičemž jejich středy jsou umístěny do středů shluků. Šířka je parametrem aktivační funkce a je u
každého neuronu nastavována individuálně odhadem z trénovacích dat. Výstupní vrstva tyto
oblasti kombinuje a vytváří tak jednotlivé skupiny odpovídající třídám. Síť RBF je považována
za jednoduchou síť se snadným a rychlým učením a je vhodná pro klasifikaci a regresi. Zde je
nutné zmínit, že RBF síť byla aplikována vzhledem k těmto výhodám pro jednotlivá i složitější
řešení předpovědí vodních stavů a průtoků průtokových vln a pro řešení křivek postupových dob
vodních stavů ( průtoků ).
Predikce s použitím neuronových sítí
Velkými výhodami neuronových sítí je schopnost učit se na příkladech a schopnost
vystihnout nelineární závislosti. Nevýhodou je, že zpravidla nelze předem odhadnout velikost
chyby nebo stanovit interval spolehlivosti. Teorie pro to neposkytuje vodítka a proto většina
těchto odhadů vychází z heuristických postupů. Pro všechny typy predikcí se hodí neuronové sítě,
které jsou univerzálními aproximátory funkcí, tedy zejména sítě typu Back-propagation a jejich
odvozených typů, dále Kohonenovy mapy upravené pro učení s učitelem atd. Predikcí
jednoduché časové řady např. Marksovou neuronovou sítí se zabývá Šnorek, Jiřina.
V rámci disertační práce bude pro predikci určité veličiny zpravidla volen speciální výběr
parametrů. Posouzena bude i možnost použití jednoduché řady pro krátkodobou předpověď.
2.2. Předpovědní metody
2.2.1. Metoda tendencí
Zakládá se na extrapolaci změn vodního stavu či průtoku v daném profilu na určitou dobu
dopředu. Dosud se prokázalo, že nejlepší podmínky užití této metody jsou na velkých rovinných
tocích. Na menších tocích, u nichž celková doba trvání ustálené tendence stoupání nebo poklesu
vodních stavů či průtoků nepřevyšuje 5 dní, nemůže být tato metoda používána pro větší předstih
než 1 den. Celkově rozeznáváme dva druhy extrapolace – lineární a nelineární.
Metoda lineární tendence
Předpokládá se, že gradient vzestupu nebo poklesu vodní hladiny za určitou časovou
jednotku je stálý
∆H
= konst.
∆t
kde
H je vodní stav odečítaný na stejném vodočtu,
t – čas
Zvolíme-li časový interval, v němž je známa změna vodního stavu jako ∆t0 = konst. a
délku předstihu rovněž jako ∆t = konst., potom při platnosti výše uvedeného předpokladu
obdržíme
∆H t + ∆t
= konst.
∆H t
Pro předpověď je tedy možné určit funkci
H t + ∆t = f (∆H t )
Metoda lineární tendence slouží též jako kritétium pro posouzení oprávněnosti používání
jiných hydrometrických předpovědních metod. Jejich zavedení do praxe se považuje jen tehdy za
účelné, převyšují-li efektivní způsob předpovídání na základě lineární tendence.
Metoda nelineární tendence
Více se blíží fyzikální podstatě průtokového režimu nelineárnost gradientu vodního stavu
či průtoku
∆H
∆Q
≠ konst . nebo
≠ konst .
∆t
∆t
Extrapolovanou částí čáry vodních stavů (průtoků) je pak křivka, jejíž tvar se stanoví
analytickou či grafickou cestou podle rovnice odvozené na základě známých předcházejících
změn vodních stavů či průtoků. Pro předpovědi s poměrně velmi krátkým předstihem se užívají
rovnice typu
H = H 0 + at + bt 2
nebo
kde
H = H 0 + ct m
t je čas od okamžiku výskytu počátečního vodního stavu H0,
a, b, c, m jsou parametry předpovědní rovnice
Při extrapolaci se však předpokládá stálost zákona, jímž se řídí změny odtoku. Dodržení
této podmínky bývá často narušováno výskytem srážek. Je prokázáno, že v takových případech
může chyba podle nelineární tendence činit až dvojnásobek chyby, kterou bychom obdrželi při
uvažování lineárních změn. Proto je tato metoda vhodná ponejvíce pro bezsrážková období.
Jelikož tato bývají doprovázena poklesem vodních stavů, omezuje se používání metody
nelineární tendence převážně k předpovědím na poklesových větvích hydrogramů.
Na základě metod tendencí jsou založena varianta určování předpovědí s využitím
neuronových sítí. Podstatou řešení je, že se na základě předchozích údajů o vodním stavu či
průtoku, které tvoří vstupy a předpovídaného průtoku o určité délce předpovědi jako výstupu
natrénuje (nakalibruje) model neuronové sítě. Předpokládá se, že počet předchozích údajů o
vodním stavu (průtoku) závisí na tvaru průtokové vlny či obecně na tvaru záznamu.
Hledaný vztah mezi vstupními a výstupní proměnnou lze zapsat do tvaru
H t + ∆t = f ( H t − n ......H t )
kde
H – vodní stav [cm] či průtok [m3.s-1]
∆t – délka předpovědi [hod.]
n – počet hodin předcházejících současnosti [hod.]
t – vodní stav (průtok) v daném časovém kroku
2.2.2. Srážko-odtokový model
Předpokládaný tvar srážko-odtokového předpovědního modelu neuronové sítě vychází se
znalosti vstupních údajů – předchozí srážky na mezipovodí, předpovídané srážky na mezipovodí
a informace o předchozím průtoku ve vstupním profilu nebo výstupním profilu (posouzeny
budou obě varianty) a výstupních údajů – předpovídaný vodní stav či průtok ve výstupním
profilu. Cílem tohoto řešení je najít nejvhodnější model neuronové sítě pro dané podmínky a
dosažené výsledky vzájemně porovnat.
Tvar hledané funkce modelu neuronové sítě závisí na významu vstupních dat a lze zapsat
přibližně takto:
H d t + ∆t = f (ht − n ....ht + n ; H ht − n ....H h0 ; H d t − n ....H d 0 )
nebo
H d t + ∆t = f ( H t − n ....H t + n ; H ht − n ....H h0 )
nebo
H d t + ∆t = f ( ht − n ....ht + n ; H dt − n ....H d 0 )
kde
Hd – vodní stav v horním vstupním profilu [cm]
Hh – vodní stav v dolním výchozím profilu [cm]
H – srážka na mezipovodí [mm]
t – čas [hod.]
∆t – časový předstih předpovědi [hod.]
n – počet časových kroků před současností [hod.]
Přesný tvar výsledné funkce je právě předmětem trénování, testování a statistického posouzení
navržených modelů.
2.2.3. Metoda odpovídajících si průtoků
Metoda odpovídajících si průtoků (též metoda korespondujících průtoků) je poměrně
jednoduchou metodou, která je založena na sledování naměřených výkyvů vodních stavů, resp.
průtoků v horní a dolní stanici a z nich odvozené závislosti postupové doby na průtoku resp.
vodním stavu. Hladný [1972] její podstatu definuje takto: „Princip této metody spočívá na
možnosti přiřadit průtoku z horní stanice sdružený, geneticky stejnorodý průtok ve stanici dolní.
Odpovídajícími si průtoky se rozumí geneticky stejnorodé průtoky v horní a dolní stanici a
postupovou dobou čas, který uplyne mezi jejich výskytem.“
Metoda korespondujících si průtoků je metodou hydrometrickou, založenou na popisu
hydrodynamických procesů probíhajících v říční síti. Výchozími podklady pro ni jsou údaje
zjistitelné přímo ve sledovaném úseku toku tj. drsnost a tvaru koryta, délka úseku, sklon hladiny
a v neposlední řadě záznamy o vodních stavech resp. průtocích v měrných profilech. Postupovou
dobu lze vyjádřit jako funkci všech výše zmíněných faktorů:
τ = f(Q Z ,J,s,ρ, k )
je průtok v horní stanici úseku,
kde
QZ
J
sklon hladiny toku,
s
délka úseku,
ρ
drsnost koryta,
k
koeficient charakterizující tvar koryta.
Vzhledem k tomu, že délka úseku mezi profily je stálá a změny drsnosti a tvaru koryta
v úseku lze považovat za zanedbatelné, je postupová doba nejvíce závislá na průtoku v horní
stanici a na sklonu hladin, který se při průchodu především velkých průtokových vln mění:
τ = f(Q Z ,J )
Tato tradiční metoda se úspěšně využívá v předpovědních provozech zejména na
středních a dolních úsecích větších toků, kde většina odtékající vody z povodí je již
koncentrována v korytě řeky a kde lze uspokojivě rozlišit přítokové a bezpřítokové úseky. Na
malých povodích, kde se povrchový odtok z povodí podílí na celkovém odtoku relativně větší
měrou, je nutné řešit odtokovou situaci jinými postupy, např. metodou jednotkového
hydrogramu.
Základní předpoklady metody
Výchozí podmínkou je, že v daném povodí existuje pozorování vodních stavů v soustavě
vodoměrných stanic, ve kterých jsou odvozeny měrné křivky průtoků umožňující převádět
hodnoty vodních stavů na hodnoty průtoků. V posledních letech byly vyvinuty přístroje, které
zaznamenávají přímo průběh průběhu prostřednictvím měření rychlostí proudění pomocí
ultrazvuku. Takto vybavené stanice však rozhodně nejsou v staniční síti ČR běžné.
Základním předpokladem metody odpovídajících si průtoků je že průtok v dolní stanici úseku je
funkcí průtoku ve stanici horní:
QtP+τ = f (QtZ )
kde
QtZ
je průtok v horní stanici v čase t,
QtP+τ je průtok v dolní stanici v čase t zvětšeným o postupovou dobu τ,
horní indexy v tomto případě vyjadřují pouze označení polohy profilu: Z – základní tj. horní
stanice, P – předpovědní, tj. dolní stanice.
V ideálním případě, kdyby se objem vody v úseku mezi sledovanými profily nezměnil, průtok by
se v dolním profilu rovnal průtoku v horním profilu v čase zpožděném o postupovou dobu τ.
Platil by vztah:
QtP+τ = QtZ
V reálných podmínkách je tento vztah neplatný, protože objem vody v říčním korytě je
navyšován z mnoha zdrojů, z výronů podzemní vody, při výskytu srážek také z povrchového a
hypodermického odtoku z mezipovodí, z přítoků aj. Souhrnně se tento objem vody, která přitéká
do koryta mezi profily, nazývá boční přítok nebo přírůstek přítoku z mezipovodí.
Průtok v předpovědním profilu je v konkrétním okamžiku t tvořen komponentami:
- průtokem z horní stanice, který za postupovou dobu dospěje v okamžik t do dolního profilu,
průtoky ze stanic na přítocích, které dotékají za svou charakteristickou postupovou dobu do
dolního profilu v okamžik t,
- povrchovým a podpovrchovým odtokem z části povodí mezi horním a dolním profilem, ze které
dobíhá voda do dolního profilu v okamžik t.
Konečně průtok může být v dolním profilu ovlivněn transformací povodňové vlny při postupu
z horního profilu, která vytváří dodatečný sklon hladiny za povodně. Mírou ovlivnění
předpovídaného průtoku transformací povodňové vlny se zabývali např. Delemeau, Velikanov a
Kalinin. Všichni tito hydrologové došli k podobnému závěru, že pro předpověď průtoku na
typech řek, které se vyskytují i u nás, lze dodatečný sklon hladiny zanedbat, resp. účinek
zploštění vlny se pohybuje v rozmezí běžných chyb hydrometrických měření. [Hladný, 1972]
Při uvažování těchto závěrů zůstává nezanedbatelným činitelem v rovnici odpovídajících si
průtoků v jednoduchém říčním úseku pouze rozdíl průtoků v horním a dolním profilu:
QtP+τ = QtZ + ∆qt +τ
kde Δq t+τ je přírůstek průtoku z mezipovodí (boční přítok).
Z této rovnice vyplývá, že při známé postupové době τ , lze rozdílem korespondujících si průtoků
horního a dolního profilu získat velikost bočního přítoku.
Hledáme-li korespondující průtok s využitím neuronové sítě pro větší počet vln s odlišnými
postupovými dobami průtoků, je funkce výsledného modelu odvozována na základě znalosti
většího rozsahu postupových dob průtoku (informací o předchozích hodnotách průtoků v určitém
časovém intervalu) v horní stanici (vstupy) a průtoku v čase t v dolním profilu (výstup).
Výsledný tvar funkce (modelu) je vždy předmětem řešení a posouzení.
2.3. Problematika třídění vzorů a jejich role při návrhu modelů neuronových sítí
Výběr vzorů pro trénování, validaci a testování má významný vliv na strukturu
navrženého modelu neuronové sítě. Celá řada zahraničních i domácích autorů volí specifický
výběr vzorů v závislosti na použitém softwaru. Při navrhování modelů neuronových sítí pro
predikci vodních stavů či průtoků na určitou délku předpovědi bych chtěl porovnat některé
přístupy při rozdělování vstupních vzorů do jednotlivých skupin. Budu vycházet z předpokladu,
že toto rozdělení stupních vzorů do jednotlivých skupin významně ovlivňuje navrženou strukturu
modelu. Tento předpoklad se budu snažit ověřit. Pokud se zabýváme předpověďmi vodních stavů
či průtoků v průběhu povodňových epizod, zpravidla vstupní vzory určité povodňové epizody
začleňujeme do určité skupiny jako celek. Avšak pokud bychom tyto vzory podrobili náhodnému
rozdělení do jednotlivých skupin, potom považuji za významné uskutečnit řadu návrhů modelů
neuronových sítí vždy pro odlišné rozdělení vstupních vzorů. To znamená, že v tomto pojetí by
určitá povodňová epizoda obsahovala jak vzory pro trénování, tak i pro validaci a testování.
3. Nejistoty při modelování hydrogramů průtokových vln aplikací
neuronových sítí
Nejistoty, které se vyskytují při modelování hydrogramů průtokových vln aplikací neuronových
sítí lze rozdělit do dvou skupin:
a) nejistoty při pořizování vstupních dat
b) nejistoty vlivem zpracování a analýzy vstupních dat
3.1. Nejistoty při pořizování vstupních dat
Hlavními druhy dat, které byly pro řešení této problematiky získány, jsou časové řady
vodních stavů či průtoků ve vodoměrných stanicích a časové řady srážkových úhrnů ve
srážkoměrných stanicích v zájmové oblasti povodí Berounky. Obecně je možné konstatovat, že
nejistoty měření těchto veličin je možné při řešení daného problému zanedbat, neboť je snahou
pořizovatele dat (ČHMÚ) částečně tyto nejistoty odstranit před jejich dalším použitím. Při
pořizování kontinuálního záznamu vodních stavů je zejména v poslední době, kdy je záznam
pořizován pomocí automatické stanice, ověřována jeho věrohodnost porovnáním s údajem na
vodočetné lati. Záznam z automatické stanice je pak opraven bez lidského zásahu pomocí
softwaru
V případě použití limnigrafického záznamu je zapotřebí jeho věrohodnost ověřit pomocí
časových odečtů na vodočetné lati.
Další nejistota se vyskytuje při digitalizaci záznamu zpravidla v důsledku nerovnosti papíru a
v případě rozpití inkoustu, kdy pak nelze přesně odhadnout průběh skutečné čáry průběhu
vodních stavů.
Lze říci, že nejistota při pořizování vstupních dat je oproti nejistotě vlivem zpracování a analýzy
vstupních dat zanedbatelná.
3.2. Nejistoty při zpracování a analýze vstupních dat aplikací metody neuronových sítí
Nejistoty při vlastním modelování hydrogramů průtokových vln v říčním systému aplikací
neuronových sítí za delší časové období je možné rozdělit na:
- nejistoty vlivem změny vztahu mezi vodním stavem a průtokem, který je důsledkem
přeměn průtočného profilu v průběhu řešeného období
- nejistoty vlivem extrapolace měrných křivek průtoku (MKP) do oblasti N-letých průtoků
- nejistoty při způsobu rozdělení vstupních dat na trénovací, validační, testovací
- nejistoty v důsledku volby množství dat a tvaru průtokových vln
Simulace hydrogramů průtokových vln pro účely předpovědi postupu povodňové vlny v říční
síti v sobě tedy skrývá řadu nejistot. Srážko - odtokový proces je ovlivňován řadou faktorů, u
nichž není jasné zda–li jsou dostatečně zahrnuty ve vstupně-výstupním vztahu dostupných
datových podkladů.
Výsledná nejistota je zde chápána jako rozdílnost řady průběhů simulované veličiny (průtoku
či vodního stavu) od veličiny pozorované a podílejí se na ní všechny výše uvedené složky
nejistot. Cílem je tedy identifikovat takový model neuronové sítě, který výrazně nezvětšuje
nejistoty plynoucí ze zpracování vstupních dat.
4. Použitý software
STATISTIKA Neuronové sítě 7.0
Během posledních deseti let se proslavila firma StatSoft a. s. svoji rozsáhlou nabídkou
programových produktů STATISTICA i v České republice.
STATISTICA je komplexní systém, který obsahuje prostředky pro analýzu dat, vytváření
grafických výstupů, správu dat a vývoj uživatelských aplikací. Poskytuje široký výběr základních
i pokročilých procedur pro obchodní i inženýrské aplikace, vytěžování dat i vědu.
Obsahuje také mnoho metod specializovaných na analýzu dat (vytěžování dat, prostředky pro
výzkum v biomedicíně, sociálních vědách, obchodu a pro inženýrské aplikace).
Všechny nástroje nabízené v produktové řadě softwaru STATICTICA je možné ovládat pomocí
několika alternativních uživatelských prostředí a komplexního, v oboru standardního
programovacího jazyka (založeného na Visual Basicu). Interaktivní uživatelská prostředí lze
snadno přizpůsobit a jazyk STATISTICA Visual Basic lze použít k zjednodušení provádění úloh
jakékoli obtížnosti.
Hlavní významné rysy řady STATISTICA jsou:
-
-
široký výběr a obsáhlost implementovaných analytických procedur
výjimečně adaptabilní (nebo flexibilní) a kvalitní grafika vhodně propojená s výpočetními
procedurami
výkonné a snadno ovladatelné intuitivní uživatelské prostředí plně integrovaný jazyk
STATISTICA Visual Basic, který přidává více než 11 000 nových funkcí k obsáhlé
syntaxi Microsoft Visual Basicu
široký výběr pokročilých softwarových technologií, které jsou základem prakticky
neomezené kapacity, výkonu a možností uživatelských úprav aplikace STATISTICA.
Mezi řadou programů postupně představovala sofistikované verze programu
STATISTICA Neuronové sítě, který lze v současné době zakoupit i v české verzi. Je vhodné říci,
že zmíněný software STATISTICA Neuronové sítě 7.0 v české verzi byl použit k analýze
předpovědí a křivek postupových dob vodních stavů či průtoků v systémech stanic na vybraných
vodních tocích.
Tato sofistikovaná verze programu byla pro řešení zvolena s ohledem na její výhody.
Hlavní výhodou tohoto produktu je fakt, že s tímto produktem mohou pracovat i začínající
odborníci v oblasti neuronových sítí, kteří by však měli mít alespoň základní znalosti v oblasti
neuronových sítí. Tito začátečníci mohou provádět rutinní úlohy pomocí přednastavených
základních dialogů spouštění analýz a mohou mít k systému přístup i prostřednictvím
internetového prohlížeče. Obecně lze říci, že zmíněný software umožňuje vlastní návrh
neuronových sítí zejména pro zkušené analytiky profesionální statistiky a pracovníky vyvíjející
pokročilé aplikace, kteří mohou navíc začlenit jakoukoli z vysoce optimalizovaných procedur
systému STATISTICA do uživatelských aplikací nebo výpočetních systémů a mohou použít
libovolnou z nejmodernějších objektově orientovaných a internetových softwarových technologií.
Ale právě pro začátečníky je k dispozici tzv. inteligentní poradce řešení, který výrazným
způsobem usnadňuje řešení – vytváří a testuje nejrůznější topologie neuronových sítí na základě
typu a množství předložených vstupních vzorů.
Další výhodou je snadná komunikace s ostatními programy. Osobně upřednostňuji možnost
přímé komunikace s programem MS Excel. Lze tedy přímo načítat soubory s příponou xls. nebo
dále txt. a řada dalších.
Řešitel si může tak například předem připravit rozsáhlé matice vstupních vzorů a později volit
jednotlivé kombinace a testovat tak závislost mezi nimi. Způsob řešení tak závislí na možnostech
každého řešitele.
Dále lze přidat i generátor kódu v jazyce C.
Dalšími možnostmi řešení jsou:
- Vícevrstvé perceptrony
- Sítě s radiální bází (RBF sítě)
- Kohonenovy samoorganizační mapy
- Lineární sítě
- Bayesovské sítě
- Metoda zpětného šíření (Backpropagation)
- Četné analytické grafy
- Opakované vzorkování (křížové ověřování, bootstrap)
- Analýza citlivosti, ROC křivky
- Soubory sítí
- API prostředí a další
Software STATISTIKA Neuronové sítě 7.0 vychází ze základních teoretických principů
umělých neuronových sítí popsaných v řadě domácích či zahraničních publikacích autorů např.
Bíla(1998), Šnorek, Jiřina (1996), Drbal, Starý (1996), Fošumpaur (1998), P. Varoonchotikul
(2003), Robert J. Abrahart, Pauline E. Kneale & Linda M. See (2004). Použitý software je dosti
sofistikovaný a výrazně usnadňuje řešiteli cestu k požadovaných výsledkům. Pro řešení
předpovědí vodních stavů i průtoků byly použity RBF sítě (Radial Basis Function).
RBF sítě se vyznačují jednoduchostí a rychlostí učení (kalibrace). Skládají se ze tří vrstev
neuronů – vstupní, skryté a výstupní a jednotlivé vrstvy neuronů jsou propojeny vahami - viz.
Obr. 4
Neurony ve skryté vrstvě jsou radiálního typu. Počet neuronů ve skryté vrstvě je volitelný, jejich
aktivační funkce má charakter Gaussovy křivky. Aktivační funkce výstupních neuronů je volena
lineární. Správnost funkčnosti modelu RBF sítě je zaručena vhodným nastavením vah, což je
předmětem učení sítě. Hodnoty vektorů vah, které vedou k jednotlivým skrytým neuronům
reprezentují centra shluků ve vstupních datech. Učení sítě bylo prováděno s využitím metody
sdružených gradientů.
Vstupní v rstv a neuronů
Skrytá v rstv a neuronů
Výstupní v rstva neuronů
Obr. 4. Příklad topologie radiální neuronové sítě
5. Aplikace metod a výsledky
Metoda RBF sítí byla aplikována při řešení výpočtových schémat vzcházejících z
hydrometrických metod ( metoda tendencí, metoda odpovídajících si průtoků) a metody
hydrometeorologické předpovědi.
5.2. Metoda tendencí
Metoda tendencí patří mezi tzv. předpovědi hydrometrické. Vycházejí ze zákonitostí, kterými se
řídí pohyb vody v otevřených korytech. Umožňují takový předstih, jaký dovoluje postupová doba
vody z horního do dolního (předpovědního) profilu. Z toho důvodu je výhodnější jejich používání
na větších nebo středních tocích s větší délkou koryta.
Základním předpokladem pro metodu lineární tendence je platnost vztahu
∆H
= konst.
∆t
kde
H
t
- vodní stav odečítaný na stejném vodočtu
- čas
Pro předpověď možné určit funkci
H t + ∆t = f (∆H t )
Pro nelineární tendenci potom platí
∆H
≠ konst. nebo
∆t
∆Q
≠ konst.
∆t
5.2.1. Aplikace RBF sítí:
Řešený vztah pomocí RBF sítí lze zapsat ve tvaru
H t + ∆t = f ( H t − n ......H 0 )
kde
H
t
n
- vodní stav [cm]
- čas [hod.]
- počet předcházejících hodnot sledované veličiny v kroku jedné hodiny
Lokalita:
Povodí:
Tok:
Úsek:
Délka úseku:
Plocha mezipovodí:
Vstupní profil:
Předpovědní profil:
Radbuza
Radbuza
Staňkov–Lhota
37,6 km
2
479 km
Staňkov
Lhota
Z hydrofondu ČHMÚ a digitalizací limnigrafických záznamů byl získán soubor 9
průtokových vln. V prvním případě byl rozdělen na trénovací a testovací p. vlny v poměru 2:1 dle
velikostí jejich kulminací. Do trénovací matice byly zahrnuty průtokové vlny s nejširším
rozsahem průtoků (vodních stavů) a to následně:
8.7. – 18.7.1996
28.3. – 7.4.2000
10.4. – 26.4.2001
20.6. – 26.6.2002
4.8. – 25.8.2002
–
–
–
–
–
trénovací
testovací
trénovací
testovací
trénovací
1.3. – 29.3.2003
12.3. – 12.4.2004
15.7. – 29.7.2004
17.9. – 30.9.2004
–
–
–
–
trénovací
testovací
trénovací
trénovací
Obr.5 Mezipovodí mezi profily Staňkov-Lhota na toku Radbuza
V druhém případě byly jednotlivé sestavené vzory ponechány pro automatické náhodné
rozdělení do trénovací, validační a testovací skupiny. V tomto případě byly vzory obsažené v
jednotlivé průtokové vlně rozděleny na trénovací, validační a testovací. Řešeny byly předpovědi
s časovým předstihem 2, 5 a 12 hodin. Za vstupy bylo použito 5 předchozích a současná hodnota
vodního stavu nebo průtoku v předpovědním profilu. Výstupem při trénování byla předpovídaná
hodnota sledované veličiny o délce předstihu předpovědi.
5.2.2. Výsledky:
Statistické hodnocení spolehlivosti odvozených modelů RBF sítí:
Spolehlivost navrženého modelu lze posoudit:
a) velikostí trénovací, testovací, případně validační chyby. Jejich velikosti známe v průběhu
výpočtu. Při výběru nejspolehlivějšího modelu se předpokládá, že je specifikován shodností
těchto chyb a charakterizován jejich nejmenšími hodnotami. Dále zde platí, že je-li např.
trénovací chyba až několikanásobně nižší, než chyba testovací, došlo pravděpodobně k přeučení
neuronové sítě a model je hodnocen jako nespolehlivý.
b) podle statistických ukazatelů:
koeficient determinace
N
∑ (H
R2 =
i =1
N
− H i )2
m ,i
∑ (H
i =1
− H )2
i
průměrná absolutní odchylka
1
N
Ep =
N
∑H
i =1
m ,i
− Hi
směrodatná odchylka odhadu
1
E sh = 
N
kde
Hm,i
Hi
N
N
∑ (H
i −1

− Hi ) 

0,5
2
m ,i
- modelovaná hodnota vodního stavu v čase i
- měřená hodnota vodního stavu v čase i
- počet všech prvků ( testovacích vzorů)
Tab. 1-3. Statistické posouzení odvozených modelů RBF sítí pro předpověď na:
2 hodiny
Dělení vzorů
vlastní
automatické
1.pokus
automatické
2.pokus
automatické
3.pokus
automatické
4.pokus
automatické
5.pokus
Train
Topologie
2
R
Ep
modelu
Veličina
H
6-122-1
0.997 2.0
Q
6-204-1
0.998 0.6
H
2-41-1
Q
3-121-1
H
6-153-1
Q
6-161-1
H
2-37-1
Q
6-108-1
H
6-85-1
Q
6-79-1
H
6-246-1
Q
2-141-1
5 hodin
Esm
R2
3.8
1.9
0.996
0.992
Test
Ep
Esm
1.6
0.4
2.3
0.7
Train, Select, Test
R2
Ep
Esm
0.996
0.999
0.996
0.997
0.997
0.982
0.997
0.984
0.998
0.997
1.7
0.8
1.8
0.6
1.6
0.9
1.6
1.1
1.7
0.5
3.7
1.2
3.7
1.9
3.2
4.4
3.3
4.2
2.8
1.7
Dělení vzorů
vlastní
automatické
1.pokus
automatické
2.pokus
automatické
3.pokus
automatické
4.pokus
automatické
5.pokus
Topologie
Train
2
R
Ep
modelu
Veličina
H
6-93-1
0.987 4.1
Q
6-88-1
0.982 1.9
H
6-121-1
Q
3-59-1
H
2-62-1
Q
4-164-1
H
6-179-1
Q
6-187-1
H
6-258-1
Q
6-108-1
H
6-50-1
Q
6-325-1
Esm
R2
7.7
5.4
0.982
0.968
Test
Ep
Esm
3.2
0.8
4.9
1.3
Train, Select, Test
R2
Ep
Esm
0.984
0.962
0.985
0.981
0.985
0.981
0.990
0.986
0.983
0.992
3.8
1.4
4.1
1.4
4.0
2.1
3.7
1.5
3.6
1.9
7.6
6.4
7.3
4.5
7.3
4.5
6.1
3.9
7.8
3.0
12 hodin
Dělení vzorů
vlastní
automatické
1.pokus
automatické
2.pokus
automatické
3.pokus
automatické
4.pokus
automatické
5.pokus
Topologie
Train
2
R
Ep
modelu
Veličina
H
6-394-1
0.960 8.3
Q
6-484-1
0.985 2.6
H
6-113-1
Q
6-384-1
H
6-58-1
Q
6-54-1
H
6-71-1
Q
6-85-1
H
6-53-1
Q
6-58-1
H
6-62-1
Q
6-116-1
Esm
R2
13.6
4.7
0.792
0.823
Test
Ep
11.7
2.1
Esm
Train, Select, Test
R2
Ep
Esm
16.6
3.1
0.929
0.973
0.930
0.885
0.929
0.898
0.921
0.943
0.925
0.941
9.0
3.2
9.0
3.6
9.1
3.5
10.1
2.8
8.9
4.1
16.0
5.4
16.0
11.2
16.1
10.5
17.0
7.9
16.5
8.0
Průběh vodních stavů
500
Měření
Simulace1
Simulace2
Simulace3
Simulace4
Simulace5
450
400
350
H [cm]
300
250
200
150
100
50
0
0
500
1000
1500
2000
2500
3000
3500
Pořadí vzorů
Průběh vodních stavů
500
Měření
Trénink
450
400
350
H [cm]
300
250
200
150
100
50
0
0
500
1000
1500
Pořadí vzorů
2000
2500
Průběh vodních stavů
250
Měření
Test
200
H [cm]
150
100
50
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Průběh průtoků
400
Měření
Simulace1
Simulace2
Simulace3
Simulace4
Simulace5
Simulace6
350
300
Q [m3.s-1]
250
200
150
100
50
0
0
500
1000
1500
2000
Pořadí vzorů
2500
3000
3500
Průběh průtoků
400
Měření
Trénink
350
300
Q [m3.s-1]
250
200
150
100
50
0
0
500
1000
1500
2000
2500
-50
Pořadí vzorů
Průběh průtoků
40
Měření
Test
35
30
Q [m 3.s-1]
25
20
15
10
5
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Obr. 6-11 Příklady porovnání měřených a předpovídaných vodních stavů a průtoků
s předstihem 2 hodiny metodou tendence v profilu Lhota
Průběh vodních stavů
600
Měření
Simulace1_trvate
Simulace2_trvate
Simulace3_trvate
Simulace4_trvate
Simulace5_trvate
500
H [cm]
400
300
200
100
0
0
500
1000
1500
2000
2500
3000
3500
Pořadí vzorů
Průběh vodních stavů
500
Měření
Trénink
450
400
350
H [cm]
300
250
200
150
100
50
0
0
500
1000
1500
Pořadí vzorů
2000
2500
Průběh vodních stavů
250
Měření
Test
200
H [cm]
150
100
50
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Průběh průtoků
450
Měření
Simulace_trvate1
Simulace_trvate2
Simulace_trvate3
Simulace_trvate4
400
350
Q [m3.s-1]
300
250
200
150
100
50
0
0
500
1000
1500
2000
-50
Pořadí vzorů
2500
3000
3500
Průběh průtoků
400
Měření
Trénink
350
300
Q [m3.s-1]
250
200
150
100
50
0
0
500
1000
1500
2000
2500
Pořadí vzorů
Průběh průtoků
45
Měření
Test
40
35
Q [m3.s-1]
30
25
20
15
10
5
0
0
200
400
600
800
1000
1200
-5
Pořadí vzorů
Obr. 12-17 Příklady porovnání měřených a předpovídaných vodních stavů a
průtoků s předstihem 5 hodin metodou tendence v profilu Lhota
Průběh vodních stavů
600
Měření
Simulace1
Simulace2
Simulace3
Simulace4
Simulace5
500
H [cm]
400
300
200
100
0
0
500
1000
1500
2000
2500
3000
3500
Pořadí vzorů
Průběh vodních stavů
500
Měření
Trénink
450
400
350
H [cm]
300
250
;
200
150
100
50
0
0
500
1000
1500
Pořadí vzorů
2000
2500
Průběh vodních stavů
300
Měření
Test
250
H [cm]
200
150
100
50
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Průběh průtoků
600
Měření
Simulace1
Simulace2
Simulace3
Simulace4
Simulace5
500
Q [m3.s-1]
400
300
200
100
0
0
500
1000
1500
2000
-100
Pořadí vzorů
2500
3000
3500
Průběh průtoků
400
Měření
Trénink
350
300
200
3
-1
Q [m .s ]
250
150
100
50
0
0
500
1000
1500
2000
2500
-50
Pořadí hodnot
Průběh průtoků
50
Měření
Test
40
Q [m3.s-1]
30
20
10
0
0
200
400
600
800
1000
1200
-10
Pořadí vzorů
Obr. 18-23 Příklady porovnání měřených a předpovídaných vodních stavů a
průtoků s předstihem 12 hodin metodou tendence v profilu Lhota
Z výše uvedených obrázků lze konstatovat, že RBF sítě jsou vhodným nástrojem pro
předpovídání s velmi krátkým časovým předstihem i v případě použití minimálního počtu vstupů.
S rostoucím časovým předstihem předpovědí klesá spolehlivost odvozených modelů RBF sítí.
Nepříznivě se projevilo dosažení záporných hodnot průtoků v oblasti jejich nízkých hodnot jak
při trénování, tak při testování modelů RBF sítí. Tento fakt se projevil pro délku předstihu
předpovědi 5 a 12 hodin. Za vhodné se proto považuje provádět veškeré další analýzy za použití
vodních stavů s následným převodem na průtoky dle platné měrné křivky průtoků pro řešené
období.
5.3. Metoda odpovídajících si průtoků
Metoda odpovídajících si průtoků (též metoda korespondujících průtoků) je poměrně
jednoduchou metodou, která je založena na sledování naměřených výkyvů vodních stavů, resp.
průtoků v horní a dolní stanici a z nich odvozené závislosti postupové doby na průtoku resp.
vodním stavu.
Pro jednoduchý úsek mezi vstupním a předpovědním profilem platí:
QtP+τ = QtZ + ∆qt +τ
kde
QtP+τ
QtZ
- odpovídající průtok v předpovědním profil, zvětšený o boční přítok a
postupovou dobu τ
- průtok ve vstupním profilu v čase t
Δq t+τ - přírůstek průtoku z mezipovodí (boční přítok).
5.3.1. Aplikace RBF sítí a výsledky
Povodí Radbuza
Zájmová lokalita zůstává totožná, jako v předcházejícím případě. Výpočtové schéma bylo
následující.
Za vstupy bylo použito 5 předchozích hodnot a hodnota vodního stavu v čase t v
předpovědním profilu a 20 předchozích hodnot a hodnota vodního stavu v čase t ve vstupním
profilu sledovaného úseku. Trénovací matice navíc obsahovala hodnotu předpovídaného vodního
stavu v předpovědním profilu s předstihem předpovědi 12 hodin. Takto široký rozsah časových
posunů řady vodních stavů ve vstupním profilu byl volen s ohledem na větší rozsah postupových
dob mezi obratovými body ve vstupním a předpovědním profilu.
V průběhu výpočtu se ukázalo, že model RBF sítě vyžadoval pouze 15 předchozích hodnot
vodního stavu ve vstupním profilu místo 20. Zbývající nebyly tedy v modelu využity.
Výsledný vztah pro odvozený model lze zapsat ve tvaru:
H tP+12 = f ( H tZ−15 ..... H tZ , H tP−5 ..... H tP )
Tab. 4 Statistické posouzení odvozených modelů RBF sítí pro předpověď na 12
hodin
Dělení vzorů
vlastní
Topologie
modelu
Veličina
H
22-457-1
R
Train
Ep
Esm
R
0.99
2.9
4.9
0.913
2
2
Test
Ep
Esm
7.9
10.8
Průběh vodních stavů
500
Měření
Trénink
450
400
350
H [cm]
300
250
200
150
100
50
0
0
500
1000
1500
2000
2500
Pořadí vzorů
Průběh vodních stavů
250
Měření
Test
200
H [cm]
150
100
50
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Obr.24-25. Porovnání měřených a předpovídaných vodních stavů s předstihem 12
hodin v profilu Lhota po přidání informace o předchozím průběhu vodních stavů ve
vstupním profilu Staňkov –trénink a testování
Soutok Mže, Radbuza a Úhlava
Toky:
Mže, Radbuza a Úhlava
Vstupní profily:
Hracholusky, České Údolí a Štěnovice
Předpovědní profil: Plzeň – Bílá Hora
Data:
13 p. vln – 9 trénovacích, 4 testovací
Období:
3/1994, 4/1995, 6/1995, 9/1995,
10/1998, 3/2000, 4/2001, 6/2002,
8/2002, 10/2002, 4/2003, 3/2004,
10/2004
Obr.26. Schéma soutoku toků Mže – Radbuza - Úhlava
V tomto případě byly obdobně sestaveny matice s časovými posuny vodních stavů ve
vstupních profilech oproti času, ve kterém je vydávána předpověď. Počet předchozích hodnot
sledované veličiny byl odhadnut dle vzdálenosti vstupních profilů od předpovědního profilu.
Vzhledem k neznalosti přesného vztahu mezi postupovými dobami mezi profily byl volen širší
interval časových posunů. Posouzení jejich významu a jejich případná filtrace z výpočtového
schématu kalibrovaného modelu RBF sítě bylo předmětem trénování a testování.
Odvozené předpovědní modely RBF sítí lze zapsat ve tvaru pro:
BH
H
H
CU
CU
S
S
Předpověď 1 hodina H t +1 = f ( H t − 21 .....H t , H t − 7 .....H t , H t −17 .....H t )
BH
H
H
CU
CU
S
S
Předpověď 2 hodiny H t + 2 = f ( H t − 20 .....H t , H t −6 .....H t , H t −16 .....H t )
BH
H
H
CU
CU
S
S
Předpověď 4 hodiny H t + 4 = f ( H t −18 .....H t , H t −4 .....H t , H t −14 .....H t )
Předpověď 6 hodin
H
H
CU
CU
H tBH
, H tS−12 ..... H tS )
+ 6 = f ( H t −16 ..... H t , H t − 3 ..... H t
kde
BH
H
CU
S
- vodoměrná stanice (profil) Plzeň – Bílá Hora
- vodoměrná stanice (profil) Hracholusky
- vodoměrná stanice (profil) České Údolí
- vodoměrná stanice (profil) Štěnovice
Tab. 5 Statistické posouzení odvozených modelů RBF sítí
Předpověď
t+1
t+1_přetrénování
t+2
t+4
t+6
Veličina
H
H
H
H
H
Topologie
modelu
48-245-1
48-831-1
43-133-1
39-145-1
34-219-1
R
2
0.987
0.998
0.990
0.989
0.988
Train
Ep
Esm
R
4.4
2.1
5.0
5.2
5.4
9.0
3.7
7.9
8.5
8.8
0.936
0.790
0.949
0.942
0.923
2
Test
Ep
6.3
13.3
6.0
6.5
7.3
Esm
10.7
18.9
9.4
10.1
11.7
Průběh vodních stavů - trénink
900
Měření
Předpověď 1 hod.
Předpověď 1 hod. - přetrénování
Předpověď 2 hod.
Předpověď 4 hod.
Předpověď 6 hod.
800
700
H [cm]
600
500
400
300
200
100
0
0
1000
2000
3000
4000
Pořadí vzorů
5000
6000
7000
Průběh vodních stavů - test
350
Měření
Předpověď 1
Předpověď 1
Předpověď 2
Předpověď 4
Předpověď 6
300
H [cm]
250
hod.
hod.- přetrénování
hod.
hod.
hod.
200
150
100
50
0
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Pořadí vzorů
Obr. 27-28. Porovnání měřených a předpovídaných hodnot vodních stavů pro
předpovědi na 1, 2, 4 a 6 hodin v profilu Bílá Hora - testování
5.4. Hydrometeorologické předpovědi
Hydrometeorologické předpovědi umožňují tím, že berou v úvahu i spadlé srážky, delší
časový předstih, než předpovědi hydrometrickými metodami – metodou tendencí a metodou
odpovídajících si průtoků. Prodloužení spočívá v získání doby, která je zapotřebí k doběhu
srážkové vody do koryt toků.
Cílem řešení bylo v tomto případě odvození a posouzení spolehlivosti předpovědních
srážkoodtokových modelů neuronových sítí – RBF sítí a porovnání výsledků simulací pro určitý
předstih předpovědi s výsledky řešení metodami hydrometrickými.
5.4.1. Aplikace RBF sítí a výsledky
Do výpočtového schématu vstupovali kromě hydrologických údajů i hodnoty hodinových
průměrů srážkového úhrnu spadlého na mezipovodí Radbuzy-viz. kap. 5.2.1. Údaje o
srážkových úhrnech byly vypočítány pomocí GIS Arcwiew 3.2.
Řešené výpočtové schéma lze zapsat ve tvaru
ST
MP
MP
L
L
H tL+12 = f ( H tST
−15 .....H t , it −30 .....it +12 , H t −5 .....H t )
kde
ST
MP
- vodoměrná stanice (profil) Staňkov
- mezipovodí Radbuzy
L
- vodoměrná stanice (profil) Lhota
Průběh vodních stavů
600
Měření
Trénink
500
H [cm]
400
300
200
100
0
0
500
1000
1500
2000
2500
Pořadí vzorů
Průběh vodních stavů
250
Měření
Test
200
H [cm]
150
100
50
0
0
200
400
600
800
1000
1200
Pořadí vzorů
Obr.29-30. Porovnání měřených a předpovídaných vodních stavů s předstihem 12
hodin v profilu Lhota po přidání další informace o předchozích a budoucích
(předpovídaných) průměrných hodinových srážkových úhrnech spadlých na
mezipovodí Radbuzy
6. Závěr
Prokázány výhody aplikace neuronových sítí při řešení předpovědí hydrometrickými metodami v
jednoduchých i složitějších říčních systémech.
S rostoucím předstihem předpovědi roste počet požadovaných vstupů pro odvození spolehlivého
modelu neuronových sítí.
Při řešení předpovědi na 12 hodin se příznivě projevilo přidání informace o předchozích
hodnotách vodních stavů ve vstupním profilu, kde se schopnost předpovídání metodou tendence
výrazně zhoršila.
V oblasti nízkých hodnot průtoků byly modelovány jejich záporné hodnoty, což je nereálné.
Proto byly v dalších výpočtech vždy uvažovány vodní stavy.
Prokázán nepříznivý vliv extrapolace měrných křivek průtoků na spolehlivost odvozených
modelů.
Prokázán předpoklad, že rozdělení vstupních vzorů do skupin má vliv na počet neuronů ve
skryté vrstvě a spolehlivost odvozeného modelu.
Průběžné výsledky řešení hydrometeorologických předpovědí bude třeba zpřesňovat dalšími
pokusy se snahou stanovit vhodnější skladbu časových posunů hodnot plošného srážkového
úhrnu oproti času, ve kterém je vydávána předpověď.
V neposlední řadě bude cílem dalšího výzkumu provést analýzu vlivu dalších vybraných faktorů
na srážkoodtokový proces v zájmovém povodí.
7. Literatura
Fošumpaur P.: Použití umělých neuronových sítí ve vodním hospodářství. Doktorská disertační
práce, ČVUT Praha, 1998, 143 s.
Hladný, J.: Hydrologická prognóza. ČHMÚ, Praha, 1972, 111 s.
Nacházel K., Starý M., Zezulák J a kol.: Využití metod umělé inteligence ve vodním
hospodářství, Academia, nakladatelství Akademie věd České republiky, 2004, 301 s.
Polách D.: Použití neuronových sítí pro operativní předpovědi říčních průtoků. Diplomová práce.
ČVUT Fsv, Praha, 2001
Robert J. Abrahart, Pauline E. Kneale and Linda M. See: Neural Networks for hydrological
modeling. A. A. Balkema Publishers, a member of Taylor and Francis Group plc, London, 2004.
Starý M.: Užití umělých neuronových sítí v aplikované hydrologii. Habilitační práce.VUT FAST,
Brno, 2004
Šnorek M., Jiřina M.: Neuronové sítě a neuropočítače, Nakladatelství ČVUT, 1998, 124 s.
Varoonchotikul Pichaild: Flood Forecasting using Artificial Neural Networks. A. A. Balkema
Publishers, a member of Swetst Zeitliner Publishers, Lisse, The Netherlands, 2003

Podobné dokumenty

Výzkum a činnost katedry vodního hospodářství a

Výzkum a činnost katedry vodního hospodářství a jmenovaného neuronu je vypočtená hodnota předpovědi. Všechny neurony v každé vrstvě jsou spojeny se všemi neurony následující vrstvy. Výše zmíněné základní stavební prvky sítě (neurony) fungují jak...

Více

Model proudové vektorové regulace asynchronního motoru pro

Model proudové vektorové regulace asynchronního motoru pro hlásí Scicos chybu2. Pokud jsou porty číslovány správně, po překliknutí do nadřazeného schématu se u Super bloku objeví přesně takové počty kontaktů (šipek), jaké jsou definovány v bloku. Stejně ja...

Více

Změny podnebí - EnviMod

Změny podnebí - EnviMod Podrobné poznání podnebí vyžaduje kvalitní a dlouhodobá měření meteorologická, která však většinou nemáme. Je to dáno tím, že teprve od sedmnáctého století nastává postupný rozvoj přístrojové techn...

Více

Diplomová práce

Diplomová práce 3.1.4 Koncepční modely (“grey box“) Pro tyto modely je typické formulovat jednotlivé části hydrologického cyklu nebo cyklus jako celek matematickými vztahy. Jedná se o modely konceptuální, odrážejí...

Více

Možné dopady klimatické změny na vodní zdroje

Možné dopady klimatické změny na vodní zdroje hydrologické bilance vodohospodářskými operacemi v povodí. Pro tyto potřeby je možno aplikovat simulační model vodohospodářských soustav a jako jeho vstupy využít výsledné neovlivněné řady z Bilanu.

Více

šablona zprávy - CityPlan spol. s r.o.

šablona zprávy - CityPlan spol. s r.o. Tato příručka nenahrazuje technickou normu nebo technické podmínky. Lze ji chápat jako jejich doplnění a rozšíření, a to zejména v případech, které jsou mimořádně vhodné pro aplikaci mikroskopickýc...

Více

hydrologie - Rozšíření akreditace studia učitelské geografie na PřF

hydrologie - Rozšíření akreditace studia učitelské geografie na PřF Úvod Vážení studenti, do rukou se Vám dostává pracovní verze studijního textu Základy fyzické geografie 1 – Hydrologie. Tento text je vytvořen v souladu se zásadami pro tvorbu distančních studijní...

Více