Stochastické diferenciální rovnice

Transkript

Stochastické diferenciální rovnice
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ
FAKULTA STROJNÍHO INŽENÝRSTVÍ
DISERTAČNÍ PRÁCE
k získání akademického titulu Doktor (Ph. D.)
ve studijním oboru
MATEMATICKÉ INŽENÝRSTVÍ
RNDr. Edita Kolářová
Stochastické diferenciální rovnice v elektrotechnice
Školitel: prof. RNDr. Jan Franců, CSc.
Oponenti:
Datum státní doktorské zkoušky: 10.2.2005
Datum odevzdání práce:
Obsah
1 Úvod
1.1 Cíle, přínos a popis práce . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Základní symboly a značení . . . . . . . . . . . . . . . . . . . . . . .
2 Teorie stochastických diferenciálních rovnic
2.1 Úvod do teorie pravděpodobnosti . . . . . . . . . . . . . .
2.1.1 Pravděpodobnostní prostor . . . . . . . . . . . . .
2.1.2 Náhodná veličina, střední hodnota a nezávislost . .
2.1.3 Charakteristická funkce . . . . . . . . . . . . . . .
2.1.4 Stochastické procesy a podmíněná střední hodnota
2.2 Brownův pohyb a jeho vlastnosti . . . . . . . . . . . . . .
2.2.1 Konstrukce Brownova pohybu . . . . . . . . . . . .
2.2.2 Vlastnosti Brownova pohybu . . . . . . . . . . . . .
2.2.3 Martingaly a Markovovy procesy . . . . . . . . . .
2.3 Stochastický integrál . . . . . . . . . . . . . . . . . . . . .
2.3.1 Itôův integrál . . . . . . . . . . . . . . . . . . . . .
2.3.2 Itôova formule . . . . . . . . . . . . . . . . . . . .
2.4 Stochastické diferenciální rovnice . . . . . . . . . . . . . .
2.4.1 Existence a jednoznačnost řešení . . . . . . . . . .
2.4.2 Některé typy rovnic a jejich metody řešení . . . . .
2.5 Numerické řešení stochastických diferenciálních rovnic . .
2.5.1 Stochastická Eulerova metoda . . . . . . . . . . . .
2.5.2 Stochastická Milsteinova metoda . . . . . . . . . .
2.5.3 Aproximace střední hodnoty stochastického řešení
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Stochastické diferenciální rovnice v elektrotechnice
3.1 Deterministický model RL obvodu . . . . . . . . . . . . . . .
3.2 Stochastický model RL obvodu . . . . . . . . . . . . . . . .
3.2.1 RL obvod se stochastickým zdrojem . . . . . . . . .
3.2.2 RL obvod se stochastickým odporem . . . . . . . . .
3.2.3 RL obvod se stochastickým zdrojem i odporem . . .
3.3 Dodatek – Porovnání teoretických výsledků s experimentem
4 Závěr
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
4
6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
9
11
12
13
14
20
23
24
26
28
31
32
36
38
39
40
42
.
.
.
.
.
.
43
43
44
44
46
48
53
55
2
Kapitola 1
Úvod
Fyzikální jevy se obvykle modelují deterministicky, pomocí diferenciálních rovnic,
které popisují průměrné chování systému. Pro úplnější informace o systému můžeme
do modelu zahrnout náhodné vlivy. Tím vznikne nový matematický model, takzvaný
stochastický. Takový model můžeme vytvořit buď přímo pro daný problém, nebo ho
získat vhodnou úpravou klasického deterministického modelu. Během posledních 50
let se studium stochastických modelů vyvíjelo velmi intenzívně v řadě oborů. Vznikla
potřeba uvažovat o náhodných vlivech také v inženýrských oborech.
Jedna z technik „stochastizaceÿ spočívá v tom, že v deterministickém matematickém
modelu systému se jeden nebo více vstupních parametrů nahradí náhodnými procesy.
Řešením výsledného modelu je opět náhodný proces. Uvažujme například obyčejnou
diferenciální rovnici
dx
= a(t, x).
dt
Stochastickou verzi této rovnice můžeme získat přidáním dalšího členu b(t, X(t))ξ(t)
do pravé strany rovnice
d
X(t) = a(t, X(t)) + b(t, X(t))ξ(t)
dt
kde symbol ξ(t) označuje stochastický proces nazývaný obvykle „bílý šumÿ. Řešením této rovnice bude náhodný proces X(t).
Z matematického hlediska je tato rovnice problematická zejména proto, že bílý šum
ξ(t) nemá spojité trajektorie. Je tedy potřeba tento model dále modifikovat. Vynásobme rovnici dt,
dX(t) = a(t, X(t)) dt + b(t, X(t))ξ(t) dt
a označme ξ(t) dt = dW (t). Tento člen budeme interpretovat jako přírůstek Wienerova procesu W (t). Tento proces, nazývaný také Brownův pohyb, hraje klíčovou roli
ve stochastickém modelování. Dostali jsme se tak ke stochastické diferenciální
rovnici
dX(t) = a(t, X(t)) dt + b(t, X(t)) dW (t),
3
kterou ve skutečnosti chápeme jako integrální rovnici
Z t
Z t
X(t) = X(t0 ) +
a(s, X(s)) ds +
b(s, X(s)) dW (s).
t0
t0
V tomto tvaru stochastické diferenciální rovnice jsou na pravé straně dva různé
druhy integrálů. Prvním je klasický Riemannův integrál, druhým je stochastický
integrál podle dW (t). Wienerův proces je sice spojitý ale má nekonečnou variaci,
proto v tomto případě nemůže jít o Riemann-Stieltjesův integrál.
Stochastický integrál poprvé definoval Japonský matematik Itô ve 40-tých letech
minulého století. Od něj pochází výše uvedený integrální tvar stochastické diferenciální rovnice, která se do té doby zkoumala jen heuristicky. Itô zavedl nový typ
integrálu, Itôův stochastický integrál, a tím vybudoval matematický aparát pro studium stochastických diferenciálních rovnic.
1.1
Cíle, přínos a popis práce
Tato práce má dva hlavní cíle. Prvním cílem je vytvořit ucelený přehled Itôova
stochastického kalkulu. Druhým cílem je využít tuto teorii na řešení problémů z inženýrské praxe, na stochastické modely elektrických RL obvodů.
Teorie stochastických diferenciálních rovnic je velice zajímavý, rychle se rozvíjející
obor matematiky, který má širokou škálu aplikací také v inženýrské praxi. Studium
matematické teorie stochastických diferenciálních rovnic předpokládá znalost mnoha
oblastí matematiky, jako jsou pravděpodobnost, teorie míry, obyčejné diferenciální
rovnice a funkcionální analýza. Jedním z našich cílů bylo shrnout teorii tak, aby
byla čitelná a srozumitelná i pro studenty inženýrského studia. Základní studijní literaturou byla monografie Øksendal [10]. Tato monografie je sice úvodem do oboru,
je ale hodně teoreticky orientována. Řada pojmů je přístupnější v učebním textu
Evans [4]. Konkrétní metody pro řešení stochastických diferenciálních rovnic jsou
rozpracovány v monografii Arnold [1]. Tato kniha je nejvhodnější pro inženýrskou
praxi, ale neobsahuje teoretické základy. Numerické metody jsme čerpali z knih Kloeden [7] a Cyganowski [3]. V těžkých chvílích bylo osvěžením otevřít knihu Steele [9],
která je zaměřená na aplikace ve finanční matematice a náročnou teorii vysvětluje
přístupnou formou.
Druhá kapitola poskytuje úvod do teorie stochastických diferenciálních rovnic. Začíná stručným shrnutím nezbytných znalostí z pravděpodobnosti. V této části důkazy
tvrzení neuvádíme.
Počínaje paragrafem 2.2 se už věnujeme nové teorii. Zde uvádíme většinu tvrzení
i s důkazy, pouze velmi složité případně technicky náročné důkazy vynecháváme
nebo uvádíme pouze myšlenku důkazu. Nejdříve zavedeme Brownův pohyb a ukážeme jeho konstrukci podle Ciesielskiho. Dále odvodíme jeho druhou variaci a další
vlastnosti Brownova pohybu. Dalším krokem je zavedení stochastického integrálu.
4
Naši pozornost soustředíme na Itôův kalkulus, ale ukážeme i rozdíl mezi Itôovým a
Stratonovičovým přístupem. Dokážeme také pravidlo pro derivování složené funkce,
Itôovu formuli.
Od paragrafu 2.4 se věnujeme stochastickým diferenciálním rovnicím. Uvedeme podmínky pro existenci a jednoznačnost řešení. Ukážeme některé typy rovnic a metody
řešení, které později využijeme v aplikacích.
Na konci této kapitoly se zabýváme numerickými metodami pro stochastické diferenciální rovnice, které jsou pro aplikace v inženýrské praxi nezbytné. Pomocí těchto
metod můžeme simulovat analytické řešení anebo získat řešení stochastické diferenciální rovnice, kde analytické řešení neumíme najít. Uvádíme dvě konkrétní metody,
Eulerovu a Milsteinovu. Eulerova metoda pro stochastické diferenciální rovnice je
odvozená ze stejnojmenné metody pro obyčejné diferenciální rovnice. Milsteinova
metoda byla vytvořená přímo pro stochastické diferenciální rovnice.
Třetí kapitola se zabývá aplikacemi teorie na elektrické obvody. Matematickým modelem jednoduchého elektrického RL obvodu je obyčejná lineární diferenciální rovnice prvního řádu. V této části práce ukážeme „stochastizaciÿ rovnice sériového
elektrického RL obvodu, kde se náhodný člen objeví buď na pravé straně rovnice
nebo u některého z koeficientů. Uvažujeme také rovnici se dvěma náhodnými koeficienty. Ve všech případech odvodíme analytické řešení pomocí Itôovy formule a
pomocí numerické simulace vygenerujeme několik trajektorií řešení. Najdeme intervaly, kde se s velkou pravděpodobnosti nacházejí trajektorie stochastického řešení.
Numerické simulace jsou naprogramovány v jazyce C#. Jde o nový, objektově orientovaný jazyk systému MS .Network. Využíváme knihovnu LinAlg, která umožňuje
vektorové programování a má širokou škálu možnosti pro práci s maticemi.
Na konci kapitoly uvádíme popis pokusu ve kterém jsme na konkrétním RL obvodu
se zašuměným zdrojem změřili hodnoty proudu. Potvrdilo se, že naměřené hodnoty
se nachází v intervalu získaném na základě teoretických výsledků.
Jedním z přínosů této práce je vytvoření co nejvíce vyváženého textu, který zpřístupňuje hlubokou matematickou teorii zájemcům o její aplikace, především inženýrům.
Dalším přínosem je implementace numerických schémat pro řešení stochastických
rovnic do jazyku C#. Hlavním přínosem práce je z matematického hlediska kompletní řešení RL obvodu pomocí stochastického kalkulu. Našli jsme jak analytické,
tak i numerické řešeni stochastického modelu obvodu se dvěma náhodnými parametry. Vyšetřili jsme statistické vlastnosti řešení a našli oblasti, kde se řešení nachází
se zadanou pravděpodobností.
5
1.2
Základní symboly a značení
R
– množina reálných čísel
B
– Borelovská σ-algebra na množině R
(Ω, A, P )
– pravděpodobnostní prostor
E[X]
– střední hodnota náhodné veličiny X
V [X]
– rozptyl náhodné veličiny X
E[X|H]
– podmíněná střední hodnota náhodné veličiny X vzhledem
k σ-algebře H
N (m, σ 2 )
– normální rozdělení se střední hodnotou m a s rozptylem σ 2
W (t), W (t, ω)
– Wienerův proces na pravděpodobnostním prostoru (Ω, A, P )
Ft
– σ-algebra generovaná W (s), s ≤ t na (Ω, A, P )
FtM
RT
A dW (t)
0
RT
B ◦ dW (t)
0
– σ-algebra generovaná procesem (W1 (s), . . . , WM (s)), s ≤ t
– Itôův integrál z A(t, ω) na intervalu (0, T )
– Stratonovičův integrál z B(t, ω) na intervalu (0, T )
Lp (0, T ), 1 ≤ p – prostor reálných procesů G(t, ω) na prostoru (Ω, A, P )
dle definice 2.3.3
6
Kapitola 2
Teorie stochastických
diferenciálních rovnic
2.1
2.1.1
Úvod do teorie pravděpodobnosti
Pravděpodobnostní prostor
Definice 2.1.1. Systém podmnožin A dané množiny Ω se nazývá σ-algebra, jestliže
platí:
(i) ∅ ∈ A,
(ii) A ∈ A ⇒ AC ∈ A, kde AC = Ω\A,
∞
[
(iii) A1 , A2 , . . . ∈ A ⇒
Ai ∈ A.
i=1
Definice 2.1.2. Je-li A σ-algebra na Ω, potom dvojice (Ω, A) se nazývá měřitelný
prostor. Množinová funkce P definovaná na σ-algebře A se nazývá pravděpodobnostní
míra , jestliže
1. P (∅) = 0, P (Ω) = 1
2. P (A) ≥ 0 pro každé A ∈ A
T
3. Pro Ai ∈ A, kde Ai Aj = ∅ je - li i 6= j, platí
P(
∞
[
Ai ) =
i=1
∞
X
P (Ai ).
i=1
Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor.
Definice 2.1.3. Nechť U je systém podmnožin množiny Ω. Potom nejmenší σalgebru, která obsahuje U, nazýváme σ-algebrou generovanou U a značíme GU .
\
GU =
{ G; G je σ−algebra na Ω, U ⊂ G}.
7
Je-li Ω = Rn a U je systém všech otevřených podmnožin Rn , potom σ-algebru generovanou U nazýváme Borelovskou σ-algebrou na Ω, a označujeme B. Množiny B ∈ B
nazýváme borelovské množiny.
Poznámka.
Nechť je f nezáporná integrovatelná funkce na Rn pro kterou je
R
f dx = 1. Pro každou borelovskou množinu B ∈ B definujeme
Rn
Z
P (B) =
f dx.
B
Potom (Rn , B, P ) je pravděpodobnostní prostor. Funkce f se nazývá hustota pravděpodobnostní míry P.
Příklad 2.1.4. Nechť z ∈ Rn je pevně daný bod. Definujeme pro každou borelovskou
množinu B ∈ B
1 pokud z ∈ B,
P (B) :=
0 pokud z ∈
/ B.
Potom (Rn , B, P ) je pravděpodobnostní prostor. Míra P se nazývá Diracova míra
soustředěná do bodu z. Píšeme P = δz .
Příklad 2.1.5. Wienerova míra. Uvažujme množinu
Ω := {ω : h0, ∞) → R, ω(0) = 0, ω spojitá funkce. }
Nechť jsou dané hodnoty 0 = t0 < t1 < . . . < tk a intervaly (ai , bi ) pro i = 1, . . . , k.
Potom pro množinu
A := {ω ∈ Ω | ai < ω(ti ) < bi , i = 1, . . . , k}
(2.1)
definujeme pravděpodobnost
Z b1
Z bk
P (A) :=
...
p(t1 , 0, x1 ) p(t2 − t1 , x1 , x2 ) . . . p(tk − tk−1 , xk−1 , xk ) dx1 . . . dxk
a1
ak
kde
|x−y|2
1
e− 2t , x, y ∈ R, t > 0.
2πt
Wiener dokázal, že zobrazení P lze rozšířit na pravděpodobnostní míru na σ-algebře
generované všemi množinami typu (2.1).
p(t, x, y) = √
Poznámka. Obvykle se pokládá p(0, x, y) = δx (y).
Poznámka. Wienerovu míru můžeme definovat i ve vícerozměrném prostoru na
množině
Ω := {ω : h0, ∞) → Rn , ω(0) = 0, ω spojitá funkce }.
8
V tomto případě je
n
p(t, x, y) = (2πt)− 2 e−
|x−y|2
2t
,
x, y ∈ Rn , t > 0.
Příslušnou σ-algebru generují množiny typu
A := {ω ∈ Ω | ω(t1 ) ∈ F1 , ω(t2 ) ∈ F2 , . . . , ω(tk ) ∈ Fk ,
i = 1, . . . , k}
kde 0 = t0 < t1 < . . . < tk jsou reálná čísla a F1 , . . . , Fk ⊂ Rn , otevřené množiny.
Z
P (A) =
p(t1 , 0, x1 ) p(t2 − t1 , x1 , x2 ) . . . p(tk − tk−1 , xk−1 , xk ) dx1 . . . dxk .
F1 ×...×Fk
2.1.2
Náhodná veličina, střední hodnota a nezávislost
Definice 2.1.6. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Zobrazení
X : Ω → Rn , n ≥ 1
se nazývá náhodná veličina, jestliže pro každé B ∈ B je X −1 (B) ∈ A.
Poznámka. Náhodná veličina X je P -měřitelná funkce z (Ω, A, P ) do (Rn , B).
Definice 2.1.7. Nechť X : Ω → Rn , n ≥ 1 je náhodná veličina. Potom systém
množin
G(X) := {X −1 (B) | B ∈ B }
tvoří σ-algebru na Ω, které říkáme σ-algebra generovaná X.
Věta 2.1.8. Nechť X, Y : Ω → Rn jsou dvě funkce, potom Y je G(X)- měřitelná
právě když existuje borelovsky měřitelná funkce g : Rn → Rn taková, že Y = g(X).
Definice 2.1.9. Každá náhodná veličina na X : Ω → Rn na pravděpodobnostním prostoru (Ω, A, P ) indukuje pravděpodobnostní míru µX na Rn definovanou
předpisem
µX (B) = P (X −1 (B)).
Míra µX se nazývá rozdělení náhodné veličiny X.
R
|X(ω)| dP (ω) < ∞, potom číslo
Z
Z
E[X] :=
X(ω) dP (ω) =
x dµX (x)
Definice 2.1.10. Jestliže
Ω
Rn
Ω
se nazývá střední hodnota X (vzhledem k P ).
9
n
Z
Poznámka. Obecněji, je-li funkce f : R → R a
|f (X(ω))| dP (ω) < ∞, potom
Ω
Z
E[f (X)] :=
Z
f (X(ω)) dP (ω) =
f (x) dµX (x).
Rn
Ω
Definice 2.1.11.
Z
V [X] :=
|X − E[X]|2 dP = E[|X|2 ] − |E[X]|2
Ω
se nazývá rozptyl náhodné veličiny X (vzhledem k P ).
Věta 2.1.12. (Čebyševova nerovnost.) Nechť X : Ω → R je náhodná veličina
s konečnou střední hodnotou m a konečným rozptylem σ 2 . Pak pro libovolné c > 0
platí nerovnost
1
P (|X − m| ≥ c σ) ≤ 2 .
c
Příklad 2.1.13. Náhodná veličina X : Ω → R má normální rozdělení N (m, σ 2 ),
jestliže
Z
(x−m)2
1
P [X ∈ B] = √
e− 2σ2 dx,
σ 2π B
kde m a σ jsou konstanty, σ > 0, a B ∈ R je Borelovská množina. V tomto případě
platí
E[X] = m
a
V [X] = σ 2 .
Definice 2.1.14. Dvě množiny A, B ∈ A se nazývají nezávislé jestliže platí
P (A ∩ B) = P (A) · P (B).
Soubor H = {Hi ; i ∈ I} systémů měřitelných množin je nezávislý jestliže platí
P (Hi1 ∩ . . . ∩ Hik ) = P (Hi1 ) . . . P (Hik )
pro libovolnou volbu Hi1 ∈ Hi1 , . . . , Hik ∈ Hik s navzájem různými indexy i1 , . . . , ik .
Systém náhodných veličin Xi , i ∈ I je nezávislý, jestliže soubor σ-algeber GXi generovaných Xi tvoří nezávislý systém.
Věta 2.1.15. Nechť X, Y : Ω → R jsou dvě nezávislé náhodné veličiny, pro které
E[|X|] < ∞ a E[|Y |] < ∞. Potom
E[XY ] = E[X]E[Y ] a V [X + Y ] = V [X] + V [Y ].
Věta 2.1.16. Nechť X, Y : Ω → R jsou dvě náhodné veličiny s normálním rozdělením. Potom platí, že
X, Y jsou nezávislé ⇔ E[(X − E[X])(Y − E[Y ])] = 0.
10
Věta 2.1.17. ( Borel-Cantelliho lemma.) Nechť (Ω, A, P ) je pravděpodobnostní
prostor a nechť A1 , . . . , An , . . . ∈ A. Potom
(i) P (
∞ [
∞
\
Am ) = 0 jestliže
n=1 m=n
(ii) P (
∞ [
∞
\
∞
X
P (An ) < ∞
n=1
Am ) = 1 jestliže
n=1 m=n
∞
X
P (An ) = ∞ a An jsou nezávislé.
n=1
Definice 2.1.18. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Říkáme, že pop
sloupnost náhodných veličin {Xk }∞
k=1 konverguje v L k náhodné veličině X : Ω → R,
jestliže
h
i
p
lim E |Xk − X| = 0.
k→∞
Pro p = 1 mluvíme o konvergeci ve smyslu středů a v případě p = 2 o konvergeci ve
smyslu kvadratických středů.
2.1.3
Charakteristická funkce
Definice 2.1.19. Nechť X je n-rozměrná náhodná veličina. Potom funkce
φX (λ) := E[eiλ·X ]
λ ∈ Rn
se nazývá charakteristická funkce X.
Příklad 2.1.20. Nechť je X náhodná veličina s rozdělením N (0, 1). Potom
φX (λ) := e−
λ2
2
Je-li X náhodná veličina s rozdělením N (m, σ 2 ), potom
φX (λ) := eimλ−
λ2 σ 2
2
.
Věta 2.1.21. Jestliže X1 , . . . , Xn jsou nezávislé náhodné veličiny, potom
φX1 +...+Xn (λ) := Πnj=1 φjX (λ)
λ ∈ Rn .
Věta 2.1.22. Nechť X je jednorozměrná náhodná veličina. Potom
E[X k ] =
1 (k)
φ (0).
ik
Věta 2.1.23. Charakteristická funkce jednoznačně určuje rozložení náhodné veličiny.
11
2.1.4
Stochastické procesy a podmíněná střední hodnota
Definice 2.1.24. Nechť (Ω, A, P ) je pravděpodobnostní prostor a T ⊂ R je interval.
Systém náhodných veličin
{X(t)| t ∈ T }
se nazývá stochastický proces.
Poznámka. Nejčastěji máme T =< 0, ∞) a díváme se na parametr t jako na čas.
Pro pevné ω ∈ Ω dostaneme funkci
t → X(t, ω);
t∈T
kterou nazveme trajektorií X(t).
Je možné ztotožnit ω s trajektorií t → X(t, ω), tzn. s funkcí T → Rn . V tomto
případě považujeme Ω za podmnožinu prostoru Ω = (Rn )T - prostoru všech funkcí z
T do Rn . Potom σ-algebra A bude obsahovat σ-algebru B generovanou množinami
typu
{ω | ω(t1 ) ∈ F1 , . . . , ω(tk ) ∈ Fk }, Fi ⊂ Rn borelovská.
Můžeme se tedy dívat na stochastický proces jako na pravděpodobnostní míru P
definovanou na prostoru ((Rn )T , B).
Definice 2.1.25. Řikáme, že stochastický proces {Y (t)| 0 ≤ t < ∞} na pravděpodobnostním prostoru (Ω, A, P ) je Gaussův proces, jestliže pro libovolnou posloupnost 0 ≤ t1 < t2 < . . . < tk má vektor (Y (t1 ), . . . Y (tk )) multidimenzionální normální
rozdělení.
Definice 2.1.26. Nechť (Ω, A, P ) je pravděpodobnostní prostor a A, B ∈ A a
P (B) > 0. Potom vzorec
P (A ∩ B)
P (A|B) :=
P (B)
definuje podmíněnou pravděpodobnost jevu A za předpokladu B.
Poznámka. Podmíněná pravděpodobnost jevu A za předpokladu B je vlastně
pravděpodobnost jevu A ∩ B v novém prostoru, kdy se díváme na množinu B jako
P
e Pe),
. Označme tento prostor (B, A,
na pravděpodobnostní prostor s mírou Pe = P (B)
kde Ae je σ-algebra A zúžená na množinu B.
Je-li X : Ω → Rn náhodná veličina na (Ω, A, P ) potom bude X|B náhodná veličina
e Pe) a můžeme mluvit o tzv. podmíněné střední hodnotě
na (B, A,
Z
Z
1
E[X|B] =
X dPe =
X dP.
P (B) B
B
12
Mějme teď náhodné veličiny X(ω), Y (ω), E[X] < ∞. Chtěli bychom znát podmíněnou střední hodnotu veličiny X za předpokladu Y. E[X|Y ] už nemůže být číslo, ale
náhodná veličina a její hodnoty závisí na G(Y ) – σ-algebře generované Y, nezávisí
přímo na funkčních hodnotách funkce Y. Tyto úvahy jsou východiskem k obecné
definici podmíněné střední hodnoty.
Definice 2.1.27. Nechť je X náhodná veličina na (Ω, A, P ), E[X] < ∞, a nechť
H je σ-algebra H ⊂ A. Podmíněnou střední hodnotu veličiny X vzhledem k H rozumíme náhodnou veličinu E[X|H] která je
1. měřitelná vzhledem k H
R
R
2. H X dP = H E[X|H] dP pro H ∈ H.
Věta 2.1.28. Nechť je (Ω, A, P ) pravděpodobnostní prostor, H ⊂ A je σ-algebra na
tomto prostoru a X, Y : Ω → Rn , E[X] < ∞, E[Y ] < ∞ jsou dvě náhodné veličiny.
Potom
(i) E[aX + bY |H] = aE[X|H] + bE[Y |H] pro a, b ∈ R
(ii) E[E[X|H]] = E[X]
(iii) E[X|H] = X je-li X H- měřitelná
(iv) E[X|H] = E[X] je-li X nezávislá na H.
(v) Je-li H = A potom E[X|H] = X
(vi)Je-li X ≤ Y potom E[X|H] ≤ E[Y |H]
(vii) E[XY |H] = X E[Y |H] je-li X H- měřitelná.
Věta 2.1.29. Nechť F a H jsou σ-algebry, takové že F ⊂ H. Potom
E[X|F] = E[E[X|H]|F].
Věta 2.1.30. (Jensenova nerovnost.) Nechť φ : R → R je konvexní funkce a
E[|φ(X)|] < ∞, potom
φ(E[X|H]) 5 E[φ(X)|H].
Poznámka. (Důsledky Jensenovy nerovnosti) (i) |E[X|H]| 5 E[|X||H]
(ii) |E[X|H]|2 5 E[|X|2 |H].
2.2
Brownův pohyb a jeho vlastnosti
Brownův pohyb - matematický model pohybu částice v tekutině - je důležitým příkladem náhodného procesu, který hraje klíčovou roli v teorii stochastických diferenciálních rovnic. Matematická teorie Brownova pohybu byla započata Wienerem (r.
1923), který rozložení pravděpodobnosti procesu Brownova pohybu chápal jako míru
v prostoru spojitých funkcí. Proto se tento proces nazývá také Wienerův proces.
13
Definice 2.2.1. Reálný stochastický proces W (t) na pravděpodobnostním prostoru
(Ω, A, P ) se nazývá Brownův pohyb nebo Wienerův proces, jestliže platí
1. W (0) = 0 skoro všude
2. W (t) − W (s) má N (0, t − s) rozdělení pro t ≥ s ≥ 0
3. pro libovolná 0 < t1 < t2 . . . < tn jsou přírůstky
W (t1 ), W (t2 ) − W (t1 ), W (t3 ) − W (t2 ), . . . , W (tn ) − W (tn−1 )
vzájemně nezávislé náhodné veličiny.
Poznámka. Platí, že
(i) E[W (t)] = 0 pro t > 0.
(ii) E[W 2 (t)] = t.
Poznámka. Wienerův proces představuje integrál toho, co se v praktických aplikacích nazývá bílým šumem.
Věta 2.2.2. Nechť W (t) je Wienerův proces. Potom
E[W (t)W (s)] = min{t, s} pro t ≥ 0, s ≥ 0.
Důkaz: Nechť t ≥ s ≥ 0. Potom
E[W (t)W (s)] = E[(W (s) + W (t) − W (s))W (s)] =
= E[W (s)2 ] + E[(W (t) − W (s))W (s)] =
= s + E[W (t) − W (s)] E[W (s)] = s = min{t, s}.
|
{z
} | {z }
=0
2.2.1
=0
Konstrukce Brownova pohybu
Konstrukci Brownova pohybu provedeme podle Z. Ciesielskiho. Nejprve se omezíme
na t ∈ h0, 1i.
Definice 2.2.3. Pro t ∈ h0, 1i definujeme Haarovy funkce {hk (·)}∞
k=0 takto:
h0 (t) := 1 pro t ∈ h0, 1i.
(
1
pro t ∈ h0, 21 i
h1 (t) :=
−1
pro t ∈ ( 12 , 1i
14
Pro 2n ≤ k < 2n+1 , n = 1, 2, . . . , definujeme

n
n

2n/2
pro k−2
≤ t ≤ k−22n+1/2

2n


n
n
hk (t) :=
−2n/2
pro k−22n+1/2 < t ≤ k−22n +1



 0
jinde.
Věta 2.2.4. Haarovy funkce tvoří úplný ortonormální systém v prostoru L2 (h0, 1i)
- funkcí integrovatelných s kvadrátem na intervalu h0, 1i.
Důkaz: Platí
1
Z
h20 (s)
ds =
1 ds = 1
0
0
1
Z
h21 (s)
1
Z
Z
1
2
ds =
0
1
Z
(−1)2 ds = 1
1 ds +
1
2
0
Obecně
Z
1
h2k (s)
k−2n +1/2
2n
Z
ds =
2 ds +
k−2n
2n
0
k−2n +1
2n
Z
n
n
k−2n +1/2
2n
2 ds = 2
Dále pro l > k máme buď hk hl = 0 nebo
Z 1
Z
n/2
hk (s)hl (s) ds = ±2
0
n
1
2n+1
+
1
2n+1
= 1.
1
hl (s) ds = 0.
0
R1
Nechť pro f ∈ L2 (h0, 1i) je 0 f (s)hk (s) ds = 0 pro každé k = 0, 1, . . . . Abychom
dokázali úplnost, ukážeme, že potom f = 0 s.v. Máme
Z 1
Z 1
f (s)h0 (s) ds =
f (s) ds = 0.
0
0
a také
Z
1
f (s)h1 (s) ds = 0.
0
Z těchto dvou vztahů dostaneme
Z 1
Z
2
f (s) ds =
Z
R1
0
f (s)h2 (s) ds = 0 a
1
4
R1
0
1
2
Z
f (s) ds =
0
f (s) ds = 0.
1
2
0
Přidáme-li vztahy
1
f (s)h3 (s) ds = 0 dostaneme
3
4
Z
f (s) ds =
f (s) ds = 0 a
1
2
1
4
15
1
Z
f (s) ds = 0.
3
4
Budeme-li v tomto postupu pokračovat, dostaneme pro každé 0 ≤ k < 2n+1 , že
Z k+1
2n+1
f (s) ds = 0.
k
2n+1
DiadickáR racionální čísla tvoří hustou podmnožinu intervalu h0, 1i a tak můžeme
p
psát, že r f (s) ds = 0 pro libovolné 0 ≤ r ≤ p ≤ 1. Ale
Z
d t
f (t) =
f (s) ds = 0
pro s. v. t.
dt 0
Dokázali jsme tedy, že Haarovy funkce tvoří úplný ortonormální systém.
Definice 2.2.5. Pro k = 1, 2, . . . definujeme k-tou Schauderovu funkci vztahem
Z t
sk (t) :=
hk (s) ds
pro t ∈ h0, 1i.
0
Poznámka. Grafy Schauderovy funkce mají tvar rovnoramenného trojúhelníku o
n
n k−2n +1
výšce 2− 2 −1 , ležícího nad intervalem h k−2
, 2n i.
2n
6
n
2− 2 −1 - - - - - - - - - - - - - - - - - - - - - - -L
L
L
L
L
L
L
L
L
L
L
k−2n
2n
k−2n +1
2n
-
Věta 2.2.6. Nechť {ak }∞
k=1 je posloupnost reálných čísel, 0 ≤ δ < 1/2 a nechť platí
|ak | = O(k δ ) pro k → ∞.
Potom řada
∞
X
ak sk (t)
k=1
konverguje stejnoměrně pro 0 ≤ t ≤ 1.
Důkaz: Zvolme si ε > 0. Pro 2n ≤ k < 2n+1 mají funkce sk (·) disjunktní nosiče.
Položme
bn :=
max
|ak | ≤ C(2n+1 )δ .
2n ≤ k < 2n+1
16
Potom pro 0 ≤ t ≤ 1 a pro m dostatečně velké platí
∞
X
|ak ||sk (t)| ≤
k=2m
≤C
∞
X
∞
X
bn
n=m
n+1 δ
(2
−n/2−1
max
|sk (t)|
n+1
2 ≤k<2
0≤t≤1
n
(δ−1)
) ·2
=C2
n=m
∞
X
2n(δ−1/2) < ε.
n=m
{Ak }∞
k=1
Věta 2.2.7. Nechť jsou
nezávislé náhodné veličiny s rozdělením N (0, 1).
Potom pro skoro všechna ω platí, že
p
pro k → ∞.
|Ak | = O( log k)
Důkaz: Pro x > 0, k = 2, . . . , máme
Z −x
Z ∞
Z ∞
2
2
s2
1
1
2
− s2
− s2
P (|Ak | > x) = √
e
e
ds + √
ds = √
e− 2 ds
2π −∞
2π x
2π x
Z
∞
x2
s2
x2
2
e− 4 ds ≤ C · e− 4
≤ √ e− 4
2π
x
√
pro nějakou konstantu C. Položme x = 4 log k. Potom
p
1
P (|Ak | > 4 log k) ≤ C · e−4 log k = C 4
k .
P∞ 1
Protože řada k=1 k4 konverguje, z Borel-Cantelliho lemmatu dostaneme, že
p
P (|Ak | > 4 log k pro nekonečně mnoho k) = 0.
Poznámka. Z této věty speciálně vyplývá, že posloupnost {Ak }∞
k=1 nezávislých
N (0, 1) náhodných veličin splňuje předpoklady věty 2.2.6.
Věta 2.2.8. Pro 0 ≤ s, t ≤ 1 je součet
P∞
k=1
sk (s)sk (t) = min(s, t).
Důkaz: Definujme pro 0 ≤ s ≤ 1 funkci
(
1
pro 0 ≤ τ ≤ s
ϕs (τ ) :=
0
pro s < τ ≤ 1.
Protože Haarovy funkce tvoří úplný ortonormální systém, můžeme psát pro s ≤ t
Z 1
∞
X
s=
ϕt ϕs dτ =
ak b k ,
0
k=1
kde
Z
ak =
1
Z
ϕt hk dτ =
0
t
Z
hk dτ = sk (t),
bk =
0
Z
ϕs hk dτ =
0
17
1
s
hk dτ = sk (s).
0
Věta 2.2.9. Nechť {Ak }∞
k=1 je posloupnost nezávislých náhodných veličin s rozdělením N (0, 1), definovaných na daném pravděpodobnostním prostoru. Potom součet
W (t, ω) :=
∞
X
0≤t≤1
Ak (ω)sk (t),
k=1
konverguje stejnoměrně v t pro s.v. ω. Navíc
(i) W (·) je Brownův pohyb a
(ii) trajektorie procesu t → W (t, ω) jsou spojité pro s. v. ω.
Důkaz: Stejnoměrná konvergence řady vyplývá z vět 2.2.6 a 2.2.7 a ze stejnoměrné
konvergence spojitých funkcí vyplývá, že trajektorie procesu t → W (t, ω) jsou spojité pro s. v. ω.
Musíme dokázat, že W (·) je Brownův pohyb. Je zřejmé, že W (0) = 0 s.v. Teď dokážeme, že pro 0 ≤ s ≤ t ≤ 1 mají přírůstky W (t) − W (s) rozdělení N (0, t − s).
Platí
P∞
E[eiλ(W (t)−W (s)) ] = E[eiλ k=1 Ak (ω)(sk (t)−sk (s)) ]
iλAk (sk (t)−sk (s))
= Π∞
]
k=1 E[e
−
= Π∞
k=1 e
= e−
λ2
2
λ2
(sk (t)−sk (s))2
2
P∞
k=1 (sk (t)−sk (s))
= e−
2
(z nezávislosti)
(z N (0, 1) rozdělení Ak )
= e−
λ2
(t−2s+s)
2
λ2
2
P∞
2
2
k=1 sk (t)−2sk (t)sk (s)+sk (s)
(z věty 2.2.8)
= e−
λ2
(t−s)
2
.
Z jednoznačnosti charakteristické funkce vyplývá, že proces W (t) − W (s) má rozdělení N (0, t − s).
Zbývá ještě dokázat, že pro libovolná 0 < t1 < t2 < . . . < tn jsou přírůstky
W (t1 ), W (t2 ) − W (t1 ), . . . , W (tn ) − W (tn−1 )
vzájemně nezávislé náhodné veličiny. Protože mají normální rozložení, stačí dokázat,
že
E[ (W (ti+1 ) − W (ti )) (W (tj+1 ) − W (tj )) ] = 0.
Nejdříve spočítáme E[W (t)W (s)].
"
E[W (t)W (s)] = E
∞
X
Ak (ω)sk (t) ·
k=1
∞
X
l=1
18
#
Al (ω)sl (s)
"
=E
∞
X
#
Ak (ω)Al (ω)sk (t)sl (s) =
k,l=1
=
∞
X
E[ A2k (ω) ]sk (t)sk (s) +
k=1
∞
X
E[Ak (ω)Al (ω)]sk (t)sl (s) =
k,l=1,k6=l
=
∞
X
sk (t)sk (s) = min(s, t),
k=1
protože Ak jsou navzájem nezávislé N (0, 1) náhodné veličiny.
Bez újmy na obecnosti můžeme předpokládat, že ti < tj a máme
E[ (W (ti+1 ) − W (ti )) (W (tj+1 ) − W (tj )) ] =
E[ W (ti+1 )W (tj+1 ) − W (ti )W (tj+1 ) − W (ti+1 )W (tj ) + W (tj )W (ti ) ]
= ti+1 − ti − ti+1 + ti = 0.
Věta 2.2.10. Existence Brownova pohybu. Nechť (Ω, U, P) je pravděpodobnostní prostor na kterém je definováno spočetně mnoho nezávislých N (0, 1) náhodných veličin {An }∞
n=1 . Potom existuje jednorozměrný Brownův pohyb W (·) definovaný pro ω ∈ Ω, t ≥ 0.
Trajektorie Brownova pohybu
19
Důkaz: Dle předcházející věty zkonstruujeme Brownův pohyb pro 0 ≤ t ≤ 1.
Přeznačováním indexů N (0, 1) náhodných veličin dostaneme spočetně mnoho tříd
spočetně mnoha náhodných veličin a tak můžeme sestrojit spočetně mnoho nezávislých Brownových pohybů W n (t) pro 0 ≤ t ≤ 1. Pak definujeme Brownův pohyb pro
t ≥ 0 vztahem
W (t) := W (n − 1) + W n (t − (n − 1)) pro n − 1 ≤ t ≤ n.
Poznámka. Uvedeme příklad pravděpodobnostního prostoru na kterém je definováno spočetně mnoho nezávislých N (0, 1) náhodných veličin. Nechť
Ω = prostor posloupnosti reálných čísel (x1 , x2 . . .)
| {z }
ω
Nechť U je σ-algebra generovaná množinami typu
A := {ω ∈ Ω | ak < xk < bk , k = 1, . . . , m; −∞ ≤ ak ≤ bk ≤ ∞}.
Pro takové množiny A definujeme pravděpodobnost předpisem
Z bk
m
Y
x2
1
√
P (A) :=
e− 2 dx.
2π ak
k=1
Tuto pravděpodobnost rozšíříme na všechny množiny z U a definujeme
An (ω) = xn
pro ω = (x1 , x2 , . . .).
Potom {An }∞
n=1 jsou nezávislé N (0, 1) náhodné veličiny.
2.2.2
Vlastnosti Brownova pohybu
Věta 2.2.11. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Potom proces
(i) W (t0 + t) − W (t0 ) je Brownův pohyb pro t0 > 0.
(ii) c W (t/c2 ) je Brownův pohyb pro c > 0.
f (t) := W (t0 + t) − W (t0 ). Potom W
f (0) = 0 a nezávislost
Důkaz: (i) Definujme W
přírůstků plyne z nezávislosti přírůstků Brownova pohybu. Pomocí charakteristické
f (t) − W
f (s) je N (0, t − s).
funkce dokážeme, že W
E[eiλ(W (t)−W (s)) ] = E[eiλ(W (t0 +t)−W (t0 )−W (t0 +s)+W (t0 )) ] =
f
f
= E[eiλ(W (t0 +t)−W (t0 +s)) ] = e−
λ2
(t0 +t−(t0 +s))
2
= e−
λ2
(t−s)
2
.
c (t) := c W (t/c2 ). Potom W
c (0) = 0 a podobně jako v (i) máme
(ii) Definujme W
c (t) − W
c (s) je N (0, t − s) :
nezávislost přírůstků a z charakteristické funkce, že W
E[eiλ(W (t)−W (s)) ] = E[ei λ c(W (t/c
c
c
2 )−W (s/c2 ))
20
] = e−
λ2 c2 t−s
( 2 )
2
c
= e−
λ2
(t−s)
2
.
Poznámka. Pomocí této věty se dají dokázat některé další důležité vlastnosti
Brownova pohybu.
Věta 2.2.12. Pro každé t ≥ 0 platí, že trajektorie Brownova pohybu nemá skoro
jistě derivaci v bodě t.
Důkaz: Dokážeme, že skoro jistě nemá trajektorie Brownova pohybu derivaci v
bodě 0. Obecné tvrzení pro t0 6= 0 plyne z toho, že proces W̃ (t) := W (t0 +t)−W (t0 )
je také Brownův pohyb.
Důkaz provedeme sporem. Předpokládejme, že existuje derivace v bodě 0. Potom
existuje číslo A < ∞ a ε > 0, že
|W (t)| < At pro každé 0 < t < ε.
Vezmeme si takové číslo A pevné. Potom
1
P (−At < W (t) < At) = √
2πt
Z
At
x2
e− 2t dx.
−At
Po substituci x = ty dostaneme, že dx = t dy a
Z A
y 2 t2
t
P (−At < W (t) < At) = √
e− 2t dy =
2πt −A
Z A
y2
1
=p
e− 2·1/t dy → 0 pro t → 0.
2π · 1/t −A
Právě jsme dokázali, že pro A pevné je |W (t)| < At pro každé 0 < t ≤ ε
s pravděpodobnosti 0. Tímto způsobem můžeme odvodit pro každé A = n, že
|W (t)| < nt pro každé 0 < t ≤ ε s pravděpodobnosti 0. Ale sjednocení spočetně mnoho množin míry 0 je množina míry 0. Tak W (t) nemá derivaci v bodě
t = 0 s pravděpodobnosti 1.
Poznámka. Dá se dokázat i silnější tvrzení, že s pravděpodobností 1 nejsou trajektorie Brownova pohybu diferencovatelné v žádném bodě. Důkaz tohoto tvrzení
pochází od Dvoretzky, Erdős a Kakutani, a je možné ho najít v [8].
Poznámka. Velice jednoduché je dokázat, že W (t) nemá derivaci v bodě t > 0 ve
smyslu kvadratických středů:
"
2 #
E (W (t + h) − W (t))2
W (t + h) − W (t)
1
E
=
= .
2
h
h
h
21
Věta 2.2.13. Nechť je W (t) Brownův pohyb. Potom (i) E[W 2 (t)] = t.
(ii) E[W 4 (t)] = 3t2 .
Důkaz: (i) W (t) je N (0, t) a proto E[W 2 (t)] = t.
(ii) E[W 4 (t)] vypočítáme přímo z definice. Při výpočtu použijeme dvakrát per partes
a dostaneme
Z
x2
1
4
E[W (t)] = √
x4 e− 2t dx = 3t2 .
2πt
R
Věta 2.2.14. (i) Nechť W (t) je Brownův pohyb na intervalu h0, ti a nechť symbol
δ n := {0 = t0 < t1 . . . < tn = t} značí dělení tohoto intervalu.
Potom pro |δ n | := max0≤k≤n−1 |tk+1 − tk | → 0 platí
n−1
X
(W (tk+1 ) − W (tk ))2 → t
k=0
ve smyslu kvadratických středů. Jinými slovy Brownův pohyb W (t) má kvadratickou
variaci rovnu t.
(ii) Trajektorie Brownova pohybu mají na každém intervalu nekonečnou variaci.
Důkaz: (i) Chceme dokázat, že

!2 
X
E
(∆Wk )2 − t  → 0 pro ∆tk → 0.
tk <t
Definujeme dělení intervalu 0 = t0 < t1 = nt < t2 = 2 nt < . . . < tn = t a
∆Wk = Wk+1 − Wk . Potom ∆tk = nt .



!2 
!2
n−1
n−1 X
X
t
=
E
(∆Wk )2 − t  = E 
(∆Wk )2 −
n
k=0
k=0
"
E
n−1 X
k,j=0
t
(∆Wk )2 −
n
!# X
n−1
t
t
t2
2
4
2
(∆Wj ) −
=
E (∆Wk ) − 2 (∆Wk ) + 2
+
n
n
n
k=0
n−1
X
t
t
2
2
+
E (∆Wk ) −
E (∆Wj ) −
n
n
{z
}
k, j = 0 |
=
0
k 6= j
=
n−1
X
k=0
(z nezávislosti ) =
n−1
n−1
X
X
2t t2
4
2
E (∆Wk ) −
E (∆Wk ) +
=
2
n
n
k=0
k=0
22
=
n−1
X
k=0
3
n−1
2t X t
t2
t2
t2 t2
t2
t2
−
+
n
=
3
−
2
+
=
2
→ 0 pro n → ∞.
n2
n k=0 n
n2
n
n
n
n
(ii) Funkce s konečnou variací mají kvadratickou variaci rovnou nule. Toto tvrzení
je tedy přímým důsledkem (i).
Definice 2.2.15. n- rozměrným Brownovým pohybem se rozumí vektorový proces
W(t) := (W1 (t), . . . , Wn (t)) t ≥ 0
jehož složky tvoří n vzájemně nezávislých Brownových pohybů.
2.2.3
Martingaly a Markovovy procesy
Definice 2.2.16. Systém σ-algeber M = {Mt , t ∈ T } na pravděpodobnostním
prostoru (Ω, A, P ) se nazývá filtrace, pokud pro každé t ∈ T je Mt ⊂ A a
Ms ⊂ Mt
pro s < t, s, t ∈ T .
Definice 2.2.17. Náhodný proces M = {M (t), t ∈ T } se nazývá martingalem
vzhledem k filtraci M = {Mt , t ∈ T }, když
E[M (t)] < ∞,
E[M (t)|Ms ] = M (s),
t∈T
a
t ≥ s,
t, s ∈ T .
Poznámka. Pojem martingalu pochází z teorie hazardních her. Popisuje spravedlivou hru, při níž očekávaná hodnota výhry je rovná částce, kterou hráč musí za účast
ve hře zaplatit. Důležitost martingalu v matematické teorii stochastických procesů
vyplývá z následující věty:
Věta 2.2.18. Nechť proces M = {M (t), t ≥ 0} je spojitým martingalem na (Ω, A, P ).
Potom pro každé p ≥ 1, T ≥ 0 a λ > 0 platí tzv. Doobova martingalová nerovnost:
1
P sup |M (t)| ≥ λ ≤ p E [|M (T )|p ] .
λ
0≤t≤T
Definice 2.2.19. Nechť W (t) je Brownův pohyb na prostoru (Ω, A, P ). Filtrace
F = {Ft , t ≥ 0} se nazývá historie Brownova pohybu, jestliže pro t > 0 je Ft
σ-algebra generovaná náhodnými veličinami W (s, ω), s ≤ t.
Poznámka. Filtrace F = {Ft , t ≥ 0} popisuje růst informace pozorovatele o
trajektorii Brownova pohybu v závislosti na čase.
Věta 2.2.20. Brownův pohyb W (t) je martingalem vzhledem k své filtraci F =
{Ft , t ≥ 0}
23
Důkaz:
E[W (t)|Fs ] = E[W (t) − W (s) + W (s)|Fs ] =
= E[W (t) − W (s)|Fs ] + E[W (s)|Fs ] = 0 + W (s) = W (s),
t ≥ s,
t, s ∈ T .
Využili jsme toho, že náhodná veličina W (t) − W (s) je nezávislá na σ-algebře Fs a
proto
E[W (t) − W (s)|Fs ] = E[W (t) − W (s)] = 0,
a náhodná veličina W (s) je Fs - měřitelná a proto E[W (s)|Fs ] = W (s) (viz větu
1.4.28).
Věta 2.2.21. (Markovova vlastnost) Nechť je W (t) Brownův pohyb, a nechť
F = {Ft , t ≥ 0} je historie Brownova pohybu. Pro s > 0 definujme proces
f (t) := W (t + s) − W (s) a nechť Fe označuje historii W
f (t). Potom pro každé
W
t > 0 jsou σ-algebry Fs a Fet nezávislé.
f (t) je Brownův pohyb a má nezávislé přírůstky stejně jako proces
Důkaz: Proces W
W (t). Definujme množiny
A :=
n
\
{W (sj ) − W (sj−1 ) ≤ xj } ∈ Fs
j=1
a
B :=
m
\
{W (tj + s) − W (tj−1 + s) ≤ yj } ∈ Fet .
j=1
Množiny A a B jsou nezávislé a množiny typu A generují F a množiny typu B
e
generují F.
Poznámka. Procesy mající Markovovu vlastnost se nazývají Markovovy procesy.
Věta tedy říká, že Brownův pohyb je Markovovův proces.
2.3
Stochastický integrál
Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Chceme definovat stochastický
integrál
Z
T
f (s, ω) dW (s, ω)
0
pro vhodnou náhodnou funkci f (s, ω). Předpokládejme zatím, že f je spojitá v s pro
každé ω ∈ Ω. Riemann-Stieltjesův integrál použít nemůžeme, protože proces W (t)
nemá konečnou variaci.
24
Příklad 2.3.1. Mějme interval h0, T i, a mějme dělení tohoto intervalu
δ n := {0 = t0 < t1 . . . < tn = T },
|δ n | := max0≤k≤n−1 |tk+1 − tk |.
Pro pevné 0 ≤ λ ≤ 1 a dělení δ n intervalu h0, T i položme
τk := (1 − λ)tk + λtk+1
(k = 0, . . . , n − 1)
a definujme
n
Rn = Rn (δ , λ, ω) :=
n−1
X
W (τk , ω)(W (tk+1 , ω) − W (tk , ω)).
k=0
RT
To jsou odpovídající Riemannovy součty pro 0 W (s, ω) dW (s, ω). Pro jednoduchost zápisu vynecháme ω a spočítáme R = lim Rn pro pevné λ a pro lim |δ n | = 0.
n→∞
n→∞
Nejdřív upravíme součin (zkráceně budeme psát ±A namísto +A − A )
W (τk )(W (tk+1 ) − W (tk )) = W (τk )W (tk+1 ) − W (τk )W (tk ) =
1
1
1
= W (τk )W (tk+1 ) ± W 2 (τk ) ± W 2 (tk ) ± W 2 (tk+1 ) + W (τk )W (tk ) =
2
2
2
1
1
1
= − [W (tk+1 ) − W (τk )]2 + [W (τk ) − W (tk )]2 + [W 2 (tk+1 ) − W 2 (tk )]
2
2
2
Dále
Rn =
n−1
X
W (τk )(W (tk+1 ) − W (tk )) =
k=0
1
=−
2
n−1
X
n−1
n−1
1X
1X 2
[W (tk+1 ) − W (τk )] +
[W (τk )−W (tk )]2 +
[W (tk+1 )−W 2 (tk )] =
2
2
k=0
k=0
k=0
2
1
1
W 2 (T )
1
1
2
2
= − (1 − λ)T + λT + (W (T ) − W (0)) =
+ (λ − )T.
2
2
2
2
2
Poznámka. Vidíme, že tento součet závisí na volbě λ. Zvolíme-li za λ = 0, dostaneme tzv. Itôův integrál
Z T
W 2 (T ) T
W dW =
− ,
2
2
0
pro λ = 1/2 dostaneme tzv. Stratonovičův integrál
Z T
W 2 (T )
W ◦ dW =
.
2
0
25
2.3.1
Itôův integrál
Definice 2.3.2. Nechť je W (t, ω) Brownův pohyb na prostoru (Ω, A, P ) a nechť
filtrace F značí historii Brownova pohybu. Říkáme, že proces {G(t, ω), t ∈ h0, ∞)}
je souhlasný s F, jestliže pro každé t ≥ 0 je funkce ω → G(t, ω) Ft - měřitelná.
Definice 2.3.3. Označme Lp (0, T ), T > 0, 1 ≤ p < ∞ prostor reálných procesů
G(t, ω) na prostoru (Ω, A, P ) takových, že
(i) {G(t, ω), t ∈ h0, T )} je souhlasný s F,
(ii) (t, ω) → G(t, ω) je B × F- měřitelná, kde B je Borelovská σ-algebra na h0, T ),
hR
i
T
p
(iii) E 0 G (t, ω) dt < ∞.
Definice 2.3.4. Proces S ∈ L2 (0, T ) se nazývá jednoduchá funkce, jestliže existuje
dělení δ := {0 = t0 < t1 . . . < tm = T }, že
pro tk ≤ t < tk+1 (k = 0, . . . , m − 1).
S(t, ω) = Sk (ω)
Poznámka. Každá funkce Sk je Ftk - měřitelná.
Definice 2.3.5. Nechť S ∈ L2 (0, T ) je jednoduchá funkce. Pak
Z
T
S dW =
0
m−1
X
Sk (ω)(W (tk+1 , ω) − W (tk , ω))
k=0
se nazývá Itôův integrál funkce S na (0, T ).
Věta 2.3.6. (Itôova izometrie) Nechť S ∈ L2 (0, T ) je jednoduchá, omezená
funkce.
Potom
" Z
Z T
2 #
T
2
S (t, ω) dt .
=E
E
S(t, ω) dW (t, ω)
0
0
Důkaz: Označme ∆Wj = W (tj+1 , ω) − W (tj , ω).

!2 
" Z
2 #
m−1
T
X
=
S dW
=E
Sj ∆Wj
E
0
=E
" m−1
X
j=0
j=0
Sj2
m−1
X
2
(∆Wj ) + 2
i,j=0,i<j
26
#
Si Sj ∆Wi ∆Wj =
=
m−1
X
m−1
X
E Sj2 ∆Wj2 + 2
E[Si Sj ∆Wi ]E[∆Wj ] =
j=0
=
m−1
X
i,j=0,i<j
E[Sj2 ]
E[∆Wj2
]=
X
j=0
E[Sj2 ]
Z
(tj+1 − tj ) = E
T
2
S dt .
0
j
Věta 2.3.7. Nechť je G ∈ L2 (0, T ). Potom existuje posloupnost jednoduchých funkcí
Sn ∈ L2 (0, T ), taková, že
Z T
2
E
(G(t, ω) − Sn (t, ω)) dt → 0
pro n → ∞.
0
Definujeme Itôův integrál funkce G na (0, T ) předpisem
Z T
Z T
G(t, ω) dW (t, ω) = lim
Sn (t, ω) dW (t, ω).
n→∞
0
0
Tato limita existuje a nezávisí na volbě posloupnosti Sn . Navíc platí Itôova izometrie
" Z
2 #
Z T
T
2
E
G(t, ω) dW (t, ω)
=E
G (t, ω) dt .
0
0
Důkaz: Prostor jednoduchých funkci tvoří hustou podmnožinu prostoru L2 (0, T ) a
proto můžeme pomocí Itôovy izometrie rozšířit definici Itôova integrálu na všechny
funkce G ∈ L2 (0, T ). Přesný důkaz neuvádíme, pouze popíšeme myšlenku důkazu.
Nejdříve uvažujme případ, kdy funkce G(t) ∈ L2 (0, T ) je spojitá funkce pro skoro
všechna ω. Definujeme posloupnost jednoduchých funkci
n
n
n+1
pro
≤t<
, n = 0, . . . , celá část (kT ).
Sk (t) := G
k
k
k
Obecně, pro G(t) ∈ L2 (0, T ) definujeme
Z t
Gm (t) :=
mem(s−t) G(s) ds pro s.v. ω.
0
RT
Funkce Gm (t) ∈ L2 (0, T ) a jsou spojitá pro s. v. ω a 0 |Gm (t) − G(t)|2 dt → 0 s.v.
Teď můžeme aproximovat funkce Gm (t) jednoduchými funkcemi dle popsaného návodu.
Věta 2.3.8. Nechť F, G ∈ L2 (0, T ). Potom
RT
RT
RT
1. 0 (a G + b F ) dW = a 0 G dW + b 0 F dW pro a, b ∈ R
hR
i
T
2. E 0 G dW = 0
3.
RT
0
G dW je FT − měřitelná.
27
Důkaz: Je zřejmé, že věta platí pro jednoduché funkce z L2 (0, T ) a limitním přechodem dostaneme tvrzení.
Věta 2.3.9. Pro G ∈ L2 (0, T ) označme I(t) :=
Potom
Rt
0
G(s, ω) dW (s, ω), 0 ≤ t ≤ T.
(i.) I(t) je martingalem vzhledem k Ft .
(ii.) Existuje t-spojitá verze I(t).
Důkaz tohoto tvrzení neuvádíme. Je možné ho najít v [10] na stranách 31-33.
2.3.2
Itôova formule
Definice 2.3.10. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ) a nechť
X(t, ω) je stochastický proces na prostoru (Ω, A, P ), t > 0. Říkáme, že X(t, ω) je
Itôův proces, jestliže
Z t
Z t
X(t, ω) = X(0, ω) +
U (s, ω) ds +
V (s, ω) dW (s, ω),
0
0
kde U ∈ L1 (0, t), V ∈ L2 (0, t) a X(0, ω) je F0 −měřitelná.
Poznámka. Stručně říkáme, že X má stochastický diferenciál
dX(t) = U dt + V dW (t).
Věta 2.3.11. (Itôova formule) Nechť X(t) má stochastický diferenciál na intervalu h0, ti
dX(t) = U dt + V dW (t).
Nechť g(t, x) : (0, ∞) × R → R je dvakrát spojitě diferencovatelná funkce. Potom
Y (t) = g(t, X(t))
je také Itôův proces, a
dY (t) =
∂g
∂g
1 ∂2g
(t, X(t)) dt +
(t, X(t)) dX(t) +
(t, X(t))( dX(t))2 ,
∂t
∂x
2 ∂x2
kde ( dX(t))2 = ( dX(t)) · ( dX(t)) se počítá podle pravidel
dt · dt = dt · dW (t) = dW (t) · dt = 0, dW (t) · dW (t) = dt.
Důkaz: Nejdříve ukážeme, že Y (t) je Itôův proces. U každé funkce počítáme hodnotu v bodě (t, X(t)). Předpokládejme, že platí vzorec
dY (t) =
∂g
∂g
1 ∂2g
dt +
dX(t) +
( dX(t))2 ,
∂t
∂x
2 ∂x2
a dosaďme do tohoto vzorce dX(t) = U dt + V dW (t).
28
∂g
∂g
1 ∂2g
dY (t) =
dt+ (U dt+V dW (t))+
(U dt+V dW (t))2 =
∂t
∂x
2 ∂x2
+
∂g ∂g
+
U
∂t ∂x
dt
1 ∂2g
∂g
2
2
2
2
=
V dW (t) +
U
(
dt)
+
2U
V
dt
dW
(t)
+
V
(
dW
(t))
∂x
2 ∂x2
1 ∂2g 2
∂g
∂g ∂g
dt +
V dW (t).
=
+
U+
V
2
∂x
∂t ∂x
2 ∂x
|
{z
}
{z
}
|
∗
V
U∗
Ukázali jsme, že Y má stochastický diferenciál
dY (t) = U ∗ dt + V ∗ dW (t).
2
∂g
∂ g
2
Pro důkaz tvrzení, že dY (t) = ∂g
dt + ∂x
dX(t) + 12 ∂x
2 ( dX(t)) , použijeme Taylo∂t
rův rozvoj funkce Y (t) = g(t, X(t)). Bez újmy na obecnosti můžeme předpokládat,
∂g
∂2g
že funkce ∂g
, ∂x
a ∂x
jsou omezené. Obecnou, dvakrát spojitě diferencovatelnou
2
∂t
funkci g můžeme aproximovat posloupností funkcí gn , které jsou omezené a mají
omezené i příslušné derivace. Budeme také předpokládat, že funkce U a V jsou jednoduché funkce.
Mějme {0 = t0 < t1 . . . < tn = t} dělení intervalu h0, ti. Tam, kde argument
neuvádíme, počítáme hodnotu dané funkce v bodě (tj , X(tj )). Dle Taylorova vzorce
X
X ∂g
X ∂g
g(t, X(t)) = g(0, X(0)) +
∆g = g(0, X(0)) +
∆tj +
∆Xj +
∂t
∂x
j
j
j
+
X ∂2g
X
1 X ∂2g
1 X ∂2g
2
2
2
2
(∆t
)
+
∆t
∆X
+
(∆X
)
+
o
(
dt)
+
(∆X
)
,
j
j
j
j
j
2
2 j ∂t2
∂x∂t
2
∂x
j
j
j
kde ∆tj = tj+1 − tj , ∆Xj = X(tj+1 ) − X(tj ), ∆g = g(tj+1 , X(tj+1 )) − g(tj , X(tj )).
Jestliže ∆tj → 0, potom máme
X ∂g
j
∂t
∆tj =
X ∂g
j
∂t
Z
(tj , X(tj ))∆tj →
0
t
∂g
(s, X(s)) ds
∂t
podobně
X ∂g
j
∂x
Z
∆Xj →
0
t
∂g
(s, X(s)) dX(s).
∂x
Předpokládáme, že funkce U a V jsou jednoduché funkce, tedy
X ∂2g
X ∂2g
X ∂2g
X ∂2g
2
2
2
(∆X
)
=
U
(∆t
)
+2
U
V
(∆t
)(∆W
)+
V 2 (∆Wj )2 ,
j
j
j
j
j
j
2
2 j
2
2 j
∂x
∂x
∂x
∂x
j
j
j
j
kde Uj = U (tj ), Vj = V (tj ) a ∆Wj = W (tj+1 ) − W (tj ).
29
První dva členy konverguji k nule při ∆tj → 0 ve smyslu kvadratických středů:

!2 
"
2 #
2
X ∂2g
X
∂
g
(∆tj )4 → 0 pro ∆tj → 0.
U 2 (∆tj )2  =
E
U2
E
2 j
2 j
∂x
∂x
j
j

!2 
2
X∂ g
E
Uj Vj (∆tj )(∆Wj )
∂x2
j
=
X
"
E
j
∂2g
Uj Vj
∂x2
2 #
(∆tj )3 → 0 pro ∆tj → 0.
Zbývá dokázat, že
X ∂2g
∂x
j
V 2 (∆Wj )2
2 j
t
Z
→
0
∂2g 2
V ds pro ∆tj → 0.
∂x2
Pro zjednodušení zápisu zavedeme nové označení
∂2g A(t) =
t, X(t) V 2 (t),
2
∂x
Aj = A(tj ),
a uvažujme

!2 
X
X
X E
Aj (∆Wj )2 −
Aj ∆tj  =
E Ai Aj ((∆Wi )2 − ∆ti )((∆Wj )2 − ∆tj ) .
j
j
i,j
Pro i < j jsou Ai Aj ((∆Wi )2 − ∆ti ) a (∆Wj )2 − ∆tj nezávislé a proto v tomto
případě střední hodnota tohoto součinu se rovná součinu středních hodnot a to se
rovná nule. Podobně můžeme uvažovat i v případě kdy i > j. Tak nám zůstává
X X 2 E A2j ((∆Wj )2 − ∆tj )2 =
E Aj E ((∆Wj )4 − 2(∆Wj )2 ∆tj + (∆tj )2 )
j
=
X
j
X E A2j (3(∆tj )2 −2(∆tj )2 +(∆tj )2 ) = 2
E A2j ((∆tj )2 ) → 0 pro ∆tj → 0.
j
j
Jinými slovy jsme právě dokázali, že
Z t
X
2
Aj (∆Wj ) →
A(s) ds pro
j
∆tj → 0,
0
což je vlastně vztah, který zkráceně píšeme
( dW (t))2 = dt.
P
Z toho vztahu také vyplývá, že j o ((∆tj )2 + (∆Xj )2 ) → 0 pro ∆tj → 0.
Tím je dokázaná Itôova formule.
30
Věta 2.3.12. (Multidimensionální Itôova formule)
Nechť W(t, ω) = (W1 (t, ω), . . . , WM (t, ω)) označuje M-dimensionální Wienerův proces a nechť stochastický proces X(t, ω) = (X1 (t, ω), . . . , XN (t, ω)) je N-dimenzionální
Itôův proces
Z
dX(t, ω) = X(0, ω) +
t
U(s, ω) ds +
0
M Z
X
j=1
t
Vj (s, ω) dWj (s, ω)
0
kde U, V jsou vektorové funkce, jejichž složky splňují podmínky z definice 2.3.10.
Nechť g(t, x) : (0, ∞)×RN → RP je dvakrát spojitě differencovatelná funkce. Potom
Y(t) = g(t, X(t)) = (g1 (t, X(t)), . . . , gP (t, X(t)))
je stochastický proces, jehož k−tá složka je dána rovnicí
dYk =
X ∂gk
∂gk
1 X ∂ 2 gk
(t, X) dt +
(t, X) dXi +
(t, X)( dXi )( dXj ),
∂t
∂xi
2 i,j ∂xi ∂xj
i
kde dXi · dXj se počítá podle pravidel
dt · dt = dt · dWi = dWi · dt = 0,
2.4
dWi · dWj = δi,j dt.
Stochastické diferenciální rovnice
Uvažujme prostor (Ω, A, P ) s neklesající soustavou σ-algeber F = {Ft , t ≥ 0}, na
kterém je definován Wienerův proces W (t) vzhledem k F. Předpokládejme, že každé
Ft obsahuje všechny P −nulové množiny z A. Budeme se zabývat stochastickými diferenciálními rovnicemi na intervalu h0, T i, 0 < T < ∞.
Itôovou stochastickou diferenciální rovnici (Itô SDR) rozumíme rovnici
dX(t) = A(t, X(t)) dt + B(t, X(t)) dW (t),
X(t0 ) = X0
kde funkce A : h0, T i×R → R se nazývá koeficient driftu a funkce B : h0, T i×R → R
se nazývá difuzní koeficient. Itô SDR je ve skutečnosti integrální rovnice
Z t
Z t
B(s, X(s)) dW (s),
A(s, X(s)) ds +
X(t) = X0 +
t0
t0
kde první integrál je Lebesgueův a druhý integrál je Itôův.
31
Když v stochastické diferenciální rovnici uvažujeme na místo Itôova integrálu Stratonovičův, dostaneme Stratonovičovu stochastickou diferenciální rovnici (Stratonovič SDR), kterou můžeme symbolicky zapsat takto:
dX(t) = A(t, X(t)) dt + B(t, X(t)) ◦ dW (t),
X(t0 ) = X0 .
Integrální interpretace této rovnice je
Z t
Z t
X(t) = X0 +
A(s, X(s)) ds +
B(s, X(s)) ◦ dW (s),
t0
t0
kde první integrál je Lebesgueův a druhý integrál je Stratonovičův.
Itô SDR a Stratonovič SDR se stejnými koeficienty nedají obecně stejná řešení. Platí
však, že řešení X(t) Itô SDR
Z t
Z t
X(t) = X0 +
A(s, X(s)) ds +
B(s, X(s)) dW (s),
t0
t0
splňuje modifikovanou Stratonovič SDR
Z t
Z t
B(s, X(s)) ◦ dW (s),
X(t) = X0 +
A(s, X(s)) ds +
t0
t0
1
∂B
(t, x).
kde koeficient A(t, X(t)) = A(t, X(t)) − B(t, X(t))
2
∂x
2.4.1
Existence a jednoznačnost řešení
Definice 2.4.1. Nechť W(t) = (W1 (t), . . . , WM (t)) značí M-dimensionalní Wienerův proces a funkce A : h0, T i×RN → RN , B : h0, T i×RN → RN ×M jsou měřitelné.
Říkáme, že na intervalu h0, T i je proces X(t) = (X1 (t), . . . , XN (t)) silným řešením
stochastické diferenciální rovnice
dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t),
X(0) = X0
jestliže proces X(t) je souhlasný s F M a pro všechna t ∈ h0, T i
Z t
Z t
X(t) = X0 +
A(s, X(s)) ds +
B(s, X(s)) dW(s) s.v.
0
0
Poznámka. Symbolem F M jsme označujeme σ-algebru generovanou procesem
W(t) = (W1 (t), . . . , WM (t)).
Věta 2.4.2. Nechť je T > 0, proces W(t) je M-dimensionální Wienerův proces a
funkce A : h0, T i × RN → RN , B : h0, T i × RN → RN ×M jsou měřitelné, pro které
platí:
32
(i) Existuje konstanta K > 0 taková, že
|A(t, x) − A(t, y)| + |B(t, x) − B(t, y)| ≤ K|x − y|
pro každé t ∈ h0, T i a x,y ∈ RN .
(ii) Existuje konstanta L > 0 taková, že
|A(t, x)| + |B(t, x)| ≤ L(1 + |x|)
pro každé t ∈ h0, T i a x ∈ R.
(iii) X0 je F0M -měřitelná náhodná veličina a E [ |X0 |2 ] < ∞.
Potom stochastická diferenciální rovnice
dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t),
X(0) = X0
má jednoznačné t-spojité silné řešení X(t), pro které
Z T
2
E
|X(t)| dt < ∞.
0
Poznámka. Ve (iii) můžeme nahradit podmínku F0M -měřitelnosti X0 podmínkou,
že X0 je nezávislá na F M .
Důkaz: Nejdříve dokážeme jednoznačnost. Nechť procesy X(t) a X̃(t) jsou dvě
silná řešení.
Z t
Z t
B(s, X(s)) − B(s, X̃(s)) dW(s)
A(s, X(s)) − A(s, X̃(s)) ds +
X(t) − X̃(t) =
0
0
Z nerovnosti (a + b)2 ≤ 2a2 + 2b2 dostaneme
"Z
2 #
t
E[|X(t) − X̃(t)|2 ] ≤ 2E A(s, X(s)) − A(s, X̃(s)) ds +
0
"Z
2 #
t
+2E B(s, X(s)) − B(s, X̃(s)) dW(s) .
0
Dle Cauchy-Schwartzovy nerovnosti platí, že
Z t
2 Z t Z t
2
A(s, X(s)) − A(s, X̃(s)) ds ≤
ds
|A(s, X(s)) − A(s, X̃(s))| ds ,
0
0
0
"Z
2 #
Z t
t
2
E A(s, X(s)) − A(s, X̃(s)) ds ≤ t · E
|A(s, X(s)) − A(s, X̃(s))| ds .
0
0
33
Na druhý sčítanec použijeme Itôovou izometrii. Přidáme-li podmínku (i.) dostaneme
Z t
2
2
E[|X(t) − X̃(t)| ] ≤ 2t · E
|A(s, X(s)) − A(s, X̃(s))| ds +
0
Z t Z t
2
+2E
E[|X(s) − X̃(s)|2 ] ds.
B(s, X(s)) − B(s, X̃(s)) d(s) ≤ C
0
0
2
Existuje tedy kladná konstanta
R t C > 0 taková, že funkce v(t) = E[|X(t) − X̃(t)| ]
splňuje nerovnost v(t) ≤ C 0 v(s) ds < ∞. Z Gronwallova lematu dostaneme, že
v(t) = E[|X(t) − X̃(t)|2 ] = 0. Uvážíme-li navíc, že řešení jsou spojitá, dostaneme
X(t) = X̃(t) s.v. pro každé t ∈ h0, T i. Ukázali jsme, že
P |X(t) − X̃(t)| = 0 pro všechna t ∈ h0, T i = 1.
Teď dokážeme existenci řešení metodou Picardových aproximací podobně jako se dokazuje existence řešení obyčejných diferenciálních rovnic. Definujme pro n = 0, 1, . . .
X0 (t) := X0
n+1
X
Z
(t) := X0 +
t
Z
n
t
B(s, Xn (s)) dW(s),
A(s, X (s)) ds +
0
0
pro t ∈ h0, T i. Definujme také
h
2 i
n+1
n
d (t) = E X (t) − X (t) .
n
Tvrdíme, že pro každé n = 0, 1, . . . a t ∈ h0, T i platí
dn (t) ≤
(M t)n+1
,
(n + 1)!
kde konstanta M závisí na X0 a na konstantách z podmínek věty.
Toto tvrzení dokážeme indukcí: Pro n = 0 zřejmě platí
h
2 i
d0 (t) = E X1 (t) − X0 (t) =
"Z
2 #
Z t
t
= E A(s, X0 (s)) ds +
B(s, X0 (s)) dW(s)
0
0
"Z
#
Z t
t
2
0
0
2
≤ 2E L(1 + |X (s)|) ds + 2E
|B(s, X (s))| ds
0
0
Z t Z t
2 2
2
≤ 2E
L (1 + |X0 |) ds ≤ M t,
L(1 + |X0 |) ds + 2E
0
0
2
pro M > 4L2 (1 + |X0 |) .
34
Teď předpokládejme, že tvrzení platí pro n − 1 a odhadneme dn (t), podobně jako v
důkazu jednoznačnosti.
h
2 i
dn (t) = E Xn+1 (t) − Xn (t) =
"Z
2 #
Z t
t
B(s, Xn (s)) − B(s, Xn−1 (s)) dW(s)
E A(s, Xn (s)) − A(s, Xn−1 (s)) ds +
0
0
"Z
2 #
Z t
n
2
t
n−1
n
n−1
2
X (s) − X (s) ds
≤ 2E K(X (s) − X (s)) ds + 2K E
0
0
≤ 2T K 2
t
Z
h
2 i
E Xn (s) − Xn−1 (s) ds + 2K 2
0
Z
t
h
2 i
E Xn (s) − Xn−1 (s) ds
0
≤ 2K 2 (1 + T )
t
Z
(M t)n+1
(M s)
ds ≤
,
n!
(n + 1)!
n
0
2
za předpokladu, že M ≥ 2K (1 + T ).
Dále odhadneme
sup Xn+1 (t) − Xn (t) ≤
0≤t≤T
Z
T
A(s, Xn (s)) − A(s, Xn−1 (s)) ds
0
Z t
n
n−1
+ sup B(s, X (s)) − B(s, X (s)) dW(s) .
0≤t≤T
0
Použijeme již dokázanou nerovnost, Doobovu martingalovu nerovnost, Itôovou izometrii a podmínky věty
P Xn+1 (t) − Xn (t) > 2−n ≤ P
Z
T
A(s, Xn (s)) − A(s, Xn−1 (s)) ds
2
!
> 2−2n−2
0
Z t
n
n−1
−n−1
+P sup B(s, X (s)) − B(s, X (s)) dW(s) > 2
0≤t≤T
0
Z T h
2 i
2n+2
≤2
T
E A(s, Xn (s)) − A(s, Xn−1 (s)) ds
0
+22n+2
Z
T
h
2
E B(s, Xn (s)) − B(s, Xn−1 (s)) ds]
0
≤ 22n+2 K 2 T
Z
T
Z
h
2 i
n
n−1
2n+2
2
E X (s) − X (s) ds+2
K
0
≤ 22n+2 K 2 (T + 1)
T
h
2
E Xn (s)) − Xn−1 (s) ds]
0
Z
0
T
(4DT )n+1
(M s)n
ds ≤
(n)!
(n + 1)!
35
pro D ≥ K 2 (T + 1).
Dále z Borel-Cantelliho lematu plyne, že
P Xn+1 (t) − Xn (t) > 2−n pro nekonečně mnoho n = 0,
a tak pro s.v. ω existuje n0 = n0 (ω) takové, že
sup Xn+1 (t) − Xn (t) ≤ 2−n
pro n ≥ n0 .
0≤t≤T
Proto posloupnost
Xn (t) = X0 (t) +
n−1
X
Xk+1 (t) − Xk (t)
k=0
konverguje stejnoměrně na h0, T i, pro s.v. ω. Označme limitu této posloupnosti X(t).
Tato funkce je spojitá v t pro s.v. ω a je také FtM −měřitelná, protože Xn (t) jsou
spojitá a FtM −měřitelné pro každé n.
Pro m > n ≥ 0 máme

!2 
m−1
X

E |Xm (t) − Xn (t)|2 = E 
Xk+1 (t) − Xk (t)
k=n
h
X (M t)k+1 2 i m−1
k+1
k
≤
E X (t) − X (t) ≤
→ 0 pro n → ∞.
(k
+
1)!
k=n
k=n
m−1
X
Můžeme tedy vybrat podposloupnost z posloupnosti Xn (t), která bude konvergovat
bodově k X(t). Proces X(t) je souhlasný s F M a platí, že
Z T
2
E
|X(t)| dt < ∞.
0
Díky stejnoměrné konvergenci můžeme přejít k limitě pro n → ∞ v definici Xn (t) a
tím dokážeme, že X(t) splňuje rovnici
Z t
Z t
X(t) = X0 +
A(s, X(s)) ds +
B(s, X(s)) dW(s) s.v.
0
2.4.2
0
Některé typy rovnic a jejich metody řešení
Definice 2.4.3. Stochastická diferenciální rovnice
dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t)
se nazývá lineární, jestliže pro koeficienty rovnice platí
A(t, x) := C(t) + D(t) x,
36
B(t, x) := E(t) + F(t) x
kde funkce C : h0, T i × RN → RN , D : h0, T i → RN ×N , E : h0, T i → RN ×M
a F : h0, T i × RN → RN ×M .
Poznámka. Předpoklady na koeficienty rovnice ve větě o existenci a jednoznačnosti
jsou splněny, pokud platí
sup |C(t)| + |D(t)| + |E(t)| + |F(t)| < ∞,
0≤t≤T
a tak pro X0 F0M -měřitelnou náhodnu veličinu s E [ |X0 |2 ] < ∞ má lineární diferenciální rovnice
dX(t) = C(t) + D(t)X(t) dt + E(t) + F(t)X(t) dW(t), X(0) = X0
jednoznačně určené silné rešení.
Příklad 2.4.4. Lineární diferenciální rovnice typu
dX(t) = C(t) + D(t)X(t) dt + E(t) dW(t),
X(0) = X0
má řešení
Z t
Φ−1 (s)(C(s) ds + E(s) dW(s)) ,
dX(t) = Φ(t) X0 +
0
kde Φ(·) je fundamentální matice řešení systému obyčejných diferenciálních rovnic
dΦ
= D(t)Φ,
dt
Φ(0) = I.
Formálně můžeme tento vzorec zdůvodnit tím, že rovnice z příkladu vznikla jako
stochastizace obyčejné lineární, nehomogenní rovnice
Ẋ(t) = D(t)X(t) + C(t) + E(t)ξ,
X(0) = X0
kde ξ značí bílý šum. Řešením této rovnice s nehomogenním členem C(t) + E(t)ξ
získáme vzorec.
Poznámka. Řešení lineární rovnice s aditivním šumem, kdy F(t) ≡ 0, je Gaussův
proces, pokud náhodná veličina X0 má normální rozdělení.
Příklad 2.4.5. Uvažujme stochastickou diferenciální rovnici typu
dX(t) = A(t, X(t)) dt + B(t)X(t) dW (t),
kde A : R × R → R a B : R → R jsou spojité funkce.
37
X(0) = X0 ,
Při řešení této rovnice můžeme postupovat následovně:
1. krok Definujeme integrační faktor F (t) jako
F (t) = e(−
Rt
0
B(s) dW (s)+ 12
Rt
0
B 2 (s) ds)
.
2. krok Pomocí Itôovy formule vypočítáme, že
d (F (t) · X(t)) = F (t) · A(t, X(t)) dt.
3. krok Definujeme funkci
Y (t) = F (t) X(t),
a pak
X(t) = F −1 (t) Y (t),
kde funkci Y (t) získáme jako řešení obyčejné diferenciální rovnice
dY (t)
= F (t) · A(t, F −1 (t) Y (t)),
dt
2.5
Y (0) = X0 .
Numerické řešení stochastických diferenciálních rovnic
Při odvozování numerických metod pro řešení stochastických diferenciálních rovnic
musíme dbát nato, aby naše metoda byla v souladu s definicí stochastického integrálu. Při hledání konkrétní trajektorie řešení dané rovnice hledáme vždy řešení
vzhledem k dané trajektorii Wienerova procesu, které generujeme pro každé řešení zvláště. V případě, kdy uvažujeme numerickou metodu s krokem ∆n , přírůstky
Wienerova procesu ∆Wn jsou N (0, ∆n ) Gaussovské náhodné veličiny, navzájem nezávislé. Numerická metoda nám určí aproximaci řešení v diskrétních časových hodnotách. Potřebujeme-li spojitou aproximaci řešení, použijeme interpolační metody.
Nejjednodušší je lineární interpolace.
Abychom mohli posoudit kvalitu metody, musíme definovat příslušné kritérium,
které by mělo vycházet z praktických požadavků na stochastickou numerickou metodu.
V některých případech testujeme statistické vlastnosti řešení a potřebujeme co nejpřesnější aproximaci jednotlivých trajektorií. Používáme tzv. silné metody s co nejlepším silným řádem konvergence.
Definice 2.5.1. Říkáme, že metoda má silný řád konvergence γ, jestliže platí:
E[|X(T ) − X ∆ (NT )|] ≤ KT ∆γ ,
38
kde X značí přesné řešení stochastické diferenciální rovnice, X ∆ (NT ) je příslušná
aproximace v čase T, a ∆ = max ∆n .
0≤n≤NT
V mnoha praktických aplikacích dostaneme přesné řešení stochastické diferenciální
rovnice které nelze vyjádřit pomocí analytických funkci, někdy dokonce ani neumíme přesné řešení najít. V takových případech potřebujeme co nejlépe aproximovat střední hodnotu a další momenty řešení. K tomuto účelu definujeme slabý řád
konvergence a používáme tzv. slabé metody.
Definice 2.5.2. Říkáme, že metoda má slabý řád konvergence β, jestliže pro každý
polynom g existuje konstanta KT taková, že platí:
|E[g(X(T ))] − E[g(X ∆ (NT ))]| ≤ KT ∆β .
Poznámka. Různou volbou polynomu dostaneme konvergenci různých momentů
řešení. V případě g(x) = x dostaneme konvergenci středních hodnot, pro g(x) = x2
zase konvergenci rozptylů aproximací řešení.
Platí, že
E[X(T )] − E[X ∆ (NT )] ≤ E |X(T ) − X ∆ (NT )| ,
a proto ze silné konvergence plyne slabá konvergence středních hodnot.
Poznámka. Některé metody pro SDR byli odvozeny ze schémat pro numerická
řešení obyčejných diferenciálních rovnic. Jako příklad takové metody uvádíme Eulerovou metodu. Jiné využívají více informace o Wienerově procesu, například Milsteinova metoda.
2.5.1
Stochastická Eulerova metoda
Uvažujme Itôovu N -dimenzionální stochastickou diferenciální rovnici s M - dimenzionálním Wienerovým procesem na intervalu h0, T i, T > 0
dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t),
X(0) = X0 ,
kde A a B jsou spojité vektorové funkce. Když tuto rovnici napíšeme po složkách,
pak i-tá rovnice má tvar
dXi (t) = Ai (t, X(t)) dt +
M
X
Bi,j (t, X(t)) dWj (t).
j=1
Nechť 0 = t0 < t1 < . . . < tN = T , pak Eulerova metoda pro i-tou složku rovnice je
definováná předpisem:
Xin+1
=
Xin
n
+ Ai (tn , X )∆n +
M
X
Bi,j (tn , Xn )∆Wjn ,
j=1
kde ∆n = tn+1 − tn =
R tn+1
tn
ds a ∆Wjn = Wj (tn+1 ) − Wj (tn ) =
39
R tn+1
tn
dWj (s).
Tato metoda je v souladu s definicí Itôova integrálu, při které se integrální součty
počítají z funkčních hodnot integrované funkce v levém krajním bodě subintervalu.
Aproximace řešení pomocí Eulerovy metody při zmenšujícím se ∆n konverguje k
přesnému Itôovu řešení, tato konvergence však není příliš rychlá.
Stochastická Eulerova metoda má silný řád konvergence γ =
gence β = 1.
2.5.2
1
2
a slabý řád konver-
Stochastická Milsteinova metoda
Přírůstky ∆Wjn neposkytují dostatek informací o Wienerově procesu uvnitř intervalu (tn , tn+1 ). Když chceme vylepšit řád konvergence numerické metody musíme
použit vícenásobné integrály dle Wj (t). Příkladem takové metody je Milsteinova
metoda.
Definujeme Milsteinovu metodu pro i-tou složku N - dimenzionální Itôové stochastické diferenciální rovnice s M - dimenzionálním Wienerovým procesem na intervalu
h0, T i, T > 0 předpisem:
Xin+1 = Xin + Ai (tn , Xn )∆n +
M
X
Bi,j (tn , Xn )∆Wjn +
j=1
M
X
+
j1
n
Z
tn+1
Z
t
L Bi,j2 (tn , X )
tn
j1 ,j2 =1
dWj1 (s) dWj2 (t)
tn
Rt
kde ∆n = tn+1 − tn ,
∆Wjn = Wj (tn+1 ) − Wj (tn ) = tnn+1 dWj (s), a pro
j = 1, . . . , M je operator
N
X
∂
j
.
L =
Bi,j
∂xi
i=1
Rt Rt
Dvojný integrál tnn+1 tn dWj1 (s) dWj2 (t) můžeme pro j1 = j2 vyjádřit pomocí
přírůstků ∆n a ∆Wjn1 :
Z tn+1 Z t
Z tn+1
dWj1 (s) dWj1 (t) =
(Wj1 (t) − Wj1 (tn )) dWj1 (t) =
tn
tn
tn
Z
tn+1
Z
tn+1
Wj1 (t) dWj1 (t) − Wj1 (tn )
=
tn
dWj1 (t) =
tn
Wj21 (tn+1 ) − Wj21 (tn ) ∆n
−
− Wj1 (tn ) (Wj1 (tn+1 ) − Wj1 (tn )) =
2
2
Wj21 (tn+1 ) + Wj21 (tn ) − 2Wj1 (tn )Wj1 (tn+1 ) ∆n
(∆Wjn1 )2 − ∆n
=
−
=
2
2
2
Pro j1 6= j2 to nelze a proto musíme zkoumat statistické vlastnosti dvojného integrálu a naprogramovat to jako nový stochastický proces.
=
40
Stochastická Milsteinova metoda má silný řád konvergence γ = 1 a slabý řád konvergence β = 1.
Poznámka. Při numerickém řešení Itô SDR s difuzním koeficientem B(t, x) = B(t)
se shoduje Milsteinova metoda s Eulerovou metodou, tzn. pro rovnici s aditivním
šumem má Eulerova metoda silný řád konvergence γ = 1.
Příklad 2.5.3. Znázorníme Milsteinovu metodu na dvourozměrné Itôové stochastické differenciální rovnici:
dX(t) = −0.5 X(t) dt + Y (t) dW (t),
dY (t) = −0.5 Y (t) dt − X(t) dW (t),
X(0) = 0,
Y (0) = 1.
Můžeme získat analytické řešení této rovnice pomocí klasického kalkulu, když rovnici
převedeme na Stratonovičovu rovnici, která v tomto případě má tvar
dX(t) = Y (t) ◦ dW (t),
dY (t) = −X(t) ◦ dW (t),
X(0) = 0,
Y (0) = 1.
Vidíme, že X(t) = sin W (t) and Y (t) = cos W (t) bude řešením Stratonovičovy rovnice a potom i příslušné Itôovy rovnice.
Aproximace X a Y na h0, 1i Eulerovou metodou:
X n+1 = X n − 0.5 X n ∆n + Y n ∆W n ,
X 0 = 0,
Y n+1 = Y n − 0.5 Y n ∆n − X n ∆W n ,
Y 0 = 1.
Obr.1 Eulerovy aproximace analytického řešení X(t) = sin(W (t)) a Y (t) = cos(W (t))
Aproximace X a Y na h0, 1i Milsteinovou metodou:
X n+1 = X n − 0.5 X n ∆n + Y n ∆W n − 0.5 X n ((∆W n )2 − ∆n ),
X 0 = 0,
Y n+1 = Y n − 0.5 Y n ∆n − X n ∆W n − 0.5 Y n ((∆W n )2 − ∆n ),
Y 0 = 1.
Fig.2 Milsteinovy aproximace analytického řešení sin(W (t)) a cos(W (t))
41
2.5.3
Aproximace střední hodnoty stochastického řešení
V některých případech nevyžadujeme od numerické metody co nejpřesnější aproximaci jednotlivých trajektorii, ale potřebujeme odhadnout pouze střední hodnotu
µ = E[XT ] řešení stochastické diferenciální rovnice v bodě T > 0. V takových případech postupujeme tak, že pomocí některé numerické metody spočítáme několik
trajektorii řešení a µ = E[XT ] vyjádříme například jako aritmetický průměr získaných trajektorii.
Pro lepší aproximaci střední hodnoty řešení, včetně výpočtu intervalu spolehlivosti
můžeme použit následující metodu. Naše trajektorie uspořádáme do L skupin po K
trajektoriich. Střední hodnotu chyby v l-té skupině spočítáme ze vzorce
K
1 X
µl =
YT,k,l − E[XT ]
K k=1
pro l = 1 . . . L, a jejích průměr
L
L
K
1X
1 XX
µl =
YT,k,l − E[XT ].
µ=
L l=1
LK l=1 k=1
Podobně, variaci skupinových průměru µl dostaneme ze vztahu
L
σµ2 =
1 X
(µl − µ)2
L − 1 l=1
a potom můžeme určit 100(1 − α) interval spolehlivosti střední hodnoty chyby µ ze
Studentova t-rozdělení o L − 1 stupních volnosti
r
r !
σµ2
σµ2
µ − t1−α,L−1
, µ + t1−α,L−1
.
L
L
Odhadnuta střední hodnota je ve skutečnosti jenom aproximaci E[XT ]. Přesnost
této aproximace závisí také na numerické metodě, pomocí které jsme simulovali
jednotlivé trajektorie řešení.
42
Literatura
[1] L. Arnold: Stochastic Differential Equations: Theory and Applications, John
Wiley & Sons, 1974.
[2] J. Anděl: Matematická statistika, SNTL, Praha, 1985
[3] S. Cyganowski, P. Kloeden, J. Ombach: From Elementary Probability to Stochastic Differential Equations with Maple, Springer-Verlag, 2002
[4] L. Evans: An introduction to stochastic differential equations, notes for Mathematics 195 at UC Berkley, 2001
[5] D. Halliday, R. Resnick, J. Walker: Fyzika, Část 3.- Elektřina a magnetizmus,
VUT Brno, VUTIUM, 2000
[6] Y. Kamarianakis, N. Frangos: Deterministic and stochastic differential equation
modelling for electrical networks, HERCMA (Hellenic and European Research
in Computational Mathematics) Conference, Athens University of Economics
& Business, 2001
[7] P. Kloeden, E. Platen, H. Schurz: Numerical Solution Of SDE Through Computer Experiments, Springer-Verlag, 1997
[8] P. Mandl: Stochastické integrály a jejich aplikace, Praha, 1976
[9] S. M. Steele: Stochastic Calculus and Financial Applications, Springer-Verlag
New York Inc., 2001
[10] B. Øksendal: Stochastic Differential Equations, An Introduction with Applications, Springer-Verlag, 1995
[11] Cs. Török: Visualization and Data Analysis in the MS .NET Framework, Communication of JINR, Dubna, 2004, E10-2004-136
[12] Cs. Török et al.: Professional Windows GUI Programming: Using C#, Chicago:
Wrox Press Inc, 2002, ISBN 1-861007-66-3
56

Podobné dokumenty

Stochastický integrál podle Wienerova procesu Jitky Kostkové

Stochastický integrál podle Wienerova procesu Jitky Kostkové V p°edkládané bakalá°ské práci se autorka zabývá úvodními partiemi stochastické analýzy a aplikacemi tohoto aparátu na vybrané modely z ekonomie, fyziky a biologie. Úst°edním pojmem je zde Wiener·v...

Více

T - MFFBorec

T - MFFBorec Tvrzení: Nechť M t je Q-martingalový proces, jehož volatilita σ t je s pravděpodobností 1 nenulová. Nechť N t je nějaký jiný Q-martingalový proces. Pak existuje neanticipativní

Více

Bližší informace o studijním programu

Bližší informace o studijním programu Profil absolventa a cíle studia Obor je zaměřen na studium ekonomických teorií, které spočívají v dynamickém přístupu k ekonomickým jevům. Tato nová metodologie nezachovává striktně lineární postup...

Více

Mechanika pro bakaláře

Mechanika pro bakaláře • antisymetrický tenzor splňuje podmínku aij = −aji , ze které plyne a11 = a22 = a33 = 0 (prvky na diagonále jsou nulové), což omezuje počet nezávislých a nutných složek na tři.

Více

Pravděpodobnost

Pravděpodobnost Míra, pravděpodobnostní míra, pravděpodobnostní prostor Definice (Míra a pravděpodobnostní míra) Mějme σ-algebru F ⊆ 2Ω . Každé zobrazení m : F → R ∪ {∞} splňující m(A) ≥ 0 pro každou A ∈ F, m(∅) ...

Více

Vliv rychlosti na bezpečnost silničního provozu

Vliv rychlosti na bezpečnost silničního provozu s fyzikálním zákonem o zachování kinetické energie, kterou je potřeba při nárazu pohltit. Tato energie je úměrná druhé mocnině rychlosti. Většina kinetické energie je vstřebána lehčím srážkovým „op...

Více

1. Úvod 1.1. Prostor elementárnıch jevu, algebra

1. Úvod 1.1. Prostor elementárnıch jevu, algebra Definice 32. Bud’ X náhodná veličina. Potom definujeme FX : R 7→ R, FX (x) = P (X ≤ x) pro každé x ∈ R. Věta 33. Bud’ X náhodná veličina, FX distribučnı́ funkce. Pak (1) x1 ≤ x2 =⇒ FX (x1...

Více