Pravděpodobnost a statistika

Transkript

Pravděpodobnost a statistika
Pravděpodobnost a statistika
Spojité náhodné veličiny
Vilém Vychodil
KMI/PRAS, Přednáška 7
Vytvořeno v rámci projektu 2963/2011 FRVŠ
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
1 / 60
Přednáška 7: Přehled
1
Lebesgueův integrál:
indikátorová funkce, Lebesgueův integrál nezáporné Borelovské funkce,
absolutní spojitost, základní věta Lebesgueova integrálního počtu,
vztah Lebesgueova a Riemannova integrálu,
funkce hustoty.
2
Spojité náhodné veličiny:
pravděpodobnostní míra indukovaná funkcí hustoty,
(absolutně) spojitá náhodná veličina,
očekávané hodnoty, střední hodnota, rozptyl, směrodatná odchylka,
percentily, kvartily, medián.
3
Základní rozdělení spojitých náhodných veličin:
empirické rozdělení, uniformní rozdělení,
exponenciální rozdělení, Erlangovo rozdělení,
gama funkce, gama rozdělení.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
2 / 60
Opakování
Definice (Lebesgueova míra Borelovských množin)
Zobrazení m : B → R ∪ {∞}, které zobrazuje každý interval na jeho délku, to jest
m (a, b) = m [a, b) = m (a, b] = m [a, b] = b − a,
a které je navíc σ-aditivní, se nazývá Lebesgueova míra.
Definice (Borelovská funkce)
Funkce f : R → R se nazývá Borelovská funkce, pokud pro každé a ∈ R platí, že
{x ∈ R | f (x) ≤ a} je Borelovská množina.
Motivace:
m na B ∩ 2[0,1] je pravděpodobnostní míra;
budeme se snažit využít m k definici obecnějších pravděpodobnostních měr.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
3 / 60
Indikátorová funkce
V dalším výkladu použijeme následující pomocný pojem:
Definice (Indikátorová funkce / charakteristická funkce)
Mějme množinu A ⊆ R. Zobrazení 1A : R → R definované
1 pokud x ∈ A,
1A (x) =
0 jinak,
se nazývá indikátorová funkce množiny A, angl.: indicator function.
Poznámky:
platí: B je Borelovská množina právě tehdy, když 1B je Borelovská funkce;
(jednoduše vidět: důsledek faktu, že {x ∈ R | 1B (x) ≤ 0.5} = R − B)
například Dirichletova funkce 1Q (všude nespojitá funkce) je Borelovská;
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
4 / 60
Definice (Lebesgueův integrál nezáporných Borelovských funkcí)
Nechť m je Lebesgueova míra Borelovských množin. Pak Lebesgueův integrál je
zobrazení, které každé nezáporné Borelovské funkci f : R → [0, ∞) přiřazuje číslo
Z
f dm ∈ R ∪ {∞}
tak, že pro každé c ∈ [0, ∞), každou Borelovskou množinu B ⊆ R a libovolné
nezáporné Borelovské funkce f, g, fn (n = 1, 2, . . . ) platí:
R
1
1B dm = m(B);
R
R
R
R
R
2
(f + g) dm = f dm + g dm a cf dm = c f dm;
(linearita)
R
R
3
pokud fn % f , pak fn dm % f dm.
(monotonní konvergence)
Poznámka:
an % b značí, že a1 , a2 , . . . je neklesající posloupnost a limn→∞ an = b;
fn % f značí, že pro každé x ∈ R platí fn (x) % f (x).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
5 / 60
Absolutní spojitost
Definice (Absolutní spojitost)
Funkce f : R → R se nazývá absolutně spojité (angl.: absolutely continuous)
pokud pro každé ε > 0 existuje δ > 0 tak, že pro každou konečnou posloupnost
(x1 , y1 ), . . . , (xn , yn ) disjunktních intervalů (xi , yi ) ⊆ R platí, že
Pn
Pn
pokud
i=1 |yi − xi | < δ, pak
i=1 |f (yi ) − f (xi )| < ε.
Další typy spojitosti:
spojitost (pro každé y ∈ R platí: pro každé ε > 0 existuje δ > 0 tak, že pro
libovolné x ∈ R takové, že |y − x| < δ, platí |f (y) − f (x)| < ε);
stejnoměrná spojitost (pro každé ε > 0 existuje δ > 0 tak, že pro libovolná
x, y ∈ R platí: pokud |y − x| < δ pak |f (y) − f (x)| < ε).
Vztahy pojmů spojitosti:
absolutní spojitost (nejsilnější) =⇒ stejnoměrná spojitost =⇒ spojitost (nejslabší)
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
6 / 60
Příklad (Cantorova funkce není absolutně spojitá)
Uvažujme posloupnost funkcí f0 , f1 , . . . , kde f0 je identita a pro libovolné n ≥ 1 je
funkce fn vyjádřena pomocí fn−1 následujícím předpisem:
1
1
f
(3x)
pro
x
∈
0, ,

n−1
2
1 32 1
pro x ∈ 3 , 3 ,
fn (x) = 2

3 1
1
f
(3x
−
2)
+
pro
x
∈
,1 .
n−1
2
2
2
Pak funkce f , pro kterou fn % f , se nazývá Cantorova funkce:
1
f je spojitá ve všech bodech z intervalu [0, 1],
f má nulovou derivaci ve všech bodech z intervalu
[0, 1] s výjimkou spočetně mnoha bodů,
f je spojitá (stejnoměrně) na intervalu [0, 1],
f není absolutně spojitá.
3
4
1
2
1
4
1
9
2
9
1
3
4
9
5
9
2
3
7
9
8
9
1
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
7 / 60
Vlastnosti Lebesgueova integrálu
Věta (Základní věta Lebesgueova integrálního počtu)
Nechť f : R → R je reálná funkce. Pak jsou následující tvrzení ekvivalentní:
1
f je absolutně spojitá na intervalu [a, b],
2
f má na [a, b] derivaci skoro všude, f 0 je Lebesgueovsky integrovatelná a platí
Z
Z
0
f (x) − f (a) =
f dm = f 0 · 1[a,x] dm
[a,x]
3
pro každé x ∈ [a, b].
existuje Lebesgueovsky integrovatelná funkce g na intervalu [a, b] taková, že
Z
Z
f (x) − f (a) =
g dm = g · 1[a,x] dm
[a,x]
pro každé x ∈ [a, b].
Skoro všude = s možnými výjimkami prvků množin A ⊆ R, pro které m(A) = 0.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
8 / 60
Lebesgueův vs. Riemannův integrál
Při výpočtech budeme používat následující vztah Lebesgueova a Riemannova
integrálu: pokud je reálná funkce f Riemannovsky integrovatelná na intervalu [a, b],
pak je i Lebesgueovsky integrovatelná a platí:
Z
Z b
f dm =
f (x) dx .
[a,b]
a
Obrácené tvrzení neplatí (Lebesgueův integrál je obecnější).
Příklad (Funkce, která není Riemannovsky integrovatelná)
Indikátorová funkce 1Q není Riemannovsky integrovatelná, ale máme:
Z
1Q dm = m(Q) = 0,
protože množina racionálních čísel Q je spočetná, tedy m(Q) = 0.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
9 / 60
Funkce hustoty
Definice (Funkce hustoty, angl.: density function)
Nezáporná Borelovská funkce f : R → [0, ∞) se nazývá funkce hustoty pokud
Z
f dm = 1.
Funkce hustoty indukují důležité pravděpodobnostní míry:
Věta (O pravděpodobnostní míře indukované funkcí hustoty)
Pokud je f funkce hustoty, pak je zobrazení P : B → R definované
Z
f dm,
pro každou A ∈ B,
P (A) =
A
pravděpodobnostní míra na B.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
10 / 60
Důkaz.
Zřejmě platí, že P (A) ≥ 0. Jelikož je f : R → [0, ∞) funkce hustoty, platí:
Z
Z
Z
P (R) =
f dm = f 1R dm = f dm = 1.
R
Uvažujme spočetně
Snmnoho vzájemně
S∞ disjunktních Borelovských množin A1 , A2 , . . .
a položme Bn = i=1 Ai a B = i=1 Ai (B i Bn jsou Borelovské).
Jelikož f 1Bn % f 1B , z monotonní konvergence máme:
Z
Z
Z
Z
P (Bn ) =
f dm = f 1Bn dm % f 1B dm =
f dm = P (B).
Bn
B
S využitím předchozího faktu dostáváme:
[ ∞
Xn
X∞
P
Ai = P (B) = lim P (Bn ) = lim
P (Ai ) =
P (Ai ).
i=1
n→∞
n→∞
i=1
i=1
To znamená, že P je σ-aditivní na B.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
11 / 60
Příklad (Funkce hustoty)
Mějme funkci f : R → R definovanou

 1 · e −x
40
f (x) = 40

0
pokud x ≥ 0,
pokud x < 0.
Funkce f je zřejmě Borelovská. Dále platí:
Z
Z ∞
Z ∞
1
−x
f dm =
f (x) dx =
· e 40 dx
0
0 40
−b
h −x ib
−b
= lim −e 40 = lim −e 40 − (−e0 ) = 1 − lim e 40 = 1 − 0 = 1.
b→∞
0
b→∞
b→∞
To znamená, že f je funkce hustoty.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
12 / 60
Spojité pravděpodobnostní míry a veličiny
Definice (Spojitá pravděpodobnostní míra, spojitá náhodná veličina)
Mějme pravděpodobnostní míru P : B → R. Pokud existuje funkce hustoty f tak, že
Z
P (−∞, x] =
f dm,
pro každé x ∈ R,
(−∞,x]
pak se P nazývá (absolutně) spojitá pravděpodobnostní míra (s hustotou f ).
Náhodná veličina X s rozdělením pravděpodobnosti PX : B → R se nazývá
(absolutně) spojitá, pokud je PX absolutně spojitá pravděpodobnstní míra.
Poznámka: Pokud je fX funkce hustoty spojité náhodné veličiny X, pak:
Z
FX (b) = PX (−∞, b] =
fX dm,
(−∞,b]
Z
P {a < X ≤ b} = PX (a, b] =
fX dm.
[a,b]
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
13 / 60
Věta (Chrakterizace spojitosti náhodné veličiny)
Náhodná veličina X je absolutně spojitá právě tehdy, když je FX absolutně spojitá.
Důkaz.
Nechť X je spojitá náhodná veličina. To jest, existuje funkce hustoty fX tak, že
Z
Z
FX (x) − FX (a) = PX (a, x] =
fX dm = 0 +
fX dm
(a,x]
(a,x]
Z
Z
Z
=
fX dm +
fX dm =
fX dm.
{a}
(a,x]
[a,x]
Aplikací základní věty ihned dostáváme, že FX je absolutně spojitá. Opačná strana:
pokud je FX absolutně spojitá reálná funkce, pak podle základní věty platí, že FX
má derivaci skoro všude, FX0 je Lebesgueovsky integrovatelná a platí
Z
FX0 dm = FX (x) − lim FX (a) = FX (x) − 0 = FX (x) = PX (−∞, x]
(−∞,x]
a→−∞
pro každé x ∈ R, což dokazuje, že FX0 je hledaná funkce hustoty.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
14 / 60
Důsledky vlastností spojitých náhodných veličin
Důsledky absolutní spojitosti FX (Přednáška 5):
Z
PX (a, b] = PX (a, b) = PX [a, b] = PX [a, b) = FX (b) − FX (a) =
FX0 dm.
[a,b]
Příklad (Prokázání slabší vlastnosti bez použití základní věty)
Označme fX funkci hustoty X. Pro libovolné x ∈ R platí:
Z
Z
Z
Z
PX ({x}) =
fX dm = fX 1{x} dm = fX (x) · 1{x} dm = fX (x) · 1{x} dm
{x}
Z
= fX (x) · 1{x} dm = fX (x) · m({x}) = fX (x) · 0 = 0.
Z kritéria o spojitosti FX zleva (Přednáška 5) tedy máme, že FX je spojitá.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
15 / 60
Příklad (Počítání pravděpodobnostní pro spojité veličiny)
Mějme spojitou náhodnou veličinu X s hustotou fX z předchozího příkladu:

Z
 1 · e −x
40
pokud x ≥ 0,
fX (x) = 40
PX (A) =
fX dm.

A
0
pokud x < 0,
0.025
P ({X > 40}) = PX [40, ∞)
Z ∞
1
−x
=
· e 40 dx
40 40
= e−1 ≈ 0.368.
0.020
0.015
0.010
0.005
20
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
40
60
80
100
120
Pravděpodobnost a statistika
16 / 60
Příklad (Vyjádření distribuční funkce z funkce hustoty a obráceně)
Mějme spojitou náhodnou veličinu X s hustotou fX z předchozího příkladu:

 1 · e −x
40
pokud x ≥ 0,
fX (x) = 40

0
pokud x < 0.
Pak pro distribuční funkci FX veličiny X platí FX (x) = 0 pro každé x < 0 a
Z x
Z x
h −t ix
1
−t
−x
40
· e dt = −e 40 = 1 − e 40 .
FX (x) =
fX (t) dt =
0
−∞
0 40
Vyjádření (nové) funkce hustoty gX derivací distribuční funkce FX :

−x
 1
· e 40 pokud x > 0,
0
gX (x) = FX (x) = 40

0
pokud x < 0.
Všimněte si: FX0 (0) není definovaná; aby byla gX funkce tvaru gX : R → R, stačí
nadefinovat gX (0) (lze zvolit libovolně). Obě fX a gX jsou funkce hustoty pro X.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
17 / 60
Příklad (Funkce hustoty s funkčními hodnotami ostře většími než 1)
Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí:
2x pokud 0 < x < 1,
fX (x) =
0
jinak.
Pro náhodnou veličinu X a její distribuční funkci FX platí:
2.0
FX (x) =

0


Z



pokud x < 0,
1.5
pokud 0 ≤ x < 1,
1.0
pokud x ≥ 1.
0.5
fX
x
2t dt = x2
0
1
FX
0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
18 / 60
Věta (O rozdělení složené náhodné veličiny g(X))
Pro náhodnou veličinu X a Borelovskou funkci g platí Pg(X) (A) = PX ({g ∈ A}).
Důkaz.
Z toho, že složené zobrazení g(X) je náhodná veličina (Přednáška 5)
a z vlastností inverzních obrazů dostáváme:
Pg(X) (A) = P ({g(X) ∈ A}) = P ({ω ∈ Ω | g(X(ω)) ∈ A})
= P ({ω ∈ Ω | X(ω) ∈ {g ∈ A}}) = P ({X ∈ {g ∈ A}}) = PX ({g ∈ A}),
což je požadované tvrzení.
Speciálně pro absolutně spojitou náhodnou veličinu X:
Z
Z
Pg(X) (A) =
fX dm ,
Fg(X) (x) =
{g∈A}
fX dm .
{g≤x}
Pozor: Výsledná g(X) nemusí být absolutně spojitá. (!!)
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
19 / 60
Věta (O funkci hustoty složené veličiny g(X))
Pokud je X absolutně spojitá náhodná veličina s hustotu fX a g je monotonní
funkce, která má spojitou derivaci, pak g(X) je absolutně spojitá veličina a její
funkce hustoty fg(X) je ve tvaru
1
−1 0
−1
· fX (g −1 (x)).
fg(X) (x) = |(g ) (x)| · fX (g (x)) = 0 −1
g (g (x))
Důkaz.
Použitím předchozího tvrzení, inverzní funkce g −1 a vlastnosti FX můžeme psát
Z g−1 (a)
Fg(X) (a) =
fX (x) dx = FX (g −1 (a)) − lim FX (y) = FX (g −1 (a)),
y→−∞
−∞
a to za předpokladu, že g je rostoucí. V tom případě derivací získáme
0
fg(X) (x) = Fg(X)
(x) = FX0 (g −1 (x)) = fX (g −1 (x)) · (g −1 )0 (x).
Pokud je g klesající, důkaz je analogický. Ostatní plyne z věty o inverzní funkci.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
20 / 60
Příklad (Složené absolutně spojité veličiny)
Mějme absolutně spojitou náhodnou veličinu X s hustotou fX , pro kterou platí:
2x pokud 0 < x < 1,
fX (x) =
0
jinak.
Úkol: Stanovte funkce hustoty veličin eX a −2X + 3.
Řešení:
1
Pro eX a x ∈ (1, e) máme (v ostatních případech je hustota nulová):
fX (ln(x)) 2 ln(x)
1
feX (x) = (ln(x))0 · fX (ln(x)) = · fX (ln(x)) =
=
.
x
x
x
2
Pro −2X + 3 a x ∈ (1, 3) máme (v ostatních případech je hustota nulová):
3 − x 0 3 − x
3 − x 3 − x
f−2X+3 (x) = = 0.5 · 2
=
.
· fX
2
2
2
2
Poznámka: Předchozí tvrzení lze zobecnit i pro funkci g, která má spojitou první
derivaci, není obecně monotonní, ale je po částech monotonní.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
21 / 60
Očekávané hodnoty
Význam:
střední hodnota náhodné veličiny v pravděpodobnostním prostoru;
další charakteristiky (rozptyl . . . ) jsou střední hodnoty odvozených veličin;
pro diskrétní veličiny jsme zavedli E(X).
Dva základní přístupy zavedení:
inženýrský (netechnický) × matematický (teoretický);
inženýrský přístup: pro diskrétní a absolutně spojité veličiny dvě definice;
matematický přístup: zavedení pomocí obecného pojmu integrál.
Nevýhody inženýrského přístupu:
do definice „není dostatečně vidětÿ (zejména v případě spojitých veličin);
E(X) je definovaná pomocí hustoty (nebo pravděpodobnostní funkce);
neřeší případy, pokud X není ani diskrétní, ani absolutně spojitá.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
22 / 60
Definice (Integrál X vzhledem k pravděpodobnostní míře P )
Mějme pravděpodobnostní prostor hΩ, F, P i Pak integrál je zobrazení, které každé
nezáporné náhodné veličině X : Ω → [0, ∞) v tomto prostoru přiřazuje číslo
R
X dP ∈ R ∪ {∞}
tak, že pro každé číslo c ∈ [0, ∞), každý jev A ∈ F a libovolné nezáporné náhodné
veličiny X, Y, Xn (n = 1, 2, . . . ) v hΩ, F, P i platí:
R
1
1A dP = P (A);
R
R
R
R
R
2
(X + Y ) dP = X dP + Y dP a cX dP = c X dP ;
(linearita)
R
R
3
pokud Xn % X, pak Xn dP % X dP .
(monotonní konvergence)
Zobecnění (pro všechny X, nejen nezáporné): Pro X definujeme
X(ω) pokud X(ω) ≥ 0,
−X(ω) pokud X(ω) < 0,
+
−
X (ω) =
X (ω) =
0
jinak,
0
jinak.
R
R +
R −
Pak zavádíme X dP = X dP − X dP (rozdíl pozitivní a negativní části).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
23 / 60
Očekávané hodnoty náhodných veličin
Definice (Očekávaná hodnota, angl.: expected value)
Mějme náhodnou veličinu X : Ω → R v pravděpodobnostním prostoru hΩ, F, P i.
Pak očekávaná hodnota X vzhledem k hΩ, F, P i je
Z
E(X) = X dP.
Odvozené charakteristiky:
střední hodnota (angl.: mean): µX = E(X);
2
rozptyl (angl.: variance): σX
= E (X − µX )2 ;
směrodatná odchylka (angl.: standard deviation): σX =
p
2
σX
.
Pozorování:
Obecně zavedené E(· · ·) je opět lineární operátor.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
24 / 60
Věta („Zákon nevědomého statistikaÿ)
Mějme náhodnou veličinu X : Ω → R v pravděpodobnostním prostoru hΩ, F, P i
a Borelovskou funkci g : R → R. Pak platí:
R
R
1
g(X) dP = g dPX ;
R
P
2
g(X) dP = x∈R g(x) · P ({X = x}) pokud je X diskrétní;
R
R
3
g(X) dP = g · fX dm pokud je X absolutně spojitá s hustotu fX .
Důkaz (náznak).
První tvrzení plyne užitím faktu, že g je náhodná veličina v hR, B, PX i a užitím
faktu, že PX ({g ∈ A}) = P ({g(X) ∈ A}), viz Billingsley (Věta 16.13).
Pokud je X diskrétní,
existuje
R
P spočetná C ⊆ R tak, že PX (C) = 1. Tvrzení se
prokáže užitím 1A dP = x∈C (1A (x) · PX ({x})), viz Billingsley (Věta 16.9).
R
R
Poslední část tvrzení plyne užitím faktu, že 1A dP = P (A) = A fX dm, viz
Billingsley (Věta 16.11).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
25 / 60
Důsledky pro očekávané hodnoty spojitých veličin
Mějme absolutně spojitou náhodnou veličinu X s funkcí hustoty fX .
Užitím předchozí věty dostáváme:
Z
E g(X) =
∞
g(x) · fX (x) dx
−∞
Speciálně dostáváme:
střední hodnota:
∞
Z
x · fX (x) dx
µ = E(X) =
−∞
rozptyl:
2
2
σ = E (X − µ)
Z
=
∞
(x − µ)2 · fX (x) dx
−∞
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
26 / 60
Příklad (Střední hodnota a rozptyl spojité náhodné veličiny)
Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí:
2x pokud 0 < x < 1,
fX (x) =
0
jinak.
Střední hodnotu X vyjádříme následovně:
" #1
Z ∞
Z 1
Z 1
2
x3
= .
µX = E(X) =
x · fX (x) dx =
x · 2 · x dx = 2 ·
x2 dx = 2 ·
3
3
−∞
0
0
0
Z linearity operátoru E dostáváme:
2
σX
2
2
=
x · fX (x) dx −
= E (X − µX ) = E(X ) −
3
−∞
" #1
2
Z 1
2
x4
4
1
=2·
=
x2 · 2 · x dx −
− =
.
3
4
9 18
0
2
2
µ2X
Z
∞
2
0
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
27 / 60
Kvantilová funkce
Definice (Kvantilová funkce)
Mějme náhodnou veličinu X s distribuční funkcí FX , pak se FX− : (0, 1) → R, kde
FX− (p) = inf{x ∈ R | p ≤ FX (x)}.
nazývá kvantilová funkce (angl.: quantile function)
Věta (Základní vlastnosti kvantilové funkce)
Pro kvantilovou funkci FX− náhodné veličiny X s distribuční funkcí FX platí:
1
FX− (p) je nejmenší prvek množiny {x ∈ R | p ≤ FX (x)};
2
FX− (FX (a)) ≤ a pro každé a ∈ R;
3
p ≤ FX (FX− (p)) pro každé p ∈ (0, 1);
4
FX− (p) ≤ a právě tehdy, když p ≤ FX (a);
5
pokud je FX spojitá a rostoucí, pak FX− = FX−1 .
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
28 / 60
Důkaz.
Sporem, kdyby A = {x ∈ R | p ≤ FX (x)} neměla nejmenší prvek, pak by existovala
klesající posloupnost x1 , x2 , . . . taková, že p ≤ FX (xi ) pro každé i = 1, 2, . . .
a limi→∞ xi 6∈ A. Potom ale p ≤ limi→∞ FX (xi ). Jelikož je FX spojitá zprava,
p ≤ limi→∞ FX (xi ) = FX (limi→∞ xi ), tedy limi→∞ xi ∈ A, což je spor.
Druhé tvrzení plyne z toho, že triviálně a ∈ {x ∈ R | FX (a) ≤ FX (x)}.
Třetí tvrzení plyne z prvního, protože FX− (p) ∈ {x ∈ R | p ≤ FX (x)}.
Čtvrté tvrzení prokážeme pomocí předchozích dvou: pokud FX− (p) ≤ a, pak
FX (FX− (p)) ≤ FX (a), protože FX je neklesající; užitím předchozího tedy
p ≤ FX (FX− (p)) ≤ FX (a). Obráceně, pokud p ≤ FX (a), pak FX− (p) ≤ FX− (FX (a)),
protože F − je rovněž neklesající; užitím předchozího dostáváme
FX− (p) ≤ FX− (FX (a)) ≤ a.
Poslední tvrzení je důsledkem toho, že pokud je FX spojitá a rostoucí, pak je
invertovatelná a tím pádem nejmenší prvek {x ∈ R | p ≤ FX (x)} je roven FX−1 (p).
Odtud dostáváme, že FX− (p) = FX−1 (p).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
29 / 60
Percentily, kvartily, medián
Definice (Percentil, kvantil, angl.: percentile, quantile)
Mějme náhodnou veličinu X s kvantilovou funkcí FX− a p ∈ (0, 1). Hodnotu FX− (p)
nazýváme (100p)% percentil nebo kvantil s hladinou p veličiny X.
Vlastnosti:
P ({X ≤ FX− (p)}) = FX (FX− (p)) ≥ p pro libovolnou X;
P ({X ≤ FX− (p)}) = FX (FX− (p)) = p pokud je FX spojitá; v důsledku:
Z FX− (p)
fX (x) dx = p .
−∞
pokud je X absolutně spojitá náhodná veličina s hustotou fX .
Terminologie a značení:
Pokud je X zřejmá z kontextu, píšeme πp místo FX− (p);
kvartily (angl.: quartile): π0.25 , π0.5 , π0.75 ; medián (angl.: median): π0.5 .
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
30 / 60
Příklady (Hodnoty kvantilových funkcí)
FX
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
1
2
3
4
5
−
FX
6
=
1
6
−1
FX
6
5
5
4
4
3
3
2
2
1
1
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
V. Vychodil (KMI/PRAS, Přednáška 7)
FY
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
1
Spojité náhodné veličiny
2
3
4
5
6
−
FX
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
Pravděpodobnost a statistika
1
31 / 60
Příklad (Hledání percentilů spojité náhodné veličiny, začátek)
Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí:
1 − |x − 1| pokud 0 ≤ x ≤ 2,
fX (x) =
0
jinak.
Pak distribuční funkce FX je ve tvaru:

0




2


x
2
FX (x) =

(2 − x)2


1
−


2


1
pokud x < 0,
pokud 0 ≤ x < 1,
pokud 1 ≤ x < 2,
pokud 2 ≤ x.
Abychom našli například hodnoty FX− (0.32) a FX− (0.92), musíme vyřešit:
2
2
FX− (0.32)
2 − FX− (0.92)
FX (π0.32 ) =
= 0.32, FX (π0.92 ) = 1 −
= 0.92.
2
2
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
32 / 60
Příklad (Hledání percentilů spojité náhodné veličiny, dokončení )
Vyjádřením FX− (0.32) a FX− (0.92) ze vztahů
2
2
FX− (0.32)
2 − FX− (0.92)
FX (π0.32 ) =
= 0.32, FX (π0.92 ) = 1 −
= 0.92.
2
2
√
dostáváme: FX− (0.32) = 2 · 0.32 a FX− (0.92) = 1.6.
Grafický význam:
1.0
fX
FX
0.92
0.8
0.6
0.4
0.32
0.2
FX− (0.32)
V. Vychodil (KMI/PRAS, Přednáška 7)
FX− (0.92) 2.0
Spojité náhodné veličiny
FX− (0.32)
FX− (0.92) 2.0
Pravděpodobnost a statistika
33 / 60
Příklad (Motivace pro empirické rozdělení)
Uvažujme výběrový soubor obsahující hmotnosti 40 produktů stejného typu:
22.38
19.39
25.92
19.84
21.55
23.86
24.00
21.97
22.20
23.28
22.97
20.11
22.55
24.63
23.43
21.06
22.87
22.35
22.72
20.57
24.40
24.23
22.90
22.48
interval
meze
(19.1, 20.3)
(20.3, 21.5)
(21.5, 22.7)
(22.7, 23.9)
(23.9, 25.1)
(25.1, 26.3)
(19.39, 20.11)
(20.57, 21.42)
(21.55, 22.67)
(22.72, 23.86)
(23.95, 24.63)
(25.92, 25.92)
V. Vychodil (KMI/PRAS, Přednáška 7)
21.65
23.95
23.32
23.60
fi
23.30
23.21
23.58
22.45
hi
3 0.063
5 0.104
12 0.250
14 0.292
5 0.104
1 0.021
Spojité náhodné veličiny
23.58
22.11
21.37
21.00
22.37
21.42
22.67
23.82
střed
19.7
20.9
22.1
23.3
24.5
25.7
Pravděpodobnost a statistika
34 / 60
Příklad (Dva způsoby zavedení funkce hustoty z empirických dat)
FX
fX
18.5
19.7
20.9
22.1
23.3
24.5
25.7
26.9
19.7
20.9
22.1
23.3
24.5
25.7
26.9
19.7
20.9
22.1
23.3
24.5
25.7
26.9
FY
fY
18.5
18.5
19.7
20.9
22.1
23.3
V. Vychodil (KMI/PRAS, Přednáška 7)
24.5
25.7
26.9
18.5
Spojité náhodné veličiny
Pravděpodobnost a statistika
35 / 60
Příklad (Motivace pro uniformní rozdělení)
Uvažujme náhodnou veličinu X, která označuje výsledek náhodného výběru jednoho
bodu z reálného intervalu (a, b], přitom všechny body mají stejnou šanci být zvoleny.
Otázka: Jak vypadá distribuční funkce X?
Analýza: Pravděpodobnost, že bod je zvolen z podintervalu (a, x] je
x−a
P {X ∈ (a, x]} =
= P {a < X ≤ x} = FX (x),
b−a
kde FX je hledaná distribuční funkce ve tvaru

0
pokud x ≤ a,


x−a
pokud a < x ≤ b,
FX (x) =
b−a



1
pokud x > b.
Důsledek: X je spojitá veličina, funkci hustoty stanovíme jako FX0 .
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
36 / 60
Uniformní rozdělení
Definice (Náhodná veličina s uniformním rozdělením)
Spojitá náhodná veličina X s hustotou fX má uniformní rozdělení (angl.: uniform
distribution) pokud existují a, b ∈ R tak, že a < b a fX je ve tvaru
fX (x) =
1
,
b−a
pokud a < x ≤ b,
a fX (x) = 0 jinak; zkráceně značíme, že X má rozdělení U (a, b).
Poznámky:
rozdělení má dva parametry: meze intervalu (a, b];
důsledek spojitosti FX : interval lze chápat také jako [a, b], (a, b), . . .
obecně lze z [a, b] „vyjmout spočetně mnoho bodůÿ,
x−a
distribuční funkce FX bude na intervalu [a, b] stále ve tvaru FX (x) =
,
b−a
neplést s diskrétním uniformním rozdělením (Přednáška 6).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
37 / 60
Příklad (Distribuční funkce a funkce hustoty pro U (a, b))
Mějme náhodnou veličinu X s rozdělením U (1.2, 2.45). Potom je fX ve tvaru:
1
1
fX (x) =
=
= 0.8,
pokud 1.2 < x ≤ 2.45
b − a 1.25
a fX (x) = 0 pro x ≤ 1.2 nebo x > 2.45.
1.0
FX
1.0
fX
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.5
1.0
1.5
2.0
0.5
2.5
1.0
1.5
2.0
2.5
Poznámka: Pokud položíme například fX (1.2) = 10, nezměníme tím FX ani PX .
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
38 / 60
Věta (Střední hodnota uniformní veličiny)
Pokud má X rozdělení U (a, b), pak µX =
b+a
.
2
Důkaz.
Integrací x · fX (x) dostáváme:
Z ∞
Z
µ = E(X) =
x · fX (x) dx =
∞
x
dx =
−∞ b − a
−∞
Z
b
a
1
x
dx =
·
b−a
b−a
Z
b
x dx
a
" #b
2
1
x2
1
b
a2
1
b 2 − a2
=
·
=
·
−
=
·
b−a
2
b−a
2
2
b−a
2
a
=
b 2 − a2
(b + a) · (b − a) b + a
=
=
.
2 · (b − a)
2 · (b − a)
2
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
39 / 60
Věta (Rozptyl uniformní veličiny)
2
Pokud má X rozdělení U (a, b), pak σX
=
(b − a)2
.
12
Důkaz.
Nejprve vyjádříme druhý moment:
Z ∞
Z
2
2
E(X ) =
x · fX (x) dx =
−∞
a
"
1
x3
·
=
b−a
3
#b
a
b
1
x2
dx =
·
b−a
b−a
Z
b
x2 dx
a
1
b 3 − a3
b 3 − a3
·
=
.
=
b−a
3
3 · (b − a)
S využitím předchozího pozorování a linearity operátoru E dostáváme:
b 3 − a3
b + a 2 b2 − 2ab + a2 (b − a)2
2
2
2
σ = E(X ) − µ =
−
=
=
.
3 · (b − a)
2
12
12
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
40 / 60
Opakování: Počet změn ve spojitém jednotkovém prostoru
Definice (Náhodná veličina s Poissonovým rozdělením)
Náhodná veličina X má Poissonovo rozdělení pokud existuje λ > 0 tak, že její
pravděpodobnostní funkce fX je ve tvaru
fX (x) =
λx · e−λ
x!
pro x = 0, 1, . . .
a fX (x) = 0 jinak.
Interpretace:
parametr λ: průměrný počet změn v jednotce uvažovaného prostoru,
nutné předpoklady (přibližný Poissonův proces, Přednáška 6):
počty změn v disjunktních podintervalech jsou nezávislé;
λh ≈ pravděpodobnost právě jedné změna v (dost malém) podintervalu délky h;
pravděpodobnost dvou a více změn v (dost malém) podintervalu je ≈ 0.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
41 / 60
Příklad (Modifikace problému: čekání na první změnu, začátek)
Problém: Uvažujeme přibližný Poissonův proces s parametrem λ, ale:
místo pozorování počtu změn v intervalu (diskrétní náhodná veličina)
budeme pozorovat dobu uplynulou mezi změnami (spojitá náhodná veličina W ).
Otázka: Jaké má náhodná veličina W rozdělení?
Analýza:
W je zřejmě spojitá a nabývá hodnot z intervalu [0, ∞),
zjednodušení úlohy: místo pozorování „doby mezi změnamiÿ budeme pozorovat
dobu od začátku procesu do výskytu první změny za předpokladu, že se jedná o
přibližný Poissonův proces s parametrem λ,
vyjádříme distribuční funkci FW náhodné veličiny W .
Jelikož doba čekání je nezáporná, zřejmě FW (w) = 0 pro každé w < 0.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
42 / 60
Příklad (Modifikace problému: čekání na první změnu, dokončení )
Úvaha: Pravděpodobnost, že doba čekání na první změnu bude delší než w ≥ 0 je
rovna pravděpodobnosti, že v intervalu [0, w] nedojde k žádné změně.
To znamená, že pro každé w ≥ 0 můžeme psát:
FW (w) = P ({W ≤ w}) = 1 − P ({W > w})
= 1 − P („žádná změna v intervalu [0, w]ÿ)
= 1 − P ({X = 0}) = 1 − fX (0),
kde X je diskrétní náhodná veličina s Poissonovým rozdělením s parametrem λ · w
(průměrný počet změn v intervalu délky w) a fX je její pravděpodobnostní funkce:
fX (x) =
(λ · w)x · e−λ·w
,
x!
odtud fX (0) =
Důsledky:
distribuční funkce: FW (w) = 1 − e−λ·w ;
0
funkce hustoty: fW (w) = FW
(w) = λ · e−λ·w .
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
1 · e−λ·w
= e−λ·w .
1
Pravděpodobnost a statistika
43 / 60
Exponenciální rozdělení
Definice (Náhodná veličina s exponenciálním rozdělením)
Spojitá náhodná veličina X s hustotou fX má exponenciální rozdělení (angl.:
exponential distribution) pokud existuje θ > 0 tak, že fX je ve tvaru
fX (x) =
1 −x
·e θ ,
θ
pokud x ≥ 0,
a fX (x) = 0 jinak.
Poznámky:
parametr θ je převrácená hodnota (výchozího) parametru λ,
intuice: θ je „průměrná doba čekání na změnuÿ (později dokážeme),
interpretace: P ({a ≤ X ≤ b}) pravděpodobnost, že první změna (od počátku
pozorování) nastane v časovém rozmezí [a, b].
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
44 / 60
Věta (Střední hodnota veličiny s exponenciálním rozdělením)
Pokud má X exponenciální rozdělení s parametrem θ, pak µX = θ.
Důkaz.
x
x
Nejprve si všimněme, že −e− θ · (x + θ) je primitivní funkcí k xθ · e− θ jelikož
0
x
x
1 −x
− xθ
− xθ
−e · (x + θ) = −e +
· e θ (x + θ) = · e− θ .
θ
θ
Odtud využitím základní věty integrálního počty a L’Hôpitalova pravidla dostáváme
Z ∞
∞
x −x
x
x
µX = E(X) =
· e θ dx = −e− θ · (x + θ) 0 = θ + lim −e− θ · (x + θ)
x→∞
0 θ
x+θ
1
x = θ + lim
x = θ + 0 = θ.
1
x→∞ −e θ
x→∞ − · e θ
θ
= θ + lim
Poznámka: θ je vskutku střední doba čekání na první změnu.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
45 / 60
Věta (Rozptyl veličiny s exponenciálním rozdělením)
2
Pokud má X exponenciální rozdělení s parametrem θ, pak σX
= θ2 .
Důkaz.
0
x
Použitím pravidla o derivaci součinu na −e− θ · (x2 + 2θx + 2θ2 ) dostáváme
x2 − x
1 −x
− xθ
θ
(x2 + 2θx + 2θ2 ) =
−e · 2(x + θ) +
·e
·e θ.
θ
θ
Analogicky jako v předchozím důkazu proto máme:
Z ∞ 2
∞
x
x
x
2
E(X ) =
· e− θ dx = −e− θ · (x2 + 2θx + 2θ2 ) 0 = 2θ2 .
θ
0
Z linearity operátoru E a předchozích pozorování dostáváme:
2
σX
= E(X 2 ) − µ2X = 2θ2 − θ2 = θ2 .
Důsledek: Směrodatná odchylka exponenciální veličiny s parametrem θ je σX = θ.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
46 / 60
Příklad (Distribuční funkce exponenciální veličiny)
Mějme náhodnou veličinu X, která má exponenciální rozdělení s parametrem µ = θ.
Pak distribuční funkce FX náhodné veličiny X je ve tvaru:
(
−x
1 − e θ pokud x ≥ 0,
FX (x) =
0
pokud x < 0.
Příklad: Pro X s parametrem θ = 5 máme:
1.0
FX
FX
0.20
0.8
0.15
0.6
0.10
0.4
0.05
0.2
fX
2
4 θ 6
V. Vychodil (KMI/PRAS, Přednáška 7)
8
10
12
14
Spojité náhodné veličiny
2
4 θ 6
8
10
12
14
fX
Pravděpodobnost a statistika
47 / 60
Příklad (Střední hodnota 6= medián)
Mějme exponenciální náhodnou veličinu X danou parametrem µ = θ = 5.
Medián mX = FX− (0.5) náhodné veličiny X stanovíme vyřešením
FX (mX ) = 1 − e
−mX
θ
= 0.5.
Zlogaritmováním obou stran dostáváme mX = −θ · ln(0.5) ≈ 3.466.
Grafický význam:
1.0
FX
0.20
0.8
0.15
0.6
0.5
0.4
0.10
0.05
0.2
2 mX
fX
θ 6
V. Vychodil (KMI/PRAS, Přednáška 7)
8
10
12
14
Spojité náhodné veličiny
2 mX
θ 6
8
10
12
14
Pravděpodobnost a statistika
48 / 60
Příklad (Délka čekání na zákazníka)
Problém: Na pobočku dochází v průměru dvacet záklazníků za hodinu. Zajímáme
se o dobu čekání na zákazníka.
Otázka: Jaká je pravděpodobnost, že na prvního budeme čekat víc jak 5 minut?
Analýza: Pro zjednodušení předpokládáme, že záklazníci na pobočku docházejí
v souladu s přibližným Poissonovým procesem s parametrem λ = 13 (zvolená
jednotka jsou minuty).
Do jaké míry je zjednodušující ponecháme stranou (nemáme další informace, ale lze
předpokládat, že průměrný počet změn se mění v čase).
Řešení: Nechť X označuje dobu čekání na prvího zákazníka. Náhodná veličina X má
1
1 −x
geometrické rozdělení s parametrem θ = = 3. Potom tedy fX (x) = · e 3 a platí
λ
3
Z ∞
1 −x
−5
· e 3 dx = e 3 ≈ 0.1889.
P ({X > 5}) =
5 3
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
49 / 60
Příklad (Zobecněný problém čekání na několik změn, začátek)
Problém: Předpokládejme, že uvažujeme přibližný Poissonův proces s průměrným
počtem změn za jednotku času rovným λ. Zajímáme se o čekání na několik změn.
Otázka: Nechť W označuje dobu čekání na prvních α změn. Jak vypadá distribuční
funkce a funkce hustoty spojité náhodné veličiny W ?
Analýza: Analogicky jako v případě čekání na jednu změnu můžeme psát
FW (w) = P ({W ≤ w}) = 1 − P ({W > w})
= 1 − P („méně jak α změn v intervalu [0, w]ÿ)
= 1 − P ({X < α}) = 1 − FX (α − 1),
kde X je diskrétní náhodná veličina s Poissonovým rozdělením s parametrem λ · w
(průměrný počet změn v intervalu délky w) a FX je její distribuční funkce:
FX (n) =
n
X
x=0
V. Vychodil (KMI/PRAS, Přednáška 7)
fX (n) =
n
X
(λ · w)x · e−λ·w
x=0
Spojité náhodné veličiny
x!
.
Pravděpodobnost a statistika
50 / 60
Příklad (Zobecněný problém čekání na několik změn, dokončení )
Z předchozího tedy dostáváme vyjádření pro distribuční funkci FW veličiny W :
FW (w) = 1 −
α−1
X
(λ · w)k · e−λ·w
k=0
k!
.
Funkci hustoty fW vyjádříme jako derivaci FW . Pro w > 0 máme:
α−1 X
k · (λ · w)k−1 · λ (λ · w)k · λ
0
−λ·w
−λ·w
−
fW (w) = FW (w) = λ · e
−e
·
k!
k!
k=1
−λ·w
=λ·e
−e
−λ·w
λ · (λ · w)α−1
· λ−
(α − 1)!
λ · (λ · w)α−1 −λ·w
=
·e
.
(α − 1)!
Terminologie: W s fW v předchozím tvaru má tzv. Erlangovo rozdělení.
Omezení: α > 0 je celé číslo, obecně chceme α ∈ (0, ∞).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
51 / 60
Speciální funkce Γ
Pro každé t > 0 definujeme hodnotu funkce Γ (gama) v bodě t následovně:
Z ∞
Γ(t) =
xt−1 · e−x dx .
0
Poznámky:
Γ(t) je pozitivní pro každé t > 0 protože xt−1 · e−x je pozitivní;
primitivní funkce k funkci f (x) = xt−1 · e−x není elementární funkce;
při výpočtech hodnot Γ(t) se používají numerické aproximace;
Γ lze rozšířit na komplexní čísla (nebudeme potřebovat).
Implementace ve standardních knihovnách C99 (ISO/IEC 9899)
#include <math.h>
double tgamma (double x);
V gcc se překládá s parametrem -std=c99 a sestavuje s parametrem -lm.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
52 / 60
Věta (Funkce Γ jako zobecnění faktoriálu)
Pro každé přirozené číslo n platí Γ(n) = (n − 1)!.
Důkaz.
Pro každé přirozené číslo n > 1 můžeme integrací per partes a konečně mnoha
aplikacemi L’Hôpitalova pravidla (protože n je přirozené číslo) vyjádřit
Z ∞
Z ∞
n−1
n−1
−x
−x ∞
Γ(n) =
x
· e dx = x
· (−e ) 0 +
(n − 1) · xn−2 · e−x dx
0
Z ∞ 0
= lim xn−1 · (−e−x ) − 0 + (n − 1) ·
xn−2 · e−x dx
x→∞
0
xn−1
= lim
+ (n − 1) · Γ(n − 1) = 0 + (n − 1) · Γ(n − 1).
x→∞ −ex
Nyní stačí ukázat, že Γ(1) = 1. To ale platí, protože
Z ∞
Z ∞
∞
1−1
−x
Γ(1) =
x
· e dx =
e−x dx = −e−x 0 = 1 + lim −e−x = 1 + 0 = 1.
0
V. Vychodil (KMI/PRAS, Přednáška 7)
x→∞
0
Spojité náhodné veličiny
Pravděpodobnost a statistika
53 / 60
Příklad (Graf funkce Γ na intervalu [0, 1])
Γ
6
5
4
3
2
1
1
V. Vychodil (KMI/PRAS, Přednáška 7)
2
Spojité náhodné veličiny
3
4
Pravděpodobnost a statistika
54 / 60
Příklad (Graf funkce Γ na intervalu [−4, 6])
200
150
100
50
0
−50
−100
−150
−200
−4
−2
V. Vychodil (KMI/PRAS, Přednáška 7)
0
Spojité náhodné veličiny
2
4
Pravděpodobnost a statistika
6
55 / 60
Rozdělení Γ
Definice (Náhodná veličina s rozdělením Γ, angl.: gamma distribution)
Spojitá náhodná veličina X s hustotou fX má rozdělení Γ (gama) pokud existují
reálná čísla θ > 0 a α > 0 tak, že fX je ve tvaru
fX (x) =
1
−x
α−1
θ ,
·
x
·
e
Γ(α) · θα
pokud x ≥ 0,
a fX (x) = 0 jinak.
Funkce hustoty je ozvozena z funkce hustoty Erlangova rozdělení:
λ · (λ · x)α−1 −λ·x
xα−1
1
−x
−x
·e
=
·e θ =
· xα−1 · e θ .
α
α
(α − 1)!
(α − 1)! · θ
Γ(α) · θ
Distribuční funkce je ve tvaru
Z ∞
1
FX (x) =
·
y x−1 · e−y dy .
Γ(x) 0
fX (x) =
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
56 / 60
Příklad (Funkce hustoty rozdělení Γ je dobře definovaná)
Využitím substituční metody řešení integrálu pro y = θ · x můžeme psát
Z ∞
Z ∞
Z ∞
1
(θ · x)α−1 · e−x
−x
α−1
θ
fX (x) dx =
·x
· e dx =
· θ dx
α
Γ(α) · θα
0
0 Γ(α) · θ
0
Z ∞
Γ(α)
1
·
y α−1 · e−y dy =
= 1.
=
Γ(α) 0
Γ(α)
To znamená, že fX v předchozí definice je korektně zavedená funkce hustoty.
Věta (Střední hodnota a rozptyl veličiny s rozdělením Γ)
2
Pokud má X rozdělení Γ s parametry θ a α, pak µX = α · θ a σX
= α · θ2 .
Speciální případy rozdělení Γ:
α = 1 (exponenciální rozdělení);
θ = 2, α = 2r , kde r je přirozené číslo (χ2 rozdělení, Přednáška 9).
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
57 / 60
Příklad (Grafy funkcí hustoty rozdělení Γ pro různé parametry)
0.10
θ=4
α=2
0.12
θ=2
α=4
0.10
0.08
α=3
0.08
θ=3
0.06
0.06
θ=4
0.04
0.04
α=4
0.02
0.02
5
10
15
20
25
30
θ pevně zvolené
5
10
15
20
25
30
α pevná zvolená
Interpretace posunu křivek pro vzrůstající θ:
Pokud se zmenšuje průměrný počet změn v jednotkovém intervalu, pak lze očekávat
prodloužení čekací doby na výskyt α změn.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
58 / 60
Příklad (Délka čekání na několik zákazníků)
Problém: Na pobočku dochází v průměru třicet záklazníků za hodinu. Zajímáme se
o dobu čekání na několik zákazníků.
Otázka: Jaká je pravděpodobnost, že na první dva budeme čekat víc jak 5 minut?
Analýza: Jako v předchozí situaci, uvažujeme X rozdělením Γ daným parametry
α = 2 (čekáme na dva zákazníky) a θ = 2 (průměrná čekací doba na jednoho
zákazníka jsou 2 minuty).
−x
−x
Řešení: Využitím faktu, že (−2) · e 2 · (x + 2) je primitivní funkcí k x · e 2 máme
−x
Z ∞ α−1 −x
Z ∞ 2−1 −x
Z ∞
x
·e θ
x
·e 2
x·e 2
P ({X > 5}) =
dx =
dx =
dx =
Γ(α) · θα
Γ(2) · 22
4
5
5
5
i∞ 7 −5
1 h
−x
2
= · (−2) · e · (x + 2)
= · e 2 ≈ 0.287.
4
2
5
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
59 / 60
Přednáška 7: Závěr
Pojmy:
indikátorová funkce, Lebesgueův integrál, absolutní spojitost
funkce hustoty, (absolutně) spojitá náhodná veličina
očekávané hodnoty, střední hodnota, rozptyl, kvantilová funkce
empirické, uniformní, exponentiální, gama rozdělení
Použité zdroje:
Billingsley, P.: Probability and Measure
John Wiley & Sons; 3. vydání, ISBN 978–0–471–00710–4.
Capinski M., Zastawniak T. J.: Probability Through Problems
Springer 2001, ISBN 978–0–387–95063–1.
Hogg R. V., Tanis E. A.: Probability and Statistical Inference
Prentice Hall; 7. vydání 2005, ISBN 978–0–13–146413–1.
V. Vychodil (KMI/PRAS, Přednáška 7)
Spojité náhodné veličiny
Pravděpodobnost a statistika
60 / 60

Podobné dokumenty

Modelování výrobní linky

Modelování výrobní linky Inspektor vybírá ze zásobníku inspekce bloky jeden po druhém a určuje kvalitu vrstvy. Pokud není dostatečná, blok je umístěn do zásobníku součástí k přepracování. Stroj na povrchovou

Více

Pravděpodobnost

Pravděpodobnost První tvrzení: Pokud je F konečné pole, pak S pro libovolné Ai ∈ F (i = 1, 2, . . . ) existuje konečná I = {i1 , . . . , ik } tak, že ∞ i=1 Ai = Ai1 ∪ · · · ∪ Aik ∈ F. Druhé tvrzení: Důsledek De Mo...

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Příklad (Pravděpodobnost nalezení klíčového slova) Problém: Předpokládejme, že máme uloženo (mnoho) HTML souborů, ve kterých se zajímáme o pravděpodobnost výskytu klíčových slov. Dlouhodobým pozor...

Více

Pravděpodobnost a statistika - Bodové odhady a intervaly spolehlivosti

Pravděpodobnost a statistika - Bodové odhady a intervaly spolehlivosti Z definice složené funkce pro statistiku ϑ máme ϑ(ω) = g(X(ω)) ∈ R; z definice rozdělení pravděpodobnosti: Pϑ (A) = P ({g(X) ∈ A}); Pro konkrétní výběr x1 , . . . , xn je g(x1 , . . . , xn ) konkré...

Více

1. Úvod 1.1. Prostor elementárnıch jevu, algebra

1. Úvod 1.1. Prostor elementárnıch jevu, algebra Definice 1. Označme Ω prostor elementárnı́ch jevů, ω ∈ Ω elementárnı́ jev, A ⊂ Ω jev. Definice 2. Bud’te A, B jevy, potom • A = Ω je jev jistý. • AC je jev opačný k jevu A. Platı́ ω ∈ A Y ω ...

Více

(dvojný) integrál

(dvojný) integrál • jestliže K = K1 ∪ K2 , kde K1 a K2 jsou dva obdélníky s vlastností K1 ∩ K2 = ∅, pak f ∈ R(K1 ), f ∈ R(K2 ) a platí (aditivita vzhledem k integračnímu oboru)

Více

Analýza rizik - Centrum pro výzkum toxických látek v prostředí

Analýza rizik - Centrum pro výzkum toxických látek v prostředí problém s technicky obtížným měřením koncentrace TCDD a příbuzných látek ve vodním sloupci. Modelována byla zátěž pstruhů za minulých, současných a budoucích podmínek. Model se shodoval s koncentra...

Více

Normální rozdělení a centrální limitní věta

Normální rozdělení a centrální limitní věta ϑ = g(X) nazveme (výběrová) statistika nebo výběrová charakteristika (angl.: sample statistics) náhodného výběru X. Rozdělení pravděpodobnosti Pϑ : B → [0, 1] veličiny ϑ nazýváme výběrové rozdělení...

Více

SA1 skripta - MATEMATIKA online

SA1 skripta - MATEMATIKA online a) přı́mý - po konečném počtu pravdivých výroků dojdeme od výroku A k výroku B, tj A ⇒ V1 ⇒ V2 ⇒ . . . ⇒ Vn ⇒ B b) nepřı́mý - provedeme obrácenou implikaci, tj ¬B ⇒ ¬A a tu pak dokazuj...

Více