Podm´ınená pravdepodobnost, náhodná velicina a zp˚usoby jej´ıho

Transkript

Podm´ınená pravdepodobnost, náhodná velicina a zp˚usoby jej´ıho
Podmı́něná pravděpodobnost, náhodná
veličina
a způsoby jejı́ho popisu
Ing. Michael Rost, Ph.D.
Podmı́něná pravděpodobnost
Pokud je jev A vázán na uskutečněnı́ jevu B, pak tento
jev nazýváme jevem podmı́něným jevu B a značı́me jej A|B.
Při určovánı́ podmı́něné pravděpodobnosti se množina všech
možných výsledků náhodného pokusu omezı́ pouze na ty výsledky,
jež vyhovujı́ dané podmı́nce. Pravděpodobnost podmı́něného jevu
pak definujeme takto:
P (A|B) =
P (A ∩ B)
P (B)
kde P (B) > 0.
Z výše uvedeného vztahu plyne následujı́cı́ rovnice:
P (A ∩ B) = P (A|B) · P (B)
Zaměnı́me-li pak formálně A a B
P (B ∩ A) = P (B|A) · P (A)
c Rost 2006
°
Tyto vzorce sloužı́ pro výpočet současného výskytu jevů A a
B a bývajı́ označovány jako věty o násobenı́ pravděpodobnostı́.
Pokud se bude jednat o nezávislé jevy, pak se věta o násobenı́
pravděpodobnostı́ zjednodušı́, nebot’ platı́:
P (A|B) = P (A)
P (B|A) = P (B)
a tedy
P (A ∩ B) = P (A) · P (B).
Obdobně pak pro n nezávislých jevů.
c Rost 2006
°
Přı́klad
Ve sklepě máte 70 kompotů: 35 hruškových, 20 jablkových
a 15 třešňových. Pošlete svého slabšı́ho sourozence (stejně
jako vždy) pro 3 kompoty. Pokud přinese všechny hruškové,
budete maximálně spokojeni a sourozenec bude pochválen.
Pokud přinese všechny třešňové, půjde znova. V jiném přı́padě
to ,,kousnete”. Sourozenc pochopitelně nevı́, na co máte chut’.
Jaká je pravděpodobnost, že:
• sourozenec bude pochválen,
• to kousneme,
• půjde znova chudák.
c Rost 2006
°
Bayesův vzorec
Pokud majı́ náhodné jevy B1, B2, B3, · · · , Bn nenulové pravděpodobnosti a zároveň tvořı́ úplný rozklad pravděpodobnostnı́ho
prostoru Ω, tj.
Ω=
n
[
Bi ,
přičemž Bi ∩ Bj = ∅ pro i 6= j ,
i=1
lze libovolný jev A vyjádřit pomocı́ jevů Bj pro j = 1, 2, · · · , n
takto:
A = (A ∩ B1) ∪ (A ∩ B2) ∪ · · · ∪ (A ∩ Bn) .
Postupným užitı́m věty o sčı́tánı́ pravděpodobnostı́ pro neslučitelné náhodné jevy a věty o násobenı́ pravděpodobnostı́
zı́skáme předpis pro výpočet pravděpodobnosti jevu A, někdy
také nazývaný vzorec úplné pravděpodobnosti.
P (A) =
n
X
P (A|Bj ) · P (Bj )
j=1
c Rost 2006
°
Bayesův vzorec
Pokud je i P (A) > 0, pak pro každý index i ∈ {1, 2, · · · , n} bude
platit:
P (A|Bi) · P (Bi)
j=1 P (A|Bj ) · P (Bj )
P (Bi|A) = Pn
Tento vztah budeme nazývat Bayesovým vzorcem.
c Rost 2006
°
Praktický přı́klad
Studiem odborných časopisů jsme zjistili relativnı́ četnosti mozkových přı́hod
a vysokého krevnı́ho tlaku u starých osob. Známe tyto informace:
1 Deset procent lidı́ ve veku 70 let utrpı́ mozkovou přı́hodu v následujı́cı́ch
pěti letech.
P (M P ) = 0, 1
a tedy
P (M P c ) = 0, 9
2 Dále vı́me, že 40 procent lidı́ kteřı́ utrpěli mozkovou přı́hodu v pěti letech
po 70 trpı́ (trpělo) vysokým krevnı́m tlakem.
P (KT |M P ) = 0, 4
3 Z lidı́ kteřı́ neměli mozkovou přı́hodu do 75 let mělo pouze 20 procent
lidı́ vysoký krevnı́ tlak.
P (KT |M P c ) = 0, 2
c Rost 2006
°
Zajı́majı́ nás dvě otázky:
1 Jaká je pravděpodobnost, že 70 letý pacient má vysoký krevnı́ tlak?
P (KT ) =?
2 Jaká je pravděpodobnost, že 70 letý pacient s vysokým krevnı́m tlakem
utrpı́ mozkovou přı́hodu v následujı́cı́ch pěti letech? P (M P |KT ) =?
Řešenı́:
P (KT ) = P (KT |M P )P (M P ) + P (KT |M P c)P (M P c ) =
0, 4 · 0, 1 + 0, 2 · 0, 9 = 0, 22
P (M P |KT ) =
P (M P ∩ KT )
P (KT |M P ).P (M P )
0, 4 · 0, 1
=
=
= 0, 182
P (KT )
P (KT )
0, 22
c Rost 2006
°
NÁHODNÁ VELIČINA
c Rost 2006
°
Náhodná veličina
Základnı́ paradigma: Představme si, že je každému prvku ω,
ω ∈ Ω přiřazeno nějaké reálné čı́slo. Jinými slovy to znamená, že
je dána určitá funkce, která nám ,,pomáhá” zobrazit Ω do R.
X:Ω→R
Necht’ tedy X(ω) je čı́slo přiřazené funkcı́ X(.) elementárnı́mu
jevu ω. Na funkci X(.) jsou kladeny určité požadavky:
Vzorem množiny B ⊂ R je
X −1(B) = {ω : X(ω) ∈ B}
O funkci X(.) řekneme, že je měřitelná, platı́-li X −1(B) ∈ A pro
každé B ∈ R. Takovouto měřitelnou funkci X(.) označı́me za
náhodnou veličinu X
c Rost 2006
°
Distribučnı́ funkce F(.)
Snahou je pochopit chovánı́ námi sledované náhodné veličiny.
Pro každé x ∈ R se definuje funkce F(x) takto
F(x) = P({ω : X(ω) ≤ x}) = P(X ≤ x)
Funkci F (x) nazveme distribučnı́ funkcı́ náhodné veličiny X.
Umı́me-li určit tyto pravděpodobnosti, pak známe tzv. rozdělenı́
pravděpodobnosti náhodné veličiny X.
c Rost 2006
°
Vlastnosti distribučnı́ funkce
Distribučnı́ funkce je definována na předem daném intervalu.
Jejı́ základnı́ vlastnosti jsou:
0 ≤ F (x) ≤ 1
F(xi) ≤ F (xj ) pro každou dvojici čı́sel xi < xj
lim F(x) = F(−∞) = 0
x→−∞
lim F(x) = F(+∞) = 1
x→+∞
P (a < X ≤ b) = F(b) − F (a)
Distribučnı́ funkce F(x) je zprava spojitá a má nejvýš spočetně
bodů nespojitosti.
c Rost 2006
°
Diskrétnı́ a spojitá náhodná veličina
Diskrétnı́ náhodná veličina
Náhodná veličina X nabývá jen konečně nebo spočetně mnoha
hodnot. Řekneme tedy, že X nabývá jen hodnot x1, x2, . . .,
přičemž
P({ω : X(ω) = xi}) = P(X = xi) = pi
i = 1, 2, . . .
V takovém přı́padě řı́káme, že X má diskrétnı́ rozdělenı́.
Jejı́ distribučnı́ funkce F() je skokovitá. Skoky jsou v bodech
x1, x2, . . ., přičemž velikost skoku v bodě xi má velikost pi,
i = 1, 2, . . .
Distribučnı́ funkce diskrétnı́ náhodné veličiny je tedy nespojitá.
Platı́ pro ni:
F(xi) = P (X ≤ xi) =
X
pj
j≤i
c Rost 2006
°
Spojitá náhodná veličina
Náhodná veličina X je spojitá, může-li nabývat všech hodnot
z konečného nebo nekonečného intervalu.
Předpokládejme že máme spojitou náhodnou veličinu X, nabývajı́cı́
všech hodnot z intervalu x ∈ (−∞; ∞). Existuje-li taková funkce
f (), že
F(xi) =
Z x
i
−∞
f (t)dt ,
pak řı́káme, že X má spojité rozdělenı́ a že f () je jejı́ hustota,
resp.hustota pravděpodobnosti
c Rost 2006
°
Hustota pravděpodobnosti f ()
Funkci definovanou vztahem
0
dF(x)
f (x) =
= F (x)
(1)
dx
nazýváme tedy hustotou pravděpodobnosti, nebo v přı́padě
diskrétnı́ náhodné veličiny frekvenčnı́ funkcı́. Základnı́ vlastnosti
této funkce jsou:
f (x) ≥ 0
lim f (x)dx = 0
x→−∞
Rb
a
f (x)dx = 1
pro x ∈ [a; b]
lim f (x)dx = 0
x→+∞
P (a < X ≤ b) =
Rb
a
f (x)dx
c Rost 2006
°
Přı́klad
Diskrétnı́ náhodná veličina X je zadána řadou rozdělenı́
(tabulkou rozdělenı́ pravděpodobnostı́):
xi
pi
3
0,2
4
0,1
7
0,4
10
0,3
Určeme distribučnı́ funkci této náhodné veličiny. S jakými pravděpodobnostmi nabývá X hodnot z intervalů: h−5; 3, 1), h3, 5; 9)
a h11; 15)?
Nebot’ platı́:
F(xi) = P (X ≤ xi) =
X
pj
j≤i
c Rost 2006
°
Přı́klad
Pak tedy:



0






0, 2
F(x) =
0, 3




0, 7




1
x<3
3≤x<4
4≤x<7
7 ≤ x < 10
x ≥ 10
např. F(7) = 0, 7
P(X ∈ h−5; 3, 1)) = P(−5 ≤ X < 3, 1) = F(3, 1) − F(−5) =
0, 2 − 0 = 0, 2
P(X ∈ h3, 5; 9)) = P(3, 5 ≤ X < 9) = F(9) − F (3, 5) =
0, 7 − 0, 2 = 0, 5
P(X ∈ h11; 15)) = P(11 ≤ X < 15) = F(15) − F (11) = 1 − 1 = 0
c Rost 2006
°
Graf distribučnı́ funkce
c Rost 2006
°
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
Graf distribučnı́ funkce
0
2
4
6
8
10
12
x
c Rost 2006
°
Ostatnı́ způsoby popisu náhodných
veličin
Chovánı́ náhodné veličiny lze postihnout i prostřednictvı́m
• tabulky rozdělenı́ pravděpodobnostı́
xi
pi
3
0,2
4
0,1
7
0,4
10
0,3
• polygonu rozdělenı́ pravděpodobnostı́.
c Rost 2006
°
α100%nı́ kvantil
Ve statistice je velmi důležitý je pojem kvantilu. α-kvantilem
nebo α100%-nı́m kvantilem náhodné veličiny X, která má
jisté spojité rozdělenı́ náhodné veličiny s distribučnı́ funkcı́ F(x)
a hustotu pravděpodobnosti f (), je čı́slo xα pro které platı́
Zxα
F (xα) = P(X ≤ xα) =
f (x)dx = α
−∞
c Rost 2006
°
Prı́klad
Předpokládejme že máme náhodnou veličinu X která má
hustotu pravděpodobnosti definovanou takto:



1
f (x) = b − a


0
x ∈ (a, b)
x jinak
Distribučnı́ funkci zı́skáme snadno jako
Z x
Z x


0



x − a
1
dt =
F(x) =
f (t)dt =

−∞
−∞ b − a

b−a


1
x≤a
a≤x<b
x≥b
Necht’ pro našı́ X platı́ a = 0 b = 2. Pak tedy:
c Rost 2006
°
Prı́klad


1
f (x) =
2

0
a
Z x
Z x
x ∈ (0, 2)
x jinak


0




1
x
F(x) =
dt =
f (t)dt =

−∞
−∞ 2

2


1
x≤0
0≤x<2
x≥2
c Rost 2006
°
Střednı́ hodnota náhodné veličiny
Nejčastěji použı́vanou čı́selnou charakteristikou polohy je prvnı́
obecný moment, který se nazývá střednı́ hodnota náhodné
veličiny X. Budeme jej označovat symbolem E(X).
Pro diskrétnı́ náhodnou veličinu X, x ∈ [a; b] s pravděpodobnostnı́
funkcı́ P(X = x) je E(X) definována jako:
E(X) =
n
X
xiP(X = xi) =
n
X
xipi .
i=1
i=1
Pro spojitou náhodnou veličinu X s hustotou pravděpodobnosti
f (x) je E(X) definována jako:
Zb
E(X = x) =
xf (x)dx .
a
c Rost 2006
°
Rozptyl náhodné veličiny
Popis polohy je třeba často doplnit o informaci, jak se rozptylujı́
jednotlivé hodnoty náhodné veličiny kolem nějaké charakteristiky polohy (nejčastěji kolem střednı́ hodnoty). Tuto informaci
podávajı́ charakteristiky variability. Mezi ně patřı́ rozptyl D(X).
Ten je stanoven jako druhý centrálnı́ moment:
D(X) = E{[X − E(X)]2}
V přı́padě diskrétnı́ náhodné veličiny X je definován jako:
D(X) =
n
X
[xi − E(X)]2pi .
i=1
V přı́padě spojité náhodné veličiny X je definován jako:
Zb
D(X) =
[xi − E(X)]2f (x)dx .
a
c Rost 2006
°
Přı́klad
Předpokládejme, že náhodná veličina X popisujı́cı́ podı́l jisté
reklamnı́ společnosti na tuzemském trhu, během jistého týdne,
může být popsána následujı́cı́ hustotou pravděpodobnosti:


3
(1 − x2)
f (x) = 2

0
0≤x≤1
jinak
Určeme: Distribučnı́ funkci, střednı́ hodnotu, medián, a rozptyl.
Distribučnı́ funkce
Zx
F(x) =
0
" #x 
"
#
3
3
3
3 x
y 
x
2
= x−
(1 − y )dy =
[y]0 −
.

2
2
3
0
2
3
c Rost 2006
°
Přı́klad
Medián zı́skáme jednoduše:
"
F(xα) = F(x0,5) =
x3
3
1
= x−
2
2
3
#
zı́skáme x3 − 3x + 1 = 0. Kořeny této kubické rovnice jsou
přibližně: −1, 879, 0,34729 a 1, 5320.
Hodnota mediánu je tedy 0, 34729.
Střednı́ hodnota:
Z1
E(X) =
0
"
3
3  x2
2
x (1 − x )dx =
2
2 2
#1
0
"
x4
−
4
#1 
=
0
3
.
8
c Rost 2006
°
Přı́klad
Rozptyl: K výpočtu rozptylu našı́ náhodné veličiny X využijeme
známého vzorce D(X) = E(X 2) − [E(X)]2.
E(X 2) =
Z1
" #1
" #1 
3
1
3 x
x5 
3
2
2
x (1 − x )dx =
−
= .
0
2
2
3
0
5
5
0
Pak již jednoduše:
" #2
3
1
D(X) = −
5
8
9
19
1
=
= 0, 05937 .
= −
5 64
320
c Rost 2006
°

Podobné dokumenty

A, P

A, P jako vždy) pro 3 kompoty. Pokud přinese všechny hruškové, budete maximálně spokojeni a sourozenec bude pochválen. Pokud přinese všechny třešňové, půjde znova. V jiném přı́padě to ...

Více

Základní vety diferenciálního poctu

Základní vety diferenciálního poctu Tı́mto důsledkem jsou vytvořeny předpoklady k definici pojmu neurčitý integrál.

Více

Text, který obsahuje poznámky k přednáškám

Text, který obsahuje poznámky k přednáškám (d) Paula je bankovnı́ úřednice a aktivnı́ feministka. (e) Paula je bankovnı́ úřednice a aktivnı́ feministka, která cvičı́ jógu. (f) Paula pracuje v malém knihkupectvı́ a je aktivnı́ femin...

Více

Metody Pocítacového Videní (MPV) - Machine learning

Metody Pocítacového Videní (MPV) - Machine learning I trénovacı́ množina X obsahujı́cı́ N prvků je algoritmem bootstrap aggregating rozdělena na T množin (počet stromů), X(t) I každá obsahuje N(t) prvků, přičemž N(t) ≤ N (pozn. vzorové...

Více

Sbırka ´uloh ze z´aklad ˚u matematiky 1

Sbırka ´uloh ze z´aklad ˚u matematiky 1 Úloha 0.17 Vrchol paraboly - optimalizace zisku. Hotel ”Blue Star”v Las Vegas, který má přesně 300 pokojů, se plně obsadı́ každý den při ceně 80 dolarů za pokoj. Jestliže se cena za po...

Více

1. Úvod 1.1. Prostor elementárnıch jevu, algebra

1. Úvod 1.1. Prostor elementárnıch jevu, algebra Definice 1. Označme Ω prostor elementárnı́ch jevů, ω ∈ Ω elementárnı́ jev, A ⊂ Ω jev. Definice 2. Bud’te A, B jevy, potom • A = Ω je jev jistý. • AC je jev opačný k jevu A. Platı́ ω ∈ A Y ω ...

Více

Stáhnout v PDF

Stáhnout v PDF Speciálním zážitkem je King Crab. Přinesou vám ho i s kladivem, abyste si užili nejen konzumaci, ale i dobývání chutného masa z krunýře a klepet. A tak sedíte u stolu, mydlíte kladivem do prkýnka, ...

Více

Bubble Trouble Uživatelská Dokumentace

Bubble Trouble Uživatelská Dokumentace levém horním rohu číslo, ukazující počet životů. Také může mít v levém dolním rohu červené číslo, indikující ohnivzdornost a ukazující, jak dlouho ještě bude trvat. Bonusy ... jsou červená kolečka ...

Více