základy teorie pravděpodobnoti

Transkript

základy teorie pravděpodobnoti
Přírodovědecká fakulta
ZÁKLADY TEORIE
PRAVDĚPODOBNOTI
Ivan Křivý
OSTRAVSKÁ UNIVERZITA 2004
OSTRAVSKÁ UNIVERZITA
ZÁKLADY TEORIE
PRAVDĚPODOBNOSTI
Ivan Křivý
ÚVOD
1
1. PROSTOR ELEMENTÁRNÍCH JEVŮ
3
1.1. Náhodné pokusy a náhodné jevy..................................................................................... 3
1.2. Vztahy mezi jevy a operace s jevy .................................................................................. 4
1.3. Prostor elementárních jevů.............................................................................................. 7
2. PRAVDĚPODOBNOST
11
2.1. Úloha teorie pravděpodobnosti ..................................................................................... 11
2.2. Kolmogorovova axiomatická soustava. Pravděpodobnostní prostor ............................ 12
2.3. Klasifikace pravděpodobnostních prostorů................................................................... 16
2.4. Klasická definice pravděpodobnosti ............................................................................. 17
2.5. Kombinatorický výpočet pravděpodobností ................................................................. 19
2.6 Geometrická pravděpodobnost...................................................................................... 24
2.5. Pravděpodobnost a četnost. Statistická definice pravděpodobnosti............................. 26
3. PODMÍNĚNÁ PRAVDĚPODOBNOST
31
3.1. Podmíněná pravděpodobnost ........................................................................................ 31
3.2. Nezávislost jevů ............................................................................................................ 33
3.3. Vzorec pro úplnou pravděpodobnost ............................................................................ 36
3.4. Bayesův vzorec ............................................................................................................. 37
Korespondenční úkol 1......................................................................................................... 41
4. NÁHODNÉ VELIČINY A JEJICH ROZDĚLENÍ
43
4.1. Základní pojmy ............................................................................................................. 43
4.2. Distribuční funkce ......................................................................................................... 45
4.3. Rozdělení diskrétní náhodné veličiny ........................................................................... 48
4.4. Rozdělení absolutně spojité náhodné veličiny .............................................................. 51
4.5. Náhodné vektory a jejich distribuční funkce................................................................. 54
4.6. Rozdělení náhodných vektorů....................................................................................... 57
A. Sdružené rozdělení dvou diskrétních náhodných veličin ............................................ 57
B. Sdružené rozdělení dvou absolutně spojitých náhodných veličin ............................... 60
4.7. Nezávislost náhodných veličin...................................................................................... 62
4.8. Funkce náhodných veličin............................................................................................. 64
A. Funkce jedné absolutně spojité náhodné veličiny ....................................................... 64
B. Funkce několika absolutně spojitých náhodných veličin ............................................ 66
5. ČÍSELNÉ CHARAKTERISTIKY NÁHODNÝCH VELIČIN
69
5.1. Klasifikace charakteristik.............................................................................................. 69
5.2. Střední hodnota ............................................................................................................. 70
5.3. Rozptyl a směrodatná odchylka .................................................................................... 74
5.4. Momentové charakteristiky........................................................................................... 76
5.5. Kvantilové a jiné charakteristiky................................................................................... 79
5.6. Charakteristiky náhodných vektorů .............................................................................. 81
A. Marginální charakteristiky .......................................................................................... 81
B. Podmíněné charakteristiky .......................................................................................... 82
C. Charakteristiky vztahu mezi náhodnými veličinami ................................................... 82
6. ROZDĚLENÍ DISKRÉTNÍHO TYPU
87
6.1. Bernoulliovy pokusy ..................................................................................................... 87
6.2. Binomické rozdělení ..................................................................................................... 88
6.3. Poissonovo rozdělení..................................................................................................... 91
6.4. Jiná rozdělení................................................................................................................. 94
A. Alternativní rozdělení.................................................................................................. 94
B. Negativně binomické rozdělení ................................................................................... 94
C. Geometrické rozdělení................................................................................................. 95
D. Hypergeometrické rozdělení ....................................................................................... 95
E. Rovnoměrné diskrétní rozdělení.................................................................................. 96
7. ROZDĚLENÍ ABSOLUTNĚ SPOJITÉHO TYPU
99
7.1. Normální rozdělení........................................................................................................ 99
7.2. Exponenciální rozdělení.............................................................................................. 102
7.3. Rovnoměrné spojité rozdělení..................................................................................... 104
7.4. Speciální rozdělení ...................................................................................................... 106
A. χ 2 rozdělení.............................................................................................................. 106
B. t rozdělení .................................................................................................................. 107
C. F rozdělení................................................................................................................. 108
Korespondenční úkol 2....................................................................................................... 111
8. ZÁKON VELKÝCH ČÍSEL
113
8.1. Čebyševovy nerovnosti ............................................................................................... 113
8.2. Konvergence podle pravděpodobnosti ........................................................................ 115
8.3. Zákon velkých čísel v Čebyševově tvaru.................................................................... 116
8.4. Zákon velkých čísel v Bernoulliově tvaru................................................................... 119
9. CENTRÁLNÍ LIMITNÍ VĚTA
121
9.1. Laplaceův div .............................................................................................................. 121
9.2. Moivreova - Laplaceova formulace centrální limitní věty.......................................... 122
9.3. Ljapunovova formulace centrální limitní věty ............................................................ 125
9.4. Užití centrální limitní věty .......................................................................................... 127
A. Pravidlo 3σ ............................................................................................................... 128
B. Pravděpodobnost a relativní četnost .......................................................................... 128
C. Aplikace na aritmetický průměr ................................................................................ 129
LITERATURA
131
Příloha I.
133
ANOTACE
Předkládaná distanční opora představuje úvod do moderní teorie pravděpodobnosti. Je
určena posluchačům distančního studia studijního oboru Aplikovaná matematika. Zahrnuje
následující témata:
Prostor elementárních jevů, náhodný jev, algebra jevů.
Kolmogorovova axiomatická soustava.
Pravděpodobnostní prostory.
Podmíněná pravděpodobnost, nezávislost jevů, věta o úplné pravděpodobnosti,
Bayesova věta.
Náhodné veličiny, jejich rozdělení a číselné charakteristiky.
Náhodné vektory.
Funkce náhodných veličin.
Zákony velkých čísel.
Centrální limitní věta a její aplikace.
V příloze I je navíc uvedena tabulka hodnot Laplaceovy funkce,
pravděpodobností pro náhodné veličiny s normálním rozdělením.
určená
k výpočtu
ÚVOD
Předkládaná distanční opora (modul), která se Vám dostává do ruky, je
určena pro jednosemestrální studium základů teorie pravděpodobnosti.
Plně pokrývá požadavky učebních osnov kurzu PAST1 (Pravděpodobnost
a statistika 1), zařazeného do 3. semestru prezenčního studia aplikované
matematiky na Přírodovědecké fakultě Ostravské univerzity. Navíc
obsahuje základní informace o náhodných vektorech, jejich rozdělení a
speciálních rozděleních používaných v matematické statistice.
Poslání modulu
Cíle modulu:
Po prostudování tohoto modulu
• pochopíte základní pojmy teorie pravděpodobnosti (náhodný
pokus, náhodný jev, pravděpodobnost jevu, atd.),
• seznámíte se s axiomatickým přístupem k teorii pravděpodobnosti
(Kolmogorovova axiomatická soustava),
• naučíte se počítat pravděpodobnosti náhodných jevů s využitím
kombinatorických principů, vzorce pro úplnou pravděpodobnost a
Bayesova vzorce,
• pochopíte význam náhodných veličin a náhodných vektorů
v praxi,
• naučíte se počítat číselné charakteristiky náhodných veličin
s rozděleními diskrétního i spojitého typu,
• pochopíte význam různých formulací zákona velkých čísel i
centrální limitní věty a naučíte se je aplikovat v praxi.
Celý modul je rozčleněn do následujících devíti lekcí :
•
prostor elementárních jevů,
•
pravděpodobnost,
•
podmíněná pravděpodobnost a nezávislost jevů,
•
náhodné veličiny a jejich rozdělení,
•
číselné charakteristiky náhodných veličin,
•
rozdělení diskrétního typu,
•
rozdělení absolutně spojitého typu,
•
zákon velkých čísel,
•
centrální limitní věta.
Obsah modulu
Nedílnou součástí skripta jsou i tabulky hodnot Laplaceovy funkce (viz
příloha I), užitečné k výpočtu pravděpodobností pro náhodné veličiny
s normálním rozdělením.
U jednotlivých lekcí jsou dodržena následující pravidla:
• je specifikován cíl lekce (tedy to, co by měl student po jejím
prostudování umět, znát, pochopit),
Struktura modulu
1
•
•
•
•
vlastní výklad učiva, popř. otázky k textu,
řešené příklady,
kontrolní úkoly (příklady) k procvičení učiva,
korespondenční úkoly.
Oba zařazené korespondenční úkoly mají charakter testů, které jsou
určeny k ověření Vašich znalostí po prostudování příslušných témat.
Součástí Vašich studijních povinností je splnění obou korespondenčních
úkolů; jejich hodnocení bude započteno do celkového hodnocení kurzu.
V každé kapitole je uvedeno vše potřebné pro samostatné studium,
počínaje definicemi základních pojmů a konče využitím teoretických
poznatků v praxi. Všechny uvedené matematické věty s výjimkou
formulací centrální limitní věty jsou podrobně dokazovány. V zájmu
správného pochopení probírané látky jsou jednotlivá témata doplněna
řešením typových příkladů. Doporučujeme čtenáři, aby se nad každým
příkladem důkladně zamyslel. Pochopení principů řešení je totiž
nezbytným předpokladem pro porozumění dalšímu výkladu. Chtěli
bychom také upozornit na to, že obrázky, které užíváme k ilustraci
probíraných témat, jsou schématické.
Čas potřebný k prostudování jednotlivých lekcí explicitně neuvádíme,
neboť z našich zkušeností vyplývá, že rychlost studia značně záleží na
Vašich schopnostech a studijních návycích.
Předpokládáme, že si mnozí z Vás budou chtít doplnit a rozšířit
poznatky studiem dalších učebnic a skript z teorie pravděpodobnosti.
Můžeme Vám proto doporučit učební texty jak v češtině
[1,2,5,8,9,11,12,13,16,18,19,20], tak i ve slovenštině [17], polštině [7],
angličtině [3] a ruštině [4]. K procvičení praktických dovedností při řešení
příkladů Vám poslouží sbírky úloh [6,14,17].
Věříme, že Vám předkládaný studijní materiál pomůže pochopit
základní principy teorie pravděpodobnosti, a přejeme Vám hodně úspěchů
ve studiu.
Autor
Autor děkuje touto cestou oběma recenzentům (PaedDr. Hashimu Habiballovi, Ph.D.,
a RNDr. Anně Madryové, Ph.D.) za pečlivé pročtení rukopisu a řadu cenných připomínek
směřujících ke zkvalitnění předkládaného učebního textu.
2
1. PROSTOR ELEMENTÁRNÍCH JEVŮ
Tato kapitola je koncipována tak, abyste po jejím prostudování:
• pochopili některé základní pojmy z teorie pravděpodobnosti
(náhodný pokus, náhodný jev, prostor elementárních jevů),
• poznali základní vztahy mezi jevy a operace s jevy a
uvědomili si, že jde vlastně o vztahy mezi množinami a
operace s množinami,
• naučili se znázorňovat vztahy mezi jevy a operace s jevy
pomocí Vennových diagramů,
• naučili se pracovat s výrazy, které obsahují jevy.
V této kapitole se seznámíte s některými základními pojmy teorie
pravděpodobnosti (náhodný pokus, náhodný jev, prostor
elementárních jevů), při výkladu vycházíme z učebnice Tutubalina
[20]. Je důležité, abyste pochopili, že vztahy mezi jevy a operace
s jevy jsou vlastně vztahy mezi množinami a operace s množinami, a
proto je můžete znázorňovat pomocí Vennových diagramů.
1.1. Náhodné pokusy a náhodné jevy
Teorie pravděpodobnosti studuje matematické modely náhodných
pokusů, tj. takových pokusů, jejichž výsledek není zcela jednoznačně
určen podmínkami pokusu. Pokusem se přitom obecně rozumí každá
realizace určitého komplexu podmínek. Oblíbeným příkladem náhodného
pokusu je hod mincí. Hodíme-li totiž mincí, může padnout buď líc nebo
rub mince.
Náhodný pokus
Teorie pravděpodobnosti se nezabývá libovolnými náhodnými pokusy,
ale pouze těmi, které mají vlastnosti:
a) hromadnosti,
b) statistické stability neboli stability četností.
Určitý pokus má vlastnost hromadnosti, když se může libovolněkrát
opakovat, nebo když se může realizovat na hromadně se vyskytujících
rovnocenných objektech. Vlastnost statistické stability lze popsat takto:
Označme písmenem A jeden z možných výsledků náhodného pokusu a
opakujme tento pokus n-krát. Předpokládejme, že se v těchto n pokusech
vyskytl výsledek A právě nA krát. Poměr nA/n se nazývá relativní četností
výsledku A. Vlastnost statistické stability spočívá v tom, že v opakovaných
sériích pokusů při dostatečně velkém, pevně zvoleném n kolísá tato
relativní četnost nepatrně kolem jistého reálného čísla, které intuitivně
považujeme za pravděpodobnost dosažení výsledku A v daném pokusu.
Základním pojmem teorie pravděpodobnosti je náhodný jev.
Náhodným jevem (stručně jevem) rozumíme jakýkoliv možný výsledek
provedeného náhodného pokusu. Každému pokusu přísluší určitá množina
jevů (možných výsledků) a o každém jevu z množiny, jež odpovídá tomuto
pokusu, lze při každém výsledku pokusu rozhodnout, zda nastal či
nenastal. Vytvoření abstraktního modelu nějakého náhodného pokusu
3
Náhodný jev
předpokládá, že se nejprve vymezí množina všech možných výsledků
tohoto pokusu. Při vymezení této množiny jevů spjatých s daným pokusem
se vychází z představy zidealizovaného (zjednodušeného) pokusu.
V případě hodu mincí se uvažují pouze dva možné jevy: padnutí líce a
padnutí rubu mince, i když je možné, že se mince ztratí ze zorného pole
nebo postaví na "hranu".
Jev jistý
Jev nemožný
Jev, který zákonitě nastane při každé realizaci určitého pokusu
(komplexu podmínek), se nazývá jevem jistým. Jestliže je známo, že
nějaký jev nemůže principiálně v daném pokusu nastat, pak se tento jev
nazývá jevem nemožným. Jev, jenž při realizaci určitého pokusu nastat
může, ale nemusí, se nazývá jevem možným.
Z uvedeného je zřejmé, že má smysl mluvit o nutnosti, nemožnosti
nebo náhodnosti nějakého jevu jen ve vztahu k určitému pokusu.
1.2. Vztahy mezi jevy a operace s jevy
Předpokládejme, že je dán určitý komplex podmínek (pokus). Uvažme
množinu jevů A, B, C,..., z nichž každý může při realizaci zmíněného
pokusu nastat či nenastat, a sledujme vztahy mezi nimi. K označování jevů
budeme v těchto skriptech zpravidla používat velkých písmen latinské
abecedy. Jev jistý budeme označovat písmenem Ω, jev nemožný
písmenem «.
Ekvivalence jevů
Z jevu A
plyne jev B
1.
Dva jevy, které při každé realizaci pokusu buď oba nastanou, nebo
oba nenastanou, považujeme za ekvivalentní (sobě rovny).
Skutečnost, že jevy A a B jsou ekvivalentní, značíme symbolem = ,
tzn. píšeme A = B.
2.
Jestliže výskyt (nastoupení) jevu A má vždy za následek výskyt jevu
B, potom říkáme, že z jevu A plyne jev B, a tuto okolnost zapisujeme
A ⊆ B.
3.
Jev, který nastane právě tehdy, nastane-li současně jev A i jev B,
nazýváme průnikem (součinem) jevů A a B a značíme A ∩ B (nebo
AB). Tím je definována binární operace průniku (násobení) jevů.
Výsledek této operace zřejmě nezávisí na pořadí jevů A a B, takže platí
komutativní zákon
Průnik (součin)
jevů
A ∩ B = B ∩ A.
Dále je zřejmé, že každý jev je idempotentní vzhledem k operaci průniku,
což lze zapsat ve tvaru
A ∩ A = A.
Definici průniku jevů je možno zobecnit na libovolný počet jevů, přičemž
lze snadno ukázat, že pro operaci průniku jevů platí i asociativní zákon
A ∩ ( B ∩ C ) = ( A ∩ B ) ∩ C.
Sjednocení
(součet) jevů
4. Jev, jenž nastane právě tehdy, nastane-li aspoň jeden z jevů A a B,
(součtem) jevů A a B a značíme
nazýváme sjednocením
A ∪ B (nebo A + B). Je bezprostředně vidět, že pro takto definovanou
operaci sjednocení platí zákon komutativní
4
A∪ B = B ∪ A
a rovněž zákon asociativní
A ∪ ( B ∪ C ) = ( A ∪ B ) ∪ C.
Definici sjednocení jevů lze tedy zřejmým způsobem rozšířit na větší počet
jevů. Každý jev je také idempotentní vzhledem k operaci sjednocení, tj,
platí
A ∪ A = A.
5. Okolnost, že jev A nenastal, představuje rovněž určitý jev. Značíme jej
A a nazýváme jevem opačným (komplementárním) k jevu A. Jevy A
a A jsou navzájem opačné, jestliže současně splňují tyto vztahy
Jev opačný
(komplementární)
A ∪ A = Ω, A ∩ A = ∅.
Přímo z definice opačného jevu plyne
A = A.
6. Jev, který nastane právě tehdy, když nastane jev A a současně
nenastane jev B, se nazývá rozdílem jevů A a B v tomto pořadí a označuje
A − B. Binární operace odčítání se na množině všech možných jevů
definuje vzorcem
Rozdíl jevů
A − B = A ∩ B.
S pomocí operace odčítání lze zapsat opačný jev v této formě
A = Ω − A.
Odčítání jevů nevyhovuje všem pravidlům známým z algebry.
7. Jevy A a B se nazývají neslučitelnými, jestliže jejich současný
výskyt je jevem nemožným, tj, jestliže platí
A ∩ B = ∅.
Neslučitelnost
jevů
Uvedenou definici lze zobecnit na libovolný počet jevů takto:
Jevy A1 , A2 ,..., An jsou neslučitelné, jestliže jsou po dvou neslučitelné, tj.
jestliže platí
Ai ∩ Aj = ∅ pro každé i ≠ j;
i, j = 1, 2,..., n.
8. Jestliže platí
n
B = ∪ Ai ,
i =1
Ai ∩ Aj = ∅ pro každé i ≠ j
( i, j = 1, 2,..., n),
Ai ≠ ∅, (i = 1, 2,..., n),
pak říkáme, že jevy A1 , A2 ,..., An tvoří rozklad jevu B nebo že se jev B
skládá z dílčích jevů A1 , A2 ,..., An .
5
Rozklad jevu
Úplný systém
neslučitelných
jevů
9. Soustava jevů A1 , A2 ,..., An
neslučitelných jevů, platí-li vztahy
n
∪ A = Ω,
i
se nazývá úplným systémem
Ai ∩ Aj = ∅ pro každé i ≠ j
( i, j = 1, 2,..., n),
i =1
Ai ≠ ∅, (i = 1, 2,..., n),
Úplnou soustavou neslučitelných jevů je ve smyslu této definice např.
soustava (A, A ), ovšem za předpokladu, že A ≠ ∅, A ≠ Ω.
Příklady
1.1. Průmyslově vyráběný filtr je podroben třem různým zkouškám. Jev
A spočívá v tom, že náhodně vybraný filtr obstojí při první zkoušce, jev B
v tom, že obstojí ve druhé, a jev C v tom, že obstojí ve třetí zkoušce.
Vyjádřete symbolicky, že filtr obstojí:
a) jen v první zkoušce;
b) ve všech třech zkouškách;
c) alespoň v jedné zkoušce?
Řešení
a) Současné nastoupení jevů A, B a C se symbolicky vyjádří jako průnik
A ∩ B ∩ C.
b) Současné nastoupení jevů A, B a C se symbolicky vyjádří jako průnik
A ∩ B ∩ C.
c) Jev "obstát alespoň jednou" je opačným jevem k jevu "neobstát ani
jednou", takže celou situaci lze symbolicky popsat jako
Ω − A ∩ B ∩ C = A ∪ B ∪ C.
1.2. Zjednodušte následující výraz
( A ∪ B) ∩ ( A ∪ B )
Řešení.
( A ∪ B ) ∩ ( A ∪ B ) = A ∪ ( B ∩ B ) = A ∪ ∅ = A.
Kontrolní úkoly
1.1. Zjednodušte následující výrazy:
a) ( A ∪ B ) ∩ ( B ∪ C ) ,
b) A ∩ B ∪ A ∩ B ∪ A ∩ B ,
c) A ∪ B ∪ A ∪ B ,
1.2. Dokažte:
a) A ∩ B = A ∪ B,
b) A ∪ B = A ∩ B,
c) A ∩ B ∪ C ∩ D = ( A ∪ B ) ∩ ( C ∪ D ) .
6
1.3. Do terče se vystřelí tři rány. Nechť jev Ak označuje zásah při k-
tém výstřelu ( k = 1, 2,3) . Vyjádřete pomocí operací
s jevy Ak a Ak následující jevy:
a) všechny tři zásahy,
d) zásah pouze třetím výstřelem,
b) alespoň jeden zásah,
e) nejvýše jedna chybná rána,
c) nejméně dva zásahy,
f) všechny tři rány chybné.
1.3. Prostor elementárních jevů
Jev A se nazývá složeným jevem, jestliže jej lze vyjádřit jako
sjednocení (součet) dvou jevů, z nichž žádný není ekvivalentní jevu A:
Složený jev
A = B ∪ C , kde B ≠ A, C ≠ A.
Předpoklady B ≠ A, C ≠ A jsou nutné k tomu, abychom vyloučili
triviální vyjádření A = A ∪ ∅, A = A ∪ A, která jsou možná pro každý jev
A. Jevy, jež nelze takto vyjádřit, se nazývají elementárními jevy. Složené
jevy mohou nastat několika různými způsoby, kdežto elementární jevy
pouze jedním. Nemožný jev « se nepočítá mezi elementární jevy.
Elementární jev
Vysvětleme si rozdíl mezi složenými a elementárními jevy na
konkrétním příkladě. Uvažme náhodný pokus, který spočívá v hodu dvěma
hracími kostkami. Nechť A značí jev, že padne součet 10, a B jev, že padne
součet 12. Jev A je zřejmě složený jev, neboť součtu 10 může být dosaženo
jednou tak, že na obou kostkách padne číslo 5, podruhé tak, že padnou
čísla 4 a 6. Přitom posledně uvedený jev je zase složený, protože může
padnout buď číslo 4 na první a číslo 6 na druhé kostce, nebo obráceně.
Naproti tomu jev B je jevem elementárním, neboť může nastat jedině tak,
že na obou kostkách padne číslo 6.
V moderní teorii pravděpodobnosti se uvažují matematické modely,
v nichž jsou zachyceny všechny možné elementární (dále nerozložitelné)
výsledky pokusu. Každému takovému výsledku pokusu odpovídá právě
jeden elementární jev. Množina všech elementárních jevů spjatých
s uvažovaným pokusem se nazývá prostorem elementárních jevů a značí
se zpravidla písmenem Ω. Povaha prvků prostoru elementárních jevů je
nepodstatná; mohou to být body eukleidovského prostoru, funkce jedné
nebo více proměnných apod. Prostor elementárních jevů, který obsahuje
konečný nebo spočetný počet elementárních jevů, nazýváme diskrétním
prostorem elementárních jevů. Jednoduchým příkladem diskrétního
prostoru elementárních jevů jsou množiny všech možných elementárních
jevů při hodu n mincemi nebo n hracími kostkami. Poněkud složitější je
situace v případě pokusu, který spočívá v tom, že se hází mincí do té doby,
než padne poprvé např. líc mince. Prostor elementárních jevů tvoří
znakové posloupnosti E1 = L, E2 = RL, E3 = RRL, ..., v nichž symbol R
označuje padnutí rubu a symbol L padnutí líce mince. Také v tomto
případě jde o diskrétní prostor elementárních jevů, protože množina
možných elementárních jevů je sice nekonečná, ale spočetná. Ne všechny
prostory elementárních jevů jsou ovšem diskrétní. Lze dokázat, že prostor
elementárních jevů sestávající ze všech kladných čísel není diskrétní.
7
Prostor
elementárních jevů
Náhodný jev
Definice operací
s jevy pomocí
elementárních jevů
Libovolnou podmnožinu diskrétního prostoru elementárních jevů Ω
nazveme náhodným jevem nebo stručně jevem. Jev je tedy jen jiné
označení pro podmnožinu prostoru Ω, proto lze očekávat, že pro jevy
budou platit všechna tvrzení, která platí pro množiny. Operace s jevy se
redukují na operace s množinami a řídí se týmiž pravidly. V dalším
uvedeme definice základních jevových relací v nové terminologii,
založené na pojmu prostoru elementárních jevů. Jde v podstatě o "překlad"
definic uvedených v předcházejících odstavcích do množinového jazyka.
1.
Jev jistý je ekvivalentní množině všech elementárních jevů. Jev
nemožný je ekvivalentní prázdné množině.
2.
Průnikem (součinem) jevů A a B nazýváme jejich množinový průnik,
tj. jev, který se skládá právě z těch elementárních jevů, jež patří
současně k oběma jevům A i B.
3.
Sjednocením (součtem) jevů A a B nazýváme jejich množinové
sjednocení, tj. jev, který se skládá právě z těch elementárních jevů, jež
patří k jevu A nebo k jevu B nebo k oběma současně.
4.
Rozdílem jevů A a B nazýváme jejich množinový rozdíl v uvedeném
pořadí, tj. jev, který se skládá právě z těch elementárních jevů, jež patří
k jevu A a nepatří k jevu B.
5.
Opačným (komplementárním) jevem k jevu A nazýváme
množinový doplněk množiny A vzhledem k množině Ω, tj. jev, který se
skládá právě z těch elementárních jevů, jež nepatří k jevu A.
Analogickým způsobem lze definovat pomocí nové terminologie i
všechny další jevové relace. Ke grafickému znázornění jevových relací se
běžně využívá Vennových diagramů (viz obr. 1.1).
Ω
Ω
A∩B
A
A∪B
B
A
a) průnik jevů A a B
B
b) sjednocení jevů A a B
Ω
Ω
A
A− B
A
c) rozdíl jevů A a B
B
A
d) jev opačný k jevu A
Obr. 1.1. Vennovy diagramy pro znázornění základních operací s jevy.
8
Pojmy k zapamatování:
• náhodný pokus
• náhodný jev
• jev jistý a jev nemožný
• jev opačný (komplementární)
• ekvivalence jevů
• průnik (součin) jevů
• sjednocení (součet) jevů
• rozdíl jevů
• rozklad jevu
• neslučitelnost jevů
• úplný systém neslučitelných jevů
• jev složený a jev elementární
• prostor elementárních jevů
Shrnutí
V této úvodní kapitole jste poznali některé základní pojmy teorie
pravděpodobnosti (náhodný pokus, náhodný jev, prostor elementárních
jevů atd.) a naučili jste se pracovat s algebraickými výrazy, které obsahují
jevy. Je velmi důležité, abyste zavedené pojmy správně pochopili. Věnujte
této části mimořádnou pozornost a teprve, až se ujistíte, že jste všemu
porozuměli, přistupte ke studiu dalších kapitol.
9
10
2. PRAVDĚPODOBNOST
Obsah této kapitoly je koncipován tak, abyste po jejím prostudování:
• poznali základy moderní teorie pravděpodobnosti založené na
Kolmogorovově axiomatické soustavě,
• pochopili základní pojmy této axiomatické soustavy (σ-algebra
jevů, pravděpodobnostní prostor, pravděpodobnostní míra),
• poznali
základní
vlastnosti
pravděpodobnostní
míry
(pravděpodobnosti),
• naučili se (s využitím těchto základních vlastností) počítat
pravděpodobnosti „složitějších“ jevů,
• zopakovali
si
středoškolské
poznatky
z teorie
pravděpodobnosti (klasická pravděpodobnost, geometrická
pravděpodobnost),
• pochopili statistický přístup k zavedení pravděpodobnosti jevu.
V této kapitole jsme zvolili netradiční přístup k výkladu základů
teorie pravděpodobnosti. Nejprve se budeme zabývat Kolmogorovovou
axiomatickou soustavou a provedeme klasifikaci pravděpodobnostních
prostorů. Ukážeme, že definice klasické i geometrické
pravděpodobnosti vycházejí ze speciálních typů pravděpodobnostního
prostoru. Základní vlastnosti pravděpodobnosti budou striktně
dokázány. Důkazů se obávat nemusíte. Sami poznáte, že jsou vesměs
velmi jednoduché.
2.1. Úloha teorie pravděpodobnosti
Věda na základě pokusů a pozorování formuluje zákony, kterými se řídí
průběh sledovaných dějů. V přírodě se vyskytují zákony dvojího typu:
a) deterministické,
b) pravděpodobnostní neboli stochastické.
Schéma deterministického zákona je jednodušší. Lze jej formulovat
takto: Při každé realizaci pokusu (komplexu podmínek) K nutně nastane
určitý jev A. Uveďme jednoduchý příklad. Při libovolné chemické reakci
probíhající v nějakém izolovaném systému (komplex podmínek K) zůstává
celkové množství látky konstantní (jev A). Uvedené tvrzení je formulací
zákona o zachování hmoty. Čtenář jistě sám nalezne celou řadu příkladů
podobných zákonů ve fyzice, chemii, biologii a jiných vědách.
V přírodě i v běžném životě se však vyskytují četné děje, které nelze
popsat deterministickým schématem a které lze charakterizovat takto:
V důsledku realizace pokusu (komplexu podmínek) K může jev A nastat,
ale může také nenastat. Zákony tohoto typu se nazývají
pravděpodobnostními neboli stochastickými zákony. Sledujeme-li např.
určitý atom radioaktivního prvku po určitou dobu, pak je možné, že se
tento atom během sledování rozpadne, avšak je také možné, že se
11
Deterministický
zákon
Stochastický zákon
nerozpadne. Okamžik, kdy k rozpadu dojde, závisí na dějích, které se
odehrávají v atomovém jádru a které většinou neznáme ani nemůžeme
pozorovat. O výskytu náhodných jevů, jež nastávají ve velkém počtu, lze
získat určitou informaci navzdory jejich náhodné povaze. Uvažujeme-li
např. radioaktivní rozpad určité látky, můžeme předpovědět, jaká část této
látky se během dané doby rozpadne. Radioaktivní rozpad se řídí
exponenciálním zákonem, který je charakterizován poločasem rozpadu, tj.
dobou, během níž se rozpadne polovina atomů radioaktivní látky.
Exponenciální zákon rozpadu je typickým pravděpodobnostním zákonem;
přitom je experimentálně potvrzen s nemenší přesností než většina tzv.
deterministických zákonů přírodních věd. V případě pravděpodobnostních
zákonů není ovšem komplexem uvažovaných podmínek určen přesný
průběh dějů. Základní úlohou teorie pravděpodobnosti je studium pravděpodobnostních zákonů a zákonitostí, jimiž se řídí hromadné jevy. Odtud
také vyplývá velký praktický význam teorie pravděpodobnosti, vždyť s
hromadnými náhodnými jevy se setkáváme téměř ve všech oblastech vědy,
techniky i každodenního života.
Skoro každé deterministické schéma přírodních věd se při
podrobnějším zkoumání ukáže pravděpodobnostním. Uvažme např.
chemickou reakci dvou látek X a Y ve vodném roztoku. Rychlost této
reakce je v každém časovém okamžiku úměrná součinu okamžitých
koncentrací látek X a Y. Tento zákon se obvykle považuje za
deterministický. Přitom se ovšem atomy, resp. ionty, obou látek volně
pohybují v roztoku, takže pouze průměrný počet "srážek" částic látky X
s částicemi látky Y je úměrný součinu koncentrací obou látek. Jde tedy
v podstatě o zákon pravděpodobnostní povahy.
2.2. Kolmogorovova axiomatická soustava.
Pravděpodobnostní prostor
Matematické vlastnosti pravděpodobnosti se vymezují prostřednictvím
tzv. axiomatické soustavy vlastností. Tato soustava postuluje minimální
možný počet vlastností pravděpodobnosti, z nichž lze všechny další
vlastnosti vyvodit deduktivním postupem. Tvrzení axiomatické soustavy
se považují za pravdivá a v rámci dané soustavy se nedokazují.
Existuje více přístupů k axiomatické výstavbě teorie pravděpodobnosti,
první z nich pochází již z roku 1917 od Bernsteina. V těchto skriptech se
však omezíme pouze na vysvětlení podstaty Kolmogorovovy axiomatické
výstavby teorie pravděpodobnosti.
Kolmogorov vychází z pojmu prostor elementárních jevů (viz
odstavec 1.3).
σ-algebra
Nechť je dána libovolná neprázdná množina Ω . Neprázdný systém À
podmnožin množiny Ω nazýváme σ-algebrou, jestliže
a) Ω ∈ À,
b) A∈ À ⇒ Ω − A ∈ À,
∞
c) Ai ∈ À, i = 1, 2, ... ⇒ ∪ Ai ∈ À.
i=1
12
Uvedenou definicí se na prostoru elementárních jevů Ω zavádí
σ-algebra náhodných jevů. Dvojice {Ω , À}se nazývá jevové pole .
σ-algebra jevů
Jevové pole
Nyní uvedeme bez důkazu základní vlastnosti σ-algebry náhodných
jevů (σ-algebry jevů).
« œ À,
1)
n
2)
Ai œ À, i = 1, 2, ..., n ⇒ ∪ Ai ∈ À,
i =1
∞
3)
Ai œ À , i = 1, 2, ... ⇒ ∩ Ai ∈ À,
i =1
n
4)
Ai œ À, i = 1, 2, ..., n ⇒ ∩ Ai ∈ À.
i =1
Základní axiomy Kolmogorovovy soustavy lze formulovat takto:
Axiom 1 (axiom nezápornosti). Každému jevu A∈ À lze přiřadit
nezáporné číslo P(A), které se nazývá pravděpodobnost jevu A.
Axiom 2 (axiom normování).
jednotková, tj. P(Ω) = 1.
Pravděpodobnost jevu jistého je
Kolmogorovovy
axiomy
Axiom 3 (axiom o σ-aditivitě pravděpodobností). Pro libovolnou
posloupnost neslučitelných jevů A1 , A2 , ... (Ai ∈ À, i = 1, 2, ...) platí
∞
∞
i =1
i =1
P (∪ Ai ) = ∑ P ( Ai ).
Z uvedených tří axiomů lze snadno odvodit několik dalších
významných vlastností pravděpodobnosti.
1. Pravděpodobnost jevu nemožného je rovna nule, tj. P (∅) = 0.
Důkaz. Položíme A1 = Ω, A2 = A3 = ... = ∅ a použijeme axiomu 3.
∞
Protože jevy A1 , A2 , ... jsou neslučitelné a platí
∪ A = Ω , dostaneme
i
i =1
∞
P (Ω) = P(Ω) + ∑ P(∅),
i=2
z čehož bezprostředně plyne dokazované tvrzení.
Ñ
2. Jsou-li jevy A1 , A2 , ... , An ∈ À neslučitelné, pak platí
n
n
i =1
i =1
P (∪ Ai ) = ∑ P ( Ai ).
Důkaz se provádí analogicky jako u vlastnosti 1.
Ñ
3. Jestliže pro jevy A, B ∈ À platí A ⊂ B , pak P ( A) ≤ P( B).
Důkaz. Platí B = A ∪ ( A ∩ B), přičemž jevy A a A ∩ B jsou neslučitelné.
Z vlastnosti 2 vyplývá P ( B) = P( A) + P( A ∩ B) a odtud s použitím
Ñ
axiomu 1 plyne uvedená nerovnost.
13
Základní vlastnosti
pravděpodobnosti
4. Pro libovolný jev A∈ À platí soustava nerovností 0 ≤ P ( A) ≤ 1.
Ñ
Důkaz. Vlastnost plyne z axiomů 1, 2 a z vlastnosti 3.
5.
Jestliže
pro
P ( B − A) = P( B ) − P( A).
A, B ∈ À
jevy
A⊂ B,
platí
pak
Důkaz vyplývá z důkazu vlastnosti 3, neboť platí B − A = B ∩ A.
Ñ
6. Pro libovolný jev A∈ À platí P ( A) = 1 − P ( A).
Důkaz. Platí A = Ω − A a zároveň A ⊂ Ω. Vztah pro pravděpodobnost
jevu opačného pak vyplývá z axiomu 2 a vlastnosti 5.
Ñ
7. Pro libovolné dva jevy A, B ∈ À platí
P ( A ∪ B) = P( A) + P( B) − P( A ∩ B ).
Důkaz. Vyjděme ze zřejmých vztahů:
A ∪ B = A ∪ ( B − ( A ∩ B)), B=(A ∩ B) ∪ (B-(A ∩ B)). Jevy A,
B − ( A ∩ B) jsou neslučitelné a totéž platí o jevech A ∩ B, B − ( A ∩ B ).
Z vlastnosti 2 vyplývá
P ( A ∪ B) = P( A) + P( B − ( A ∩ B )),
P ( B) = P( A ∩ B) + P( B − ( A ∩ B )).
Odtud ovšem přímo plyne dokazovaný vzorec pro pravděpodobnost
‫‮‬
sjednocení libovolných jevů A, B ∈ À .
8. Pro libovolné jevy A1 , A2 , ... , An ∈ À platí
n −1
n
n
i =1
i =1
P (∪ Ai ) = ∑ P( Ai ) − ∑
n − 2 n −1
+∑
∑ P( A ∩ A ) +
i =1 j =i +1
n
∑ ∑ P( A ∩ A
i
i =1 j =i +1 k = j +1
n
j
i
j
∩ Ak ) − ... + (−1)
n −1
(2.1)
n
P(∩ Ai ).
i =1
Důkaz se provede matematickou indukcí.
9. Nechť jevy
An ⊂ An +1 pro
‫‮‬
A1 , A2 , ... , An , ... tvoří posloupnost takovou, že
n = 1, 2, ... ,
∞
a
nechť
A = ∪ Ai .
Potom
platí
i =1
P ( A) = lim P ( An ).
n →∞
Důkaz. Uvažujme posloupnost jevů definovaných vztahem
B1 = A1 , B2 = A2 − A1 , ... , Bn = An − An −1 , ... . Zřejmě platí
∞
n
i =1
i =1
A = ∪ Bi a An = ∪ Bi , přičemž jevy B1 , B2 , ... jsou neslučitelné. Podle
axiomu 3 máme
∞
n
P ( A) = ∑ P( Bi ) = lim ∑ P( Bi ) = lim P( An ).
i =1
n →∞
i =1
n →∞
‫‮‬
Podobně jako vlastnost 9 lze dokázat i následující dvě vlastnosti
pravděpodobnosti (viz např. [9]).
14
10. Nechť jevy
An ⊃ An +1
A1 , A2 , ... , An , ... tvoří posloupnost takovou, že
∞
n = 1, 2, ... ,
pro
a
nechť
A = ∩ Ai .
Potom
platí
i =1
P ( A) = lim P ( An ).
n →∞
11. Pro libovolnou posloupnost jevů A1 , A2 , ... platí
∞
∞
i =1
i =1
P (∪ Ai ) ≤ ∑ P( Ai ).
Kolmogorovova axiomatická soustava je bezrozporná, protože existují
takové reálné objekty, které vyhovují všem třem axiomům. Uvažme např.
libovolnou množinu W sestávající z konečného počtu n prvků, tj.
Ω = {E1 , E2 , ... , En }. Nechť À je systém všech podmnožin množiny W.
Položíme
P ( E1 ) = p1 , P ( E2 ) = p2 , ... , P ( En ) = p n ,
kde p1 , p2 , ... , pn jsou libovolná nezáporná reálná čísla, pro něž platí
n
∑p
i =1
i
= 1. Dále pro lib. neprázdnou podmnožinu {Ei1 , Ei2 , ... , Eis } množiny
W (1 ≤ i1 < i2 < ... < is ≤ n; 1 ≤ s ≤ n) položíme
P ({Ei1 , Ei2 , ... , Eis }) = pi1 + pi2 + ... + pis .
Pak jsou zřejmě splněny všechny axiomy Kolmogorovovy soustavy.
Kolmogorovova soustava axiomů je evidentně neúplná. Pro daný prostor
elementárních jevů W lze pravděpodobnosti jevů ze σ-algebry À zvolit
různými způsoby. Ukážeme to na jednoduchém příkladě hodu hrací
kostkou, přičemž jednotlivé elementární jevy označíme symboly
E1 , E2 , E3 , E4 , E5 , E6 . Pravděpodobnosti jevů v příslušném jevovém poli lze
zadat buď soustavou
1
P ( E1 ) = P ( E2 ) = P ( E3 ) = P ( E4 ) = P ( E5 ) = P( E6 ) =
6
nebo soustavou
1
1
P ( E1 ) = P ( E2 ) = P ( E3 ) = , P ( E4 ) = P ( E5 ) = P( E6 ) =
4
12
6
nebo nějakou jinou soustavou, ale takovou, že platí
∑ P( E ) = 1.
i =1
i
Neúplnost Kolmogorovovy axiomatické soustavy nelze v žádném případě
považovat za její nedostatek. V praxi je třeba často řešit takové úlohy,
v nichž se uvažují identické množiny náhodných jevů, ale s různými
hodnotami příslušných pravděpodobností.
Axiomatická definice pravděpodobnosti představuje zavedení
v prostoru elementárních jevů jisté normované (axiom 2), nezáporné
(axiom 1) a σ-aditivní (axiom 3) míry P, definované pro všechny jevy
15
Pravděpodobnostní míra příslušné σ-algebry À. Míru P s uvedenými vlastnostmi nazýváme
Pravděpodobnostní
pravděpodobnostní mírou a trojici {Ω, À, P} pravděpodobnostním
prostor
prostorem.
2.3. Klasifikace pravděpodobnostních prostorů
Rozlišíme tři základní typy pravděpodobnostního prostoru:
1. konečný pravděpodobnostní prostor,
2. spočetný pravděpodobnostní prostor,
3. spojitý pravděpodobnostní prostor.
Konečný
pravděpodobnostní
prostor
Jednotlivé složky konečného pravděpodobnostního prostoru jsou
definovány následujícím způsobem.
a) Prostor elementárních jevů Ω je neprázdná množina obsahující
konečný počet prvků N.
b) σ-algebra jevů À je množina všech podmnožin Ω (včetně triviálních
podmnožin); obsahuje tedy právě 2 N podmnožin (náhodných jevů).
c) Pro pravděpodobnosti elementárních jevů ω1 , ω2 , ...,ωN platí
∀ωi ∈ Ω : P (ωi ) ≥ 0;
N
∑ P(ω ) = 1.
i =1
i
Odtud pro pravděpodobnost libovolného jevu A ∈ À vyplývá
P ( A) = ∑ P(ωi ) .
Klasický
pravděpodobnostní
prostor
Spočetný
pravděpodobnostní
prostor
i:ωi ∈ A
Speciálním případem konečného pravděpodobnostního prostoru je
klasický pravděpodobnostní prostor. Ten se odlišuje pouze tím, že
pravděpodobnosti všech elementárních jevů jsou si rovny, tj.
1
∀ωi ∈ Ω : P(ωi ) = ,
N
takže pro pravděpodobnost libovolného jevu A ∈ À vyplývá
k
P ( A) = , kde k značí počet elementárních jevů obsažených v jevu A.
N
Složky spočetného pravděpodobnostního prostoru jsou definovány
analogicky.
a) Prostor elementárních jevů Ω je spočetná množina, má právě tolik
prvků jako množina přirozených čísel.
b) σ-algebra jevů À je množina všech podmnožin Ω.
c) Pro pravděpodobnosti elementárních jevů ω1 , ω2 , ...,ωN , … platí
∀ωi ∈ Ω : P(ωi ) ≥ 0;
∞
∑ P (ω ) = 1
i =1
i
a pravděpodobnost libovolného jevu A ∈ À je dána stejným vztahem
jako v případě konečného pravděpodobnostního prostoru.
Spojitý
pravděpodobnostní
prostor
Spojitý pravděpodobnostní prostor je definován odlišně. Na tomto
místě uvedeme pouze jeho zjednodušenou definici.
a) Prostor elementárních jevů Ω je nějaká „integrovatelná“ podmnožina nrozměrného euklidovského prostoru.
b) σ-algebra jevů À je systém všech „integrovatelných“ podmnožin Ω.
16
c) Na prostoru elementárních jevů je definována nezáporná
„integrovatelná“ funkce π ( x1 , x2 , ... , xn ) taková, že splňuje podmínku
normování
∫ ... ∫ π ( x , x , ... , x ) dx dx ...dx
1
2
n
1
2
n
= 1.
Ω
Pak pro pravděpodobnost libovolného jevu A ∈ À platí
P ( A) = ∫ ... ∫ π ( x1 , x2 , ... , xn ) dx1dx2 ...dxn .
A
2.4. Klasická definice pravděpodobnosti
V předcházejícím odstavci jsme ukázali souvislost klasické
pravděpodobnosti s klasickým pravděpodobnostním prostorem. Z hlediska
historického však klasická definice pravděpodobnosti vychází z pojmu
„stejné možnosti" nastoupení jevů. Uvedený pojem se považuje za
fundamentální a nedefinuje se. V případě hodu hraní kostkou, která je
zhotovena z homogenního materiálu a má přesně symetrický tvar, lze za
stejně možné považovat padnutí kteréhokoli z čísel 1, 2, 3, 4, 5, 6, protože
není důvodu preferovat některou ze stěn před ostatními.
V obecném případě se uvažuje konečná množina stejně možných
elementárních jevů ω1 , ω 2 , ..., ω n takových, že tvoří úplnou soustavu
neslučitelných jevů (rozklad množiny Ω).
Laplaceova definice pravděpodobnosti: Nechť určitý pokus může
vykázat celkem n různých, vzájemně se vylučujících výsledků, které jsou
na podkladě symetrie a homogenity stejně možné. Jestliže m z těchto
výsledků má nevyhnutelně za následek realizaci určitého jevu A, kdežto
zbývajících n - m výsledků ji vylučuje, pak pravděpodobnost jevu A je
rovna
P ( A) =
m
.
n
V aplikacích teorie pravděpodobnosti se užívá poněkud odlišné
terminologie. Množina všech neslučitelných a stejně možných jevů
ωi (i = 1, 2, ..., n) , které jsou spjaty s nějakým pokusem, se nazývá
množinou možných výsledků tohoto pokusu. Ty z možných výsledků, jež
vedou k nastoupení jevu A, tvoří množinu výsledků příznivých jevu A.
S použitím právě zavedené terminologie lze klasickou definici
pravděpodobnosti vyslovit takto: Pravděpodobností jevu A rozumíme
poměr počtu výsledků příznivých jevu A k počtu výsledků možných. Tato
definice je přirozeně jednodušší, ovšem nepřesná, protože nezahrnuje
předpoklad o stejné možnosti jednotlivých výsledků pokusu.
V souladu s Laplaceovou definicí je každému jevu A, tj. každé
m
podmnožině A ⊂ Ω , přiřazena určitá pravděpodobnost P( A) = , kde m
n
značí počet těch elementárních jevů ωi (i = 1, 2, ..., n) , z nichž se skládá
17
jev A. Pravděpodobnost P(A) lze tedy považovat za funkci jevu A. Tato
funkce má následující vlastnosti:
Uvědomte si, že klasický přístup k zavedení pravděpodobnosti
nevychází z žádných axiomů, proto je nutno dokázat i ta tvrzení, která
se v Kolmogorovově přístupu považují za axiomy.
1. Pro každý jev A platí
P ( A) ≥ 0.
Důkaz. Uvedená vlastnost je zřejmá, neboť poměr
m
nemůže podle
n
definice nabývat záporných hodnot.
2. Pravděpodobnost jistého jevu je jednotková, tj. platí
P(Ω) = 1.
Důkaz. Jistému jevu jsou příznivé všechny možné výsledky pokusu,
n
takže
P(Ω) = = 1.
n
3. Jestliže se jev A skládá z dílčích jevů B a C, pak
P(A) = P(B ∪ C) = P(B) + P(C) .
Důkaz. Nechť se jev B skládá z m1 a jev C z m2 elementárních jevů
Ei , i = 1, 2, ..., n. Jevy B a C jsou podle předpokladu neslučitelné, a proto
ty elementární jevy Ei , z nichž se skládá jeden z jevů, jsou vesměs různé
od elementárních jevů Ei , z nichž sestává druhý. Existuje tedy celkem
m1 + m2 elementárních jevů Ei , ze kterých se skládá jev B ∪ C (které jsou
příznivé nastoupení jevu B ∪ C ).
Zřejmě platí P ( A) =
m1 + m2 m1 m2
=
+
= P( B) + P(C ).
n
n
n
4. Pravděpodobnost jevu A (jevu opačného k A) je rovna
P ( A) = 1 − P ( A).
Důkaz. Jevy A a A jsou neslučitelné, takže v souladu s vlastností 3 platí
P ( A ∪ A) = P( A) + P( A).
Navíc je zřejmé, že A ∪ A = Ω, a proto vzhledem k vlastnosti 2 musí být
P ( A ∪ A) = P(Ω) = 1. Dokazované tvrzení vyplývá bezprostředně ze
srovnání dvou posledních rovností.
5. Pravděpodobnost jevu nemožného je rovna nule, tj. platí
P (∅) = 0.
18
Jevy
Ω
a
Důkaz.
P (Ω) = P(Ω ∪ ∅) = P(Ω) + P(∅).
∅
jsou
neslučitelné,
proto
Odtud však okamžitě plyne, že
P (∅) = 0.
6. Jestliže z jevu A plyne jev B, pak platí
P( A) ≤ P( B).
Důkaz. Jev B může být vyjádřen jako sjednocení dvou neslučitelných
jevů A a A ∩ B .
S použitím vlastností 3 a 1 snadno dostaneme
P ( B) = P( A ∪ ( A ∩ B)) = P( A) + P( A ∩ B) ≥ P( A).
7. Pro pravděpodobnost libovolného jevu A z příslušného jevového pole
platí 0 ≤ P( A) ≤ 1.
Důkaz. Libovolný jev A jevového pole splňuje zřejmě vztahy
∅ ⊂ A ∪ ∅ = A = A ∩ Ω ⊂ Ω.
Odtud ovšem a použitím vlastnosti 6 odvodíme nerovnosti
0 = P(∅) ≤ P( A) ≤ P(Ω) = 1.
Klasická definice pravděpodobnosti jevu zavádí pojem apriorní
pravděpodobnosti. Vychází sice z objektivních vlastností jevu samého, ale
je zcela nezávislá na výsledcích experimentu.
K vážným nedostatkům klasické definice patří její omezenost na
konečně mnoho elementárních jevů, neurčitost a dokonce i „bludný kruh“,
spočívající v tom, že vychází z pojmu "stejná možnost" ve smyslu "stejné
pravděpodobnosti".
Přestože se moderní teorie pravděpodobnosti nemůže spokojit
s klasickou definicí pravděpodobnosti, využívá se v praxi této definice
k řešení celé řady problémů (viz odstavec 2.5), zejména těch, které se dají
převést na tzv. urnová schémata.
2.5. Kombinatorický výpočet pravděpodobností
Výpočet pravděpodobností podle klasické definice se zakládá na
kombinatorických úvahách.
Zopakujte si základní kombinatorické principy a vztahy pro určení
počtu kombinací, variací a permutací, ať už s opakováním nebo bez
opakování. Doporučujeme Vám knížku Vilenkina [21], v níž naleznete
řešení celé řady zajímavých (i velmi obtížných) kombinatorických
úloh.
Uvedeme několik typových příkladů.
Příklady
2.1. Kdosi má v kapse N klíčů a chce potmě otevřít dveře svého bytu.
Vyjímá naslepo z kapsy jeden po druhém a zkouší jimi otevřít dveře. Jaká
je pravděpodobnost toho, že při k-tém pokusu zvolí správný klíč?
19
Řešení. Počet všech možných pořadí, jak vyjímat klíče, je zřejmě roven
počtu permutací množiny N prvků, tj. N ! . Předpokládejme, že všechny
permutace jsou stejně možné. Musíme tedy určit, kolik je takových
permutací, při nichž stojí daný prvek (klíč) na k-tém místě. Odpověď je
jednoduchá. Existuje právě ( N − 1) ! permutací, které jsou příznivé
uvažovanému jevu, takže hledaná pravděpodobnost je rovna výrazu
( N − 1)! 1
= .
N!
N
Pravděpodobnosti toho, že správný klíč padne do ruky při prvém, při
druhém,…, resp. při posledním N-tém pokusu, jsou stejné a rovnají se 1/N.
2.2. Výtah s r pasažéry zastavuje postupně v n patrech. Určete
pravděpodobnost jevu A, který spočívá v tom, že žádní dva pasažéři
nevystoupí v jednom a tomtéž patře.
Řešení. Předpokládejme, že všechny způsoby rozmístění pasažérů do
jednotlivých pater jsou stejně možné. Celkový počet způsobů rozmístění je
zřejmě roven počtu variací r-té třídy z n prvků s opakováním, tj. výrazu
n r . Kolik je však způsobů rozmístění příznivých jevu A? Hledaný počet je
dán opět počtem variací r-té třídy z n prvků, ale tentokrát bez opakování,
tj. výrazem n(n − 1)(n − 2) ... (n − r + 1). Pro pravděpodobnost jevu A tedy
platí
P ( A) =
n(n − 1)(n − 2) ... (n − r + 1)
n!
=
.
r
n
(n − r )!n r
2.3. Z hromádky 32 karet (4 barvy po 8 kartách) se náhodně vybere k
karet (k > 1). Určete pravděpodobnost toho, že mezi těmito kartami je
a) právě jedno eso;
b) alespoň jedno eso.
Řešení. Označme symbolem Ai jev, který spočívá v nalezení právě i es
mezi k vybranými kartami ( i ≤ min(k , 4) ) a symbolem A jev, který
spočívá v tom, že mezi k kartami bude nalezeno alespoň jedno eso.
a) Množina všech možných výsledků pokusu je tvořena všemi kombinacemi k-té třídy z 32 prvků; počet těchto kombinací je roven
⎛ 32 ⎞
kombinačnímu číslu ⎜ ⎟ . Počet výsledků příznivých jevu A1 určíme
⎝k⎠
⎛ 4⎞
následujícím postupem. Jedno eso lze vybrat ⎜ ⎟ různými způsoby a
⎝1⎠
⎛ 28 ⎞
zbývající karty v počtu k - 1 celkem ⎜
⎟ způsoby, takže počet
⎝ k − 1⎠
příznivých případů je roven součinu obou uvedených kombinačních čísel.
Pro hledanou pravděpodobnost tedy platí
20
⎛ 4 ⎞ ⎛ 28 ⎞
⎜ ⎟⎜
⎟
1 ⎠ ⎝ k − 1⎠
⎝
P ( A1 ) =
.
⎛ 32 ⎞
⎜ ⎟
⎝k⎠
b) Podobnou úvahou jako v předcházející úloze stanovíme pravděpodobnosti všech jevů Ai pro i = 1, 2, ..., m, kde m značí menší z čísel k
a 4, tj. m = min(k,4). Zřejmě platí
⎛ 4 ⎞ ⎛ 28 ⎞
⎛ 4 ⎞ ⎛ 28 ⎞
⎜ ⎟⎜
⎟
⎜ ⎟⎜
⎟
2⎠⎝ k − 2⎠
m⎠⎝ k − m⎠
⎝
⎝
, ..., P ( Am ) =
.
P ( A2 ) =
⎛ 32 ⎞
⎛ 32 ⎞
⎜ ⎟
⎜ ⎟
⎝k⎠
⎝k⎠
Jev A lze vyjádřit jako sjednocení neslučitelných jevů A1 , A2 , ..., Am , proto
P ( A) = P ( A1 ) + P( A2 ) + ... + P( Am ).
2.4. Dítě si hraje s písmeny M, M, A, A, A, T, T, E, I, K. Jaká je
pravděpodobnost toho, že se mu podaří při náhodném řazení písmen za
sebou vytvořit slovo MATEMATIKA?
Řešení. Označme uvažovaný jev symbolem A. Kdyby byla písmena
vesměs různá, byl by počet všech možných výsledků pokusu roven počtu
permutací množiny těchto písmen, tj. 10!. Mezi uvažovanými deseti
písmeny jsou však dvě navzájem nerozlišitelná písmena M, tři
nerozlišitelná písmena A a dvě nerozlišitelná písmena T. Proto permutace,
které se liší transpozicí (záměnou) písmen M (takových permutací je
celkem 2!) a/nebo transpozicí písmen A (celkem 3!) a/nebo transpozicí
písmen T celkem 2!) představují jeden a tentýž výsledek pokusu.
Z uvedeného je zřejmé, že počet všech vzájemně různých výsledků pokusu
10!
. Pouze jedna z těchto permutací je příznivá jevu A, takže pro
je
2!3!2!
hledanou pravděpodobnost platí
P ( A) =
2!3!2!
0, 0000066.
10!
2.5. Mějme n částic, z nichž každá má stejnou možnost nacházet se
v kterémkoliv z N možných stavů ( N ≥ n) . Předpokládejme, že všechna
možná rozdělení částic do stavů jsou stejně pravděpodobná (MaxwellovaBoltzmannova statistika). Jaká je pravděpodobnost toho, že
a) v určitých n stavech bude po jedné částici (jev A);
b) v libovolných n stavech bude po jedné částici (jev B)?
21
Řešení.
a) Každá částice se může objevit v libovolném z N stavů; to znamená, že
existuje N možností pro jednu částici. Celkový počet možných způsobů
rozmístění n částic je zřejmě roven N n . K výpočtu hledané
pravděpodobnosti zbývá ještě určit, kolika způsoby mohou být částice
rozmístěny po jedné do n určitých stavů. Pro prvou částici máme
zřejmě n možností, pro druhou n − 1 , pro třetí n − 2 , atd., až pro
poslední zbude pouze jediná možnost. Z uvedené úvahy vyplývá, že
existuje celkem n( n − 1)( n − 2) ... 2.1 = n! způsobů rozmístění, které
jsou příznivé jevu A. Proto lze psát
P ( A) =
n!
.
Nn
b) Počet možných způsobů rozmístění n částic v N stavech je dán, stejně
jako v případě předcházejícím, výrazem N n . Při určování toho, kolika
způsoby lze částice rozmístit po jedné do libovolných n stavů,
využijeme rovněž dílčího výsledku předchozího příkladu. Počet
způsobů rozmístění příznivých jevu B je tolikrát větší než počet
způsobů příznivých jevu A, kolikrát je možno vybrat n stavů z jejich
⎛N⎞
celkového počtu N. Odtud plyne, že existuje n !⎜ ⎟ způsobů
⎝n⎠
rozmístění částic po jedné do n libovolných stavů. Hledaná
pravděpodobnost jevu B je tedy
⎛N⎞
n !⎜ ⎟
n
N!
.
P( B) = ⎝ n ⎠ =
( N − n)! N n
N
2.6. Řešte příklad 2.5 za předpokladu, že všechny částice jsou vzájemně
nerozlišitelné a přitom v každém z N stavů se může nacházet nejvýše
jediná částice (Fermiho-Diracova statistika).
Řešení. V tomto případě můžeme považovat za různá jen taková
rozmístění částic, která se liší kvalitou obsazených stavů. Počet všech
různých rozmístění se zřejmě rovná počtu možností, jak vybrat n stavů
⎛N⎞
z jejich celkového počtu N, tedy kombinačnímu číslu ⎜ ⎟ .
⎝n⎠
a)
Je evidentní, že v případě Fermiho-Diracovy statistiky lze částice
rozmístit v n určitých stavech pouze jediným způsobem, a proto
P ( A) =
1
( N − n)!n !
=
.
N!
⎛N⎞
⎜ ⎟
⎝n⎠
b) Jev B, jenž spočívá v rozmístění částic do n libovolných stavů, je
v případě Fermiho-Diracovy statistiky jevem jistým, takže
P(B) = 1 .
22
Podobné i podstatně obtížnější úlohy na kombinatorický výpočet
pravděpodobností nalezne čtenář v učebnici Fellerově [3]. Metodám řešení
kombinatorických úloh jsou věnovány speciální monografie, např. [21].
2.7 (úloha o shodách). Je dána množina N různých dopisů a množina N
obálek s různými adresami. Předpokládejme, že roztržitý úředník přiřadil
dopisy zcela náhodně k jednotlivým obálkám. Jaká je pravděpodobnost
toho, že alespoň jeden z dopisů dojde na správnou adresu?
Řešení. Obálky libovolným způsobem uspořádáme a označíme je
v souladu se zvoleným uspořádáním čísly 1, 2, ... , N. Dále postupujeme
tak, že libovolně uspořádáme i dopisy a dopis, který je na i-tém místě,
přiřadíme obálce s označením i (i = 1, 2,..., N). Předpokládáme, že
pravděpodobnost každého možného uspořádání (permutace) dopisů je
stejná a rovna 1/N!. Nechť Ai značí jev, jenž spočívá v tom, že dopis
odpovídající obálce s označením i bude právě na i-tém místě, tj. bude přiřazen ke správné obálce. Protože ostatní dopisy mohou být uspořádány
libovolně, platí
( N − 1)!
(i = 1, 2, ... , N );
N!
( N − 2)!
P ( Ai ∩ Aj ) =
(i ≠ j; i, j = 1, 2, ..., N ).
N!
P ( Ai ) =
Úlohu řešíme pomocí vzorce (2.1), na jehož pravé straně bude celkem N
sčítanců. Sčítanec s pořadovým číslem k, 1 ≤ k ≤ N , obsahuje
⎛N⎞
( N − k )!
N!
, takže má
příspěvků, z nichž každý je roven
⎜ ⎟=
N!
⎝ k ⎠ ( N − k )!k !
1
hodnotu
. Pro hledanou pravděpodobnost lze psát
k!
N
P (∪ Ai ) = 1 −
i =1
1 1
1
+ − ... + (−1) N −1
.
N!
2! 3!
V případě dostatečně velkého N tedy platí
N
P(∪ Ai ) ≈ 1 − e −1
0,63212,
i =1
což znamená, že hledaná pravděpodobnost prakticky nezávisí na N a je
blízká 2/3.
Kontrolní úkoly
2.1.
Z hromádky 32 karet obsahující 4 esa jsou náhodně vybrány 3
karty. Určete pravděpodobnost toho, že mezi nimi budou
nejméně 2 esa.
2.2.
V sérii n výrobků je právě k zmetků ( k ≤ n ). Určete
pravděpodobnost toho, že mezi m náhodně vybranými výrobky
bude právě r zmetků ( r ≤ k ) .
23
2.3.
Ve studijní skupině je celkem 30 studentů. Jaká je
pravděpodobnost toho, že žádní dva studenti neslaví
narozeniny téhož dne? Předpokládejme, že rok má 365 dnů.
2.4.
Mezi 25 zkušebními lístky je 5 „šťastných“ a 20 „nešťastných“.
Studenti si vybírají lístky postupně jeden za druhým. U kterého
je větší pravděpodobnost, že si vytáhne „šťastný“ lístek: u toho,
který táhne první, nebo u toho, který táhne druhý?
2.5.
Číslice 1, 2, ... , n
( n ≤ 9)
jsou náhodně uspořádány do
posloupnosti. Jaká je pravděpodobnost toho, že číslice 1 a 2
stojí vedle sebe právě v tomto pořadí?
2.6.
Určete pravděpodobnost toho, že poslední dvě číslice třetí
mocniny náhodně vybraného celého čísla jsou rovny jednotce.
2.7.
Krychle, jejíž všechny stěny jsou nabarveny, se rozřeže na
1000 krychliček stejného rozměru. Jaká je pravděpodobnost
toho, že náhodně vybraná krychlička bude mít dvě nabarvené
stěny?
2.8.
Určete pravděpodobnost výhry první, druhé, třetí a čtvrté ceny
a) v Sazce,
b) ve Sportce.
2.6 Geometrická pravděpodobnost
Jedním z nedostatků klasické definice pravděpodobnosti je skutečnost,
že tato definice uvažuje pouze konečné základní množiny elementárních
(stejně možných) jevů. Pokusy o rozšíření klasické teorie
pravděpodobnosti i na případ nekonečné základní množiny elementárních
jevů vedly již koncem 18. století k zavedení pojmu geometrické
pravděpodobnosti. V podstatě šlo jen o modifikaci klasické definice
pravděpodobnosti, protože se vycházelo opět z pojmu stejné možnosti
nastoupení určitých jevů.
Úloha na geometrickou pravděpodobnost může být formulována takto:
Nechť je v euklidovském prostoru dána nějaká oblast Ω , která má
konečný objem (obsah) V( Ω ) a v ní (uvnitř) jiná oblast A
s integrovatelnou hranicí. Vybíráme náhodně bod z oblasti Ω a ptáme se,
s jakou pravděpodobností patří tento bod také do oblasti A.
Předpokládáme, že pravděpodobnost "padnutí" náhodně vybraného bodu
oblasti Ω do oblasti A je úměrná objemu (obsahu) této oblasti a nezávisí
na jejím umístění ani tvaru. Hledanou pravděpodobnost klademe
v geometrickém pojetí rovnu hodnotě výrazu V ( A) V (Ω) , kde V(A) je
objem (obsah) oblasti A. Takto zavedená geometrická pravděpodobnost se
stala vhodným nástrojem na řešení řady úloh, na něž nestačilo klasické
pojetí pravděpodobnosti.
Adekvátní definice geometrické pravděpodobnosti je založena na
pojmu Lebesgueovy míry. Podrobné poučení o Lebesgueově míře nalezne
čtenář např. v monografii [10].
Definice geometrické pravděpodobnosti. Nechť Ω je měřitelná
podmnožina n-rozměrného euklidovského prostoru n , která má kladnou
24
a konečnou Lebesgueovu míru µ (Ω). Dále nechť À je systém všech
měřitelných podmnožin množiny Ω a µ ( A) je n-rozměrná Lebesgueova
míra měřitelné množiny A∈ À . Položme
P ( A) =
µ ( A)
.
µ (Ω )
(2.2)
Takto uvedená trojice {Ω, À, P} je Kolmogorovův pravděpodobnostní
prostor. Pravděpodobnostní míra definovaná vztahem (2.2) je
geometrickou pravděpodobností jevu A∈ À.
Poznámka. Připomínáme, že Lebesgueova míra v euklidovském
prostoru n je invariantní vzhledem k transformaci kartézské soustavy
souřadnic a rovněž je invariantní vzhledem ke shodným zobrazením
prostoru n . Výpočet geometrické pravděpodobnosti pomocí vztahu (2.2)
se v praxi převádí na výpočet délky, obsahu nebo objemu určitých
geometrických útvarů. Uvedeme dva jednoduché příklady na výpočet
geometrické pravděpodobnosti.
Příklady
2.8. Hodiny, které nebyly včas nataženy, se po určité době zastaví. Jaká
je pravděpodobnost toho, že se velká ručička zastaví mezi trojkou a
šestkou?
Řešení. Označme uvažovaný jev písmenem A. Pravděpodobnost, že se
velká ručička zastaví uvnitř definovaného oblouku číselníku je úměrná
délce tohoto oblouku. Proto je hledaná pravděpodobnost rovna poměru
délky oblouku mezi číslicemi tři a šest ( π r ) a délky obvodu celého
2
číselníku ( 2π r ), tj.
πr
1
P ( A) = 2 = .
2π r 4
2.9 (úloha o setkání). Dva studenti X a Y se dohodli, že se setkají na
určitém místě v době od 12 do 13 hodin. Ten, kdo přijde první, počká na
druhého 20 minut, a nedočká-li se, odejde. Jaká je pravděpodobnost, že se
oba studenti za těchto podmínek setkají, jestliže předpokládáme stejnou
možnost příchodu každého z nich v kterémkoliv okamžiku stanoveného
časového intervalu a okamžiky příchodu jsou nezávislé?
Řešení. Označme okamžik příchodu (v minutách po 12.00 hod.)
studenta X písmenem x a okamžik příchodu studenta Y písmenem y.
Nutnou a postačující podmínkou pro uskutečnění setkání obou studentů je
platnost vztahu
x − y ≤ 20.
Veličiny x a y budeme interpretovat jako kartézské souřadnice v
euklidovské rovině (viz obr. 2.1). Všechny možné výsledky pokusu lze
pak znázornit body čtverce o straně dlouhé 60 jednotek.
25
Geometrická
pravděpodobnost
Ty možnosti, které jsou příznivé setkání obou studentů, leží zřejmě
uvnitř vyšrafované oblasti. Pravděpodobnost setkání je tedy rovna podílu
obsahu vyšrafované oblasti a obsahu celého čtverce, tj.
P=
602 − 402 5
= .
602
9
y
60
40
20
0
0
20
40
60
Obr. 2.1. Schematické znázornění k úloze o setkání
x
Úlohy o setkání lze principiálně využít k řešení následujícího problému
z oblasti hromadné obsluhy. Dělník obsluhuje několik strojů téhož typu,
z nichž každý vyžaduje v náhodných časových okamžicích dělníkovu
přítomnost (pozornost). Může se stát, že v době, kdy je dělník u jednoho
stroje, vyžaduje jeho přítomnost některý jiný, resp. jiné stroje. Úkolem je
stanovit pravděpodobnost takového jevu.
Kontrolní úkoly
2.9. Vepišme do koule krychli. Jaká je pravděpodobnost toho, že
náhodně vybraný bod koule je také bodem vepsané krychle?
2.10. Koeficienty p a q kvadratického trojčlenu x 2 + px + q jsou
vybrány náhodně z intervalu −1,1 . Jaká je pravděpodobnost toho, že
uvedený trojčlen má reálné nulové body?
2.11. Na rovnoběžné přímky (v rovině) ležící ve stejných vzdálenostech
d od sebe házíme jehlu délky h ( h < d ) . Jaká je pravděpodobnost toho, že
jehla protne jednu z rovnoběžek (Buffonova úloha)?
2.5. Pravděpodobnost a četnost. Statistická definice
pravděpodobnosti
Relativní četnost jevu
Statistické pojetí pravděpodobnosti vychází z pojmu relativní četnosti
jevu. Uvažme nějaký pokus, jehož výsledkem může být nastoupení nebo
nenastoupení určitého jevu A. Označme symbolem nA počet nastoupení
uvažovaného jevu v n nezávislých pokusech. Relativní četností jevu A
pak rozumíme podíl počtu pokusů, které vedly k nastoupení jevu A,
26
k celkovému počtu skutečně provedených pokusů, tj. poměr
nA
n
. Číslo
nA se nazývá absolutní četností jevu A.
Dlouhodobá pozorování ukazují, že relativní četnosti celé řady jevů při
dostatečně velkém n zůstávají při přechodu od jedné série pokusů k druhé
prakticky konstantní. Větší odchylky od této "konstanty" se přitom
pozorují tím vzácněji, čím početnější jsou provedené série experimentů.
Tato stabilita relativních četností byla poprvé zjištěna u jevů
demografického charakteru. Už od nejstarších dob je známo, že poměr
počtu narozených chlapců k celkovému počtu narozených dětí pro velká
města i celé státy zůstává v průběhu let téměř konstantní a blízký hodnotě
1/2. Později, zejména během 17. a 18. století, byla pozorována stabilita
i jiných charakteristik a zákonitostí demografické povahy: procenta
úmrtnosti v daném věku pro dané sociální skupiny obyvatelstva, rozdělení
obyvatelstva daného pohlaví podle vzrůstu, šířky hrudníku apod.
Významné je zjištění, že v těch případech, kdy je použitelná klasická
definice pravděpodobnosti, kolísají relativní četnosti jevů kolem hodnot
jejich klasických pravděpodobností. V současné době máme k dispozici
rozsáhlý experimentální materiál, který nesporně potvrzuje tuto
skutečnost. V tabulce 2.1 jsou uvedeny některé výsledky experimentů
s hodem mincí.
Tab. 2.1.Výsledky pokusů s hodem mincí
Experimentátor
Buffon
Pearson
Pearson
Počet
hodů
4 040
12 000
24 000
Abs. četnost padnutí Rel. četnost padnutí
rubu
rubu
2 048
0,5080
6 019
0,5016
12 012
0,5005
Z údajů v tabulce je zřejmé, že relativní četnost padnutí rubu mince
kolísá kolem hodnoty 1/2, tj. kolem klasické pravděpodobnosti
uvažovaného jevu pro případ homogenní a přesně symetrické mince.
K podobnému závěru vedly i jiné pokusy, např. hody hrací kostkou,
určování relativní četnosti výskytu určité číslice v tabulce náhodných čísel
apod. Uvedené skutečnosti nás přivádějí k předpokladu objektivní
existence nějaké číselné charakteristiky jevu (pravděpodobnosti jevu),
kolem níž kolísají experimentálně určované relativní četnosti.
Statistické zavedení pravděpodobnosti. Říkáme, že určitý jev A má
pravděpodobnost, jestliže tento jev splňuje následující podmínky:
a) je možno (alespoň principiálně) provést neomezený počet vzájemně
nezávislých a přesně stejných pokusů, z nichž každý může vést
k nastoupení nebo nenastoupení jevu A;
b) relativní četnost jevu A se prakticky pro každou velkou sérii pokusů
liší jen nepatrně od nějaké, v obecném případě neznámé, konstanty.
27
Absolutní četnost jevu
Statistická
pravděpodobnost
Tato číselná charakteristika náhodného jevu A se nazývá statistickou
pravděpodobností. Za její přibližnou hodnotu lze při dostatečně velkém
počtu pokusů vzít buď přímo relativní četnost jevu A nebo nějaké číslo
blízké této četnosti.
Toto statistické zavedení pravděpodobnosti má převážně popisný
charakter. Nejde o formální matematickou definici pravděpodobnosti, ale
pouze o vymezení podmínek nutných pro existenci pravděpodobnosti a
stanovení metody pro odhad hodnoty této pravděpodobnosti.
Misesova
definice
pravděpodobnosti.
Statistickou
pravděpodobností jevu A se nazývá limita relativních četností jevu A,
roste-li počet pokusů, z nichž relativní četnost určujeme, nade všechny
meze, tzn.
nA
.
n →∞ n
P ( A) = lim
Poznámka. Uvedenou definici je možno zpřesnit takto: Pro libovolné
ε > 0 platí
lim P(
n →∞
nA
− p <ε ) = 1, p = P( A).
n
Misesova definice je velmi rozšířena zejména v oblasti přírodních věd.
Mises odmítá klasickou definici pravděpodobnosti a nepovažuje za nutné
znát vnitřní strukturu jevů. Podle něj je uvedená empirická definice
schopna v plné míře zabezpečit veškeré požadavky přírodních věd
i filozofie.
Statistický způsob vymezení pravděpodobnosti má ovšem vážný
nedostatek. Pravděpodobnosti jevů jsou v tomto případě vázány na
výsledky pokusů, takže jde o tzv. aposteriorní pravděpodobnosti. Pojem
statistické pravděpodobnosti vychází pouze z výsledků pokusů a nepřihlíží
k vnitřním zákonitostem a vlastnostem sledovaných jevů. Bez realizace
konkrétních pokusů nelze o pravděpodobnosti jevů v rámci statistické
definice vůbec mluvit.
Třebaže jsou proti statistickému vymezení pravděpodobnosti vážné
výhrady, používá se jej dodnes tam, kde jde o sledování velkých souborů,
např. v demografickém výzkumu. Přitom se předpokládá, že
pravděpodobnosti studovaných jevů jsou přibližně rovny experimentálně
určeným relativním četnostem.
Příklad 2.9. Na základě statistických údajů uvedených v prvních třech
sloupcích tabulky 2.2 odhadněte pravděpodobnost narození dvojčat
mužského pohlaví.
Řešení. Údaje v tabulce 2.2 doplníme o relativní četnosti. Z uvedených
údajů je možno odhadnout pravděpodobnost narození dvojčat mužského
pohlaví číslem 0,35.
28
Tab. 2.2. Údaje o počtu narozených dvojčat v ČSSR
Rok
1963
1964
1965
1966
1967
1968
Počet narozených
dvojčat
2321
2265
2330
2188
1957
1953
Z toho oba
chlapci
809
792
847
772
673
696
Relativní četnost
dvojčat-chlapců
0,349
0,350
0,364
0,353
0,344
0,356
Pojmy k zapamatování:
• σ-algebra jevů
• jevové pole
• Kolmogorovovy axiomy
• pravděpodobnostní prostor
• pravděpodobnost (pravděpodobnostní míra)
• klasická pravděpodobnost (Laplace)
• geometrická pravděpodobnost
• statistická pravděpodobnost
• relativní četnost jevu
• absolutní četnost jevu
Shrnutí:
V této kapitole byly vyloženy základy moderní teorie pravděpodobnosti
založené na Kolmogorovově axiomatické soustavě. Zvláštní pozornost
byla věnována důkazům základních vlastností pravděpodobnostní míry
(pravděpodobnosti) a odvození užitečných vztahů pro výpočet
pravděpodobnosti „složitějších“ jevů. Použití těchto vztahů bylo
ilustrováno na řadě typových úloh.
29
30
3. PODMÍNĚNÁ PRAVDĚPODOBNOST
Po prostudování této kapitoly:
• pochopíte další základní pojmy teorie pravděpodobnosti
(podmíněná pravděpodobnost, podvojná a sdružená
nezávislost jevů),
• naučíte se počítat pravděpodobnosti jevů, resp. podmíněné
pravděpodobnosti jevů, s využitím věty o násobení
pravděpodobností, vzorce pro úplnou pravděpodobnost a
Bayesova vzorce
V této kapitole se naučíte používat další užitečné vzorce pro
výpočet pravděpodobnosti „složitějších“ jevů, konkrétně vzorce pro
pravděpodobnost součinu (průniku) jevů, vzorec pro úplnou
pravděpodobnost a Bayesův vzorec. Zvláštní pozornost věnujte
pochopení pojmů podvojná a sdružená nezávislost jevů, aby
nedocházelo k záměně s pojmem neslučitelnosti jevů.
3.1. Podmíněná pravděpodobnost
Pojem podmíněné pravděpodobnosti je jedním ze základních pojmů
teorie pravděpodobnosti. Dosud jsme se zabývali studiem jevů, které
mohou nastoupit či nenastoupit v důsledku realizace určitého pokusu
(komplexu podmínek). Jestliže při výpočtu pravděpodobnosti takových
jevů neklademe kromě uvedeného komplexu podmínek žádné další
omezení, pak se jedná o nepodmíněné pravděpodobnosti. V řadě případů
je však třeba určit pravděpodobnost sledovaného jevu A za doplňujícího
předpokladu, že nastal určitý jev (hypotéza) B, který má kladnou
pravděpodobnost. Taková pravděpodobnost se nazývá podmíněnou
pravděpodobností a označuje symbolicky P ( A | B ).
Nechť B je jev s kladnou pravděpodobností a A libovolný jev.
Podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B
(za hypotézy, resp. podmínky B), je definována vztahem
P( A | B) =
P( A ∩ B)
.
P( B)
(3.1)
Uvedená definice má smysl jen pro P ( B ) > 0. Má-li jev (hypotéza) B
nulovou
pravděpodobnost,
není
podmíněná
pravděpodobnost
P( A | B) definována. V diskrétních prostorech elementárních jevů nemá
tento případ praktického významu.
Příklad 3.1 (výběr bez vracení). Ze souboru obsahujícího n různých
prvků 1, 2, ... , n se postupně vybírá po jednom prvku bez vracení
vybraného prvku zpět. Nechť i a j jsou dva různé prvky uvažovaného
souboru. Jaká je podmíněná pravděpodobnost toho, že při druhém pokusu
bude vybrán prvek j za předpokladu, že poprvé byl vybrán prvek i?
31
Podmíněná
pravděpodobnost
Řešení. Zavedeme toto označení jevů: A - při druhém pokusu vybrán
prvek j, B - při prvém pokusu vybrán prvek i. Zřejmě platí
1
1
P( B) = , P( A ∩ B) =
. Odtud plyne pro hledanou podmíněnou
n
n(n − 1)
pravděpodobnost v souladu s definicí vzorec
1
1
n(n − 1)
P( A | B) =
=
.
1
n −1
n
Výsledný vzorec vyjadřuje skutečnost, že se druhý výběr provádí ze
souboru o rozsahu n − 1 různých prvků, přičemž každý z těchto prvků
1
může být vybrán s pravděpodobností
.
n −1
Podmíněná pravděpodobnost má evidentně všechny vlastnosti
pravděpodobnosti. Snadno lze ověřit, že vyhovuje všem třem axiomům,
které formuloval Kolmogorov. Axiom 1 je zřejmě splněn, jelikož každému
jevu A∈ À je podle (3.1) přiřazena nezáporná funkce P ( A | B ) . Jestliže je
A = B , pak podle definice (3.1) platí
P( B | B) =
P( B ∩ B)
= 1,
P( B)
čímž je ověřena platnost axiomu 2. Pro libovolnou posloupnost
neslučitelných jevů A1 , A2 , ... zřejmě také platí axiom 3, neboť
∞
∞
P((∪ Ai ) ∩ B )
i =1
P( B)
P (∪ Ai | B) =
i =1
∞
=
∑ P( A ∩ B)
i
i =1
P( B)
∞
= ∑ P( Ai | B).
i =1
Pravděpodobnostní prostor pro podmíněné pravděpodobnosti P ( A | B ) je
tvořen trojicí
{B, Á, P( A ∩ B) / P( B)} , kde
Á značí σ-algebru jevů
definovanou vztahem
Á = { A ∩ B; A ∈ À}.
Z uvedeného vyplývá, že všechny věty a vzorce o (nepodmíněných)
pravděpodobnostech platí i pro podmíněné pravděpodobnosti, jsou-li
podmíněné pravděpodobnosti uvažovány za jedné a téže hypotézy
(podmínky).
Věta 3.1 (věta o násobení pravděpodobností). Pravděpodobnost
průniku (současného výskytu) dvou libovolných jevů A, B
( P( A) > 0, P( B) > 0) je rovna součinu pravděpodobnosti jednoho z nich a
podmíněné pravděpodobnosti druhého za předpokladu, že nastal první jev,
tj. platí
P ( A ∩ B) = P( B) P( A | B) = P( A) P( B | A).
32
(3.2)
Důkaz. Násobíme-li definiční rovnost (3.1) číslem P( B) > 0 ,
dostaneme
okamžitě
P ( A ∩ B) = P( B) P ( A | B).
Vzorec
P ( A ∩ B) = P( A) P( B | A) získáme analogicky z definice podmíněné
P( A ∩ B)
.
„
pravděpodobnosti zapsané ve tvaru P ( B | A) =
P( A)
Uvedenou větu lze snadno zobecnit na případ více jevů. Uvažme např.
tři jevy A1 , A2 , A3 a položme nejprve B = A1 ∩ A2 . Opakovaným použitím
vztahu (3.2) (podruhé zvolíme B = A1 ) získáme pro P ( A1 ∩ A2 ) > 0 vztah
P ( A1 ∩ A2 ∩ A3 ) = P( A1 ∩ A2 ) P( A3 | A1 ∩ A2 ) =
= P( A1 ) P( A2 | A1 ) P ( A3 | A1 ∩ A2 ).
Další zobecnění na případ čtyř a více jevů je evidentní. Pravděpodobnost průniku jevů
A1 , A2 , ... , An
je za předpokladu
n −1
P (∩ Ai ) > 0 rovna
i =1
n
n −1
i =1
i =1
P (∩ Ai ) = P( A1 ) P( A2 | A1 ) ... P( An | ∩ Ai ).
(3.3)
Věta 3.1 a její zobecnění představují v podstatě pravidlo pro počítání
pravděpodobnosti průniku libovolného konečného počtu jevů.
Příklad 3.2. V urně se nachází 5 bílých, 4 černé a 3 modré kuličky.
Každý pokus spočívá v tom, že se náhodně vytáhne jedna kulička, která se
pak už nevrací zpět do urny. Jaká je pravděpodobnost toho, že se při
prvním kroku vytáhne bílá kulička, při druhém černá a při třetím modrá?
Řešení. Zvolme následující označení jevů: A - při prvním kroku se
vytáhne bílá kulička, B - při druhém kroku černá kulička, C - při třetím
kroku modrá kulička. Snadno určíme
P ( A) =
5
4
3
, P( B | A) = , P(C | A ∩ B) = ,
12
11
10
takže pro hledanou pravděpodobnost dostaneme
5 4 3
1
⋅ ⋅ = .
12 11 10 22
Kontrolní úkol 3.1. Z hromádky 32 karet se postupně vytáhnou dvě
karty. Určete podmíněnou pravděpodobnost toho, že druhou taženou
kartou je eso, jestliže první tažená karta bylo také eso.
P ( A ∩ B ∩ C ) = P ( A) P( B | A) P(C | A ∩ B) =
3.2. Nezávislost jevů
Je přirozené tvrdit, že jev A nezávisí na jevu B ( P ( B ) > 0) , jestliže se
podmíněná pravděpodobnost jevu A za hypotézy (podmínky) B rovná
(nepodmíněné) pravděpodobnosti jevu A, tj.
P ( A | B) = P( A).
33
Je-li také P ( A) > 0 , pak lze vzhledem k platnosti (3.2) psát
P ( B | A) P ( A) = P ( A | B ) P ( B ) = P ( A) P ( B ). Odtud ovšem bezprostředně
plyne P ( B | A) = P( B) , tj. vlastnost nezávislosti jevů je symetrická. Lze
tedy vyslovit tuto definici.
Jevy A, B se nazývají nezávislé, platí-li rovnost
Podvojná
nezávislost jevů
P ( A ∩ B ) = P( A) P( B).
Poznámka. V uvedené definici nezávislosti jevů A a B můžeme upustit
od požadavku, aby jevy A a B měly kladné pravděpodobnosti. Jev A, pro
který platí P(A) = 0 nebo P(A) = 1, je pak nezávislý na jakémkoliv jevu B.
Smysl této definice spočívá v tom, že když nastal jeden z nezávislých
jevů, pak to nikterak neovlivňuje pravděpodobnost druhého jevu.
Věta 3.2. Jsou-li jevy A, B nezávislé, pak jsou také nezávislé jevy A , B.
Důkaz. Vyjdeme ze zřejmé rovnosti P ( A | B) + P( A | B) = 1. Podle
předpokladu platí P ( A | B) = P( A), takže
P ( A | B) = 1 − P( A) = P( A).
‫‮‬
Podobně lze dokázat i tvrzení, že z nezávislosti jevů A, B vyplývá
nezávislost jevů A, B , popř. A, B.
Ujasněte si rozdíl mezi pojmem neslučitelnost jevů, který byl
definován v kapitole první, a pojmem nezávislost jevů. Neslučitelnost
daných jevů je zpravidla zřejmá na první pohled, kdežto jejich
nezávislost nikoliv.
Uvedená definice pojmu nezávislosti dvou jevů má všechny potřebné
vlastnosti, jež požadujeme z intuitivního hlediska. Abychom stejně tak
"rozumně" definovali nezávislost libovolného konečného počtu n jevů
A1 , A2 , ... , An , je třeba postupovat takto:
Sdružená
nezávislost jevů
Jevy A1 , A2 , ... , An se nazývají sdruženě nezávislé, jestliže pro každou
podmnožinu {i1 , i2 , ... , ik } množiny indexů {1, 2, …, n} platí při všech
k ≤ n rovnost
P ( Ai1 ∩ Ai2 ∩ ... ∩ Aik ) = P ( Ai1 ) P ( Ai2 ) ... P ( Aik ).
(3.4)
Platí-li tato rovnost pouze pro k = 2, potom se jevy A1 , A2 , ... , An
nazývají po dvou nezávislé (podvojně nezávislé).
V odstavci 3.1 jsme dokázali, že pro pravděpodobnost průniku
(současného nastoupení) jevů A1 , A2 , ... , An platí v obecném případě
vzorec (3.3). Jsou-li však uvažované jevy sdruženě nezávislé, pak přímo
z definice plyne pro k = n vztah
n
P (∩ Ai ) = P( A1 ) P( A2 ) ... P ( An ).
i =1
34
(3.5)
Vzorec (3.5) představuje pravidlo pro výpočet pravděpodobnosti
průniku libovolného konečného počtu sdruženě nezávislých jevů.
Příklady
3.3. Máme tři bedny s výrobky. V každé bedně je celkem 10 výrobků.
V prvé bedně je 8, ve druhé 7 a ve třetí 9 standardních výrobků. Jaká je
pravděpodobnost toho, že náhodně vybrané tři výrobky, po jednom
z každé bedny, budou standardní?
Řešení. Jev A - vybrán standardní výrobek z prvé, jev B - vybrán
standardní výrobek z druhé, jev C - vybrán standardní výrobek ze třetí
bedny. Z triviální úvahy plyne
P(A) = 0,8 ; P(B) = 0,7 ; P(C) = 0,9 .
Z organizace pokusu plyne, že jevy A, B, C jsou sdruženě nezávislé, a
proto lze využít vzorce (3.5).
P ( A ∩ B ∩ C ) = P ( A) P( B ) P(C ) = 0,8 . 0, 7 . 0,9 = 0,504.
Jsou-li jevy A1 , A2 , ... , An sdruženě nezávislé, pak jsou podle definice
také po dvou nezávislé. Toto tvrzení nelze ovšem obrátit. Na následujícím
příkladě ukážeme, že když jsou nějaké jevy nezávislé po dvou, nemusí být
ještě sdruženě nezávislé.
3.4. Je dán čtyřstěn. Jedna jeho stěna je zbarvena červeně, druhá zeleně,
třetí modře a čtvrtá je rozdělena na tři trojúhelníky, z nichž jeden má
červenou, druhý zelenou a třetí modrou barvu. Při hodu takovým
čtyřstěnem mohou nastat tyto jevy: A1 - padne červená, A2 - padne zelená,
A3 - padne modrá barva. Pod pojmem "padne" určitá barva rozumíme
přitom skutečnost, že čtyřstěn po dopadu na rovinnou podložku zůstane
v poloze, kdy stěna zbarvená touto barvou bude ve styku s podložkou.
Rozhodněte, zda jsou jevy A1 , A2 , A3 po dvou nezávislé, popř. sdruženě
nezávislé.
Řešení. Zřejmě platí:
1
P ( A1 ) = P ( A2 ) = P ( A3 ) = ,
2
1
P ( A1 ∩ A2 ) = P ( A1 ∩ A3 ) = P ( A2 ∩ A3 ) = ,
4
1
P ( A1 ∩ A2 ∩ A3 ) = .
4
Libovolná dvojice jevů Ai , Aj (i ≠ j; i, j = 1, 2,3) tedy splňuje vztah
P ( Ai ∩ Aj ) = P ( Ai ) P( Aj ) , takže jevy A1 , A2 , A3 jsou po dvou nezávislé.
Neplatí však vztah P ( A1 ∩ A2 ∩ A3 ) = P( A1 ) P ( A2 ) P ( A3 ) , což značí, že
uvažované jevy nejsou sdruženě nezávislé.
Kontrolní úkol 3.3. Nechť jevy A a B jsou nezávislé. Dokažte, že také
jevy A a B jsou nezávislé.
35
V teorii se zavádí pro libovolné možné jevy A a B korelační koeficient
definovaný vztahem
Korelační koeficient
jevů
ρ ( A, B ) =
P ( A ∩ B) − P( A) P( B)
+ P( A) P( A) P( B) P( B )
,
který nabývá hodnot z intervalu −1,1 . V případě, že jevy A a B jsou
nezávislé, platí ρ(A, B) = 0.
3.3. Vzorec pro úplnou pravděpodobnost
Vyjdeme z následující věty.
Věta 3.3 (věta o úplné pravděpodobnosti). Nechť jevy (hypotézy)
H1 , H 2 , ... , H n
tvoří
úplnou
soustavu
neslučitelných
jevů
( P( H i ) ≥ 0, i = 1, 2, ... , n) a nechť A je libovolný jev. Potom platí rovnost
n
P ( A) = ∑ P ( H i ) P ( A | H i ).
(3.6)
i =1
Důkaz. Podle předpokladů věty platí
n
Ω = ∪ H i , H i ∩ H j = ∅ (i ≠ j , i, j = 1, 2, ... , n).
i =1
Z těchto vztahů vyplývá
n
A = ∪ ( A ∩ H i ), přičemž ( A ∩ H i ) ∩ ( A ∩ H j ) = ∅ pro
i =1
i, j = 1, 2, ... , n; i ≠ j.
Odtud s použitím vlastnosti 2 pravděpodobnosti a věty 3.1 dostaneme
n
n
i =1
i =1
P ( A) = ∑ P( A ∩ H i ) = ∑ P( H i ) P( A | H i ).
Vzorec pro úplnou
pravděpodobnost

Vzorec (3.6) se nazývá vzorec pro úplnou pravděpodobnost.
Z hlediska matematika je tento vzorec triviální, ovšem umožňuje řešit
mnoho úloh, aniž je nutno konstruovat pravděpodobnostní prostor. Zvláště
užitečný je v těch případech, kdy je odhad podmíněných pravděpodobností
P ( A | H i ) snazší než přímý výpočet pravděpodobnosti P(A).
Příklad 3.5. Chodec vyjde z místa O s cílem dojít do místa A (viz obr.
3.1). Na každé křižovatce se rozhodne zcela náhodně, kterou cestou půjde.
Chybná volba cesty znamená, že chodec do místa A nedojde. Jakou má
chodec pravděpodobnost, že se dostane do místa A?
Řešení. Zavedeme toto označení jevů: A - chodec dojde do místa A, Bi chodec půjde přes křižovatku Bi , i = 1, 2, 3, 4, 5. Jevy B1 , B2 , B3 , B4 a B5
tvoří úplnou soustavu neslučitelných jevů, přičemž
1
P ( B1 ) = P ( B2 ) = P ( B3 ) = P( B4 ) = P( B5 ) = .
5
36
Pro podmíněné pravděpodobnosti plyne z podmínek úlohy
1
1
2
P ( A | B1 ) = 0, P( A | B2 ) = , P ( A | B3 ) = , P ( A | B4 ) = , P ( A | B5 ) = 1.
3
2
3
Hledaná pravděpodobnost je dána vzorcem (3.6), tj.
5
1
1 1 2
1
P ( A) = ∑ P( Bi ) P( A | Bi ) = (0 + + + + 1) = .
5
3 2 3
2
i =1
B1
B2
O
A
B3
B4
B5
Obr. 3.1. Schéma k příkladu 3.5.
Kontrolní úkoly
3.4. Je známo, že 5 % studentů dovede správně zodpovědět všechny
zkušební otázky, 30 % studentů zná správnou odpověď na 70 % otázek,
40 % studentů na 60 % otázek a 25 % studentů jen na 50 % otázek. Jaká je
pravděpodobnost toho, že náhodně vybraný student odpoví správně na
zadanou otázku?
3.5. Střelec má k dispozici pět pušek, přičemž pravděpodobnosti zásahu
jednotlivými puškami jsou 0,5; 0,6; 0,7; 0,8, resp. 0,9. Určete
pravděpodobnost zásahu jedním výstřelem za předpokladu, že si střelec
vybere zbraň zcela náhodně.
3.4. Bayesův vzorec
Nejprve dokážeme tuto větu:
Věta 3.4 (Bayesova věta) . Nechť jevy (hypotézy) H1 , H 2 , ... , H n tvoří
úplnou soustavu neslučitelných jevů ( P( H i ) ≥ 0, i = 1, 2, ... , n) a nechť A
je libovolný jev, pro nějž P( A) > 0. Pak pro každé i , i = 1, 2,..., n, platí
P ( H i | A) =
P( H i ) P( A | H i )
n
∑ P( H
j =1
j
.
(3.7)
) P( A | H j )
37
Důkaz. Nechť A a H i jsou dva libovolné jevy takové, že P(A) > 0,
P ( H i ) > 0. Podle věty 3.1 platí
P ( A ∩ H i ) = P( A) P( H i | A) = P( H i ) P( A | H i )
P( H i ) P( A | H i )
. Odtud s použitím vzorce pro úplnou
P( A)
pravděpodobnost jevu A dostaneme okamžitě vzorec (3.7).
Ñ
neboli P ( H i | A) =
Bayesův vzorec
Vztah (3.7) se nazývá Bayesův vzorec. V teorii pravděpodobnosti
neexistuje žádná jiná věta, o které by se tolik diskutovalo jako o Bayesově
větě. Zmíněná věta je nesporně dokázána a o její správnosti pochyby
nevznikají. Diskuse se týká pouze jejích aplikací.
Bayesova věta se často nazývá větou o pravděpodobnostech příčin.
Tento název pochází odtud, že se Bayesovy věty většinou používá tehdy,
chceme-li z výskytu (nastoupení) jevu A učinit závěry
o pravděpodobnostech hypotéz čili příčin H i (i = 1, 2,..., n), tj. chceme-li
zkoumat, do jaké míry výskyt jevu A určité hypotézy potvrzuje nebo
vyvrací. Pokud jsou známy pravděpodobnosti jednotlivých hypotéz P ( H i )
do provedení pokusu (tzv. apriorní pravděpodobnosti), můžeme po
realizaci pokusu použít Bayesovy věty k určení aposteriorních pravděpodobností P ( H i | A), tj. přehodnotit naše přesvědčení o správnosti každé
hypotézy tak, že zaměníme pravděpodobnosti P ( H i ) pravděpodobnostmi
P( H i | A). Jestliže pravděpodobnosti P ( H i ) nejsou známy, a to se stává
velmi často, musíme jim přiřadit více či méně libovolné hodnoty; tento
postup je pak skutečně problematický.
Existují však případy, kdy popsané schéma může být užitečné. Jde např.
o lékařskou diagnostiku. Předpokládejme, že na některou kliniku
přicházejí nemocní, kteří mohou mít jednu z chorob H1 , H 2 , ... , H n .
Označme písmenem A soubor symptomů u daného pacienta. V tomto
P ( H i ) i podmíněné
případě lze apriorní pravděpodobnosti
pravděpodobnosti P ( A | H i ), i = 1, 2,..., n, určit experimentálně na základě
statistických záznamů z minulých let. Přitom pravděpodobnost P ( H i ) se
přibližně rovná relativní četnosti choroby H i , vyskytnuvší se u pacientů
dané kliniky, a podmíněná pravděpodobnost P ( A | H i ) je přibližně rovna
relativní četnosti pozorování souboru symptomů A u pacientů s chorobou
H i na uvažované klinice. Jelikož jde o statistiku za minulá léta, je možno
tyto statistické údaje považovat za téměř věrohodné. Použití Bayesova
vzorce v takovém případě nevyvolává žádných pochyb, potíže se však
objevují při snaze o praktickou realizaci tohoto plánu. Musíme totiž
shromáždit obrovský objem experimentálního materiálu (dat), abychom
mohli získat věrohodné výsledky.
Bayesova vzorce se často užívá v dělostřelecké praxi při zaměřování, tj.
při upřesňování znalostí o podmínkách střelby (např. o správnosti
zamíření). Dobře známa je i aplikace Bayesova vzorce v chemii.
38
Předpokládejme, že v n nádobách jsou roztoky téže soli o různých
koncentracích, přičemž celkový objem roztoků je 1 litr. Označme P ( H i )
objem roztoku v i-té nádobě, i = 1, 2,..., n, a P( A | H i ) koncentraci soli
v i-té nádobě. Vzorec (3.7) pak udává, jaká část z celkového množství soli
se nachází v i-té nádobě.
Příklad 3.6. Přístroj najde vadu v materiálu s pravděpodobností 0,995,
ale současně s pravděpodobností 0,0001 chybně označí materiál bez vady
jako vadný. Je známo, že vada v materiálu se vyskytuje v 0,1 % případů.
Přístroj označil materiál jako vadný. Jaká je pravděpodobnost toho, že
materiál má skutečně vadu?
Řešení. Jev A - přístroj označil materiál jako vadný, jev H1 - materiál
má skutečně vadu, jev H 2 - materiál nemá vadu. Z podmínek úlohy
vyplývá
P ( H1 ) = 0, 001, P( H 2 ) = 0,999, P( A | H1 ) = 0,995, P( A | H 2 ) = 0, 0001.
Po dosazení do Bayesova vzorce dostaneme
P ( H1 | A) =
=
P ( H1 ) P ( A | H1 )
=
P ( H1 ) P ( A | H1 ) + P ( H 2 ) P ( A | H 2 )
0, 001 . 0,995
= 0,909.
0,001 ⋅ 0,995 + 0,999 ⋅ 0,0001
Kontrolní úkoly
3.6. Výrobky zhotovené v daném závodě jdou na kontrolu k jednomu ze
dvou kontrolorů. Pravděpodobnost, že výrobek přijde k prvnímu
kontrolorovi je 0,6 a ke druhému 0,4. Pravděpodobnost toho, že výrobek
bude uznán za standardní prvním kontrolorem je 0,94 a druhým 0,98. Jistý
výrobek byl shledán standardním. Jaká je pravděpodobnost, že tento
výrobek prověřoval první kontrolor?
3.7. Na 100 mužů připadá pět a na 1000 žen dva daltonisté. Ze skupiny
osob, ve které je stejný počet mužů i žen, je náhodně vybrána osoba, jež se
projevila jako daltonista. Jaká je pravděpodobnost toho, že je to muž?
Pojmy k zapamatování:
• podmíněná pravděpodobnost
• podvojná nezávislost jevů
• sdružená nezávislost jevů
• vzorec pro úplnou pravděpodobnost
• Bayesův vzorec
Shrnutí:
V této kapitole jste poznali další základní pojmy z teorie
pravděpodobnosti: podmíněná pravděpodobnost, podvojná a sdružená
nezávislost jevů. Dále jsou uvedeny vzorec pro pravděpodobnost průniku
(součinu) jevů, vzorec pro úplnou pravděpodobnost a Bayesův vzorec,
s jejichž pomocí byste měli zvládnout běžné úlohy na výpočet
pravděpodobnosti, resp. podmíněné pravděpodobnosti, jevů.
39
40
Korespondenční úkol 1
1. Určete náhodný jev X z rovnosti
X ∪ A ∪ X ∪ A = B.
2.
Dokažte, že jevy A, A ∩ B a A ∪ B tvoří úplný systém jevů.
3. Ve skříni je celkem 10 párů přezůvek různé velikosti. Z těchto
přezůvek se náhodně vyberou 4 kusy. Jaká je pravděpodobnost
toho, že mezi takto vybranými 4 kusy bude alespoň jeden pár?
4. Házíme současně třemi hracími kostkami. Určete pravděpodobnost
toho, že při jednom hodu bude součet bodů na všech třech kostkách
a) roven 12,
b) roven 13.
Poznámka. Tato úloha je známa pod názvem Méreův paradox.
5. Účastníci tzv. Janovské loterie si kupují lístky, na nichž je napsáno
některé z čísel 1, 2, …, 90. Mohou si koupit i takové lístky, na
kterých jsou 2, 3, 4 nebo 5 různých čísel. V den tahu loterie se
vyjímá z osudí, jež obsahuje žetony s čísly 1 až 90, právě pět
žetonů. Vyhrávají ti, kteří mají všechna čísla na svém lístku mezi
taženými. Určete pravděpodobnost výhry
a) při hře na jedno číslo,
b) při hře na dvě čísla (tzv. ambo),
c) při hře na tři čísla (terno).
6. Série 100 výrobků bude převzata uživatelem, jestliže při kontrole
50 náhodně vybraných výrobků nebude zjištěn více než jeden
zmetek. Určete pravděpodobnost toho, že se celá série převezme,
když obsahuje právě pět zmetků.
7. Ze šesti vajec jsou právě dvě prasklá. Jaká je pravděpodobnost, že
při náhodném odběru dvou vajec vybereme
a) dvě dobrá,
b) jedno prasklé,
c) dvě prasklá?
8. Jev A může nastat v daném pokusu s pravděpodobností p. Pokus
byl nezávisle opakován celkem n-krát. Jaká je pravděpodobnost
toho, že přitom jev A nastane alespoň jednou?
9. Pravděpodobnost sestřelení letadla jedním výstřelem z karabiny je
1 250. Určete pravděpodobnost sestřelení letadla salvou z 250
karabin za předpokladu, že jednotlivé výstřely jsou nezávislé.
10. Lovec vystřelil třikrát na divočáka. Pravděpodobnost zásahu
prvním výstřelem je 0,4; druhým 0,5; třetím 0,7. Jedním zásahem
lze divočáka usmrtit s pravděpodobností 0,2; dvěma zásahy
s pravděpodobností 0,6 a třemi zásahy s jistotou. Jaká je
pravděpodobnost toho, že lovec divočáka usmrtí?
41
11. Tři střelci současně vystřelili na určitý cíl, v cíli však byly zjištěny
pouze dva zásahy. Určete pravděpodobnost toho, že třetí střelec cíl
zasáhl, jestliže pravděpodobnost zásahu cíle je pro prvního střelce
0,6; pro druhého 0,5 a pro třetího 0,4?
12. Na významnou sportovní soutěž se připravují 4 žáci prvního
ročníku, 6 žáků druhého ročníku a 5 žáků třetího ročníku určité
střední školy. Pravděpodobnost reprezentace školy v uvedené
soutěži je pro žáky prvního ročníku 0,9; pro žáky druhého ročníku
0,7 a pro žáky třetího ročníku 0,8. Náhodně vybraný žák skutečně
reprezentoval školu v uvedené soutěži. Ve kterém ročníku tento žák
s největší pravděpodobností studuje?
42
4. NÁHODNÉ VELIČINY A JEJICH ROZDĚLENÍ
•
•
•
•
•
Po prostudování této kapitoly:
pochopíte stěžejní pojmy teorie pravděpodobnosti, a to pojmy
náhodné veličiny a jejího rozdělení,
poznáte základní vlastnosti funkcí popisujících rozdělení náhodné
veličiny (distribuční funkce, pravděpodobnostní funkce, hustota
pravděpodobnosti) a naučíte se s nimi pracovat,
seznámíte se s pojmy náhodného vektoru a jeho rozdělení,
pochopíte význam nezávislosti náhodných veličin při konstrukci
jejich sdruženého rozdělení,
seznámíte se s postupem, jak počítat rozdělení jednoduchých
funkcí náhodné veličiny.
Pojmy náhodné veličiny a jejího rozdělení patří k základním
pojmům teorie pravděpodobnosti. Věnujte pochopení těchto pojmů
maximální pozornost, protože s nimi budeme pracovat v celé
zbývající části tohoto učebního textu.
4.1. Základní pojmy
Z intuitivního hlediska rozumíme náhodnou veličinou (proměnnou)
takovou veličinu (proměnnou), jejíž hodnoty nejsou jednoznačně určeny
výsledky náhodných pokusů. Dříve než přistoupíme k formální definici,
uvedeme několik příkladů náhodných veličin.
Náhodnou veličinou je např. počet kosmických částic dopadajících na
danou oblast zemského povrchu během časového intervalu definované
délky. Tento počet značně kolísá v závislosti na celé řadě náhodných
příčin. Také počet volání, které přijdou na telefonní ústřednu v daném
časovém intervalu, je náhodnou veličinou. Tato veličina může zřejmě
nabývat libovolných nezáporných celočíselných hodnot; její změny jsou
přitom zcela náhodné. Rychlost molekuly plynu nezůstává konstantní, ale
mění se v závislosti na srážkách s ostatními molekulami. Těchto srážek
bývá obrovský počet, dokonce i během velmi krátkého časového intervalu.
Známe-li rychlost molekuly v daném okamžiku, nemůžeme s jistotou určit
její hodnotu za 0,01 nebo 0,001 sekundy. Změny rychlosti molekuly mají
evidentně náhodný charakter.
Uvedené příklady přesvědčivě ukazují, že se s náhodnými veličinami
setkáváme v nejrůznějších oblastech vědy a techniky. Všechny příklady,
bez ohledu na různost jejich konkrétního obsahu, mají jedno společné. Jde
v nich o veličinu, která může pod vlivem náhodných okolností nabývat
různých hodnot.
V žádném z uvedených příkladů nelze předem říci, jaké hodnoty
nabude sledovaná veličina, poněvadž její změny jsou ryze náhodné
povahy.
43
Náhodná veličina
Formálně lze náhodnou veličinu definovat takto: Nechť je dán
pravděpodobnostní prostor (Ω, À, P ) . Náhodnou veličinou nazýváme
reálnou funkci X (ω ) prvků ω prostoru elementárních jevů Ω takovou, že
pro každé reálné číslo x je množina {ω ∈ Ω; X (ω ) < x} náhodným jevem,
tj. platí
{ω ∈ Ω; X (ω ) < x} ∈ À .
( 4.1 )
V rámci těchto skript budeme náhodné veličiny označovat důsledně
velkými písmeny latinské abecedy a jejich konkrétní hodnoty příslušnými
malými písmeny latinské abecedy. K označení náhodného
jevu {ω ∈ Ω; X (ω ) < x} budeme v dalším textu používat zjednodušeného
zápisu { X < x}.
Pro další výklad o náhodných veličinách a jejich charakteristikách je
důležitá následující věta.
Věta 4.1. Jestliže X je náhodná veličina a f(x) borelovsky měřitelná
funkce reálné proměnné x, pak Y = f ( X ) je také náhodná veličina.
Důkaz nalezne čtenář v učebnici [16].
Poznámka. Funkce f(x) je borelovsky měřitelná, jestliže množina
reálných čísel x, definovaná pro libovolné reálné c nerovností f ( x) < c je
borelovská. Spojitá funkce je borelovsky měřitelná.
V aplikacích se zpravidla setkáváme s náhodnými veličinami dvojího
typu:
a) Náhodná veličina může nabýt jen hodnot z nějaké konečné nebo
spočetné množiny { x1 , x2 , ...} .
b) Náhodná veličina může nabýt všech hodnot z určitého nedegenerovaného intervalu.
Diskrétní náhodná
veličina
Absolutně spojitá
náhodná veličina
V případech a) říkáme, že náhodná veličina X je diskrétní (má
rozdělení diskrétního typu). V případech b) jde zpravidla o absolutně
spojitou náhodnou veličinu (rozdělení absolutně spojitého typu).
Existují i takové náhodné veličiny, které nelze zařadit ani mezi diskrétní,
ani mezi absolutně spojité, ovšem jejich praktický význam je
zanedbatelný.
Příklad 4.1. Rozhodněte, které z uvedených náhodných veličin jsou
diskrétní a které absolutně spojité, a stanovte obory jejich funkčních
hodnot.
a) počet členů domácnosti;
b) počet nekvalitních výrobků z celkové denní produkce;
c) podíl zmetků mezi čtyřmi výrobky vybranými ze zásilky 100 výrobků,
která obsahuje dva zmetky;
d) životnost televizoru;
e) náhodně vybrané reálné číslo.
Řešení. Náhodné veličiny a) až c) jsou diskrétní, zbývající náhodné
veličiny jsou absolutně spojité. Obory funkčních hodnot:
44
a) 1, 2,...;
b) 0, 1,..., velikost denní produkce;
1 1
c) 0, , (počet zmetků ve výběru může být roven 0, 1, 2);
4 2
d) (0, ∞);
e) (-∞, ∞).
K charakterizaci náhodné veličiny nestačí znát pouze všechny možné
hodnoty, kterých tato veličina může nabýt.
Jedním z úkolů teorie pravděpodobnosti je vybudovat matematický
aparát, pomocí kterého by bylo možno přiřadit každé prakticky zajímavé a
důležité podmnožině množiny reálných čísel pravděpodobnost toho, že
náhodná veličina X nabývá hodnot z této podmnožiny. Je-li takový vztah
a jejich pravděpodobnostmi dán, říkáme,
mezi podmnožinami množiny
že je dáno rozdělení pravděpodobností příslušné náhodné veličiny X.
Rozdělení
pravděpodobností
4.2. Distribuční funkce
Náhodné veličiny, jejichž studiem se teorie pravděpodobnosti zabývá,
jsou velmi rozmanité. Počet všech možných hodnot, kterých náhodné
veličiny nabývají, může být konečný, spočetný i nespočetný. K tomu,
abychom mohli popisovat rozdělení pravděpodobností náhodných veličin
jednotným způsobem, zavádí se v teorii pravděpodobnosti pojem
distribuční funkce náhodné veličiny.
Nechť X je náhodná veličina a x libovolné reálné číslo. Distribuční
funkcí F(x) náhodné veličiny X nazýváme funkci, která je definována
vztahem
Distribuční funkce
F ( x) = P( X < x) pro − ∞ < x < ∞.
(4.2)
Hodnota distribuční funkce v bodě x tedy udává pravděpodobnost toho,
že náhodná veličina X nabývá hodnoty menší než x. Zápis P( X < x) je
zjednodušenou
formou
zápisu
pravděpodobnosti
jevu
{ X < x} = {ω ∈ Ω; X (ω ) < x} .
Nyní přejdeme k formulaci základních vlastností distribuční funkce
jednorozměrné náhodné veličiny.
1. Pro libovolné reálné číslo x platí 0 ≤ F ( x) ≤ 1.
Důkaz. Soustava nerovností 0 ≤ P( A) ≤ 1 platí pro libovolný náhodný
jev A∈ À, a tedy i pro jev A = { X < x}.
Ñ
2. Distribuční funkce F(x) je monotónní, a to neklesající.
Důkaz. Je-li x2 > x1 , pak
F ( x2 ) = P( X < x2 ) = P( X < x1 ) + P( x1 ≤ X < x2 ) =
= F ( x1 ) + P( x1 ≤ X < x2 ) ≥ F ( x1 ),
čímž je tvrzení dokázáno.
(4.3)
Ñ
45
Vlastnosti distribuční
funkce
Důsledek 1. Pravděpodobnost toho, že náhodná veličina nabude
hodnoty z intervalu < a, b) , je rovna přírůstku distribuční funkce F(x)
v tomto intervalu, tj.
P (a ≤ X < b) = F (b) − F (a ).
Důkaz. Tento důsledek vyplývá přímo ze vztahů (4.3), jestliže položíme
x1 = a, x2 = b.
□
Důsledek 2. Pravděpodobnost toho, že absolutně spojitá náhodná
veličina X nabude jediné určité hodnoty x0 , je rovna nule, tj.
P ( X = x0 ) = 0.
Důkaz. Položíme-li ve vztazích (4 .3) x1 = x0 , x2 = x0 + ∆x, dostaneme
P ( x0 ≤ X < x0 + ∆x) = F ( x0 + ∆x) − F ( x0 ).
Distribuční funkce absolutně spojité náhodné veličiny je spojitá pro
všechna reálná x (viz odstavec 4.4). Z její spojitosti v bodě x0 plyne
lim [ F ( x0 + ∆x) − F ( x0 ) ] = 0,
∆x → 0
a proto P ( X = x0 ) = 0.
Ñ
3. Pro libovolnou distribuční funkci F(x) platí limitní vztahy
F (−∞) = 0, F (∞) = 1.
Důkaz. Dokážeme první z uvedených vztahů.
∞
F (−∞) = lim F (− x) = lim F (− n) = lim P( X < − n) = P(∩ { X < − n}) = P(∅) = 0.
x →∞
n →∞
n →∞
n =1
Záměnu lim F (− n) za lim F (− x) lze provést vzhledem k monotónnosti
n →∞
x →∞
funkce F(x). V další části důkazu se využívá vlastnosti 10
pravděpodobnosti (viz odstavec 2.5). Analogickým postupem lze dokázat i
platnost vztahu
F (∞) = lim F ( x) = 1.
x →∞
Ñ
4. Distribuční funkce F(x) je spojitá zleva v libovolném bodě
x0 ∈ ( −∞, ∞ ) , tj.
lim F ( x) = F ( x0 ).
x → x0 −
Důkaz. Nechť { xn } je libovolná posloupnost reálných čísel taková, že
xn
x0 (konvergence zdola).
Označme A0 = { X < x0 } , An = { X < xn } , n = 1, 2, ... . Pak
46
F ( xn ) = P( An ), n = 1, 2, ... ,
∞
An ⊂ An +1 , n = 1, 2, ... a A0 = ∪ An .
n =1
Z vlastnosti 9 pravděpodobnosti (viz odstavec 2.5) pak vyplývá
lim F ( xn ) = F ( x0 ), což se mělo dokázat.
Ñ
n →∞
Jestliže pro x = x0 platí lim F ( x) − F ( x0 ) = C0 > 0, pak říkáme, že
x → x0 +
distribuční funkce F(x) má v bodě x0 skok. Takové skoky v distribuční
funkci se vyskytují pouze v případě diskrétních náhodných veličin, a to
v bodech, které reprezentují možné hodnoty příslušné náhodné veličiny.
Lze snadno ukázat, že distribuční funkce diskrétní náhodné veličiny
nemůže mít více než spočetný počet skoků. Počet skoků je totiž
jednoznačně určen počtem možných hodnot diskrétní náhodné veličiny, a
ten může být buď konečný nebo spočetný. Velikost skoků je přitom dána
pravděpodobnostmi, s nimiž uvažovaná diskrétní náhodná veličina těchto
svých hodnot nabývá.
V tomto odstavci jsme dokázali, že každá distribuční funkce je
neklesající,
spojitá
zleva
a
splňuje
okrajové
podmínky
F (−∞) = 0, F (∞) = 1. Platí i obrácené tvrzení. Každá funkce, která má
uvedené tři vlastnosti, může být považována za distribuční funkci nějaké
náhodné veličiny.
V souvislosti se zavedením distribuční funkce upozorníme na jednu
významnou skutečnost. Je zřejmé, že každé náhodné veličině lze
jednoznačně přiřadit distribuční funkci. Na druhé straně však existuje
nekonečně mnoho různých náhodných veličin, které mají jednu a tutéž
distribuční funkci. Uvažme např. náhodnou veličinu X, jež nabývá
1
s pravděpodobnostmi
dvou různých hodnot − 1 a +1, a náhodnou
2
veličinu Y = − X . Náhodné veličiny X a Y nabývají vždy různých hodnot.
Nicméně obě tyto veličiny mají jednu a tutéž distribuční funkci, a to
⎧ 0 pro x ≤ −1,
⎪1
⎪
F ( x) = ⎨ pro -1 < x ≤ 1,
⎪2
⎪⎩ 1 pro x > 1.
Na závěr definujeme ještě podmíněnou distribuční funkci. Nechť B je
nějaký takový jev, že P( B) > 0. Pak funkci
F ( x | B) = P( X < x | B)
nazýváme podmíněnou distribuční funkcí náhodné veličiny X za
podmínky (hypotézy) B. Funkce F ( x | B) má evidentně všechny vlastnosti
obyčejné distribuční funkce F(x).
47
Podmíněná
distribuční funkce
4.3. Rozdělení diskrétní náhodné veličiny
Rozdělení
diskrétního typu
Náhodná veličina X je diskrétní (má rozdělení diskrétního typu),
jestliže existuje konečná nebo spočetná množina reálných čísel
{ x1 , x2 , ...} taková, že pro každé xi z této množiny je pravděpodobnost
P ( X = xi ) > 0 a
∑ P( X = x ) = 1.
(4.4)
i
i
Nejjednodušším způsobem lze rozdělení diskrétní náhodné veličiny X
popsat zadáním množiny { x1 , x2 , ...} možných hodnot této veličiny a
odpovídajících pravděpodobností P ( X = xi ), i = 1, 2, ... . Pravděpodobnosti P( X = xi ) jsou přirozeně funkcí odpovídajících hodnot xi a tato
funkce
P ( x) = P( X = x)
Pravděpodobnostní
funkce
se nazývá pravděpodobnostní funkcí náhodné veličiny X. V bodech
x ≠ xi jsou hodnoty pravděpodobnostní funkce zřejmě nulové. Přímo
z definice pravděpodobnostní funkce vyplývá:
1. 0 ≤ P ( x) ≤ 1,
2.
∑ P ( x ) = 1.
i
i
Distribuční funkce diskrétní náhodné veličiny X je dána vztahem
F ( x) =
∑ P ( x ),
(4.5)
i
i: xi < x
v němž se sčítá přes všechna i, pro která platí xi < x. Ze vztahu (4.5)
vyplývá, že distribuční funkce libovolné diskrétní náhodné veličiny je
nespojitá, vykazuje skoky při hodnotách xi , jež jsou možnými hodnotami
sledované veličiny. Velikost skoku distribuční funkce F(x) v bodě xi je
rovna hodnotě P ( xi ), i = 1, 2, ... . Jsou-li dvě možné hodnoty veličiny X
odděleny intervalem, který už neobsahuje žádné další možné hodnoty této
veličiny, pak je distribuční funkce F(x) v tomto intervalu konstantní.
V případě, že veličina X může nabývat jen konečného počtu n různých
hodnot, má distribuční funkce F(x) tvar stupňovité (po částech konstantní)
funkce s počtem stupňů (oborů konstantnosti) rovným n + 1.
Rozdělení diskrétního typu lze popsat vzorcem, tabulkou nebo graficky.
V tabulce 4.1 se uvádějí všechny možné hodnoty xi náhodné veličiny X a
odpovídající pravděpodobností pi = P ( xi ), i =1,2, ... , n.
Tab. 4.1. Tabulka hodnot pravděpodobnostní funkce
48
xi
x1
x2
xn
pi = P ( xi )
p1
p2
pn
Tabelární způsob popisu rozdělení diskrétní náhodné veličiny je vhodný
tam, kde počet možných hodnot není příliš velký. Základními způsoby
grafické reprezentace rozdělení pravděpodobností diskrétní náhodné
veličiny jsou:
a) úsečkový diagram,
b) polygon,
c) histogram.
Úsečkového diagramu lze užít v případě libovolné diskrétní náhodné
veličiny. Na ose x se vynášejí jednotlivé hodnoty xi náhodné veličiny a na
ose y odpovídající pravděpodobnosti pi . Úsečkový diagram je tvořen
Úsečkový diagram
svislými úsečkami délky pi sestrojenými nad body o souřadnicích [ xi , 0].
Polygon a histogram se uplatňují v těch případech, kdy možné hodnoty xi
náhodné veličiny X tvoří aritmetickou posloupnost s diferencí d = xi +1 − xi ,
i = 1, 2, …, n.
Polygonem rozdělení pravděpodobností se zpravidla rozumí (v rozporu
s obvyklým významem pojmu polygon) lomená čára spojující všechny
body o souřadnicích [ xi , pi ] .
Při konstrukci histogramu rozdělení pravděpodobností se postupuje
následujícím způsobem. Nad každým bodem o souřadnicích [ xi , 0] se sestrojí obdélník o obsahu pi tak, aby tento bod ležel ve středu vodorovné
strany obdélníka, která má délku d. Svislé strany jednotlivých obdélníků
mají tedy délku pi d a celkový obsah všech obdélníků je jednotkový.
Společné části svislých stran sousedních obdélníků se v histogramu
nevyznačují. Jednotlivé způsoby reprezentace rozdělení diskrétního typu
budou zřejmé z následujícího příkladu.
Příklad 4.2. Pravděpodobnost toho, že výrobek bude vyhovovat všem
technickým požadavkům je 0,9. Popište rozdělení náhodné veličiny X,
která udává počet nevyhovujících výrobků mezi třemi výrobky.
Řešení. Počet nevyhovujících výrobků může nabýt těchto hodnot:
x1 = 0, x2 = 1, x3 = 2, x4 = 3. Z jednoduché kombinatorické úvahy plyne
p1 = P ( X = 0) = 0,9 . 0,9 . 0,9 = 0,729;
p2 = P ( X = 1) = 0,9 . 0,9 . 0,1 + 0,9 . 0,1 . 0,9 + 0,1 . 0,9 . 0,9 = 0,243;
p3 = P ( X = 2) = 0,9 . 0,1 . 0,1 + 0,1 . 0,9 . 0,1 + 0,1 . 0,1 . 0,9 = 0,027;
p4 = P ( X = 3) = 0,1 . 0,1 . 0,1 = 0,001.
Pravděpodobnostní funkce P ( x) sledované náhodné veličiny má
zřejmě tvar
⎧⎛ 3 ⎞ x 3− x
pro x = 0,1, 2,3,
⎪⎜ ⎟ 0,1 0,9
P ( x ) = ⎨⎝ x ⎠
⎪ 0
pro ostatní x.
⎩
49
Polygon
Histogram
Jednotlivé způsoby reprezentace rozdělení pravděpodobnosti veličiny X
jsou uvedeny v tabulce 4.2 a na obrázcích 4.1 - 4.3 .
Tab. 4.2. Hodnoty pravděpodobnostní funkce k příkladu 4.2
xi
0
1
2
3
pi
0,729
0,243
0,027
0,001
Distribuční funkci počtu nevyhovujících výrobků mezi třemi výrobky lze
vyjádřit vzorcem
0
pro x ≤ 0,
⎧
⎪
⎛3⎞
⎪
F ( x) = ⎨ ∑ ⎜ ⎟ 0,1xi 0,93− xi pro 0 < x ≤ 3,
⎪ i:xi < x ⎝ xi ⎠
⎪
1
pro x > 3.
⎩
Hodnoty této distribuční funkce jsou uvedeny v tabulce 4.3 a její graf je
na obrázku 4.4.
Tab. 4.3. Hodnoty distribuční funkce k příkladu 4.2
0
1
2
3
>3
x
F(x) 0,000 0,729 0,972 0,999 1,000
P (x)
1,0
P ( x)
1,0
0,5
0,5
0
50
0
1
2
3 x
Obr. 4.1 Úsečkový diagram
0
0
1
2
3 x
Obr. 4.2. Polygon
F(x)
P (x)
1,0
1,0
0,5
0,5
0
0
1
2
3
Obr. 4.3. Histogram
0
x
0
1
2
3 x
Obr. 4.4. Distribuční funkce
Kontrolní úkoly
4.1. Určete distribuční funkci F(x) a nakreslete histogram náhodné
veličiny X, pro níž platí
P( X = k ) =
1
, k = 1, 2, ... .
2k
4.2. Náhodná veličina X nabývá hodnot –1, 0, 1 s pravděpodobnostmi
1 , 1 , resp. 1 . Určete distribuční funkci veličiny X a znázorněte ji
4 2
4
graficky.
4.4. Rozdělení absolutně spojité náhodné veličiny
Náhodná veličina X je absolutně spojitá (má rozdělení absolutně
spojitého typu), jestliže existuje nezáporná reálná funkce f(x) taková, že
pro všechna reálná čísla x platí
Rozdělení absolutně
spojitého typu
x
F ( x) =
∫
f (t )dt.
(4.6)
−∞
Funkce f(x) se nazývá hustota rozdělení pravděpodobností nebo
stručněji hustota náhodné veličiny X.
Distribuční funkce absolutně spojité náhodné veličiny je absolutně
spojitá, tj. má skoro všude derivaci a je rovna neurčitému integrálu své
derivace (viz např. [3]). V bodech, kde existuje derivace distribuční
funkce, platí
f ( x) = F ′( x).
(4.7)
V bodech, kde derivace F(x) neexistuje, rovnost (4.7) ztrácí smysl.
Proto za definici hustoty pomocí distribuční funkce můžeme považovat
rovnost (4.6), ne však rovnost (4.7).
51
Hustota
Uvedeme základní vlastnosti hustoty rozdělení pravděpodobností.
Vlastnosti hustoty
1.
Hustota rozdělení pravděpodobnosti je nezáporná, tj. f ( x) ≥ 0.
Tato vlastnost je obsažena přímo v definici distribuční funkce absolutně
spojitého typu. Tuto vlastnost je možno interpretovat geometricky tak, že
body grafu funkce f(x) leží buď nad osou x nebo na ní. Graf funkce f(x) se
obvykle nazývá křivkou rozdělení příslušné náhodné veličiny.
2. Pravděpodobnost toho, že absolutně spojitá náhodná veličina X
nabývá hodnot z intervalu 〈 a, b) kde a, b jsou libovolná reálná čísla
(a < b), je dána rovností
b
P (a ≤ X < b) = ∫ f ( x)dx.
(4.8)
a
Důkaz.
Z
vlastnosti
2
distribuční
funkce
plyne
P (a ≤ X < b) = F (b) − F (a ). Vycházejíce z Newtonova - Leibnitzova
vzorce, odvodíme pro rozdíl F(b) - F(a) vztahy
b
b
a
a
F (b) − F (a) = ∫ F ′( x)dx = ∫ f ( x)dx.
Vztah (4.8) vyplývá
s předcházející rovností.
bezprostředně
ze
srovnání
těchto
vztahů

Geometrická interpretace vlastnosti 2: Pravděpodobnost toho, že
absolutně spojitá náhodná veličina X nabude hodnoty z intervalu 〈 a, b)
(ale také z intervalů (a, b), (a, b〉 nebo a, b ), je rovna obsahu
geometrického útvaru, který je vymezen křivkou f(x), osou x a přímkami
x = a, x = b (viz obr. 4.5).
f (x)
0
a
b
x
Obr. 4.5. Ilustrace k vlastnosti 2 hustoty rozdělení pravděpodobností
Právě uvedenou vlastnost lze také formulovat takto: Je-li f(x) spojitá
v bodě x, pak
P ( x ≤ X < x + ∆x) = f ( x)∆x + o(∆x),
kde o (∆x) reprezentuje nekonečně malou veličinu, pro níž platí
o (∆x)
lim
= 0.
∆x → 0 ∆x
3. Hustota rozdělení pravděpodobností splňuje podmínku
52
∞
∫
f ( x)dx = 1.
(4.9)
−∞
Důkaz. Nevlastní integrál ve vztahu (4.9) představuje pravděpodobnost
jevu spočívajícího v tom, že absolutně spojitá náhodná veličina X nabude
hodnoty z intervalu ( −∞, ∞ ) . Je zřejmé, že jde o pravděpodobnost jevu
jistého, a ta je jednotková.
V souladu s vlastností 3 je obsah geometrického útvaru vymezeného
křivkou f(x) a osou x jednotkový.
Každou borelovsky měřitelnou nezápornou funkci f(x) splňující vztah
(4.9) lze považovat za hustotu rozdělení pravděpodobností. Funkce
x
F ( x) =
∫
f (t )dt
−∞
má totiž všechny vlastnosti distribuční funkce.
Rozdělení pravděpodobností absolutně spojité náhodné veličiny se
nejčastěji reprezentuje vzorcem pro hustotu f(x) nebo jejím grafem
(křivkou rozdělení pravděpodobností). Principiálně je možno rozdělení
absolutně spojité náhodné veličiny popsat i tabulkou nebo histogramem.
V takovém případě se interval 〈 a, b) možných hodnot náhodné
veličiny X rozdělí na n elementárních intervalů stejné délky
〈 x0 = a, x1 ), 〈 x1 , x2 ), ... , 〈 xn −1 , xn = b) a spočtou se pravděpodobnosti
pi = P( xi −1 ≤ X < xi ). Tabulka pak obsahuje pro každý z elementárních
intervalů < xi −1 , xi ) příslušnou pravděpodobnost
pi , i =1,2, ... , n.
Histogram sestává z n obdélníků, přičemž i-tý obdélník se sestrojí nad
elementárním intervalem < xi −1 , xi ) a má obsah pi .
Příklad 4.3. Doba života libovolného atomu radioaktivního prvku je
náhodná veličina X, jejíž distribuční funkce má tvar
⎧1-e −α x pro x ≥ 0,
F ( x) = ⎨
⎩ 0 pro x < 0.
kde α > 0 značí rozpadovou konstantu uvažovaného radioaktivního prvku.
Určete hustotu doby života atomu tohoto prvku.
Řešení. Distribuční funkce F(x) má derivaci všude kromě bodu x = 0 a
platí
⎧α e −α x pro x > 0,
f ( x) = F ′( x) = ⎨
pro x < 0.
⎩0
Bod x = 0 je zřejmě bodem nespojitosti hustoty doby života
radioaktivního atomu. Většina autorů pokládá definitoricky f (0) = 0.
Distribuční funkce a hustota doby života radioaktivního atomu jsou
schematicky znázorněny na obrázcích 4.6 a 4.7.
53
F (x)
1
f ( x)
α
0
0
x
0
x
Obr. 4.6. Distribuční funkce k příkladu 4.3 Obr. 4.7. Hustota k příkladu 4.3
0
Kontrolní úkoly
4.3. Rozhodněte, zda funkce
⎧ e − x pro x > 0,
f ( x) = ⎨
jinak.
⎩0
je hustotou náhodné veličiny X a určete
a) distribuční funkci F(x),
1
b) pravděpodobnosti P ( X < ) a P(1 < X < 2).
2
4.4. Určete hodnotu konstanty c tak, aby následující funkce byly
hustotami náhodné veličiny X:
a) f ( x) = cxe − x pro 0<x < ∞,
b) f ( x) = c sin x pro 0 < x < π.
4.5. Náhodná veličina X má hustotu
A
f ( x) =
pro − ∞ < x < ∞.
1 + x2
Určete hodnotu konstanty A a distribuční funkci F(x).
4.5. Náhodné vektory a jejich distribuční funkce
Až dosud jsme uvažovali pouze jednorozměrné náhodné veličiny, tj.
takové veličiny, jejichž možnými hodnotami byla vždy reálná čísla.
V tomto odstavci se budeme zabývat náhodnými vektory a jejich
distribučními funkcemi.
Nechť
Náhodný vektor
{Ω, À, P} je
náhodným
vektorem
pravděpodobnostní prostor, pak n-rozměrným
X = ( X 1 , X 2 , ... , X n )
nazýváme
zobrazení
X : Ω → Ñ n takové, že pro libovolná reálná čísla x1 , x2 , ... , xn platí
n
∩{ X
i
< xi } ∈ À.
(4.10)
i =1
Uvedená definice je ekvivalentní následující definici: n-rozměrným
nazýváme
zobrazení
náhodným
vektorem X = ( X 1 , X 2 , ... , X n )
X : Ω → Ñ n takové, že pro libovolnou borelovskou podmnožinu B ⊂ Ñn
platí
54
{ω ∈ Ω; X (ω ) ∈ B )} = X
−1
( B ) ∈ À.
Borelovskými podmnožinami n-rozměrného euklidovského prostoru
rozumíme prvky nejmenší σ-algebry obsahující všechny n-rozměrné
otevřené intervaly
{x = ( x1 , x2 , ... , xn ); a1 < x1 < b1 , ... , an < xn < bn }.
Místo pojmu n-rozměrný náhodný vektor se často užívá pojmu
n-rozměrná náhodná veličina.
Každá složka X i , i = 1, 2, ... , n, náhodného vektoru X je náhodná
veličina. O pravdivosti tohoto tvrzení se přesvědčíme, když ve vztahu
(4.10) zvolíme x j → ∞, j = 1, 2, ... , n, j ≠ i.
Je-li dán vztah mezi podmnožinami euklidovského prostoru Ñ n a jejich
pravděpodobnostmi, říkáme, že je dáno sdružené rozdělení pravděpodobností náhodného vektoru X = ( X 1 , X 2 , ... , X n ). Distribuční
funkcí náhodného vektoru X = ( X 1 , X 2 , ... , X n ) nebo také sdruženou
distribuční funkcí náhodných veličin X 1 , X 2 , ... , X n nazýváme reálnou
funkci n reálných proměnných x1 , x2 , ... , xn danou vztahem
F ( x1 , x2 , ... , xn ) = P ( X 1 < x1 , X 2 < x2 , ... , X n < xn ),
v němž pravděpodobnost na pravé straně značí pravděpodobnost průniku
jevů { X i < xi } , i = 1, 2, ... , n. Veličiny X 1 , X 2 , ... , X n lze geometricky
interpretovat jako souřadnice bodů v Ñ n . V této interpretaci je poloha
bodu [ X 1 , X 2 ... , X n ] zřejmě náhodná a distribuční funkce
F ( x1 , x2 , ... , xn ) udává pravděpodobnost toho, že bod
[ X 1 , X 2 ... , X n ]
padne do n-rozměrné oblasti
(−∞, x1 ) × (−∞, x2 ) × ... × (−∞, xn ).
Pomocí distribuční funkce náhodného vektoru X můžeme snadno
spočíst pravděpodobnost, že bod
[ X 1 , X 2 ... , X n ] padne dovnitř
rovnoběžnostěnu
〈 a1 , b1 ) × 〈 a2 , b2 ) × ... × 〈 an , bn ),
kde ai , bi jsou libovolná reálná čísla ( ai < bi ). S použitím geometrické
interpretace získáme vztah
n
P (ai ≤ X i < bi ; i = 1, 2, ... , n) = F (b1 , b2 , ... , bn ) − ∑ pi +
i =1
n −1
+∑
n
∑p
i =1 j =i +1
v
němž
(4.11)
− ... +(−1) F (a1 , a2 , ... , an ),
n
ij
pij ...k
značí
hodnotu
funkce
F ( c1 , c2 , ..., cn ) ,
kde ci = ai , c j = a j , ..., ck = ak a cs = bs pro s ≠ i, s ≠ j , ... , s ≠ k .
55
Sdružené rozdělení
náhodného vektoru
Distribuční funkce
náhodného vektoru
Pro speciální případ n = 2 platí
P (a1 ≤ X 1 < b1 , a2 ≤ X 2 < b2 ) = F (b1 , b2 ) − F (a1 , b2 ) − F (b1 , a2 ) + F (a1 , a2 ).
Základní vlastnosti distribuční funkce náhodného vektoru X lze
odvodit analogicky jako v jednorozměrném případě.
1. Distribuční funkce F ( x1 , x2 , ... , xn ) splňuje soustavu nerovností
Vlastnosti distribuční
funkce náh. vektoru
0 ≤ F ( x1 , x2 , ... , xn ) ≤ 1.
2. Distribuční funkce F ( x1 , x2 , ... , xn ) je neklesající funkcí každé své
proměnné při pevných hodnotách ostatních proměnných, tj. platí
xi 2 > xi1 ⇒ F (... , xi 2 , ...) ≥ F (... , xi1 , ...) pro i = 1, 2, ... , n.
3. Distribuční funkce F ( x1 , x2 , ... , xn ) je spojitá zleva v každé ze
svých proměnných při pevných hodnotách ostatních proměnných.
4. Pro distribuční funkci F ( x1 , x2 , ... , xn ) platí následující vztahy
F (+∞, +∞, ... , + ∞) = 1,
lim F ( x1 , x2 , ... , xn ) = 0 pro i = 1, 2, ... , n
xi →−∞
a libovolné hodnoty ostatních proměnných x j (j ≠ i ).
V jednorozměrném případě jsou uvedené čtyři vlastnosti nutnou a
postačující podmínkou k tomu, aby funkce F(x) byla distribuční funkcí
nějaké náhodné veličiny X. Ve vícerozměrném případě musí mít sdružená
distribuční funkce ještě následující vlastnost.
5. Pro libovolná ai < bi (i = 1, 2, ... , n) je hodnota výrazu na pravé
straně rovnosti (4.11) nezáporná.
Vlastnost 5 neplyne z vlastností 1 - 4, což ukážeme na jednoduchém
příkladě. Definujme funkci vztahem
⎧1 pro x1 + x2 > 0,
F ( x1 , x2 ) = ⎨
⎩0 pro x1 + x2 ≤ 0.
.
Tato funkce má zřejmě vlastnosti 1 - 4, ne však vlastnost 5, protože
např. platí
P (−1 ≤ X 1 < 2, − 1 ≤ X 2 < 2) = F (2, 2) − F (−1, 2) − F (2, −1) + F (−1, −1) = −1.
Každá sdružená distribuční funkce musí mít všech pět základních
vlastností. Toto tvrzení je možno obrátit. Každou funkci n proměnných,
splňující uvedených pět vlastností, lze považovat za distribuční funkci
nějakého náhodného vektoru.
Distribuční funkce F ( x1 , x2 , ... , xn ) má pro popis rozdělení náhodného
vektoru X = ( X 1 , X 2 , ... , X n ) mnohem menší význam než distribuční
funkce F(x) pro popis jednorozměrné náhodné veličiny X. Je to dáno tím,
56
že ve vícerozměrném prostoru lze zvolit celou řadu vhodných soustav
souřadnic (kartézské soustavy i soustavy křivočarých souřadnic).
Ve vícerozměrném případě se vedle sdružené distribuční funkce
F ( x1 , x2 , ... , xn ) uvažují distribuční funkce marginální (okrajové) a
podmíněné. Marginální distribuční funkce popisují rozdělení libovolné
skupiny k náhodných veličin X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n, a
jsou definovány vztahem
Marginální
distribuční funkce
F ( xi1 , xi2 , ... , xik ) = P( X i1 < xi1 , X i2 < xi2 , ... , X ik < xik ) = F (c1 , c2 , ... , cn ),
kde cs = xs pro s = ir , 1 ≤ r ≤ k , a cs = +∞ v ostatních případech. Speciálně
marginální distribuční funkce Fs ( xs ) náhodné veličiny X s má tvar
Fs ( xs ) = P( X s < xs ) = F (c1 , c2 , ... , cn ),
kde cs = xs a pro všechna cr , r ≠ s, platí cr = +∞.
Podmíněné distribuční funkce popisují rozdělení libovolné skupiny k
náhodných
veličin
X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n,
za
Podmíněná
distribuční funkce
předpokladu, že zbývající náhodné veličiny nabývají nějakých konkrétních
hodnot.
4.6. Rozdělení náhodných vektorů
Nyní se ve stručnosti zmíníme o dalších způsobech popisu rozdělení
náhodných vektorů. Soustředíme svou pozornost na dvourozměrné
náhodné vektory, přičemž budeme rozlišovat, zda jde o vektory
diskrétních nebo spojitých veličin.
A. Sdružené rozdělení dvou diskrétních náhodných veličin
Uvažujme dvě diskrétní náhodné veličiny X a Y, jež mohou nabývat
hodnot x1 , x2 , ... , xr , resp. y1 , y2 , ... , ys . Jejich rozdělení lze přirozeně
Sdružená
popsat pomocí sdružené pravděpodobnostní funkce
pravděpodobnostní funkce
P ( x, y ) = P( X = x, Y = y ),
která udává pravděpodobnost, že náhodná veličina X nabude hodnoty x a
současně náhodná veličina Y nabude hodnoty y. Pro x ≠ xi , i = 1, 2,..., r,
a/nebo y ≠ y j , j = 1, 2,..., s, jsou hodnoty této sdružené
pravděpodobnostní funkce nulové. Sdružená pravděpodobnostní funkce
náhodných veličin X, Y má tyto základní vlastnosti:
1. 0 ≤ P ( x, y ) ≤ 1,
2.
r
s
∑∑ P( x , y ) = 1.
i =1 j =1
i
j
Sdružené rozdělení dvou diskrétních veličin se zpravidla popisuje
tabulkou (viz tab. 4.4).
57
Tab. 4.4. Tabulka hodnot sdružené a marginálních pravděpodobnostních funkcí v případě dvou diskrétních náhodných veličin
yj
xi
Součet
y1
y2
ys
x1
P ( x1 , y1 )
P ( x1 , y2 )
P ( x1 , ys )
P1 ( x1 )
x2
P ( x2 , y1 )
P ( x2 , y2 )
P ( x2 , ys )
P1 ( x2 )
xr
P ( xr , y1 )
P ( xr , y2 )
P ( xr , ys )
P1 ( xr )
Součet
P2 ( y1 )
P2 ( y2 )
P2 ( ys )
1
Za předpokladu, že veličina X může nabývat právě r a veličina Y právě s
různých hodnot, obsahuje tabulka rs hodnot sdružené pravděpodobnostní
funkce P ( xi , y j ) odpovídajících všem možným kombinacím hodnot
Marginální
pravděpodobnostní funkce
xi a y j . Řádkové součty v tabulce 4.4 jsou hodnotami marginální
pravděpodobnostní funkce P1 ( x) , která udává pravděpodobnost, že
náhodná veličina X nabude hodnoty x bez ohledu na hodnotu veličiny Y .
Obdobně sloupcové součty udávají hodnoty marginální pravděpodobnostní
funkce P2 ( y ). Platí tedy
s
P1 ( xi ) = ∑ P ( xi , y j ), i = 1, 2, ... , r ,
j =1
r
P2 ( y j ) = ∑ P ( xi , y j ), j = 1, 2, ... , s,
i =1
přičemž
r
s
i =1
j =1
r
s
∑ P1 (xi ) = ∑ P2 ( y j ) = ∑∑ P( xi , y j ) = 1.
Pro popis podmíněných
Podmíněná
pravděpodobnostní funkce
pravděpodobnostní funkce
předpokladu,
že
je
i =1 j =1
rozdělení se zavádí podmíněná
P ( x | Y = y j ), resp. P ( y | X = xi ),
za
P(Y = y j ) > 0, j = 1, 2, ... , s, resp.
P ( X = xi ) > 0, i =1,2, ... , r . Funkce P ( x | Y = y j ) udává pravděpodobnost
toho, že náhodná veličina X nabude hodnoty x za podmínky Y = y j a
obdobně funkce P ( y | X = xi ) pravděpodobnost toho, že veličina Y
nabude hodnoty y za podmínky X = xi . Podmíněné pravděpodobnostní
funkce jsou definovány jako podíl sdružené a příslušné marginální
pravděpodobnostní funkce. K výpočtu hodnot zmíněných pravděpodobnostních funkcí se užívá vzorců
58
P ( xi | Y = y j ) =
P ( xi , y j )
, P2 ( y j ) > 0;
P2 ( y j )
P ( xi , y j )
P ( y j | X = xi ) =
P1 ( xi )
, P1 (xi ) > 0.
které platí pro i = 1, 2,..., r, j = 1, 2,..., s.
S použitím známých hodnot pravděpodobnostních funkcí se pak stanoví
hodnoty sdružené distribuční funkce
∑ ∑
F ( x, y ) = P ( X < x, Y < y ) =
i: xi < x j: y j < y
P ( xi , y j ),
marginálních distribučních funkcí
s
∑ ∑ P( x , y
F1 ( x) = F ( x, +∞) =
i: xi < x j =1
r
F2 ( y ) = F (+∞, y ) = ∑
∑
i =1 j: y j < y
i
j
),
P ( xi , y j )
a podmíněných distribučních funkcí
F (x | Y = y j ) =
∑ P( x , y )
P2 ( y j )
∑
F ( y | X = xi ) =
i
i: xi < x
j: y j < y
j
, P2 ( y j ) > 0, j = 1, 2, ... , s;
P ( xi , y j )
P1 ( xi )
, P1 ( xi ) > 0, i = 1, 2, ... , r.
Příklad 4.4. V zásilce 10 výrobků je 8 kvalitních a 2 nekvalitní. Mezi
kvalitními je 5 první jakosti a 3 druhé jakosti. Ze zásilky se náhodně
vyberou 2 výrobky (výběr bez vracení). Počet kvalitních kusů ve výběru je
náhodná veličina X a počet výrobků první jakosti je náhodná veličina Y.
Určete sdružené a marginální rozdělení veličin X a Y.
⎛10 ⎞
Řešení. Výběr 2 výrobků lze provést ⎜ ⎟ = 45 způsoby. Z toho ve
⎝2⎠
⎛ 5 ⎞ ⎛ 3 ⎞⎛ 2 ⎞
⎜ ⎟ ⎜ ⎟⎜ ⎟ = 3 případech jsou ve výběru 2 výrobky druhé jakosti,
⎝ 0 ⎠ ⎝ 2 ⎠⎝ 0 ⎠
⎛ 5 ⎞ ⎛ 3 ⎞⎛ 2 ⎞
v
případech
2
výrobky
první
jakosti,
⎜ ⎟ ⎜ ⎟⎜ ⎟ = 10
⎝ 2 ⎠ ⎝ 0 ⎠⎝ 0 ⎠
⎛ 5⎞ ⎛ 3⎞ ⎛ 2⎞
⎛ 5⎞ ⎛ 3⎞ ⎛ 2 ⎞
v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 1 případě 2 nekvalitní výrobky, v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 15
⎝ 0⎠ ⎝ 0⎠ ⎝ 2⎠
⎝ 1⎠ ⎝ 1⎠ ⎝ 0⎠
případech 1 výrobek první a 1 výrobek druhé jakosti,
⎛ 5⎞ ⎛ 3⎞ ⎛ 2⎞
v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 10 případech 1 výrobek první jakosti a 1 nekvalitní
⎝ 1⎠ ⎝ 0⎠ ⎝ 1⎠
59
⎛ 5 ⎞ ⎛ 3⎞ ⎛ 2 ⎞
výrobek a v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 6 případech 1 výrobek druhé jakosti a 1
⎝ 0 ⎠ ⎝ 1⎠ ⎝ 1 ⎠
nekvalitní.
Hledané
hodnoty
sdružené
a
marginálních
pravděpodobnostních funkcí jsou uspořádány do tabulky 4.5.
Tab. 4.5. Tabulka k příkladu 4.4
yj
xi
0
1
2
P2 ( y j )
0
1
45
6
45
3
45
1
0
2
0
10
45
15
45
0
10
45
10
45
25
45
10
45
P1 ( xi )
1
45
16
45
28
45
1
B. Sdružené rozdělení dvou absolutně spojitých náhodných
veličin
Uvažme dvojici absolutně spojitých náhodných veličin X, Y, jejichž
sdružené rozdělení má tu vlastnost, že existuje nezáporná reálná funkce
f(x, y) taková, že pro všechna reálná x, y platí
x
F ( x, y ) =
y
∫∫
f (t , u )dtdu.
(4.12)
−∞ −∞
Hustota náh.
vektoru
Funkce f(x, y) se nazývá hustota rozdělení pravděpodobností
(stručněji hustota) náhodného vektoru (X, Y) nebo také sdružená
hustota rozdělení pravděpodobností náhodných veličin X, Y.
V bodech, kde existuje derivace distribuční funkce F(x, y), je možno
určit sdruženou hustotu pomocí vztahu
f ( x, y ) =
∂ 2 F ( x, y )
.
∂x ∂y
(4.13)
Hustota náhodného vektoru má vlastnosti analogické vlastnostem
hustoty jednorozměrné náhodné veličiny.
1. Hustota f(x, y) je nezáporná, tj. f ( x, y ) ≥ 0.
2. Pravděpodobnost toho, že bod
[ X ,Y ]
padne dovnitř obdélníku
< a1 , b1 )× < a2 ,b2 ) je rovna
P (a1 ≤ X < b1 , a2 ≤ Y < b2 ) =
b1 b2
∫∫
a1 a2
60
f ( x, y ) dx dy.
3. Hustota f(x, y) splňuje podmínku
∞ ∞
∫∫
f ( x, y ) dx dy = 1.
−∞ −∞
Hustota rozdělení pravděpodobností vystupuje v případě absolutně
spojitých náhodných veličin ve stejné roli jako pravděpodobnostní funkce
u diskrétních veličin. Marginální hustoty veličin X a Y se určují ze vztahů
Marginální hustota
∞
∫
f1 ( x) =
f ( x, y ) dy,
−∞
(4.14)
∞
f2 ( y) =
∫
f ( x, y ) dx.
−∞
a podmíněné hustoty ze vztahů
f ( x, y )
, f 2 ( y ) > 0,
f ( x | Y = y) =
f2 ( y)
f ( x, y )
, f1 ( x) > 0.
f ( y | X = x) =
f1 ( x)
Podmíněná hustota
(4.15)
f ( x | Y = y ), resp. f ( y | X = x), je pouze konvenčním
Poznámka.
označením pro podmíněnou hustotu veličiny X za podmínky Y = y, resp.
pro podmíněnou hustotu veličiny Y za podmínky X = x. Při odvozování
vztahů (4.15) není na závadu, když pravděpodobnosti jevů {Y = y} nebo
{ X = x} jsou nulové.
Známe-li hustotu náhodného vektoru (X, Y), pak je příslušná distribuční
funkce určena vztahem (4.12). Pro marginální distribuční funkce
jednotlivých veličin platí
x
F1 ( x) = F ( x, ∞) =
∫
f1 (t ) dt ,
−∞
y
F2 ( y ) = F (∞, y ) =
∫
f 2 (u ) du.
−∞
a pro podmíněné distribuční funkce
x
F ( x | Y = y) =
∫
f (t | Y = y ) dt
−∞
f2 ( y)
, f 2 ( y ) > 0;
y
F ( y | X = x) =
∫
f (u | X = x) du
−∞
f1 ( x)
, f1 ( x) > 0.
Příklad 4.5. Sdružená hustota rozdělení pravděpodobností náhodného
vektoru (X, Y) je dána vztahem
61
⎧1 x y
⎪ ( + ) pro 0 < x < 2, 0 < y < 3,
f ( x, y ) = ⎨ 6 2 3
⎪⎩ 0 pro ostatní hodnoty x, y.
Určete marginální a podmíněné hustoty obou veličin.
Řešení. Marginální hustoty se stanoví pomocí vztahů (4.14), takže
⎧1 3 x y
1
⎪ ∫ ( + ) dy = ( x + 1) pro 0 < x < 2,
f1 ( x) = ⎨ 6 0 2 3
4
⎪0
pro ostatní hodnoty x;
⎩
⎧1 2 x y
1
2y
⎪ ∫ ( + ) dx = (1 + ) pro 0 < y < 3,
f2 ( y) = ⎨ 6 0 2 3
6
3
⎪ 0
pro ostatní hodnoty y.
⎩
Pro podmíněné hustoty platí v souladu se vztahy (4.15)
⎧1 x y
⎪ 6 ( 2 + 3 ) 3x + 2 y
pro 0 < x < 2, 0 < y < 3,
=
⎪
2y
f ( x | Y = y) = ⎨ 1
6 + 4y
(1 + )
⎪6
3
⎪
pro ostatní hodnoty x, y;
⎩0
⎧1 x y
⎪ 6 ( 2 + 3 ) 3x + 2 y
pro 0 < x < 2, 0 < y < 3,
=
⎪
f ( y | X = x) = ⎨ 1
9( x + 1)
( x + 1)
⎪ 4
⎪
pro ostatní hodnoty x, y.
⎩ 0
Kontrolní úkol 4.6. Dvourozměrná náhodná veličina (X, Y) má
sdruženou hustotu
f ( x, y ) =
(
π 16 + x
2
A
2
)( 25 + y )
2
.
Určete hodnotu konstanty A a sdruženou distribuční funkci F(x, y).
4.7. Nezávislost náhodných veličin
Při zavádění pojmu nezávislosti náhodných veličin se vychází
z definice nezávislosti jevů. Nezávislost náhodných veličin X, Y se
intuitivně pojímá tak, že ze znalosti hodnoty (výsledku pozorování) jedné
náhodné veličiny nelze nic usoudit o druhé náhodné veličině.
Nezávislost
náhodných veličin
Náhodné veličiny X, Y jsou nezávislé, jestliže pro libovolné
borelovské množiny A, B jsou jevy { X ∈ A} , {Y ∈ B} nezávislé. Přitom
{ X ∈ A}
značí jev, který spočívá v tom, že náhodná veličina X nabývá
hodnot z množiny A.
62
Zvolíme-li speciálně A = ( −∞ , x), B = ( −∞ , y), dostaneme tuto definici
nezávislosti: Náhodné veličiny X a Y jsou nezávislé, jestliže pro libovolná
reálná x, y platí
P ( X < x, Y < y ) = P( X < x) P(Y < y )
(4.16)
neboli
F ( x, y ) = F1 ( x) F2 ( y ),
kde F1 ( x), F2 ( y ) jsou marginální distribuční funkce náhodných veličin X,
Y. Lze dokázat, že obě uvedené definice jsou ekvivalentní.
Nyní dokážeme několik jednoduchých vět o nezávislosti dvou
náhodných veličin.
Věta 4.2. Konstanta je nezávislá na každé náhodné veličině.
Důkaz. Nechť Y = c (konstanta), pak
⎧ P( X < x) pro c < y,
P ( X < x, Y < y ) = ⎨
0 pro c ≥ y.
⎩
takže vztah (4.16) zřejmě platí.
□
Věta 4.3. Jestliže náhodné veličiny X, Y jsou nezávislé a každá z nich
má hustotu, pak platí
f ( x, y ) = f1 ( x) f 2 ( y ),
(4.17)
kde f1 ( x), f 2 ( y ) jsou marginální hustoty veličin X, Y a f(x, y) hustota
náhodného vektoru (X, Y). Naopak, platí-li vztah (4.17), jsou náhodné
veličiny X, Y nezávislé.
Důkaz. Vztah (4.17) plyne přímo ze vztahů (4.16) a (4.13). Obráceně
dostaneme vztah (4.16) ze vztahu (4.17) integrováním.
□
Poznámka. V případě dvou nezávislých diskrétních náhodných veličin
platí analogický vztah pro pravděpodobnostní funkce. Definici nezávislosti
lze přirozeně zobecnit na případ více než dvou náhodných veličin.
Náhodné veličiny X 1 , X 2 , ... , X n jsou sdruženě nezávislé, jestliže pro
A1 , A2 , ... , An
jsou
jevy
libovolné
borelovské
množiny
{ X 1 ∈ A1} , { X 2 ∈ A2 } , ... , { X n ∈ An } sdruženě nezávislé. Pro
Ai = (−∞, xi ),
i = 1, 2,..., n, dostaneme ekvivalentní definici sdružené nezávislosti ve
tvaru: Náhodné veličiny X 1 , X 2 , ... , X n se nazývají sdruženě nezávislé,
jestliže pro každou skupinu X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n,
těchto veličin platí rovnost
P ( X i1 < xi1 , X i2 < xi2 , ... , X ik < xik ) = P ( X i1 < xi1 ) P ( X i2 < xi2 ) ... P( X ik < xik )
při libovolných reálných xi1 , xi2 , ... , xik a libovolném k, 2 ≤ k ≤ n.
Pojem nezávislosti náhodných veličin má zásadní význam v teorii
pravděpodobnosti. Jsou-li náhodné veličiny sdruženě nezávislé, pak
rozdělení náhodného vektoru je plně určeno rozdělením jednotlivých
složek.
63
Sdružená nezávislost
náhodných veličin
Příklad 4.6. Určete hustotu náhodného vektoru ( X 1 , X 2 ), jehož složky
jsou nezávislé a mají tzv. normální rozdělení, tj. platí
f k ( xk ) =
1
σk
⎡ ( x − µ )2 ⎤
exp ⎢ − k 2 k ⎥ pro − ∞ < xk < ∞,
2σ k ⎦
2π
⎣
kde µ k , σ k2 jsou charakteristiky veličiny X k (k = 1, 2).
Řešení. Hustota náhodného vektoru X 1 , X 2 je podle vztahu (4.17)
rovna
⎡ ( x − µ )2 ( x − µ )2 ⎤
1
f ( x1 , x2 ) =
exp ⎢ − 1 21 − 2 2 2 ⎥ .
2πσ 1σ 2
2σ 1
2σ 2 ⎦
⎣
4.8. Funkce náhodných veličin
V teorii pravděpodobnosti je třeba často řešit úlohy následujícího typu.
Je dána distribuční funkce F ( x1 , x2 , ... , xn ) náhodného vektoru
X = ( X 1 , X 2 , ... , X n ) a požaduje se určení sdružené distribuční funkce
G ( y1 , y2 , ... , yk ) veličin Y1 = ϕ1 ( X 1 , X 2 , ..., X n ), Y2 = ϕ 2 ( X 1 , X 2 , ... , X n ),
… , Yk = ϕ k ( X 1 , X 2 , ... , X n ).
Obecné řešení této úlohy je principiálně jednoduché, ale vyžaduje
rozšíření pojmu integrálu. Proto v rámci těchto skript ukážeme jen řešení
dvou prakticky významných speciálních případů.
A. Funkce jedné absolutně spojité náhodné veličiny
Předpokládejme, že známe rozdělení pravděpodobností náhodné
veličiny X a hledáme rozdělení pravděpodobností náhodné veličiny
Y = ϕ ( X ) . Omezíme se přitom jen na případy, kdy veličina X je absolutně
spojitá a má distribuční funkci F(x) a hustotu f(x) = dF ( x) dx . Pokud je
funkce ϕ ( x ) v oboru možných hodnot veličiny X ryze monotónní, pak
existuje mezi veličinami X a Y vzájemně jednoznačný vztah (zobrazení) a
není obtížné určit rozdělení veličiny Y.
Věta 4.4. Je-li funkce y = ϕ ( x ) na množině možných hodnot x veličiny
X ryze monotónní, tj. je-li ϕ ( x ) buď rostoucí nebo klesající funkcí x, má
náhodná veličina Y = ϕ ( X ) hustotu
g ( y ) = f ⎡⎣ϕ −1 ( y ) ⎤⎦
d ϕ −1 ( y )
,
dy
(4.18)
kde x = ϕ −1 ( y ) je inverzní funkce k funkci y = ϕ ( x ) .
Důkaz. Pro rostoucí funkci ϕ ( x ) je distribuční funkce náhodné veličiny
Y rovna
64
G ( y ) = P(Y < y ) = P [ϕ ( X ) < y ] = P ⎡⎣ X < ϕ −1 ( y ) ⎤⎦ = F ⎡⎣ϕ −1 ( y ) ⎤⎦ .
Odtud dostaneme
dG ( y )
d ϕ −1 ( y )
= f ⎡⎣ϕ −1 ( y ) ⎤⎦
.
dy
dy
g ( y) =
Obdobně pro klesající funkci ϕ ( x ) platí
G ( y ) = P ⎡⎣ X > ϕ −1 ( y ) ⎤⎦ = 1 − P ⎡⎣ X ≤ ϕ −1 ( y ) ⎤⎦ = 1 − P ⎡⎣ X < ϕ −1 ( y ) ⎤⎦ =
= 1 − F ⎡⎣ϕ −1 ( y ) ⎤⎦ , g ( y ) = − f ⎡⎣ϕ −1 ( y ) ⎤⎦
d ϕ −1 ( y )
,
dy
čímž je věta dokázána.
□
Jestliže funkce ϕ ( x ) není v oboru možných hodnot veličiny X ryze
monotónní, neexistuje mezi veličinami X a Y vzájemně jednoznačný vztah,
a tedy ani inverzní funkce ϕ −1 ( y ). V takovém případě je distribuční funkce
G(y) veličiny Y dána pravděpodobností, že náhodná veličina X nabude
hodnoty z kteréhokoliv intervalu ∆ i ( y ), i = 1, 2, ... , pro nějž platí
Y = ϕ ( X ) < y . Protože tyto intervaly jsou disjunktní, je pro dané y0
hodnota G ( y0 ) rovna (viz obr. 4.8)
G ( y0 ) = ∑ P( X ∈ ∆ i ( y0 )) = ∑
i
i
∫
f ( x) dx.
(4.19)
∆i ( y0 )
Hustotu g(y) pak dostaneme derivováním distribuční funkce G(y).
y
y
0
0
1(y0)
0
2(y0)
x
Obr. 4.8. Ilustrace ke vztahu (4.19)
Příklad 4.7. Náhodná veličina X má normální rozdělení, tj. rozdělení
s hustotou
f ( x) =
⎡ ( x − µ )2 ⎤
1
exp ⎢ −
⎥ pro − ∞ < x < ∞.
2σ 2 ⎦
σ 2π
⎣
Určete hustotu náhodné veličiny Y = ( X − µ ) σ , σ > 0.
Řešení. Pro hustotu g(y) veličiny Y platí podle (4.18)
g ( y ) = f (σ y + µ )σ .
Dosadíme-li do tohoto vztahu za hustotu f (σ y + µ ) , dostaneme
65
g ( y) =
⎡ y2 ⎤
exp ⎢ − ⎥ pro − ∞ < y < ∞.
2π
⎣ 2⎦
1
B. Funkce několika absolutně spojitých náhodných veličin
Hledejme zákon rozdělení náhodné veličiny Y = ϕ ( X 1 , X 2 , .. , X n ) za
předpokladu, že je dán náhodný vektor ( X 1 , X 2 , ... , X n ), který má
sdruženou hustotu f ( x1 , x2 , ... , xn ).
Distribuční funkci G(y) veličiny Y určíme z obecného vztahu
G ( y ) = ∫ ∫ ...∫ f ( x1 , x2 , ..., xn ) dx1dx2 ...dxn ,
S
v němž se integruje přes oblast S vymezenou nerovností
ϕ ( x1 , x2 , ... , xn ) < y. Postup určení distribuční funkce G(y) a příslušné
hustoty g(y) ukážeme na jednom prakticky významném příkladě.
Příklad 4.8. Je dána sdružená hustota f ( x1 , x2 ) náhodného vektoru
( X 1 , X 2 ) pro −∞ < x1 < ∞, − ∞ < x2 < ∞. Určete hustotu rozdělení
pravděpodobností náhodné veličiny Y = X 1 + X 2 .
Řešení. Pro distribuční funkci veličiny Y platí
G ( y ) = P(Y < y ) = P ( X 1 + X 2 < y ) = ∫∫ f ( x1 , x2 ) dx1 dx2 .
S
Oblast S je v tomto případě (viz obr. 4.9) pro pevně zvolená y ∈ ( −∞, ∞ )
x1 + x2 < y,
což
znamená,
že
buď
vymezena
nerovností
−∞ < x1 < ∞, − ∞ < x2 < y − x1 nebo −∞ < x1 < y − x2 , − ∞ < x2 < ∞.
x2
x1 + x2 = y
s
x1
Obr. 4.9. Ilustrace k příkladu 4.8
Distribuční funkce G(y) je tedy dána vztahem
66
∞ y − x2
⎡ y − x1
⎤
⎡
⎤
G ( y ) = ∫ ⎢ ∫ f ( x1 , x2 ) dx2 ⎥ dx1 = ∫ ⎢ ∫ f ( x1 , x2 ) dx1 ⎥ dx2 .
⎢ −∞
⎢ −∞
−∞ ⎣
−∞ ⎣
⎦⎥
⎦⎥
∞
Odtud pro hledanou hustotu plyne
∞
g ( y) =
∞
dG ( y )
= ∫ f ( x1 , y − x2 ) dx1 = ∫ f ( y − x2 , x2 ) dx2 .
dy
−∞
−∞
Uvedený vztah platí obecně pro −∞ < y < ∞. Jsou-li veličiny X 1 , X 2
nezávislé, platí navíc f ( x1 , x2 ) = f1 ( x1 ) f 2 ( x2 ), a tedy
∞
g ( y) =
∫
−∞
∞
f1 ( x1 ) f 2 ( y − x1 ) dx1 =
∫
f1 ( y − x2 ) f 2 ( x2 ) dx2 .
−∞
Podobně lze na základě známé sdružené hustoty f ( x1 , x2 ) náhodného
vektoru ( X 1 , X 2 ) stanovit i hustoty rozdělení pravděpodobností veličin
X 1 − X 2 , X 1 X 2 , popř. X 1 X 2 .
Pojmy k zapamatování:
• náhodná veličina
• diskrétní náhodná veličina
• (absolutně) spojitá náhodná veličina
• rozdělení diskrétního typu
• rozdělení (absolutně) spojitého typu
• distribuční funkce náhodné veličiny
• pravděpodobnostní funkce náhodné veličiny
• hustota náhodné veličiny
• náhodný vektor
• rozdělení náhodného vektoru (sdružené rozdělení náhodných
veličin)
• distribuční funkce náhodného vektoru (sdružená distribuční funkce
náhodných veličin)
• marginální distribuční funkce
• podmíněná distribuční funkce
• pravděpodobnostní funkce náhodného vektoru (sdružená
pravděpodobnostní funkce náhodných veličin)
• marginální pravděpodobnostní funkce
• podmíněné pravděpodobnostní funkce
• hustota náhodného vektoru (sdružená hustota náhodných veličin)
• marginální hustota
• podmíněná hustota
• nezávislost dvou náhodných veličin
• sdružená nezávislost náhodných veličin
• úsečkový diagram
• polygon
• histogram
67
Shrnutí:
V této kapitole se především zavádí pojem náhodné veličiny a jejího
rozdělení. Zvláštní pozornost se přitom věnuje popisu rozdělení náhodné
veličiny, ať už ve formě analytické (distribuční funkce, pravděpodobnostní
funkce, hustota), tak i ve formách tabelární (tabulka rozdělení
pravděpodobností) a grafické (úsečkový diagram, polygon, histogram, graf
distribuční funkce a hustoty). Dále se definuje pojem náhodného vektoru a
jeho rozdělení (sdružená, marginální a podmíněná distribuční funkce,
pravděpodobnostní funkce a hustota). Závěrečné odstavce jsou věnovány
mimořádně významné problematice nezávislosti náhodných veličin
(podvojná a sdružená nezávislost) a konstrukci rozdělení některých
jednoduchých funkcí dané náhodné veličiny.
68
5. ČÍSELNÉ CHARAKTERISTIKY NÁHODNÝCH
VELIČIN
Po prostudování této kapitoly:
• pochopíte význam číselných charakteristik pro popis rozdělení
náhodné veličiny,
• poznáte systematické třídění číselných charakteristik,
• naučíte se počítat hodnoty základních číselných charakteristik
náhodných veličin, popř. náhodných vektorů.
Číselné charakteristiky náhodných veličin jsou reálná čísla, která
reprezentují jednoduchým způsobem rozdělení příslušných veličin.
Existuje velký počet takových charakteristik pro popis velikosti
(úrovně) náhodné veličiny, její variability i tvaru jejího rozdělení.
V této kapitole poznáte pouze ty nejvýznamnější z nich, jež se
v praxi nejčastěji používají. Věnujte patřičnou pozornost jejich
definici a základním vlastnostem, abyste byli schopni bez problémů
spočítat jejich hodnoty.
5.1. Klasifikace charakteristik
Chování náhodné veličiny je jednoznačně popsáno jejím rozdělením.
Tato informace o náhodné veličině je sice úplná, ale často značně
nepřehledná. Pro řešení úloh z teorie pravděpodobnosti a statistiky je proto
výhodné shrnout informaci o rozdělení náhodné veličiny do několika
vhodných číselných údajů (tzv. charakteristik), které dostatečně výstižně
popisují základní vlastnosti tohoto rozdělení.
Podle vlastnosti, kterou popisují, třídíme charakteristiky náhodné
veličiny do tří skupin:
a) charakteristiky úrovně (např. střední hodnota, modus, medián), jež
jsou měřítkem úrovně hodnoty náhodné veličiny;
b) charakteristiky variability (např. rozptyl, směrodatná odchylka,
kvartilová odchylka), jež jsou měřítkem proměnlivosti (rozptýlenosti)
jednotlivých hodnot náhodné veličiny;
c) charakteristiky šikmosti a špičatosti (např. koeficienty šikmosti a
špičatosti), jež slouží ke kvantifikaci tvaru rozdělení náhodné veličiny.
Podle způsobu konstrukce rozlišujeme:
a) charakteristiky momentové, které jsou funkcemi všech možných
hodnot uvažované náhodné veličiny;
b) charakteristiky kvantilové, které jsou vždy reprezentovány nějakou
konkrétní hodnotou uvažované veličiny, a to takovou, jež vyhovuje
příslušné podmínce,
69
c) charakteristiky jiné, jež nejsou ani momentové ani kvantilové.
V této kapitole se budeme podrobněji zabývat pouze nejčastěji
používanými číselnými charakteristikami jedné náhodné veličiny a
způsoby jejich výpočtu. Závěrem se pak ve stručnosti zmíníme o základních charakteristikách náhodných vektorů.
5.2. Střední hodnota
Nejdůležitější charakteristikou úrovně hodnoty náhodné veličiny X je
střední hodnota (očekávaná hodnota nebo matematická naděje) EX .
V obecné matematické definici střední hodnoty vystupuje abstraktní
Lebesgueův integrál nebo Stieltjesův integrál. Protože čtenář těchto skript
není obeznámen se zmíněnými integrály, uvedeme zvláště definici střední
hodnoty pro náhodné veličiny diskrétního a absolutně spojitého typu.
Nechť X je diskrétní náhodná veličina, která nabývá hodnot x1 , x2 , ...
s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , přičemž platí vztah (4.4). Jeli řada
∑ x P( X = x ) absolutně konvergentní, pak její součet
i
i
i
EX = ∑ xi P( X = xi )
(5.1)
i
Střední hodnota
náhodné veličiny
nazýváme střední hodnotou diskrétní náhodné veličiny X.
V případě absolutně spojité náhodné veličiny se vychází z hustoty.
Nechť f(x) je hustota absolutně spojité náhodné veličiny X. Jestliže
∞
absolutně konverguje integrál
∫ xf ( x) dx, pak
−∞
∞
∫ xf ( x) dx
EX =
(5.2)
−∞
se nazývá střední hodnotou absolutně spojité náhodné veličiny X.
Pokud řada
∑ x P( X = x ) ,
i
i
∞
resp. integrál
i
∫ xf ( x) dx,
nekonverguje
−∞
absolutně, budeme říkat, že příslušná náhodná veličina
hodnotu.
nemá střední
Na vztahu (5.1) jsou založeny rozmanité fyzikálně matematické
interpretace pojmu střední hodnota. Představme si např. soustavu
hmotných bodů rozložených na přímce v bodech o souřadnicích
x1 , x2 , ... , xn a majících hmotnosti pi = P( X = xi ), i = 1, 2, ... , n, přičemž
n
∑ pi = 1. Pak hodnota výrazu
i =1
n
∑x p
i =1
i
i
udává souřadnici těžiště této
soustavy hmotných bodů.
Vztahů (5.1) a (5.2) se využívá v praxi k výpočtu středních hodnot
náhodných veličin. Nyní dokážeme základní vlastnosti střední hodnoty,
70
pro jednoduchost budeme přitom uvažovat jen případ diskrétních
náhodných veličin.
1. Nechť ϕ ( x ) je libovolná funkce reálné proměnné x a nechť X je
x1 , x2 , ...
diskrétní náhodná veličina, která nabývá hodnot
s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , přičemž platí vztah (4.4).
Potom střední hodnota náhodné veličiny Y = ϕ ( X ) je
EY = ∑ ϕ ( xi )P( X = xi )
(5.3)
i
za předpokladu, že řada vpravo absolutně konverguje.
Důkaz.
Náhodná
veličina
Y
může
nabývat
hodnot
y1 = ϕ ( x1 ), y2 = ϕ ( x2 ), ... . V uvedené posloupnosti se ovšem mohou
některé hodnoty opakovat. Označme y (1) , y (2) , ... posloupnost různých
čísel z výchozí posloupnosti y1 , y2 , ... . Podle definice střední hodnoty
(5.1) je
EY = ∑ y (i ) P(Y = y ( i ) ), ale P (Y = y ( i ) ) =
i
∑
j:ϕ ( x j ) = y ( i )
P( X = x j ),
a tedy platí (5.3).
□
Poznámka 1. Při dokazování dalších vlastností střední hodnoty budeme
vycházet ze vztahu pro výpočet střední hodnoty funkce dvou proměnných.
Lze dokázat následující tvrzení: Nechť φ(x, y) je libovolná funkce reálných
proměnných x a y a nechť X, Y jsou diskrétní náhodné veličiny, z nichž
první nabývá hodnot xi s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , a
druhá hodnot y j s pravděpodobnostmi P (Y = y j ), j = 1, 2, ... , přičemž
∑ P( X = x ) = 1, ∑ P(Y = y ) = 1.
i
i
j
j
Pak střední hodnota náhodné veličiny Z = ϕ ( X , Y ) je
EZ = ∑∑ ϕ ( xi , y j ) P( X = xi , Y = y j )
i
j
za předpokladu, že řada vpravo absolutně konverguje.
Poznámka 2. Jestliže veličina X má absolutně spojité rozdělení
s hustotou f(x) a funkce ϕ je taková, že k ní existuje inverzní funkce ϕ −1 ,
používá se k výpočtu střední hodnoty náhodné veličiny Y = ϕ ( X ) vztahu
∞
EY =
∫ ϕ ( x) f ( x) dx
(5.4)
−∞
za předpokladu absolutní konvergence integrálu vpravo.
Při výpočtu střední hodnoty náhodné veličiny Z = ϕ ( X , Y ) se vychází
ze vztahu
71
Vlastnosti střední
hodnoty
∞ ∞
EZ =
∫ ∫ ϕ ( x, y) f ( x, y) dx dy.
−∞ −∞
2. Střední hodnota konstanty je rovna této konstantě, tj. Ec = c.
Důkaz. Konstantu c je možno považovat za diskrétní náhodnou
veličinu, která může nabývat pouze jediné hodnoty c, a to
□
s pravděpodobností 1. Proto Ec = c.1 = c.
3. Jsou-li X, Y libovolné náhodné veličiny mající střední hodnoty
EX , EY , pak střední hodnota součtu těchto náhodných veličin je rovna
součtu jejich středních hodnot, tj.
E( X + Y ) = EX + EY .
Důkaz. Nechť náhodná veličina X může nabývat hodnot xi , i = 1, 2, ... ,
a náhodná veličina Y hodnot y j , j = 1, 2, ... . Jevy
{ X = x ,Y = y }
i
tvoří
j
zřejmě úplnou soustavu neslučitelných jevů a platí
∑ P( X = x , Y = y ) = P(Y = y ), ∑ P( X = x , Y = y ) = P( X = x ).
i
j
j
i
i
j
i
j
Odtud plyne
E( X + Y ) = ∑∑ ( xi + y j ) P( X = xi , Y = y j ) =
i
j
= ∑ xi P( X = xi ) + ∑ y j P(Y = y j ) = EX + EY .
i
j
Používá se toho, že součet absolutně konvergentních řad je rovněž
absolutně konvergentní řada.
□
Důsledek. Střední hodnota součtu konečného počtu náhodných veličin
majících střední hodnoty je rovna součtu jejich středních hodnot, tj.
n
n
i =1
i =1
E( ∑ X i ) = ∑ E X i .
Uvedené zobecnění plyne z vlastnosti 3, jestliže použijeme matematické
indukce.
4. Jsou-li X, Y nezávislé náhodné veličiny mající střední hodnoty
EX , EY , pak střední hodnota součinu těchto náhodných veličin je rovna
součinu jejich středních hodnot, tj.
E( XY ) = EX EY .
Důkaz. Nechť xi , i = 1, 2, ... , jsou všechny možné hodnoty náhodné
veličiny X a y j , j = 1, 2, ... všechny možné hodnoty veličiny Y. Potom
platí
72
E( XY ) = ∑∑ xi y j P( X = xi , Y = y j ) = ∑∑ xi y j P( X = xi ) P(Y = y j ) =
i
j
i
j
⎤
⎡
⎤ ⎡
= ⎢ ∑ xi P( X = xi ) ⎥ ⎢ ∑ y j P(Y = y j ) ⎥ = EX EY .
⎣ i
⎦ ⎣ j
⎦
Provedené úpravy jsou oprávněné, lze totiž dokázat, že také řada
□
∑∑ xi y j P( X = xi , Y = y j ) je absolutně konvergentní.
i
j
Důsledek 1. Je-li X libovolná náhodná veličina mající střední hodnotu
EX a c libovolné reálné číslo, pak platí E(cY ) = c EY .
Toto tvrzení vyplývá bezprostředně z vlastnosti 4 a věty 4.2 .
Důsledek 2. Střední hodnota součinu konečného počtu sdruženě
nezávislých náhodných veličin X 1 , X 2 , ... , X n majících střední hodnoty
je rovna součinu středních hodnot jednotlivých veličin, tj.
n
n
i =1
i =1
E(∏ X i ) = ∏ EX i .
Uvedené vlastnosti střední hodnoty představují pravidla pro výpočet
střední hodnoty složitějších výrazů s náhodnými veličinami.
Příklady
5.1. Určete střední hodnotu náhodné veličiny X, která má rozdělení
P (k ) = P( X = k ) =
1
2k
pro k = 1, 2, ... .
Řešení. Výraz pro hledanou střední hodnotu upravíme takto:
∞
∞
∞
k
k
k
m −1
=
=
=
=
2
2
∑
∑
∑
k
k
k +1
m
k =1 2
k =0 2
k =0 2
m =1 2
∞
EX = ∑
⎡∞ m ∞ 1 ⎤
= 2 ⎢ ∑ m − ∑ ( ) m ⎥ = 2(EX − 1).
m =1 2
⎣ m =1 2
⎦
Ze srovnání prvního a posledního výrazu plyne okamžitě EX = 2.
5.2. Náhodné veličiny X 1 , X 2 jsou nezávislé a mají střední hodnoty
EX 1 = 0, 2; EX 2 = 1,8. Určete střední hodnoty náhodných veličin
a) 2 X 1 + 3 ;
b) 2 X 1 − 5 X 2 ;
c) X 1 X 2 .
Řešení.
a) E(2 X 1 + 3) = 2EX 1 + 3 = 2 ⋅ 0, 2 + 3 = 3, 4;
b) E(2 X 1 − 5 X 2 ) = 2EX 1 − 5EX 2 = 2 ⋅ 0, 2 − 5 ⋅ 1,8 = −8, 6;
c) E( X 1 X 2 ) = EX 1 EX 2 = 0, 2 ⋅ 1,8 = 0,36 .
5.3. Náhodná veličina X má hustotu
73
π
π
⎧ω
pro − ≤ x ≤ ,
⎪
f ( x) = ⎨ 2π
ω
ω
⎪⎩
0 jinak.
Určete střední hodnotu náhodné veličiny Y = asin(ω X ), kde a, ω jsou
kladná reálná čísla.
Řešení. S použitím vztahu (5.4) dostaneme
EY = E [ a sin(ω X ) ] = a E [sin(ω X ) ] =
aω
2π
π
ω
∫π sin(ω x) dx = 0.
−
ω
Kontrolní úkoly
5.1. Náhodná veličina X má Poissonovo rozdělení s parametrem λ , tj.
λ k e −λ
P( X = k ) =
pro k = 1, 2, ... .
k!
Určete její střední hodnotu.
5.2. Určete střední hodnotu
a) počtu bodů dosaženého při hodu jednou hrací kostkou,
b) součtu bodů dosaženého při hodu dvěma hracími kostkami.
5.3. Hustota náhodné veličiny X je dána vztahem
1
⎧
pro x < 2
⎪
f ( x) = ⎨ π 4 − x 2
⎪
0
jinak.
⎩
Určete její střední hodnotu.
(
)
5.3. Rozptyl a směrodatná odchylka
Rozptyl náhodné
veličiny
Rozptyl je základní charakteristikou odchylek hodnot náhodné veličiny
od její střední hodnoty. Rozptylem (disperzí nebo také variancí) DX
náhodné veličiny X se nazývá střední hodnota náhodné veličiny
( X − EX ) 2 , a tedy
DX = E ⎡⎣( X − EX ) 2 ⎤⎦ .
(5.5)
Přímo z definice vyplývá, že rozptyl jakékoliv náhodné veličiny je vždy
nezáporný.
S použitím vlastnosti 1 střední hodnoty dostaneme pro diskrétní
náhodnou veličinu X toto vyjádření rozptylu
DX = ∑ ( xi − EX ) 2 P( X = xi ) = ∑ ( xi − EX ) 2 P ( xi ).
i
(5.6)
i
V případě absolutně spojité náhodné veličiny X se rozptyl vyjadřuje ve
tvaru
∞
DX =
∫ ( x − EX )
−∞
74
2
f ( x) dx.
(5.7)
Rozptyl nějaké náhodné veličiny existuje přirozeně tehdy, jestliže řada,
resp. integrál, na pravé straně vztahu (5.6), resp. (5.7), konverguje. Vzorec
(5.6), podobně jako vzorec (5.1), umožňuje názornou interpretaci rozptylu
v mechanice. Jsou-li xi souřadnice a pi = P( X = xi ), i = 1, 2, ..., n,
hmotnosti soustavy hmotných bodů v přímce, pak DX má význam
momentu setrvačnosti této soustavy vzhledem k těžišti.
Pro praxi je vhodnější jiné vyjádření rozptylu než vztah (5.5). Jestliže
použijeme vlastností 3 a 4 střední hodnoty, získáme po jednoduché úpravě
DX = E ⎡⎣( X − EX ) 2 ⎤⎦ = E ⎡⎣ X 2 − 2 X EX + (EX ) 2 ⎤⎦ =
(5.8)
= E( X 2 ) − 2(EX ) 2 + (EX ) 2 = E( X 2 ) − (EX ) 2 .
(Veličina EX je konstanta.) Je zřejmé, že vztah (5.8) je pro stanovení
rozptylu efektivnější než vztah (5.5).
Rozptyl udává variabilitu náhodné veličiny ve čtvercích jejích jednotek.
Proto se vedle rozptylu používá pro kvantitativní posouzení variability Směrodatná odchylka
náhodné veličiny X také směrodatná odchylka σ X , která je definována
vztahem
σ X = + DX .
Směrodatná odchylka měří variabilitu (odchylku od střední hodnoty) v
původních jednotkách uvažované náhodné veličiny. Základní vlastnosti
rozptylu dokážeme pomocí již odvozených vlastností střední hodnoty.
1. Rozptyl konstanty c je roven nule, tj. Dc = 0.
Vlastnosti rozptylu
Důkaz.
Dc = E ⎡⎣(c − Ec) 2 ⎤⎦ = E ⎡⎣(c − c) 2 ⎤⎦ = 0.
□
2. Pro libovolnou náhodnou veličinu X a libovolnou konstantu c platí
D(cX ) = c 2 DX .
Důkaz.
{
D(cX ) = E [ (cX − E(cX ) ]
2
} = E{c [( X − EX )] } = c DX .
2
2
2
□
3. Pro libovolné náhodné veličiny X, Y platí
D( X ± Y ) = DX + DY ± 2E [ ( X − EX )(Y − EY ) ] .
Důkaz.
{
D( X ± Y ) = E [ X ± Y − E( X ± Y ) ]
2
} = E{[( X − EX ) ± (Y − EY )] } =
2
= E ⎡⎣( X − EX ) 2 ⎤⎦ + E ⎡⎣(Y − EY ) 2 ⎤⎦ ± 2E [ ( X − EX )(Y − EY ) ] =
= DX + DY ± 2E [ ( X − EX )(Y − EY ) ].
Výraz E [ ( X − EX )(Y − EY ) ] se nazývá kovariance náhodných veličin
X, Y. Vlastnost 3 je možno přirozeně zobecnit na libovolný konečný počet
náhodných veličin.
□
75
Kovariance
náhodných veličin
Důsledek. Rozptyl součtu i rozdílu dvou nezávislých náhodných veličin
X, Y je roven součtu jejich rozptylů, tj.
D( X ± Y ) = DX + DY .
Lze totiž snadno ukázat, že pro nezávislé náhodné veličiny X, Y platí
E [ ( X − EX )(Y − EY ) ] = 0.
Vztahy uvedené v tomto odstavci můžeme chápat jako pravidla pro
výpočet rozptylu náhodných veličin.
Příklad 5.4. Hustota rozdělení pravděpodobností náhodné veličiny X
má tvar
⎧1
⎪
f ( x) = ⎨ a
⎪⎩
pro 0 < x < a,
0
jinak.
S použitím vlastností střední hodnoty a rozptylu určete D(2 X + 3).
Řešení. Nejprve určíme číselné charakteristiky EX a E( X 2 ).
a
a
1
a
1
a2
EX = ∫ x dx = ; E( X 2 ) = ∫ x 2 dx = .
a0
2
a0
3
Rozptyl náhodné veličiny X je dán vztahem
DX = E( X ) − ( EX )
2
2
a2 a2 a2
=
−
= .
3 4 12
Odtud pro hledaný rozptyl dostaneme
D(2 X + 3) = 4DX =
4a 2 a 2
= .
12
3
Kontrolní úkoly
5.4. Určete rozptyl náhodné veličiny, která má Poissonovo rozdělení
s parametrem λ (viz kontrolní úkol 5.1).
5.5. Určete střední hodnotu a rozptyl náhodné veličiny, jejíž hustota má
tvar
π
⎧2
2
⎪ cos x pro x ≤ ,
f ( x) = ⎨ π
2
⎪⎩
0 jinak.
5.4. Momentové charakteristiky
Obecné momenty
Nejužívanějšími
charakteristikami
náhodné
veličiny
jsou
charakteristiky založené na tzv. momentech. V zásadě rozlišujeme
momenty trojího druhu: obecné, centrální a normované. Obecným
momentem k-tého řádu µ k′ ( X ) náhodné veličiny X nazýváme střední
hodnotu veličiny X k , tj.
76
µ k′ ( X ) = E( X k ), k = 0,1, ... .
Pro výpočet obecných momentů se používá těchto vzorců
⎧ ∑ xik P ( xi )
⎪⎪ i
µ k′ ( X ) = ⎨ ∞
⎪ ∫ x k f ( x) dx
⎪⎩ −∞
pro diskrétní veličiny,
(5.9)
pro abs. spojité veličiny.
Z definice je zřejmé, že obecné momenty existují tehdy, jestliže výrazy
na pravé straně vztahů (5.9) konvergují absolutně. Mezi obecnými
momenty náhodné veličiny X zaujímá nejvýznamnější postavení moment
1. řádu µ1′( X ), který je střední hodnotou EX této veličiny.
Existuje-li µ1′( X ) = EX , pak můžeme definovat centrální momenty
náhodné veličiny X. Centrálním momentem k - tého řádu náhodné
k
veličiny X nazýváme střední hodnotu veličiny ( X − EX ) , tj.
Centrální momenty
k
µ k ( X ) = E ⎡( X − EX ) ⎤ , k =1,2, ... ,
⎣
⎦
Centrální momenty se počítají s použitím vzorců
⎧ ∑ ( xi − EX )k P ( xi )
⎪⎪ i
µk ( X ) = ⎨ ∞
⎪ ∫ ( x − EX )k f ( x) dx
⎪⎩ −∞
pro diskrétní veličiny,
(5.10)
pro abs. spojité veličiny.
Nutnou podmínkou pro existenci centrálních momentů je absolutní
konvergence řady, resp. integrálu, na pravé straně vzorců (5.10). Mezi
centrálními a obecnými momenty existuje jednoduchý vztah. Zřejmě platí
⎛k⎞
⎛k⎞
k
k −i
k −i
µ k ( X ) = E ⎡( X − EX ) ⎤ = ∑ ⎜ ⎟ ( −EX ) E ( X i ) = ∑ ⎜ ⎟ ( −EX ) µi′( X ).
k
⎣
⎦
k
i =0
⎝i⎠
i =0
⎝i⎠
Vzhledem k tomu, že µ1′( X ) = EX , můžeme souvislost mezi centrálními a obecnými momenty popsat takto
k
µ k ( X ) = ∑ ( −1)
i=2
k −i
⎛k⎞
k −i
k −1
k
⎜ ⎟ [ µ1′( X ) ] µi′( X ) + ( −1) (k − 1) [ µ1′( X ) ] .
⎝i⎠
Každý centrální moment lze tedy vyjádřit pomocí obecných momentů.
Pro centrální momenty prvních čtyř řádů tedy platí:
µ1 ( X ) = 0,
µ 2 ( X ) = µ 2′ ( X ) − [ µ1′( X ) ] = E( X 2 ) − ( EX ) ,
2
2
µ3 ( X ) = µ3′ ( X ) − 3µ 2′ ( X ) µ1′( X ) + 2 [ µ1′( X ) ] ,
3
µ 4 ( X ) = µ 4′ ( X ) − 4µ3′ ( X ) µ1′( X ) + 6µ 2′ ( X ) [ µ1′( X ) ] − 3[ µ1′( X ) ] .
2
4
77
Z uvedeného vyplývá, že centrální moment 2. řádu µ 2 ( X ) náhodné
veličiny X je rozptylem DX této veličiny.
Při popisu tvaru rozdělení náhodné veličiny lze využít tzv.
normovaných momentů. Tyto momenty jsou definovány pro normovanou
náhodnou veličinu
U=
Normované momenty
X − EX
.
DX
Normovaným momentem k-tého řádu µ k*
náhodné veličiny X
k
nazýváme střední hodnotu veličiny U , tj.
µ k∗ ( X ) = E(U k ), k = 1, 2, ... .
Normované momenty se počítají pomocí vzorců typu (5.9), místo
náhodné veličiny X se uvažuje normovaná náhodná veličina U.
Normované momenty, a tedy i charakteristiky na nich založené, jsou
bezrozměrná čísla.
Koeficient šikmosti
Praktický význam mají normované momenty µ3∗ ( X ) a µ 4∗ ( X ).
Normovaný moment 3. řádu nazýváme koeficientem šikmosti
(asymetrie) . V praxi se určuje podle vzorce
µ3∗ ( X ) =
µ3 ( X )
µ3 ( X )
.
=
µ 2 ( X ) µ 2 ( X ) DX DX
U symetrického rozdělení je koeficient šikmosti roven nule. Jeho
absolutní hodnota je tím vyšší, čím má rozdělení větší asymetrii.
Znaménko koeficientu šikmosti udává typ zešikmení, tj. zda jde o kladně
nebo záporně zešikmené rozdělení (viz obr. 5.1).
Koeficient špičatosti
Normovaný moment 4. řádu nazýváme zpravidla koeficientem
špičatosti. Pro výpočet tohoto koeficientu se užívá vzorce
µ 4∗ ( X ) =
µ4 ( X )
[ µ 2 ( X )]
2
=
µ4 ( X )
(DX ) 2
.
Takto definovaný koeficient špičatosti je bezrozměrné nezáporné číslo.
Jeho hodnota je mírou špičatosti rozdělení. Někdy se koeficient špičatosti
definuje výrazem µ 4∗ ( X ) − 3. Je tomu tak proto, že špičatost uvažovaného
rozdělení porovnáváme obvykle se špičatostí normálního rozdělení a pro
normální rozdělení je hodnota výrazu µ 4∗ ( X ) − 3 nulová.
Příklad 5.5. Náhodná veličina X má hustotu
f ( x) =
1 −| x|
e
2
pro − ∞ < x < ∞.
Určete momentové charakteristiky úrovně, variability, šikmosti a špičatosti
této veličiny.
Řešení. Nejprve určíme obecné momenty prvních čtyř řádů.
78
∞
1
µ1′( X ) = EX = ∫ xe−| x| dx = 0 (integrand je funkce lichá),
2 −∞
µ 2′ ( X ) =
∞
∞
1
x 2 e −| x| dx = ∫ x 2 e − x dx = Γ(3) = 2,
∫
2 −∞
0
∞
1
µ3′ ( X ) = ∫ x3e−| x| dx = 0,
2 −∞
µ 4′ ( X ) =
∞
∞
1
x 4 e −| x| dx = ∫ x 4 e − x dx = Γ(5) = 24.
∫
2 −∞
0
Vzhledem k tomu, že EX = 0, jsou obecné momenty zároveň momenty
centrálními, a proto
DX = 2, µ3∗ ( X ) = 0, µ 4∗ ( X ) − 3 =
P (x)
24
− 3 = 3.
22
P (x)
a)
b)
x
x
Obr. 5.1. Grafy záporně (a) a kladně (b) zešikmeného rozdělení
Poznámka. Při výpočtu obecných momentů jsme použili Γ funkce,
která je definována vztahem
∞
Γ(t ) = ∫ xt −1e − x dx.
0
Γ funkce má tyto základní vlastnosti:
a) Γ(1) = Γ(0) = 1;
b) pro t > 0 platí Γ(t + 1) = tΓ(t ); je-li speciálně t přirozené číslo, pak
Γ(t + 1) = t ! ;
1
c) Γ( ) = π .
2
Kontrolní úkol 5.6. Určete hodnoty koeficientů šikmosti a špičatosti
pro náhodnou veličinu mající Poissonovo rozdělení s parametrem λ.
5.5. Kvantilové a jiné charakteristiky
V některých případech jsou pro popis rozdělení náhodné veličiny
výhodnější charakteristiky kvantilové. Jde především o takové případy,
kdy uvažovaná náhodná veličina nemá momentové charakteristiky (střední
79
hodnotu, rozptyl), tj. kdy řady, resp. integrály, ve vzorcích pro momentové
charakteristiky nejsou absolutně konvergentní.
Nechť F(x) je distribuční funkce náhodné veličiny X. Zavedeme funkci
F předpisem
−1
F −1 (α ) = inf { x; F ( x) ≥ α } , 0 < α < 1.
Kvantily
Funkci F −1 nazýváme kvantilovou funkcí odpovídající distribuční funkci
F. Hodnoty F −1 (α ) se nazývají 100α procentní kvantily a značí se
zpravidla symbolem xα . Je-li distribuční funkce F rostoucí a spojitá, pak
funkce F −1 je inverzní funkcí k F a kvantily se určují ze vztahu
F ( xα ) = α .
Medián
Nejznámější kvantilovou charakteristikou úrovně je medián. Je to
50 %-ní kvantil x0,50 , který budeme dále značit x. Medián x je taková
hodnota náhodné veličiny X, pro níž platí
1
F ( x) ≤ ,
2
Kvartily, decily,
percentily
(5.11)
1
lim F (u ) ≥ .
u→ x+
2
V obecném případě není medián těmito podmínkami jednoznačně
určen. Pokud je ovšem distribuční funkce F(x) rostoucí a spojitá, platí
1
F ( x) = . U symetrického rozdělení je medián zřejmě roven střední
2
hodnotě za předpokladu, že střední hodnota existuje. Mediánu se někdy
dává přednost před střední hodnotou proto, že jeho hodnota je přirozeně
interpretovatelná. Hodnota mediánu nezávisí na extrémních hodnotách
náhodné veličiny. K charakterizaci úrovně náhodné veličiny se v praxi
dosti
často
používají
také
kvartily
( x0,25 , x0,75 ),
decily
xk /10 (k = 1, 2, ... , 9) a percentily xk /100 (k = 1, 2, ... , 99).
Z kvantilových charakteristik variability uvedeme pouze kvartilovou
Kvartilová odchylka odchylku. Kvartilová odchylka náhodné veličiny X je definována pomocí
dolního kvartilu x0,25 a horního kvartilu x0,75 takto
1
( x0,75 − x0,25 ).
2
Této charakteristiky se užívá zřídka; je užitečná jen v těch případech, kdy
sledovaná náhodná veličina nemá rozptyl (má nekonečně velký rozptyl).
Q( X ) =
Kvantilovými charakteristikami šikmosti a špičatosti rozdělení se
zabývat nebudeme, protože se jich užívá v teorii pravděpodobnosti jen
ojediněle.
Modus
Z ostatních charakteristik úrovně náhodné veličiny X je nejdůležitější
modus, který se obvykle značí symbolem xˆ. V případě diskrétní veličiny
udává modus její nejpravděpodobnější hodnotu. Jestliže diskrétní veličina
může nabývat hodnot x1 , x2 , ... , pak pro její modus platí
P ( xˆ ) ≥ P ( xi ), i = 1, 2, ... .
80
Má-li náhodná veličina X absolutně spojité rozdělení s hustotou f(x),
potom se za její modus považuje taková hodnota x̂ , pro kterou platí
f ( xˆ ) ≥ f ( x), -∞ <x <∞.
Je důležité si uvědomit, že ani modus nemusí být určen jednoznačně.
Příklad 5.6. Určete medián a modus náhodné veličiny X, jež má
hustotu
f ( x) =
1
π 1 + x2
(
pro − ∞ < x < ∞.
)
Řešení. Uvažovaná náhodná veličina nemá ani střední hodnotu, ani
rozptyl. Distribuční funkce této veličiny má tvar
x
F ( x) =
1
∫ π (1 + t
2
−∞
1 1
dt = + arctg x .
2 π
)
Medián určíme podle (5.11) z rovnice
1 1
1
+ arctgx = ,
2 π
2
jejímž řešením je x = 0.
Modus stanovíme z podmínek pro maximum hustoty rozdělení pravděpodobností
xˆ
⎛ 2⎞
f ′( xˆ ) = ⎜ − ⎟
⎝ π ⎠ 1 + xˆ 2
(
)
2
= 0,
2 2
2
2
⎛ 2 ⎞ (1 + xˆ ) − 4 xˆ (1 + xˆ )
f ′′( xˆ ) = ⎜ − ⎟
< 0.
4
2
⎝ π⎠
ˆ
1+ x
(
)
Uvedené podmínky splňuje xˆ = 0.
Kontrolní úkol 5.7. Určete medián náhodné veličiny X s hustotou
f ( x) =
1 2
⎛ 1 ⎞
x exp ⎜ − x 2 ⎟ pro − ∞ < x < ∞.
2π
⎝ 2 ⎠
5.6. Charakteristiky náhodných vektorů
Budeme se především zabývat číselnými charakteristikami
dvourozměrného náhodného vektoru (X, Y). Tyto charakteristiky můžeme
pro větší přehlednost rozdělit do tří skupin.
A. Marginální charakteristiky
Marginální charakteristiky podávají informaci o vlastnostech
marginálního rozdělení veličiny X, resp. veličiny Y. Jsou totožné
s charakteristikami jednorozměrné veličiny a platí pro ně také stejné
vztahy. Střední hodnota náhodné veličiny X se tedy počítá podle vztahů
81
⎧ ∑ xi P1 ( xi ) pro diskrétní veličinu,
⎪⎪ i
EX = ⎨ ∞
⎪ ∫ xf1 ( x) dx pro abs. spojitou veličinu.
⎪⎩ −∞
K výpočtu rozptylu náhodné veličiny X se užívá vztahů
⎧ ∑ ( xi − EX )2 P1 ( xi ) pro diskrétní veličinu,
⎪⎪
i
DX = ⎨ ∞
⎪ ∫ ( x − EX )2 f1 ( x) dx pro abs. spojitou veličinu.
⎪⎩ −∞
Obdobné vzorce platí i pro náhodnou veličinu Y. Nutnou podmínkou
pro existenci marginální střední hodnoty i rozptylu je absolutní
konvergence řady nebo integrálu na pravé straně odpovídajících vzorců.
B. Podmíněné charakteristiky
Tyto charakteristiky popisují tvar podmíněného rozdělení veličiny X,
resp. veličiny Y. Uvedeme opět jen vztahy pro výpočet podmíněné střední
hodnoty a podmíněného rozptylu náhodné veličiny X za podmínky, že
náhodná veličina Y nabývá hodnoty y.
⎧ ∑ xi P ( xi | Y = y ) pro diskrétní veličinu,
⎪⎪ i
E( X | Y = y) = ⎨ ∞
⎪ ∫ xf ( x | Y = y ) dx pro abs. spojitou veličinu.
⎪⎩ −∞
⎧ ⎡ x − E ( X | Y = y ) ⎤ 2 P ( x | Y = y ) pro diskrétní veličinu,
i
⎣ i
⎦
⎪∑
⎪ i
D( X | Y = y ) = ⎨ ∞
2
⎪ ⎡ x − E ( X | Y = y ) ⎤ f ( x | Y = y ) dx pro spojitou veličinu.
⎣
⎦
∫
⎪⎩ −∞
Obdobně
jsou
definovány
i
podmíněné
charakteristiky
E(Y | X = x) a D(Y | X = x). O existenci podmíněných charakteristik platí
totéž co v případě marginálních charakteristik.
C. Charakteristiky vztahu mezi náhodnými veličinami
Uvažujeme vztah mezi dvěma náhodnými veličinami X a Y. Do této
skupiny charakteristik patří zejména kovariance cov ( X , Y ) a korelační
koeficient ρ ( X , Y ).
Kovariance náhodných veličin X, Y je definována jako střední
Kovariance
hodnota
součinu odchylek veličin X, Y od jejich středních hodnot, tj.
náhodných veličin
cov( X , Y ) = E ⎡⎣( X − EX )(Y − EY ) ⎤⎦ .
Pro numerický výpočet kovariance je ovšem vhodnější vzorec
82
cov( X , Y ) = E ( XY ) − EX EY ,
(5.12)
který se odvodí podobným postupem jako vzorec (5.8) pro výpočet
rozptylu. Kovariance může nabývat libovolné hodnoty z intervalu ( −∞, ∞ )
a je pouze pomocným ukazatelem pro měření intenzity vazby mezi dvěma
veličinami.
Mírou těsnosti lineárního vztahu mezi náhodnými veličinami X, Y je
korelační koeficient, jenž je definován jako podíl kovariance a součinu
směrodatných odchylek obou veličin
ρ ( X ,Y ) =
Korelační koeficient
cov( X , Y )
.
σ X σY
Korelační koeficient nabývá hodnot z intervalu < −1,1 > . Je-li jeho
absolutní hodnota rovna 1, jde o lineární závislost mezi oběma
sledovanými náhodnými veličinami. Platí
| ρ ( X , Y ) |= 1 ⇔ P(Y = a + bX ) = 1,
kde a, b jsou konstanty, přitom b > 0 v případě ρ ( X , Y ) = +1 a b < 0
v případě ρ ( X , Y ) = −1. Pokud platí ρ ( X , Y ) = 0, jsou náhodné veličiny X
a Y lineárně nezávislé (nekorelované). Nulová hodnota korelačního
koeficientu tedy neznamená obecnou nezávislost uvažovaných náhodných
veličin.
Rozdělení n-rozměrného náhodného vektoru
( X 1 , X 2 , ... , X n )
se
zpravidla popisuje dvěma charakteristikami:
a) vektorem středních hodnot ( EX 1 , EX 2 , ... , EX n ) ,
⎛ c11 c12
⎜
c
c
b) kovarianční (varianční) maticí ⎜ 21 22
⎜
⎜⎜
⎝ cn1 cn 2
c1n ⎞
⎟
c2n ⎟
.
⎟
⎟
cnn ⎟⎠
Kovarianční matice
Varianční matice
Kovarianční matice je symetrická. Na její hlavní diagonále jsou
rozptyly jednotlivých složek cii = DX i , i = 1, 2, ... , n, a pro ostatní prvky
matice platí cij = cov( X i , X j ), i ≠ j; i, j = 1, 2, …, n.
Příklad 5.7. Dvourozměrný náhodný vektor ( X 1 , X 2 ) má hustotu
π
π
⎧
⎪0,5 sin ( x1 + x2 ) pro 0 ≤ x1 ≤ , 0 ≤ x2 ≤ ,
f ( x1 , x2 ) = ⎨
2
2
⎪⎩ 0
pro ostatní hodnoty x1 , x2 .
Určete kovarianční matici.
Řešení. Pro střední hodnotu náhodné veličiny X 1 platí
83
π
π
⎡ π2
⎤
2
⎡
⎤
π⎞
⎢
⎥
⎛
EX 1 = 0,5 ∫ x1 ⎢ ∫ sin ( x1 + x2 ) dx2 ⎥ dx1 = 0,5∫ x1 ⎢ −cos ⎜ x1 + ⎟ + cos x1 ⎥ dx1 =
2⎠
⎝
⎣
⎦
0
0
⎢0
⎥
⎣
⎦
2
=
π
0, 785.
4
Podobně pro rozptyl náhodné veličiny X 1 dostaneme podle (5.8)
π
⎡ π2
⎤
π2
⎥
2 ⎢
=
DX 1 = 0,5 ∫ x1 ⎢ ∫ sin ( x1 + x2 ) dx2 ⎥dx1 −
16
0
⎢⎣ 0
⎥⎦
2
π
⎡
⎤
π⎞
π2 π2 π
⎛
= 0,5∫ x ⎢ −cos ⎜ x1 + ⎟ + cos x1 ⎥ dx1 −
=
+ −2
2⎠
16 16 2
⎝
⎣
⎦
0
2
2
1
0,188.
Ze symetrie hustoty f ( x1 , x2 ) vzhledem k proměnným x1 , x2 plyne
EX 2 = EX 1 , DX 2 = DX 1.
Pro kovarianci cov( X 1 , X 2 ) platí podle (5.12)
π
⎡ π2
⎤
π2
⎢
⎥
=
cov( X 1 , X 2 ) = 0,5∫ x1 ⎢ ∫ x2sin ( x1 + x2 ) dx2 ⎥dx1 −
16
0
⎢⎣ 0
⎥⎦
2
π
⎡ ⎛
π⎞
π
π ⎞⎤
π2 π
π2
⎛
= 0,5 ∫ x1 ⎢sin ⎜ x1 + ⎟ − sin x1 − cos ⎜ x1 + ⎟ ⎥dx1 −
= −1−
2⎠
2
2 ⎠⎦
16 2
16
⎝
⎣ ⎝
0
2
−0, 046.
⎛ 0,188 −0, 046 ⎞
Hledaná kovarianční (varianční) matice má tedy tvar ⎜
⎟.
⎝ −0, 046 0,188 ⎠
Pojmy k zapamatování:
• momenty obecné
• střední hodnota
• momenty centrální
• rozptyl (disperze, variance)
• směrodatná odchylka
• momenty normované
• koeficient šikmosti
• koeficient špičatosti
• kvantily
• medián
• kvartily dolní a horní
• decily
84
•
•
•
•
•
•
percentily
kvartilová odchylka
modus
kovariance
korelační koeficient
kovarianční matice
Shrnutí:
V úvodním odstavci uvádíme klasifikaci číselných charakteristik
náhodné veličiny ze dvou hledisek: podle vlastnosti, kterou popisují, a
podle způsobu konstrukce (výpočtu). Následují definice nejužívanějších
číselných charakteristik. Největší pozornost přitom věnujeme střední
hodnotě, rozptylu, mediánu a modu náhodné veličiny. Dokazujeme
základní vlastnosti střední hodnoty a rozptylu, abyste mohli počítat jejich
hodnoty i pro jednoduché funkce náhodných veličin. Na závěr uvádíme
přehled základních číselných charakteristik náhodného vektoru a
charakteristiky vztahu (intenzity vztahu) mezi náhodnými veličinami
(kovariance, korelační koeficient, kovarianční matice).
85
86
6. ROZDĚLENÍ DISKRÉTNÍHO TYPU
Po prostudování této kapitoly:
• pochopíte pojem Bernoulliovy pokusy (Bernoulliovo schéma
pokusů),
• seznámíte se s nejčastěji používanými rozděleními diskrétního
typu a jejich vlastnostmi (zejména číselnými charakteristikami),
• naučíte se řešit úlohy, v nichž vystupují diskrétní náhodné
veličiny.
V této kapitole se budeme zabývat pouze nejdůležitějšími typy
rozdělení pravděpodobnosti jednorozměrné diskrétní náhodné
veličiny, a to takovými, které se používají nejčastěji. S definicí a
vlastnostmi jiných rozdělení diskrétního typu se můžete seznámit
např. v monografiích [1,2].
6.1. Bernoulliovy pokusy
V teorii pravděpodobnosti má velký význam jednoduché schéma
náhodných pokusů, které se nazývá Bernoulliovy pokusy. Klasicky je
můžeme definovat takto:
Bernoulliovy pokusy (Bernoulliovo schéma) představují takovou sérii
(posloupnost) nezávislých pokusů se dvěma možnými výsledky (úspěch a
neúspěch), že pravděpodobnost úspěchu se nemění při přechodu od
jednoho pokusu k pokusu dalšímu. Podle uvedené definice lze rozhodnout,
v jakých konkrétních situacích jde o Bernoulliovy pokusy. Bernoulliovými
pokusy jsou např. házení mincí (úspěchem je např. padnutí rubu mince),
náhodný výběr s vracením (úspěchem je vybrání prvku zvoleného druhu)
nebo pozorování počasí každoročně v určitý den roku (úspěchem je např.
počasí beze srážek). Definici Bernoulliových pokusů však nevyhovují
např. tyto pokusy: házení různě deformovanými mincemi, náhodný výběr
bez vracení nebo každodenní sledování počasí během určitého období. V
prvních dvou případech se mění pravděpodobnost úspěchu při přechodu od
jednoho pokusu k druhému a v posledním případě je narušena podmínka
nezávislosti jednotlivých pokusů.
Pro rozvíjení teorie pravděpodobnosti je přirozeně vhodnější definice
založená na pojmu pravděpodobnostního prostoru.
V případě jediného pokusu se dvěma možnými výsledky se prostor
elementárních jevů skládá ze dvou prvků. Jeden z těchto prvků nazveme
"úspěchem" a označíme jej jedničkou, druhý nazveme "neúspěchem" a
označíme jej nulou. Je-li pravděpodobnost úspěchu p, tj. P (1) = p, pak
pravděpodobnost neúspěchu je q = 1 − p , a tedy P (0) = q = 1 − p.
87
Bernoulliovy pokusy
V případě n nezávislých pokusů je příslušný prostor elementárních jevů
Ω součinem n prostorů
{0,1} . Skládá se ze všech n-členných
posloupností E = (ω1 , ω 2 , ... , ω n ) , kde ωi ∈ {0,1} , i = 1, 2, ... , n.
Z uvedeného je zřejmé, že symbol ωi reprezentuje výsledek i-tého pokusu.
Při určování pravděpodobností příslušejících jednotlivým posloupnostem
náhodných pokusů je třeba každé jedničce v uvažované posloupnosti
přiřadit pravděpodobnost p, každé nule pravděpodobnost q a tyto
pravděpodobnosti spolu vynásobit. Počet jedniček (úspěchů)
v
posloupnosti E budeme označovat symbolem k(E).
Na základě předcházejících úvah můžeme Bernoulliovy pokusy
definovat takto: Bernoulliovými pokusy nazýváme pravděpodobnostní
prostor ( Ω, À, P ) , kde platí
Ω = {0,1} × {0,1} × ... × {0,1}
n -krát
a pro libovolné E
P ( E ) = p k ( E ) q n − k ( E ) , 0 ≤ p ≤ 1, q = 1 − p.
Definice založená na pojmu pravděpodobnostního prostoru je vhodná
pro teoretické závěry, nedává však návod, jak rozpoznat v praxi
Bernoulliovy pokusy.
6.2. Binomické rozdělení
Předpokládejme, že se provede n nezávislých pokusů, přičemž
pravděpodobnost úspěchu v každém jednotlivém pokusu je konstantní a
rovna p. Hledejme rozdělení diskrétní náhodné veličiny X, která udává
celkový počet úspěchů (nezávisle na pořadí) v sérii n Bernoulliových
pokusů.
Počet úspěchů může být zřejmě roven 0, 1,..., n. Pro odpovídající
pravděpodobnosti platí následující věta.
Věta 6.1. Pravděpodobnost P(X = k) toho, že série n Bernoulliových
pokusů s pravděpodobností úspěchu p vede k-krát k úspěchu a (n - k)-krát
k neúspěchu je dána vztahem
⎛ n⎞
⎛ n⎞
n−k
P ( X = k ) = ⎜ ⎟ p k (1 − p ) = ⎜ ⎟ p k q n − k .
⎝k⎠
⎝k⎠
(6.1)
Důkaz. Vyjdeme z definice Bernoulliových pokusů uvedené na konci
předchozího odstavce. Naším úkolem je v podstatě určit, kolika způsoby je
možné dosáhnout k úspěchů v n nezávislých pokusech, tj. kolik existuje
takových elementárních jevů, pro něž platí X = k. Hledaný počet je zřejmě
⎛ n⎞
,
roven kombinačnímu číslu ⎜ ⎟ , čímž je tvrzení dokázáno.
⎝k⎠
88
Náhodná veličina X, jejíž rozdělení je popsáno pravděpodobnostní
funkcí
⎧⎛ n ⎞ k
p (1 − p ) n − k pro k = 0,1, ... , n,
⎪
P (k ) = ⎨⎜⎝ k ⎟⎠
⎪
0
pro ostatní k ,
⎩
(6.2)
má binomické rozdělení s parametry n a p, což zapisujeme symbolicky ve
tvaru X ∼ Bi ( n, p ) . Funkce P (k ), definovaná vztahem (6.2), splňuje
podmínky pro pravděpodobnostní funkci, protože platí
a) P (k ) > 0 pro k = 0,1, ... , n;
n
n
⎛ n⎞
n−k
=
P
k
( ) ∑ ⎜ ⎟ p k (1 − p ) = ⎣⎡(1 − p ) + p ⎦⎤ = 1.
∑
k =0
k =0 ⎝ k ⎠
n
b)
Hodnoty pravděpodobnostní funkce pro n = 5 a vybrané hodnoty p jsou
znázorněny na obr. 6.1.
P ( k)
p = 0,1
p = 0,5
p = 0,9
0,6
0,4
0,2
0
0
1
2
3
4
k
5
Obr. 6.1. Rozdělení náhodné veličiny X ∼ Bi ( 5, p )
Odvodíme vztahy pro střední hodnotu a rozptyl náhodné veličiny
X ∼ Bi ( n, p ) .
Uvažme nejprve náhodné veličiny X i , i = 1, 2, … , n, definované takto:
⎧ 1, jestliže i -tý pokus skončil úspěchem,
Xi = ⎨
⎩0, jestliže i -tý pokus skončil neúspěchem.
Pro tyto veličiny zřejmě platí
EX 1 = EX 2 = ... =EX n = 1. p + 0. (1 − p ) = p,
( )
( )
( )
= E ( X ) − ( EX )
E X 12 = E X 22 = ... =E X n2 = 12. p + 02. (1 − p ) = p,
DX 1 = DX 2 = ... =DX n
2
i
i
2
= p (1 − p ) = pq.
Sledovaná náhodná veličina X je součtem sdruženě nezávislých veličin
X 1 , X 2 , ... , X n . Proto lze psát
89
Binomické rozdělení
⎛ n
⎞ n
EX = E ⎜ ∑ X i ⎟ = ∑ EX i = np,
⎝ i =1 ⎠ i =1
⎛ n
⎞ n
DX = D ⎜ ∑ X i ⎟ = ∑ DX i = np (1 − p ) = npq.
⎝ i =1 ⎠ i =1
Binomické rozdělení je plně určeno dvěma parametry: počtem pokusů n
a pravděpodobností úspěchu p při jednom pokusu.
V aplikacích bývá obvykle n známé, za p se dosazuje relativní četnost
úspěchů při dostatečně velkém počtu nezávislých pokusů.
V praxi nás často zajímá, čemu je roven nejpravděpodobnější počet
úspěchů k̂ v sérii n Bernoulliových pokusů. Přímo ze vztahu (6.1) plyne
( n + 1) p − k ,
P( X = k )
= 1+
P ( X = k − 1)
kq
takže
P ( X = k ) > P( X = k − 1) pro k < ( n + 1) p,
P ( X = k ) < P ( X = k − 1) pro k > ( n + 1) p,
P ( X = k ) = P( X = k − 1) pro k = ( n + 1) p, je-li ( n + 1) p celé číslo.
Nejpravděpodobnější počet úspěchů k̂ musí tedy splňovat podmínku
( n + 1) p − 1 = np − q ≤ kˆ ≤ ( n + 1) p = np + p.
(6.3)
Příklady
6.1. Pravděpodobnost zásahu cíle jedním výstřelem je rovna
1
. Jaká je
8
pravděpodobnost toho, že z 12 výstřelů nezasáhne ani jeden cíl?
Řešení. Náhodná veličina X, která udává počet zásahů cíle, má
rozdělení Bi(12, 1 ). Proto podle vzorce (6.1) platí
8
0
12
⎛12 ⎞ ⎛ 1 ⎞ ⎛ 7 ⎞
P ( X = 0) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
0, 2014.
⎝ 0 ⎠⎝ 8 ⎠ ⎝ 8 ⎠
6.2. Provádí se 6 nezávislých pokusů. Pravděpodobnost nastoupení jevu
A je pro všechny pokusy stejná a rovna 0,2. Určete nejpravděpodobnější
počet nastoupení jevu A.
Řešení. V tomto případě máme n = 6; p = 0,2; q = 0,8. Po dosazení do
vztahu (6.3) dostaneme
6 ⋅ 0, 2 − 0,8 ≤ kˆ ≤ 6 ⋅ 0, 2 + 0, 2 neboli 0, 4 ≤ kˆ ≤ 1, 4.
Odtud vyplývá, že nejpravděpodobnější počet nastoupení jevu A je 1.
90
Kontrolní úkoly
6.1. V přístroji je zamontováno 10 tranzistorů. Pravděpodobnost toho,
že každý jednotlivý tranzistor bude pracovat bez poruchy v průběhu roku,
je rovna p. Jaká je pravděpodobnost toho, že v průběhu roku
• bude mít poruchu alespoň jeden tranzistor,
• budou mít poruchu právě dva tranzistory?
6.2. Při realizaci určitého pokusu je pravděpodobnost dosažení
požadovaného výsledku rovna 0,1. Kolikrát je nutno pokus opakovat, aby
bylo možno s pravděpodobností 0,5 očekávat dosažení tohoto výsledku
aspoň jednou?
6.3. Poissonovo rozdělení
Při praktických aplikacích binomického rozdělení nás obvykle zajímají
pravděpodobnosti
P ( a ≤ X ≤ b) =
∑
a ≤ k ≤b
P( X = k ) =
⎛ n⎞
∑ ⎜ k ⎟p q
a ≤ k ≤b
⎝ ⎠
k
n−k
.
(6.4)
Pro velká n, a, b je výpočet součtů typu (6.4) velmi složitý. Bylo by proto
vhodné, kdyby byly k dispozici tabulky pro vyčíslení těchto součtů.
Zřejmě platí
P (a ≤ X ≤ b) = P(0 ≤ X ≤ b) − P(0 ≤ X ≤ a − 1),
takže úplně postačí sestavit tabulky pro výpočet P (0 ≤ X ≤ b). Tato
pravděpodobnost závisí na hodnotách n, p, b a tabulky musí mít tedy tři
vstupy. Z uvedeného vyplývá, že takové tabulky jsou příliš objemné a pro
praxi nepohodlné.
V praxi se uplatňují některé aproximace binomického rozdělení, které
se dostanou při různých předpokladech o parametrech n, p. Takové
aproximace jsou dvě: Moivreova-Laplaceova a Poissonova.
Nyní se budeme zabývat jednodušší, i když historicky pozdější,
aproximací Poissonovou, jež se týká případu, kdy počet pokusů n je veliký
a pravděpodobnost úspěchu p malá, přičemž hodnota součinu np je
konstantní.
Poissonovu aproximaci nelze formulovat pomocí jedné série
Bernoulliových pokusů. Je třeba uvažovat posloupnost sérií
Bernoulliových pokusů: v první sérii je pouze jeden pokus (n = 1) s
pravděpodobností úspěchu p1 , ve druhé sérii jsou dva nezávislé pokusy (n
= 2) s pravděpodobností úspěchu p2 , ... , v n-té sérii je n nezávislých
pokusů s pravděpodobností úspěchu pn . Sledovanými náhodnými
veličinami jsou počty úspěchů v jednotlivých sériích, označíme je
postupně X 1 , X 2 , ... , X n .
Věta 6.2 (Poissonova věta). Nechť pn → 0 pro n → ∞ a přitom
npn → λ , kde λ je pevně zvolené nezáporné číslo. Potom pro libovolné k
= 0, 1, … platí
91
P( X n = k ) →
λk
k!
e − λ pro n → ∞.
Důkaz. Vyjdeme z předpokladu pn =
λ
⎛1⎞
⎛1⎞
+ o ⎜ ⎟ , kde symbolem o ⎜ ⎟
n
⎝n⎠
⎝n⎠
vyjadřujeme, že
λ⎞ ⎛1⎞
⎛
⎜ pn − ⎟ ⎜ ⎟ → 0 pro n → ∞. Pak můžeme psát
n⎠ ⎝n⎠
⎝
⎛ n⎞
n−k
P ( X n = k ) = ⎜ ⎟ pnk (1 − pn ) =
⎝k⎠
n ( n − 1) ... ( n − k + 1) ⎡ λ
⎛ 1 ⎞⎤
=
+ o ⎜ ⎟⎥
⎢
k!
⎝ n ⎠⎦
⎣n
k
⎡ λ
⎛ 1 ⎞⎤
⎢1 − n − o ⎜ n ⎟ ⎥
⎝ ⎠⎦
⎣
n−k
.
Pro n → ∞ máme
k
⎡λ
⎛ 1 ⎞⎤
n ( n − 1) ... ( n − k + 1) ⎢ + o ⎜ ⎟ ⎥ =
⎝ n ⎠⎦
⎣n
n ( n − 1) ... ( n − k +1)
k
⎡⎣1 + o (1) ⎤⎦ → λ k ;
= λk
k
n
⎡ λ
⎛ 1 ⎞⎤
⎢1 − n − o ⎜ n ⎟ ⎥
⎝ ⎠⎦
⎣
n−k
→ e−λ ,
z čehož okamžitě plyne tvrzení věty 6.2.
,
Aproximace binomického rozdělení, kterou dává Poissonova věta, není
zvlášť dobrá. Tutubalin [20] považuje Poissonovu větu za výbornou v tom
smyslu, že její tvrzení zůstává v platnosti, i když jsou porušeny její
předpoklady. Formálně se vztahuje k Bernoulliovým pokusům, lze však
dost silně porušit podmínky Bernoulliova schématu (připustit proměnnou
pravděpodobnost úspěchu a dokonce nepříliš silnou závislost jednotlivých
pokusů), aniž se poruší závěr Poissonovy věty.
Náhodná veličina X, jejíž rozdělení je popsáno pravděpodobnostní
funkcí
⎧ λ k −λ
⎪ e pro k =0,1, ... , λ > 0,
P (k) = ⎨ k!
⎪0
pro ostatní hodnoty k .
⎩
Poissonovo rozdělení
(6.5)
má Poissonovo rozdělení s parametrem λ , což zapisujeme symbolicky ve
tvaru X ∼ Po ( λ ) . Uvedená pravděpodobnostní funkce splňuje skutečně
podmínky kladené na pravděpodobnostní funkci, neboť
a) je-li λ > 0, pak P (k ) > 0 pro k = 0,1, ... ;
92
b)
∞
∞
λk
k =0
k =0
k!
∑ P (k ) = ∑
e − λ = e − λ eλ = 1.
Na obr. 6.2 je pro ilustraci znázorněno polygonem rozdělení náhodné
veličiny X ∼ Po ( 0,1) .
P ( k)
1,0
0,8
0,6
0,4
0,2
0
0
1
2
3
4
k
5
Obr. 6.2. Rozdělení náhodné veličiny X ∼ Po ( 0,1)
Pro střední hodnotu náhodné veličiny X ∼ Po ( λ ) platí
∞
λk
k =0
k!
EX = ∑ k
= λe
−λ
∞
∞
λk
k =1
k!
e− λ = ∑ k
λm
∞
e− λ = λ e− λ ∑
k =1
λ k −1
( k − 1)!
=
∑ m ! = λ e λ eλ = λ .
−
m =0
( )
Analogicky odvodíme E X 2 = λ 2 + λ , takže pro rozptyl sledované
náhodné veličiny dostaneme
( )
DX = E X 2 − ( EX ) = λ 2 + λ − λ 2 = λ.
2
Poissonova rozdělení užíváme v praxi k aproximaci binomického
rozdělení v těch případech, kdy jsou splněny následující předpoklady:
n > 30, p ≤ 0,1 a součin np je konstanta v rozmezí 0-10. Uvažované
rozdělení má např. počet bakterií v kapce vody, počet onemocnění nějakou
neinfekční chorobou v určité oblasti, atd.
Poissonovým rozdělením se řídí také náhodná veličina, která má
význam počtu výskytů sledovaného jevu v určitém časovém intervalu
délky ∆t. Jestliže uvažovaný jev splňuje následující podmínky:
a) jev může nastat v kterémkoliv časovém okamžiku,
b) počet výskytů jevu během časového intervalu ∆t závisí jen na jeho
délce a ne na jeho počátku, ani na tom, kolikrát jev nastoupil před jeho
počátkem,
c) pravděpodobnost, že jev nastoupil více než jednou v intervalu délky
∆t , konverguje k nule rychleji než ∆t ,
d) střední hodnota počtu výskytů jevu za časovou jednotku (intenzita
výskytů jevu) je rovna právě λ ,
93
pak příslušná náhodná veličina má rozdělení Po ( ∆t λ ) . Poissonovo
rozdělení je tedy vhodné např. k popisu počtu dopravních nehod, počtu
zákazníků v prodejně, počtu telefonních volání nebo počtu pozorovaných
komet během nějakého časového intervalu.
Poissonova rozdělení nelze použít tam, kde jde o silnou závislost
výsledků jednotlivých pokusů. To platí např. pro počet nemocných
nějakou infekční chorobou v uvažované oblasti nebo pro počet kupujících,
kteří přišli do prodejny během jistého časového intervalu pro zboží, jehož
je na trhu nedostatek.
Příklad 6.3. Automatická telefonní ústředna spojuje za hodinu
průměrně 540 hovorů. Jaká je pravděpodobnost toho, že během daného
časového intervalu délky 1 minuta spojí právě 20 hovorů?
Řešení. Náhodná veličina X, kterou je počet telefonních hovorů během
intervalu délky 1 minuta, má zřejmě Poissonovo rozdělení s parametrem
1
.540 = 9. Hledaná pravděpodobnost je tedy
60
P ( X = 20) =
920 −9
e
20!
0, 000617.
Kontrolní úkol 6.3. Přístroj sestává z 1000 elektronických prvků.
Pravděpodobnost poruchy každého jednotlivého prvku v průběhu jednoho
roku je rovna 0,001 a nezávisí na stavu ostatních prvků. Určete:
• pravděpodobnost poruchy právě dvou prvků za rok,
• pravděpodobnost poruchy alespoň dvou prvků za rok.
6.4. Jiná rozdělení
A. Alternativní rozdělení
Alternativní rozdělení
Nejjednodušším rozdělením diskrétního typu je rozdělení alternativní.
Náhodná veličina X nabývající dvou možných hodnot 1 a 0 má
alternativní rozdělení, jestliže její rozdělení je popsáno vztahy
P ( X = 1) = p, P ( X = 0 ) = 1 − p = q.
B. Negativně binomické rozdělení
Předpokládejme, že provádíme nezávislé pokusy a že pravděpodobnost
úspěchu je pro všechny pokusy stejná a rovna p. Náhodnou veličinou X
nechť je počet neúspěšných pokusů, které předcházejí n-tému úspěšnému
pokusu. Z jednoduché kombinatorické úvahy vyplývá
⎛ k + n − 1⎞ n
k
P( X = k ) = ⎜
⎟ p (1 − p ) .
⎝ k ⎠
Říkáme, že náhodná
pravděpodobnostní funkcí
veličina
X,
jejíž
rozdělení
⎧⎛ k + n − 1⎞ n
k
p (1 − p ) pro k = 0,1, ... ; n > 0,
⎪⎜
⎟
P ( k ) = ⎨⎝ k
⎠
⎪
0
pro ostatní k ,
⎩
94
je
určeno
(6.6)
má negativně binomické rozdělení s parametry n, p. Čtenář se může
snadno přesvědčit, že funkce (6.6) splňuje všechny podmínky kladené na
pravděpodobnostní funkci.
Negativně binomické
rozdělení
Pro číselné charakteristiky veličiny X s negativně binomickým
rozdělením platí
EX =
n(1 − p)
,
p
DX =
n(1 − p)
.
p2
Uvedená interpretace negativně binomického rozdělení předpokládá, že
parametr n je celé číslo.
C. Geometrické rozdělení
Toto rozdělení je speciálním případem negativně binomického
rozdělení pro n =1. Říkáme tedy, že náhodná veličina X s pravděpodobnostní funkcí
⎧ p (1 − p ) k pro k = 0,1, 2, ...
P (k ) = ⎨
0
pro ostatní k
⎩
má geometrické rozdělení s parametrem p. Tuto náhodnou veličinu lze
interpretovat jako počet provedených neúspěšných nezávislých pokusů do
prvního úspěchu. Název geometrické vyplývá ze skutečnosti, že
s rostoucím k hodnoty pravděpodobnostní funkce klesají řadou
geometrickou.
D. Hypergeometrické rozdělení
Uvažujme náhodný výběr prvků nějakého souboru za předpokladu, že
se žádný vybraný prvek nevrací zpět, tj. výběr bez vracení.
Předpokládejme, že soubor o rozsahu N prvků obsahuje právě M prvků
(M < N) se sledovaným znakem. Vybereme-li z tohoto souboru náhodně n
( n < N ) prvků bez vracení, pak pro náhodnou veličinu X, která udává
počet vybraných prvků se sledovaným znakem, platí
⎛ M ⎞⎛ N − M ⎞
⎜ ⎟⎜
⎟
k ⎠⎝ n − k ⎠
⎝
P( X = k ) =
pro max(0, M − N + n) ≤ k ≤ min( M , n).
⎛N⎞
⎜ ⎟
⎝n⎠
Říkáme, že náhodná veličina X, jejíž rozdělení je popsáno
pravděpodobnostní funkcí
⎧⎛ M ⎞ ⎛ N − M ⎞
⎪⎜ ⎟ ⎜
⎟
⎪⎪ ⎝ k ⎠ ⎝ n − k ⎠ pro max(0, M − N + n) ≤ k ≤ min( M , n),
(6.7)
P (k ) = ⎨
⎛N⎞
⎜
⎟
⎪
⎝n⎠
⎪
⎪⎩ 0
pro ostatní k ,
95
Geometrické rozdělení
Hypergeometrické
rozdělení
má hypergeometrické rozdělení. Střední hodnota a rozptyl takové
veličiny X jsou
M
M ⎛ M ⎞ N −n
, DX = n ⎜1 − ⎟
.
N
N⎝
N ⎠ N −1
Střední hodnota je zřejmě totožná se střední hodnotou pro rozdělení
M
Bi(n, p), kde p =
. Rozptyl je roven součinu rozptylu pro zmíněné
N
binomické
rozdělení
a
zlomku
( N − n ) ( N − 1) . Protože
EX = n
( N − n ) ( N − 1) ≤ 1,
je rozptyl v případě hypergeometrického rozdělení
zpravidla menší než rozptyl pro odpovídající binomické rozdělení. Tato
skutečnost má význam pro matematickou statistiku, neboť z ní plyne, že
úsudky vytvořené na základě výběru bez vracení jsou přesnější než ty
založené na výběru s vracením.
Hypergeometrické rozdělení se uplatňuje především ve statistické
kontrole jakosti. Když ze série N výrobků, mezi nimiž je M zmetků,
vybereme náhodně n kusů, udává vztah (6.7) pravděpodobnost toho, že
mezi vybranými kusy bude právě k zmetků. Dále se hypergeometrického
rozdělení užívá jako pravděpodobnostního modelu některých her, např.
Sportky nebo Matesa (N = počet všech čísel, M = počet vylosovaných
čísel, n = počet vsazených čísel, k = počet uhodnutých čísel).
E. Rovnoměrné diskrétní rozdělení
Náhodná veličina X, jejíž rozdělení je dáno pravděpodobnostní funkcí
⎧1
⎪
P (k ) = ⎨ m
⎪⎩ 0
Rovnoměrné diskrétní
rozdělení
pro k = 1, 2, ..., m,
jinak,
má rovnoměrné diskrétní rozdělení. Pro základní číselné charakteristiky
takové veličiny X zřejmě platí
EX =
m +1
,
2
DX =
m2 − 1
.
12
Příklad 6.4. Při sázení Matesa se vyznačí (vsadí) 5 z celkového počtu
35 čísel. Losování spočívá v tom, že se náhodně bez vracení vybere 5
vyhrávajících čísel. Určete pravděpodobnost výhry prvního pořadí
v Matesu.
Řešení. Náhodná veličina X, kterou je počet uhodnutých čísel na jedné
sázence, má zřejmě hypergeometrické rozdělení. Protože N = 35, M = 5,
n = 5, je pravděpodobnost výhry prvního pořadí
⎛ 5 ⎞ ⎛ 30 ⎞
⎜ ⎟⎜ ⎟
5 0
P ( X = 5) = ⎝ ⎠ ⎝ ⎠
⎛ 35 ⎞
⎜ ⎟
⎝5⎠
96
0, 0000031.
Kontrolní úkol 6.4. Administrativní pracovnice podniku A volá
ústřednu podniku B v době největšího zatížení linky, kdy je
pravděpodobnost, že linka nebude obsazena, rovna 0,25. Jednotlivé pokusy
o spojení opakuje po několika minutách tak dlouho, dokud nebude
spojena. Určete pravděpodobnost toho, že dosáhne spojení až při pátém
pokusu.
Pojmy k zapamatování:
•
•
•
•
•
•
•
•
Bernoulliovy pokusy (Bernoulliovo schéma)
rozdělení alternativní
rozdělení binomické
rozdělení Poissonovo
rozdělení negativně binomické
rozdělení geometrické
rozdělení hypergeometrické
rozdělení rovnoměrné diskrétní
Shrnutí:
V této kapitole zavádíme pojem Bernoulliovy pokusy, a to jak
intuitivně, tak striktní definicí. Následně podrobně rozebíráme dva
nejvýznamnější typy rozdělení diskrétních náhodných veličin: binomické
rozdělení a Poissonovo rozdělení. Závěrečný odstavec přináší stručný
přehled jiných rozdělení diskrétního typu (alternativní, negativně
binomické, geometrické, hypergeometrické a rovnoměrné).
97
98
7. ROZDĚLENÍ ABSOLUTNĚ SPOJITÉHO TYPU
V této kapitole:
• poznáte náhodné veličiny absolutně spojitého typu a jejich
vlastnosti (zejména číselné charakteristiky),
• seznámíte se s některými speciálními typy
rozdělení
spojitého typu, které hrají významnou roli ve statistice,
• naučíte se řešit úlohy, v nichž vystupují absolutně spojité
náhodné veličiny.
V úvodním odstavci se budeme podrobně zabývat
nejdůležitějším, v teorii i v praxi nejčastěji používaným,
rozdělením spojitého typu – rozdělením normálním. Následující
odstavce jsou věnovány exponenciálnímu rozdělení a rozdělení
rovnoměrnému. S definicí a vlastnostmi jiných rozdělení
absolutně spojitého typu se můžete seznámit např. v monografiích
[1,2].
7.1. Normální rozdělení
Nejprve se budeme zabývat speciálním případem normálního rozdělení,
tzv. normovaným normálním rozdělením. Říkáme, že náhodná veličina X
má normované normální rozdělení, jestliže pro její hustotu platí
f ( x) =
1 - x2 2
e
2π
pro − ∞ < x < ∞.
(7.1)
Funkce (7.1) zřejmě splňuje základní požadavky kladené na hustotu
rozdělení pravděpodobností, protože
a)
f ( x) > 0
pro − ∞ < x < ∞,
∞
b)
∫
f ( x) dx =
−∞
1
2π
∞
∫e
−∞
− x2 2
dx =
2
2π
∞
∫e
0
− x2 2
dx =
1
π
∞
∫t
−1 2 − t
e dt =
0
1
1
Γ( ) = 1.
π 2
Při výpočtu integrálu jsme použili jednak toho, že hustota normovaného
normálního rozdělení je funkce sudá, tj. f ( x) = f (− x) , jednak vlastností
funkce G(viz poznámka k příkladu 5.5).
Podobným postupem určíme i střední hodnotu a rozptyl veličiny
s normovaným normálním rozdělením.
99
Normované
normální rozdělení
1
EX =
2π
DX =
1
2π
∞
∫ xe
− x2 2
dx = 0,
−∞
∞
∫
2
x 2 e − x 2 dx =
−∞
∞
2
2
2
x 2 e − x 2 dx =
∫
π
2π 0
∞
∫t
1 2 −t
e dt =
0
2
3
Γ( ) = 1.
π 2
Normované normální rozdělení označujeme zpravidla symbolem N(0, 1),
což značí, že jde o normální rozdělení s parametry EX = 0 a DX = 1.
Gaussova křivka
Hustota veličiny X ~ N(0, 1) je schematicky znázorněna na obr. 7.1.
Graf této funkce se obvykle nazývá Gaussovou křivkou, popř. křivkou
rozdělení chyb. Gaussova křivka je symetrická vzhledem k přímce x = 0 a
nabývá maxima o velikosti 1 2π v bodě x = 0. Inflexní body Gaussovy
křivky mají souřadnice x = ±1.
Distribuční funkce veličiny X ~ N(0, 1) má tvar
1
F ( x) ≡ Φ( x) =
2π
Laplaceova funkce
x
∫e
−t 2 2
dt.
(7.2)
−∞
Tato funkce se nazývá Laplaceova funkce a označuje se zpravidla
zvláštním symbolem Φ , její graf je schematicky znázorněn na obr. 7.2.
Laplaceovu funkci nelze vyjádřit pomocí elementárních funkcí, její
hodnoty jsou však tabelovány (viz příloha I). Hodnota Laplaceovy funkce
Φ ( x) udává podle definice pravděpodobnost, že náhodná veličina
X ~ N(0, 1) nabývá hodnoty z intervalu (-¶, x). Základní vlastnosti
Laplaceovy funkce lze formulovat takto:
F ( x)
f ( x)
1
√2π
1,0
0,5
x
−1
0
1
Obr. 7.1. Hustota veličiny X ~ N(0, 1)
x
Obr. 7.2. Distribuční funkce
veličiny X ~ N(0, 1)
1. Φ (− x) = 1 − Φ ( x),
2. P ( x1 < X < x2 ) = Φ ( x2 ) − Φ ( x1 ), a speciálně
P (| X |< x) = P(− x < X < x) = Φ ( x) − Φ (− x) = 2Φ ( x) − 1.
Význam Laplaceovy funkce vynikne zejména v souvislosti s použitím
centrální limitní věty.
Poznámka. Někteří autoři definují Laplaceovu funkci trochu odlišně,
např.
100
1
Φ ( x) =
*
2π
x
∫e
−t 2 2
dt.
0
Takto upravená funkce Φ* je pro tabelaci zřejmě výhodnější (menší
rozsah tabulek). Před použitím tabulek Laplaceovy funkce je nutno vždy
prohlédnout jejich záhlaví, kde musí být uvedeno, co se konkrétně chápe
pod Laplaceovou funkcí.
Nyní přejdeme k obecnému tvaru normálního rozdělení. Říkáme, že
náhodná veličina Y = σ X + µ , kde σ > 0, m je libovolné reálné číslo a
X ~ N(0, 1), má normální rozdělení s parametry µ a σ 2 , což zapisujeme
symbolicky ve tvaru Y ∼ N ( µ , σ 2 ). Taková náhodná veličina Y má hustotu
f ( y) =
1
σ 2π
e−( y − µ )
2
(2σ 2 )
pro − ∞ < y < ∞.
Pro její střední hodnotu a rozptyl zřejmě platí
EY = E(σ X + µ ) = σ EX + µ = µ ,
DY = D(σ X + µ ) = σ 2 DX = σ 2 .
Výpočet momentových charakteristik šikmosti a špičatosti veličiny Y vede
k těmto výsledkům:
µ3* (Y ) = 0,
µ 4* (Y ) = 3.
Také v případě, kdy sledovaná náhodná veličina má obecné (ne
normované) normální rozdělení, lze k výpočtům pravděpodobností využít
tabulek Laplaceovy funkce. Jestliže Y = σ X + µ , X ~ N(0, 1), σ > 0,
potom
y − µ Y − µ y2 − µ
P ( y1 < Y < y2 ) = P( 1
<
<
)=
σ
σ
σ
y −µ
y −µ
y −µ
y −µ
P( 1
<X< 2
) = Φ( 2
) − Φ( 1
).
σ
σ
σ
σ
Normálním rozdělením se řídí přesně jen málo náhodných veličin. Jsou
to především náhodné chyby měření, tj. chyby způsobené velkým počtem
neznámých a vzájemně nezávislých příčin, proto se normálnímu rozdělení
často říká zákon chyb.
Význam normálního rozdělení spočívá zejména v tom, že za jistých
podmínek dobře aproximuje řadu jiných (i diskrétních) rozdělení. Tak
např. normální rozdělení velmi dobře aproximuje binomické rozdělení pro
velké hodnoty parametru n (Moivreova-Laplaceova věta, viz odstavec
9.2).
V praxi se často předpokládá, že sledovaná náhodná veličina má
normální rozdělení, ačkoliv její skutečné rozdělení má jen podobný tvar, to
znamená, že je jednovrcholové a přibližně symetrické. Takový postup je
výhodný, poněvadž usnadňuje teoretické řešení mnoha problémů i
praktický výpočet hledaných charakteristik.
101
Obecné normální
rozdělení
Příklady
7.1. Náhodná veličina X má normální rozdělení s parametry
µ = 20 a σ = 10, tj. X ∼ N (20,100). Určete pravděpodobnost, že její
odchylka od střední hodnoty bude v absolutní hodnotě menší než 3.
Řešení.
X − 20
< 0,3) = Φ (0,3) − Φ (−0,3) =
10
2.0, 61791 − 1 = 0, 23582.
P (| X − 20 |< 3) = P(−0,3 <
= 2Φ (0,3) − 1
7.2. Pevnost jistého druhu ocelových lan je náhodná veličina
s rozdělením N(1000 kg/cm2, 2500 (kg/cm2)2. Určete, kolik ocelových lan
z 1000 kusů má průměrně menší pevnost než 900 kg/cm2.
Řešení. Sledovanou náhodnou veličinu označíme např. symbolem X.
Spočteme pravděpodobnost P ( X < 900 kg/cm 2 ). Zřejmě platí
P ( X < 900) = P(
X − 1000
< −2) = Φ (−2) = 1 − Φ (2) 1 − 0,97725 =
50
= 0, 02275.
Mezi 1000 kusy ocelových lan je tedy v průměru 22-23 lan s pevností
menší než 900 kg/cm2.
Kontrolní úkoly
7.1. Určete pravděpodobnost, že náhodná veličina U s normovaným
normálním rozdělením nabude hodnoty:
a) menší než 1,64;
b) větší než –1,64;
c) v mezích od –1,96 do 1,96.
7.2. Náhodná veličina X má normální rozdělení. Určete P (1 < X < 4 ) ,
jestliže platí: EX = 3 a P ( 3 < X < 5 ) = 0,1915.
7.2. Exponenciální rozdělení
Exponenciální
rozdělení
Říkáme, že náhodná veličina X má exponenciální rozdělení
s parametry A, α ( α >0 ) , jestliže pro její hustotu (viz obr. 7.3) platí
⎧α e −α ( x − A) pro x > A,
f ( x) = ⎨
pro x ≤ A.
⎩0
(7.3)
V praxi se častěji užívá speciálního tvaru exponenciálního rozdělení pro
A = 0, tj. tvaru
⎧α e −α x pro x > 0,
f ( x) = ⎨
pro x ≤ 0.
⎩0
102
Čtenář se může snadno přesvědčit, že funkce definovaná vztahem (7.3)
splňuje podmínky pro hustotu rozdělení pravděpodobností. Pro střední
hodnotu veličiny X s exponenciálním rozdělením platí
∞
EX = α ∫ xe
-α (x − A )
A
⎡ A 1 ∞ −α ( x − A) ⎤
1
dx = α ⎢ + ∫ e
dx ⎥ = A +
α
⎣α α A
⎦
Analogicky lze odvodit
E( X 2 ) = A2 +
2A
α
+
2
α2
,
takže pro rozptyl sledované veličiny dostaneme
DX = E( X 2 ) − (EX ) 2 = A2 +
f ( x)
2A
α
+
2
α
2
− (A+
1
α
)2 =
1
α2
.
F (x)
1
0
0
A
Obr. 7.3. Hustota veličiny
s exp. rozdělením
x
0
0 A
x
Obr. 7.4. Distribuční funkce veličiny
s exp. rozdělením
Distribuční funkce veličiny s exponenciálním rozdělením má tvar
pro x ≤ A,
⎧0
⎪ x
F ( x) = ⎨
-α (t − A )
dt = 1 − e-α (x − A) pro x > A.
⎪α ∫ e
⎩ A
Průběh této distribuční funkce je zřejmý z obr. 7.4, její hodnoty se pro
x → ∞ asymptoticky blíží hodnotě 1.
Exponenciální rozdělení se používá v teorii obnovy a v teorii hromadné
obsluhy. Popisuje se jím doba životnosti některých výrobků, doba trvání
nějakých akcí (např. obsluhy zákazníka v prodejně) nebo doba čekání na
nějakou událost (např. poruchu).
Hypotéza exponenciálního rozdělení je velmi přitažlivá. Uvedeme pro
to dva důvody.
a) Předpokládejme, že se uvažovaný přístroj skládá z n součástí
S1 , S 2 , ..., Sn . Porucha libovolné součásti nechť má za následek
poruchu přístroje, přičemž okamžiky poruch X i součástí Si jsou
sdruženě nezávislé náhodné veličiny, které mají exponenciální
rozdělení s parametry Ai = 0 a α i > 0, i = 1, 2, ..., n. V tomto případě je
103
okamžik
poruchy
přístroje
X = min( X 1 , X 2 , ..., X n ). Platí
náhodnou
veličinou
P ( X < x) = 1 − P ( X ≥ x) = 1 − P (min( X 1 , X 2 , ..., X n ) ≥ x) =
n
= 1 − ∏ P( X i ≥ x) = 1 − e-(α1 +α 2 + ... +α n ) x ,
i =1
takže veličina X má opět exponenciální rozdělení s parametrem
α = α1 + α 2 + ... + α n .
b) Exponenciální rozdělení těsně souvisí s Poissonovým rozdělením.
Předpokládejme, že počet poruch X, které vzniknou během časového
intervalu 0,t má Poissonovo rozdělení s parametrem λ . Délka
bezporuchového provozu zařízení Y má pak exponenciální rozdělení
s parametry A = 0 a α >0. Pravděpodobnost P (Y ≥ t ) bezporuchového
provozu v intervalu 0,t je zřejmě rovna pravděpodobnosti P(X = 0).
Odtud plyne
P (Y < t ) = 1 − P(Y ≥ t ) = 1 − e-α t = 1 − P( X = 0) = 1 − e- λ .
Příklad 7.3. Životnost určitého výrobku se řídí exponenciálním
rozdělením se střední hodnotou 3 roky. Jak dlouhou záruční dobu poskytne
výrobce zákazníkům, jestliže požaduje, aby relativní četnost výrobků,
které během záruční doby přestanou plnit svou funkci, byla v průměru 0,1?
Řešení. Sledovanou náhodnou veličinou T je délka časového intervalu,
v němž výrobek plní svou funkci. Ze zadání plyne, že T má exponenciální
1
rozdělení s parametrem α = , dále předpokládáme A = 0. Označíme-li
3
délku záruční doby jako z, pak řešíme exponenciální rovnici
P (T < z ) = 1 − e − z 3 = 0,1.
Z této rovnice dostaneme z
0,32 roku.
Kontrolní úkol 7.4. Výrobní zařízení má poruchu v průměru jednou za
2000 hodin. Předpokládejme, že doba čekání na poruchu je náhodná
veličina s exponenciálním rozdělením. Určete hodnotu t
tak, aby
pravděpodobnost, že zařízení bude pracovat bez poruchy dobu delší než t,
byla rovna 0,99.
7.3. Rovnoměrné spojité rozdělení
Rovnoměrné spojité
rozdělení
Říkáme, že náhodná veličina X má rovnoměrné spojité rozdělení
v nedegenerovaném intervalu (a, b), jestliže pro její hustotu (viz obr. 7.5)
platí
⎧ 1
pro a < x < b,
⎪
f ( x) = ⎨ b − a
⎪⎩ 0
pro ostatní x.
104
(7.4)
Funkce typu (7.4) zřejmě splňuje všechny podmínky kladené na hustotu
rozdělení pravděpodobností, neboť
a)
f ( x) ≥ 0 pro − ∞ < x < ∞,
∞
b)
∫
−∞
b
1
f ( x)dx =
dx = 1.
b − a ∫a
f ( x)
1
b− a
0
F (x)
1
0 a
b
0
x
Obr. 7.5. Hustota veličiny
s rovnoměrným rozdělením
0 a
b
x
Obr. 7.6. Distribuční funkce veličiny
s rovnoměrným rozdělením
Pro základní číselné charakteristiky náhodné veličiny X s rovnoměrným
spojitým rozdělením dostaneme
b
1
a+b
EX =
x dx =
,
∫
b−a a
2
b
E( X 2 ) =
1
b3 − a 3 b 2 + ab + a 2
2
x
dx
,
=
=
b − a ∫a
3(b − a)
3
DX = E( X ) − ( EX )
2
2
b 2 + ab + a 2 (a + b) 2 (b − a) 2
.
=
−
=
3
4
12
Distribuční funkce veličiny X s rovnoměrným spojitým rozdělením (viz
obr. 7.6) má tvar
⎧ 0
⎪
x
x−a
⎪ 1
F ( x) = ⎨
dx =
∫
b−a
⎪b − a a
⎪
1
⎩
pro x ≤ a,
pro a < x < b,
pro x ≥ b.
Náhodnými veličinami s rovnoměrným spojitým rozdělením jsou např.
chyby při zaokrouhlování nebo doba čekání do nastoupení určitého jevu,
který se opakuje v pravidelných intervalech.
Příklad 7.4. Prodejna očekává dodávku nového zboží určitý den v době
od 8 do 10 hodin. Podle sdělení dodavatele je uskutečnění dodávky stejně
možné kdykoliv během tohoto časového intervalu. Jaká je
pravděpodobnost, že zboží bude dodáno v době od půl deváté do tři čtvrtě
na devět?
Řešení. Sledovanou náhodnou veličinou X je doba čekání na dodávku
zboží. Tato veličina má podle zadání rovnoměrné spojité rozdělení
v intervalu (8, 10). Proto platí
105
8,75
1
8, 75 − 8,50
P (8,50 < X < 8, 75) = ∫ dx =
= 0,125.
2 8,50
2
Kontrolní úkol 7.5. Trolejbusy městské dopravy odjíždějí z dané
stanice v pětiminutových intervalech. Předpokládejme, že cestující přijde
na stanici v libovolném okamžiku. Jaká jsou střední hodnota a směrodatná
odchylka doby jeho čekání na odjezd ze stanice?
7.4. Speciální rozdělení
V tomto odstavci se budeme stručně zabývat třemi speciálními
rozděleními, která mají mimořádný význam v matematické statistice,
zejména při ověřování statistických hypotéz. Jsou to rozdělení
χ 2 (Pearsonovo), t (Studentovo) a F (Fisherovo - Snedecorovo).
A. χ 2 rozdělení
Nechť U1 ,U 2 , ..., U n jsou sdruženě nezávislé náhodné veličiny
s normovaným normálním rozdělením, tj. U i ∼ N(0,1) pro i = 1, 2,..., n.
Pak náhodná veličina
n
X = U12 + U 22 + ... +U n2 = ∑ U i2
i =1
2
χ rozdělení
má χ rozdělení s n stupni volnosti, což zapisujeme ve tvaru X ∼ χ n2 .
2
Lze dokázat, že hustota rozdělení pravděpodobností veličiny X ∼ χ n2 má
tvar
1
⎧
x n 2−1e − x 2 pro x > 0,
⎪
n2
Γ
n
(
2)2
f n ( x) = ⎨
⎪0
pro x ≤ 0.
⎩
(7.5)
Ze vztahu (7.5) je zřejmé, že tvar rozdělení χ 2 závisí na jediném
parametru, a to počtu stupňů volnosti n, n = 1, 2,... . Graf hustoty χ 2
rozdělení je pro vybrané hodnoty parametru n uveden na obr. 7.7.
Pro náhodnou veličinu X ∼ χ n2 platí
EX = n,
DX = 2n.
S růstem n se χ n2 rozdělení blíží k normálnímu rozdělení se střední
hodnotou n a rozptylem 2n.
Kritická hodnota
Distribuční funkci χ n2 rozdělení nelze vyjádřit pomocí elementárních
funkcí. V praxi se neužívá hodnot distribuční funkce, ale tabulek kvantilů
nebo tzv. kritických hodnot χ n2 (α ) definovaných vztahem
P ( X ≥ χ n2 (α )) = α .
106
fn (x)
0,5
0,4
0,3
0,2
0,1
0
n=1
n=4
n = 10
0
2
4
6
8
10
12
14
x
Obr. 7.7. Hustota veličiny s rozdělením χ 2 (schematicky)
B. t rozdělení
Nechť Y a Z jsou takové nezávislé
Y ∼ N(0,1) a Z ∼ χ n2 . Pak náhodná veličina
X=
Y
Z
náhodné
veličiny,
že
n
má t rozdělení s n stupni volnosti . Toto rozdělení značíme symbolem tn ,
n = 1, 2,... . Hustota náhodné veličiny X ∼ tn má tvar (viz obr. 7.8)
n +1
)
x2
2
f n ( x) =
(1 + ) − ( n +1) / 2 pro − ∞ < x < ∞.
n
n
Γ( ) π n
2
Γ(
Z uvedeného vztahu vyplývá, že rozdělení veličiny X závisí pouze na
jediném parametru, a to počtu stupňů volnosti veličiny Z.
fn (x)
n=1
n=3
0,4
0,2
−3 −2 −1 0
1
2
3
x
Obr. 7.8. Hustota veličiny s tn rozdělením (schematicky)
Analýza průběhu hustoty f n ( x) pro tn rozdělení ukazuje, že s rostoucím
počtem stupňů volnosti n se graf této funkce blíží grafu hustoty pro
normované normální rozdělení. Pro n > 30 se tn rozdělení velmi dobře
aproximuje rozdělením N(0, 1).
Základní charakteristiky náhodné veličiny X ∼ tn jsou
107
t rozdělení
EX = 0
DX =
pro n > 1,
n
n−2
pro n > 2.
Také v případě tn rozdělení se namísto distribuční funkce využívá
tabulek kvantilů a kritických hodnot tn (α ) , které jsou obvykle definovány
takto:
P (| X |≥ tn (α )) = α .
C. F rozdělení
Nechť Y a Z jsou takové nezávislé
Y ∼ χ m2 a Z ∼ χ n2 . Pak náhodná veličina
X=
F rozdělení
náhodné
veličiny,
že
Y m
Z n
má F rozdělení o m a n stupních volnosti, m, n = 1, 2,... , což zapisujeme
ve tvaru X ∼ Fm,n . Hustota tohoto rozdělení (viz obr. 7.9) je rovna
⎧ m+n
⎪ Γ( 2 ) ⎛ m ⎞ m 2 m 2−1
m
(1 + x) − ( m + n ) / 2 pro x > 0,
x
⎪
⎜
⎟
n n
f m,n ( x) = ⎨ m
n
Γ ( )Γ ( ) ⎝ ⎠
⎪ 2
2
⎪
pro x ≤ 0.
⎩0
fn (x)
0,5
0,4
0,3
0,2
0,1
0
n=1
n=4
n = 10
0
2
4
6
8
10
12
14
x
Obr. 7.9. Hustota veličiny s Fm ,n rozdělením (schematicky)
Rozdělení náhodné veličiny X ∼ Fm,n je tedy charakterizováno dvěma
parametry, a to stupni volnosti čitatele a jmenovatele v definičním vztahu.
Pro střední hodnotu a rozptyl veličiny X lze odvodit
n
pro n > 2,
n−2
2n 2 (m + n − 2)
DX =
pro n > 4.
m(n − 2) 2 (n − 4)
EX =
V praxi se namísto distribuční funkce používá tabulek kvantilů a
kritických hodnot Fm,n (α ), jež jsou definovány vztahem
108
P ( X ≥ Fm,n (α )) = α .
•
•
•
•
•
•
•
•
•
•
Pojmy k zapamatování:
rozdělení normované normální
rozdělení normální
Gaussova křivka (křivka rozdělení chyb)
Laplaceova funkce
rozdělení exponenciální
rozdělení rovnoměrné
χ2-rozdělení (rozdělení Pearsonovo)
t-rozdělení (rozdělení Studentovo)
F-rozdělení (rozdělení Fisherovo-Snedecorovo)
kritická hodnota rozdělení
Shrnutí:
V této kapitole podrobně rozebíráme tři nejvýznamnější typy rozdělení
absolutně spojitého typu: normální rozdělení (s důrazem na normované
normální rozdělení), exponenciální rozdělení a rovnoměrné rozdělení.
V posledním odstavci uvádíme přehled speciálních typů spojitého
rozdělení (χ2-rozdělení, t-rozdělení a F-rozdělení), které se uplatňují
především v matematické statistice (intervalové odhady, testování
statistických hypotéz), a zavádíme pojem kritické hodnoty rozdělení
daného typu.
109
110
Korespondenční úkol 2
1. Ze série 100 výrobků, mezi nimiž je 10 zmetků, se náhodně vybere
pět výrobků ke kontrole kvality. Určete rozdělení pravděpodobností
veličiny X, jež udává počet zmetků ve výběru.
2. Náhodná veličina X má hustotu
−b x −c
f ( x) = ae
pro − ∞ < x < ∞,
přičemž 0 < a < ∞, 0 < b < ∞, − ∞ < c < ∞. Určete vztah mezi
konstantami a, b, jakož i příslušnou distribuční funkci F(x).
3. Distribuční funkce náhodné veličiny X má tvar
4.
5.
6.
7.
8.
9.
⎧
⎪
0
pro x ≤ 0,
⎪
π
⎪
F ( x) = ⎨a + b sin x pro 0 < x < ,
2
⎪
π
⎪
1
pro x ≥ .
⎪⎩
2
Čemu se rovnají konstanty a a b? Jaký tvar má odpovídající hustota
rozdělení pravděpodobností?
Určete rozptyl počtu bodů dosaženého
a) při hodu jednou hrací kostkou,
b) při hodu dvěma hracími kostkami.
Do daného terče se střílí až do dosažení n-tého zásahu. Předpokládá
se, že jednotlivé výstřely jsou navzájem nezávislé a
pravděpodobnost zásahu je při každém výstřelu rovna p. Určete
střední hodnotu spotřeby nábojů (náhodné veličiny X).
Určete střední hodnotu a rozptyl náhodné veličiny X, jejíž hustota
rozdělení pravděpodobností má tvar
⎧ 9
pro x > 1,
⎪
f ( x ) = ⎨ x10
⎪⎩ 0
jinak.
Určete střední hodnotu a rozptyl veličiny X, jejíž hustota má tvar
π
⎧2
2
⎪ cos x pro x ≤ ,
f ( x) = ⎨ π
2
⎪⎩
0 jinak.
Je známo, že pravděpodobnost vypěstování zdravé rostliny ze
semena je 0,4. Bylo zasazeno právě 12 semen. Za náhodnou
veličinu X považujte počet zdravých rostlin vypěstovaných z těchto
semen. Určete, jaký je nejpravděpodobnější počet zdravých rostlin,
které lze takto vypěstovat, a jaká je pravděpodobnost dosažení
tohoto počtu.
Telefonní ústředna přijme během hodiny průměrně 15 hovorů. Jaká
je pravděpodobnost, že během čtyř minut přijme
a) právě jeden hovor,
b) alespoň dva hovory,
c) alespoň dva a nejvýše pět hovorů?
111
10. Při kontrole se přejímají všechny výrobky, jejichž délka
přesahuje 77 cm. Bylo zjištěno, že střední hodnota délky
výrobku (náhodné veličiny X) je 75 cm a směrodatná odchylka 5
cm. Za předpokladu, že sledovaná náhodná veličina má přibližně
normální rozdělení, určete
a) pravděpodobnost, že výrobek projde kontrolou,
b) pravděpodobnost, že výrobek, který prošel kontrolou, je
delší než 80 cm.
11. Náhodná veličina X má rovnoměrné spojité rozdělení
v intervalu (2, 6). Vypočtěte
a) E ( 2 X + 3) ,
(
)
b) E X 2 − 5 X + 2 ,
c) D ( 6 X − 7 ) ,
( )
d) D X 2 .
12. Stanovte střední hodnotu doby obsluhy v prodejně, víte-li že
pravděpodobnost obsloužení v době kratší než 4 minuty je
0,2592. Předpokládejte, že doba obsluhy má exponenciální
rozdělení s hustotou ve tvaru
−λ x −1
⎪⎧λe ( ) pro x > 1,
f ( x) = ⎨
jinak.
⎪⎩ 0
112
8. ZÁKON VELKÝCH ČÍSEL
Po prostudování této kapitoly:
pochopíte význam Čebyševových nerovností pro dokazování
různých formulací zákona velkých čísel,
• seznámíte se s konvergencí posloupnosti náhodných veličin podle
pravděpodobnosti a pochopíte, v čem se tato konvergence liší od
konvergence číselných posloupností,
• poznáte dvě nejvýznamnější formulace zákona velkých čísel a
naučíte se jich využívat v praxi.
•
Tato kapitola je pro samostatné studium velmi náročná. Poznáte v ní
řadu nových, pro pochopení obtížnějších pojmů: Čebyševovy
nerovnosti, konvergence posloupnosti náhodných veličin podle
pravděpodobnosti a zákon velkých čísel. Uvědomte si, že Čebyševovy
nerovnosti představují především matematický aparát pro dokazování
různých formulací zákona velkých čísel. Věnujte zvláštní pozornost
pochopení rozdílu mezi nově zavedenou konvergencí podle
pravděpodobnosti a konvergencí číselných posloupností známou
z matematické analýzy. V této kapitole poznáte pouze dvě z celé řady
různých formulací zákona velkých čísel, a to ty, jež mají pro realizaci
praktických měření největší význam.
8.1. Čebyševovy nerovnosti
Při důkazu vět, které formulují zákon velkých čísel, se vychází z tzv.
Čebyševových nerovností.
Věta 8.1 (Čebyševova nerovnost I. typu). Pro libovolnou nezápornou
náhodnou veličinu X, která má střední hodnotu EX , a libovolné reálné
ε > 0 platí
P( X ≥ ε ) ≤
EX
ε
.
(8.1)
Důkaz. Uvažujme pro jednoduchost jen diskrétní náhodné veličiny.
Vyjdeme ze vztahu
EX = ∑ xi P( X = xi ),
i
kde se sčítá přes všechny možné hodnoty náhodné veličiny X. Nahradímeli sčítání přes všechna i sčítáním přes všechna taková i, že xi ≥ ε , pak se
součet nemůže zvětšit. Platí tedy
EX ≥
∑ x P( X = x ) ≥ ε ∑ε P( X = x ) = ε P( X ≥ ε ),
i: xi ≥ε
i
i
z čehož bezprostředně plyne (8.1).
i: xi ≥
i
Ñ
113
Čebyševova nerovnost
I. typu
Čebyševova nerovnost
II. typu
Věta 8.2 (Čebyševova nerovnost II. typu). Pro libovolnou náhodnou
veličinu X, která má střední hodnotu EX a rozptyl DX , a libovolné reálné
ε > 0 platí
P(| X − EX |≥ ε ) ≤
DX
ε2
.
(8.2)
Důkaz. Postupujeme analogicky jako při důkazu Čebyševovy
nerovnosti I. typu. Dostaneme
DX ≥
∑
i:| xi − EX | ≥ε
( xi − EX ) 2 P( X = xi ) ≥ ε 2
∑
i:| xi − EX |≥ε
P( X = xi ) = ε 2 P(| X − EX |≥ ε ).
Ñ
Z uvedeného ovšem přímo vyplývá nerovnost (8.2)
Poznámka. Čebyševovy nerovnosti lze také zapsat ve tvaru
P( X < ε ) ≥ 1 −
EX
ε
,
P (| X − EX |< ε ) ≥ 1 −
DX
ε2
.
V praxi je užívanější Čebyševova nerovnost II. typu, kterou lze
zjednodušeně formulovat takto: Je-li rozptyl DX malý, pak jsou velké
odchylky náhodné veličiny X od její střední hodnoty EX jen málo
pravděpodobné.
Čebyševových nerovností se užívá:
a) k důkazu různých formulací zákona velkých čísel,
b) pro odhad uvedených pravděpodobností bez znalosti rozdělení
uvažované náhodné veličiny.
Čebyševovy nerovnosti mají pro odhadování jen omezený význam,
protože často poskytují velmi hrubé nebo dokonce triviální odhady. Je-li
např. DX > ε 2 , a tedy DX / ε 2 > 1, pak Čebyševova nerovnost II. typu
vyjadřuje pouze tu skutečnost, že pravděpodobnost jevu {| X − EX |≥ ε } je
menší než 1, ale to je zřejmé i bez použití Čebyševovy nerovnosti.
Příklady
8.1. Jaká je pravděpodobnost toho, že absolutní hodnota odchylky
3
náhodné veličiny Y od její střední hodnoty EY nebude menší než σ Y ?
2
Řešení. S použitím Čebyševovy nerovnosti II. typu dostaneme
3
4
DY
P (| Y − EY |≥ σ Y ) ≤
= .
9
2
DY 9
4
114
8.2. Jaký je nejvyšší možný počet vkladatelů, jestliže žádný vklad
neklesne pod 100 Kč, úhrn vkladů je 20 milionů Kč a pravděpodobnost
toho, že náhodný vklad činí alespoň 1 100 Kč je rovna 0,7?
Řešení. Za náhodnou veličinu X zvolíme částku, o kterou vklad
převyšuje 100 Kč na náhodně vybrané vkladní knížce. Pro střední hodnotu
této veličiny platí
EX =
20 000 000 − 100n
,
n
kde n značí počet vkladatelů. Přitom víme, že P ( X ≥ 1 000) = 0, 7.
S použitím Čebyševovy nerovnosti I. typu získáme
0, 7 ≤
20 000 000 − 100n
.
1 000n
Řešením uvedené nerovnice dostaneme pro maximální počet vkladatelů
nmax = 25 000.
Kontrolní úkoly
8.1. Pro náhodnou veličinu X platí DX = 0, 01 a nerovnost
P ( X − EX < a ) > 0,96.
Určete hodnotu čísla a.
8.2. Dokažte, že pro náhodnou veličinu X platí nerovnost
E eX
,
P ( X ≥ a) ≤
ea
jestliže ovšem existuje střední hodnota E e X .
( )
( )
8.2. Konvergence podle pravděpodobnosti
Pojem konvergence podle pravděpodobnosti (pravděpodobnostní
konvergence) zavedeme následujícími definicemi.
Říkáme, že posloupnost náhodných veličin X 1 , X 2 , ..., X n , ...
konverguje podle pravděpodobnosti k nule, jestliže pro libovolné reálné
ε > 0 platí
P (| X n |< ε ) → 1
Konvergence podle
pravděpodobnosti k nule
pro n → ∞.
P
→,
Konvergenci podle pravděpodobnosti značíme obvykle symbolem ⎯⎯
P
→ 0.
takže namísto P (| X n |< ε ) → 1 můžeme psát X n ⎯⎯
Uvedenou definici můžeme rozšířit takto: Říkáme, že posloupnost
náhodných veličin X 1 , X 2 , ..., X n , ... konverguje podle pravděpodobnosti
P
ke konstantě c, resp. k náhodné veličině X (zápis X n ⎯⎯
→ c , resp.
P
X n ⎯⎯
→ X ), jestliže posloupnost rozdílů X 1 − c, X 2 − c, ..., X n − c, ... ,
resp. X 1 − X , X 2 − X , ..., X n − X , ..., konverguje podle pravděpodobnosti
k nule, tj. jestliže platí
115
Zobecnění
konvergence podle
pravděpodobnosti
P ( X n − c < ε ) → 1, resp. P ( X n − X < ε ) → 1 pro n → ∞.
Poznámka.
Skutečnost,
že
posloupnost
náhodných
veličin
X 1 , X 2 , ..., X n , ... konverguje podle pravděpodobnosti k nule, resp. ke
konstantě c, resp. k náhodné veličině X, lze zapsat také takto:
P (| X n |≥ ε ) → 0
pro n → ∞,
P (| X n − c |≥ ε ) → 0 pro n → ∞,
P (| X n − X |≥ ε ) → 0 pro n → ∞.
Je nutno si uvědomit, že konvergence podle pravděpodobnosti nemá
charakter matematické konvergence, s níž se čtenář setkal v matematické
analýze. Pravděpodobnostní konvergencí rozumíme skutečnost, že
pravděpodobnost libovolné odchylky náhodných veličin X 1 , X 2 , ..., X n , ...
od nuly konverguje k nule s rostoucím n.
Úkol k zamyšlení
Jaký je rozdíl mezi konvergencí posloupnosti náhodných veličin podle
pravděpodobnosti a obyčejnou konvergencí číselné posloupnosti?
Na závěr tohoto odstavce dokážeme užitečnou větu.
Věta 8.3. Jestliže pro posloupnost náhodných veličin X 1 , X 2 , ..., X n , ...
DX n → 0
pro
n → ∞,
pak
posloupnost
platí
X 1 − EX 1 , X 2 − EX 2 , ..., X n − EX n , ... konverguje podle pravděpodobnosti
k nule.
Důkaz. Podle Čebyševovy nerovnosti II. typu platí pro každé reálné
ε>0
1 ≥ P(| X n − EX n |< ε ) ≥ 1 −
DX n
ε2
.
Jestliže pro n → ∞ platí DX n → 0, potom zřejmě také platí
P (| X n − EX n |< ε ) → 1,
čímž je tvrzení věty dokázáno.
□
8.3. Zákon velkých čísel v Čebyševově tvaru
Hodnoty náhodné veličiny získáváme v aplikacích jako výsledky
měření, přičemž buď samotná měření jsou zatížena náhodnými chybami
nebo objekty měření se náhodně vybírají z nějakého souboru. Již dávno
bylo pozorováno, že zatímco hodnoty náhodných veličin
X 1 , X 2 , ..., X n , ..., které reprezentují výsledky jednotlivých měření, se
mohou značně lišit, vykazují aritmetické průměry
( X1 + X 2 +
... +X n ) n
mnohem větší stabilitu.
Jsou-li aritmetické průměry skutečně statisticky stabilní, pak
v matematickém modelu, jímž zkoumáme náhodné jevy, musí existovat
věta, která by tuto skutečnost postihovala. Touto větou je právě
116
Čebyševova formulace zákona velkých čísel. V jejích předpokladech je
ovšem třeba uvést některá omezení na náhodné veličiny
X 1 , X 2 , ..., X n , ... . Tyto předpoklady jsou dvojího druhu:
a) předpoklad o nezávislosti veličin X 1 , X 2 , ..., X n , ...,
b) předpoklad o existenci (omezenosti) středních hodnot a rozptylů
veličin X 1 , X 2 , ..., X n , ... .
Věta 8.4 (zákon velkých čísel v Čebyševově tvaru) . Nechť náhodné
veličiny X 1 , X 2 , ..., X n , ... jsou po dvou nezávislé, mají střední hodnoty
EX i a rozptyly DX i ≤ c, i = 1, 2, ..., n, ..., kde c je nějaké kladné reálné
číslo. Pak pro libovolné reálné ε > 0 platí
P (|
X 1 + X 2 + ... +X n EX 1 + EX 2 + ... + EX n
−
|< ε ) → 1 pro n → ∞.
n
n
Důkaz. Jelikož
E(
X 1 + X 2 + ... + X n
EX 1 + EX 2 + ... + EX n
)=
,
n
n
pak stačí podle věty 8.3 dokázat, že rozptyly aritmetických průměrů
( X 1 + X 2 + ... +X n ) n konvergují k nule. Vzhledem k uvedeným dvěma
předpokladům dostaneme pro n → ∞
D(
X 1 + X 2 + ... + X n
1
)= 2
n
n
n
∑ DX
i =1
i
≤
nc c
= → 0,
n2 n
což se mělo dokázat.
(8.3)
□
Důsledek. Ve speciálním případě EX 1 = EX 2 = ... = EX n = ... = µ
platí pro libovolné reálné ε > 0
P (|
X 1 + X 2 + ... + X n
− µ |< ε ) → 1 pro n → ∞.
n
Tento důsledek právě vyjadřuje stabilitu aritmetických průměrů.
Poznámka. Větu 8.4 lze dokázat přímo s použitím Čebyševovy
nerovnosti II. typu na aritmetické průměry.
Podstata dokázané věty spočívá v následujícím: Jednotlivé nezávislé
náhodné veličiny X i mohou nabývat hodnot vzdálených od jejich
středních hodnot EX i , ale aritmetický průměr dostatečně velkého počtu
těchto náhodných veličin nabývá s velkou pravděpodobností hodnoty
blízké aritmetickému průměru jejich středních hodnot. Jinými slovy,
zatímco jednotlivé náhodné veličiny mohou mít rozptyly velké, jejich
aritmetický průměr bude mít rozptyl malý. Aritmetický průměr dostatečně
velkého počtu nezávislých náhodných veličin (s omezeným rozptylem)
jakoby ztrácí charakter náhodné veličiny. Vysvětluje se to tím, že
odchylky jednotlivých veličin od jejich středních hodnot mohou být jak
kladné, tak i záporné, a v případě aritmetického průměru se tyto odchylky
vzájemně kompenzují.
117
Čebyševův zákon
velkých čísel
Je třeba si uvědomit, že z Čebyševovy formulace zákona velkých čísel
nevyplývá stabilita aritmetických průměrů jako experimentální skutečnost.
Z žádné matematické věty logicky neplyne ten či onen výsledek
experimentu, protože nikdy nelze v praxi zaručit splnění všech podmínek
věty.
Nyní ukážeme použití věty 8.4 (speciálně jejího důsledku) v praxi. Při
měření nějaké fyzikální veličiny se obvykle postupuje tak, že se provede
několik měření a pak se určí aritmetický průměr, který se považuje za
hledanou hodnotu měřené veličiny. Čebyševova formulace zákona velkých
čísel říká, že tento způsob měření je správný v tom případě, kdy jsou
splněny následující podmínky:
a) náhodné veličiny X 1 , X 2 , ..., X n , které reprezentují výsledky
jednotlivých měření, jsou po dvou nezávislé;
b) střední hodnoty všech uvažovaných náhodných veličin jsou stejné a
jsou rovny skutečné hodnotě fyzikální veličiny;
c) rozptyly všech náhodných veličin jsou omezeny jedním a týmž
číslem.
První požadavek bývá zpravidla splněn. Druhý požadavek bude splněn
tehdy, jestliže měření nejsou zatížena systematickými chybami, tj.
chybami, jež mají jednostranný charakter (totéž znaménko). Pro splnění
třetího požadavku je nutno, aby měřící přístroj zajistil určitou přesnost
měření, tj. omezenost rozptylů jednotlivých měření. Význam Čebyševovy
formulace zákona velkých čísel spočívá nejen v tom, že ukazuje správnost
popsaného způsobu měření, ale také v tom, že specifikuje podmínky, za
nichž může být tento způsob použit.
Příklad 8.3. Určete pravděpodobnost toho, že aritmetický průměr z 500
nezávislých měření udává skutečnou hodnotu měřené veličiny µ
s přesností 0,1, jestliže rozptyl jednotlivých výsledků měření nepřevyšuje
0,3.
Řešení. Nechť X 1 , X 2 , ..., X 500 jsou výsledky nezávislých měření,
přičemž
EX i = µ a DX i ≤ 0,3 pro i = 1, 2, ..., 500.
Pak s použitím Čebyševovy nerovnosti II. typu a vztahu (8.3) dostaneme
X 1 + X 2 + ... + X 500
X + X 2 + ... + X 500
1
− µ |≥ 0,1) ≤
D( 1
)≤
2
500
500
0,1
1 0,3
≤
= 0, 06.
0,12 500
P (|
Odtud plyne pro hledanou pravděpodobnost
P (|
X 1 + X 2 + ... + X 500
− µ |< 0,1) ≥ 1 − 0, 06 = 0,94.
500
Kontrolní úkoly
8.3. Kolik nezávislých měření je třeba provést, aby pravděpodobnost
toho, že aritmetický průměr z těchto měření udává hodnotu měřené
118
veličiny s přesností 0,3, byla rovna 0,99, jestliže rozptyl jednotlivých
výsledků měření nepřevyšuje 0,2?
8.4. Pravděpodobnost, že aritmetický průměr ze 400 nezávislých měření
udává hodnotu měřené veličiny s přesností ε , je rovna 0,80. Určete
hodnotu ε za předpokladu, že rozptyl jednotlivých výsledků měření
nepřevyšuje 0,04.
8.4. Zákon velkých čísel v Bernoulliově tvaru
V tomto odstavci se budeme zabývat jinou, velmi významnou formulací
zákona velkých čísel.
Věta 8.5 (zákon velkých čísel v Bernoulliově tvaru).
Nechť náhodná veličina X udává počet nastoupení jevu A v n
nezávislých opakováních určitého pokusu a p pravděpodobnost nastoupení
tohoto jevu v každém jednotlivém pokusu. Pak pro náhodnou veličinu X/n
a libovolné reálné ε > 0 platí
⎛ X
⎞
P ⎜ − p < ε ⎟ → 1 pro n → ∞.
⎝ n
⎠
Důkaz. Zavedeme náhodné veličiny X i , které udávají počet nastoupení
jevu A v i-tém pokusu, i = 1, 2, ... n. Zřejmě platí
1
X = X 1 + X 2 + ... + X n ; EX i = p; DX i = p(1 − p) ≤ .
4
Odtud
E(
X
⎛1 n
⎞ 1 n
) = E ⎜ ∑ X i ⎟ = ∑ EX i = p ,
n
⎝ n i =1 ⎠ n i =1
D(
X
⎛1 n
⎞ 1
) = D⎜ ∑ Xi ⎟ = 2
n
⎝ n i =1 ⎠ n
n
∑ DX
i =1
i
=
np (1 − p ) 1
≤
→ 0 pro n → ∞,
4n
n2
takže Bernoulliova formulace je pouze jednoduchým speciálním případem
formulace Čebyševovy.
‫‮‬
Věta 8.5 tvrdí toto: Roste-li počet nezávislých pokusů, pak relativní
četnost nastoupení jevu A v sérii těchto pokusů konverguje podle
pravděpodobnosti ke konstantě p, tj.
X P
⎯⎯
→ p pro n → ∞.
n
Praktický význam Bernoulliovy formulace zákona velkých čísel je
v tom, že můžeme odhadnout pravděpodobnost nastoupení uvažovaného
jevu v jednom pokusu relativní četností tohoto jevu při realizaci velkého
počtu nezávislých pokusů.
Pro ověření Bernoulliovy formulace bylo provedeno mnoho rozsáhlých
sérií pokusů (házení mincí, házení hracími kostkami, rozdávání karet
apod.). Výsledky těchto experimentů vykázaly vždy velmi dobrou shodu
s teorií.
119
Bernoulliův zákon
velkých čísel
Část pro zájemce
Vedle konvergence podle pravděpodobnosti se zavádí také konvergence
skoro jistě (konvergence s pravděpodobností 1). Posloupnost náhodných
veličin X 1 , X 2 , ..., X n , ... konverguje skoro jistě (s pravděpodobností 1)
k náhodné veličině X, jestliže platí
⎛∞ ∞ ∞ ⎛
1 ⎞⎞
⎛
⎞
P ⎜ lim X n = X ⎟ = P ⎜ ∩∪ ∩ ⎜ X n − X ≤ ⎟ ⎟ = 1.
k ⎠⎠
n →∞
⎝
⎠
⎝ k =1 N =1 n = N ⎝
s. j.
X.
Taková konvergence se označuje znakem X n ⎯⎯→
S použitím právě zavedené konvergence se pak formulují tzv. silné zákony
velkých čísel. Např. silný zákon velkých čísel pro aritmetické průměry
(obdoba speciálního případu Čebyševovy formulace zákona velkých čísel)
lze formulovat takto:
Nechť X 1 , X 2 , ..., X n , ... je posloupnost nezávislých náhodných veličin se
stejným rozdělením. Nechť pro všechna n
( n = 1, 2, ...)
existují střední
hodnoty EX n = µ a rozptyly DX n = σ2 > 0. Pak pro tuto posloupnost platí
1 n
⎛
⎞
P ⎜ lim ∑ X k = µ ⎟ = 1.
⎝ n→∞ n k =i
⎠
Další podrobnosti o konvergenci skoro jistě a silných zákonech velkých
čísel naleznete např. v učebnici [17].
Pojmy k zapamatování:
• Čebyševova nerovnost I. typu
• Čebyševova nerovnost II. typu
• konvergence podle pravděpodobnosti (slabá konvergence)
• konvergence podle pravděpodobnosti k nule
• konvergence podle pravděpodobnosti k dané konstantě (náhodné
veličině)
• Čebyševova formulace zákona velkých čísel
• Bernoulliova formulace zákona velkých čísel
Shrnutí:
Úvodní část této kapitoly pojednává o Čebyševových nerovnostech I. a
II. typu. Následuje zavedení pojmu konvergence posloupnosti náhodných
veličin podle pravděpodobnosti k nule, resp. k dané konstantě či dané
náhodné veličině. S využitím takto zavedené konvergence jsou
formulovány dva nejvýznamnější zákony velkých čísel (Čebyševova a
Bernoulliova formulace zákona velkých čísel).
120
9. CENTRÁLNÍ LIMITNÍ VĚTA
Tato kapitola je koncipována tak, že po jejím prostudování:
pochopíte podstatu různých formulací centrální limitní věty,
seznámíte se s nejobecnější formulací centrální limitní věty
(Ljapunovovou větou) a dvěma v praxi nejužívanějšími
formulacemi této věty (integrální i lokální MoivreovouLaplaceovou větou),
• naučíte se využívat centrální limitní věty při řešení úloh týkajících
se náhodných veličin s binomickým rozdělením,
• poznáte tzv. pravidlo 3 σ , jež má významné uplatnění
v matematické statistice.
•
•
Tato kapitola je pro samostatné studium zřejmě nejobtížnější.
Poznáte v ní jednu ze stěžejních vět teorie pravděpodobnosti – centrální
limitní větu. Věnujte maximální úsilí tomu, abyste pochopili její
„filozofickou“ podstatu formulovanou na konci úvodního odstavce 9.1.
Pak už byste neměli mít problémy s jejími četnými aplikacemi.
9.1. Laplaceův div
Uvažme n sdruženě nezávislých náhodných veličin X 1 , X 2 , ..., X n ,
které mají identická rozdělení se střední hodnotou µ a rozptylem σ 2 ,
takže platí
n
E( X 1 + X 2 + ... + X n ) = ∑ EX i = nµ ,
i =1
n
D( X 1 + X 2 + ... + X n ) = ∑ DX i = nσ 2 .
i =1
Vytvoříme nyní novou náhodnou veličinu (tzv. normovaný součet) U n
s použitím vztahu
Un =
( X1 + X 2 +
... + X n ) − nµ
σ n
.
Lze dokázat, že veličina U n má pro dostatečně velká n následující
vlastnosti:
a) U n má přibližně normované normální rozdělení, což značí, že pro její
hustotu platí
f (u ) ≈
1 −u 2 2
e
2π
pro − ∞ < u < ∞.
121
b) Pravděpodobnost, že náhodná veličina U n nabývá hodnoty z intervalu
〈 a, b) je dána přibližným vzorcem
1
P (a ≤ U n < b) ≈
2π
b
∫e
− x2 2
dx = Φ (b) − Φ (a ),
(9.1)
a
kde Φ značí Laplaceovu funkci (viz vztah (7.2)).
Laplaceův div
Vztah (9.1) platí bez omezení pro diskrétní i spojité náhodné veličiny
X i , i = 1, 2,..., n, a je matematickým vyjádřením tzv. Laplaceova divu,
jehož podstata spočívá v tom, že normovaný součet nezávislých
náhodných veličin s libovolným, ale přitom identickým rozdělením má za
uvedených podmínek přibližně normované normální rozdělení.
V této kapitole se budeme podrobněji zabývat některými, z praktického
hlediska nejvýznamnějšími formulacemi centrální limitní věty. Podstatu
všech možných formulací centrální limitní věty lze vyjádřit takto:
Jestliže náhodné veličiny X 1 , X 2 , ..., X n , jsou sdruženě nezávislé a mají
střední hodnoty EX i a rozptyly DX i , i = 1, 2, ..., n, pak náhodná veličina
X = X 1 + X 2 + ... + X n
má za dosti obecných předpokladů pro dostatečně velká n přibližně
normální rozdělení. Důkazy jednotlivých formulací jsou zdlouhavé a
nepřinášejí z metodického hlediska mnoho nového, nebudeme je proto
uvádět a odkážeme čtenáře na příslušnou literaturu.
9.2. Moivreova - Laplaceova formulace centrální limitní
věty
Nejprve uvedeme Moivreovu - Laplaceovu větu v integrálním tvaru.
Věta 9.1 (integrální Moivreova - Laplaceova věta).
Nechť náhodná veličina X udává počet úspěchů v sérii n nezávislých
Bernoulliových pokusů s konstantní pravděpodobností p dosažení úspěchu
v každém jednotlivém pokusu. Pak náhodná veličina ( X − np ) / npq, kde
q = 1 − p, splňuje pro n → ∞ limitní vztah
⎛ X − np
⎞
< x ⎟ → Φ ( x),
P⎜
⎜ npq
⎟
⎝
⎠
a to stejnoměrně vzhledem k x.
Důkaz nalezne čtenář v učebnicích [4,20].
Ñ
Poznámka. Veličinu X je možno pokládat za součet sdruženě
X 1 , X 2 , ..., X n ,
z nichž každá nabývá
nezávislých veličin
s pravděpodobností p hodnoty 1 a s pravděpodobností q = 1 - p hodnoty 0.
Integrální Moivreova - Laplaceova věta tedy říká, že při velkém počtu n
nezávislých náhodných pokusů konverguje distribuční funkce veličiny X
122
s rozdělením Bi(n, p) k distribuční funkci normálního rozdělení. Proto lze
v uvažovaném případě používat následující aproximace
⎛
⎞
X − np
< b ⎟ ≈ Φ (b) − Φ (a).
P⎜a ≤
⎜
⎟
npq
⎝
⎠
Uvedená aproximace není vhodná tam, kde jsou pravděpodobnosti p
velmi nízké ( p 0, 001) nebo naopak velmi blízké jednotce ( p 0,999 ).
V takových případech může vést navrhovaná aproximace k chybám
o velikosti řádově až stovky procent.
Příklady
9.1. Pravděpodobnost narození chlapce je
pravděpodobnost, že mezi 10 000 novorozenci bude
a) více děvčat než chlapců;
b) chlapců od 5 000 do 5 300 včetně?
0,515.
Jaká
je
Řešení. Počet narozených chlapců je náhodnou veličinou X, která má
zřejmě binomické rozdělení s parametry n = 10 000 a p = 0,515
(q = 0,485). Protože n je dostatečně velké a hodnoty pravděpodobností p,
q zhruba stejné, jsme oprávněni použít integrální Moivreovy - Laplaceovy
věty. Snadno spočteme np = 5 150, npq = 2 497,75.
a)
⎛ X − 5 150 5 000 − 5 150 ⎞
<
P ( X < 5 000) = P ⎜
⎟
⎜ 2 497,75
2 497,75 ⎟⎠
⎝
≈ Φ (−3) = 1 − Φ (3) 1 − 0,99865 = 0, 00135.
⎛ X − 5 150
⎞
< −3 ⎟
P⎜
⎜ 2 497,75
⎟
⎝
⎠
b)
⎛
⎞
X − 5 150
≤ 3 ⎟ ≈ Φ (3) − Φ (−3) =
P ⎜ −3 ≤
⎜
⎟
2 497,75
⎝
⎠
= 2Φ (3) − 1 1,99730 − 1 = 0,99730.
P (5 000 ≤ X ≤ 5 300)
9.2. Pravděpodobnost poruchy autobusu během sledovaného období je
0,2. Jak velký musí být počet autobusů, aby se během daného období
alespoň 50 z nich s pravděpodobností 0,9 vyhnulo poruše?
Řešení. Za náhodnou veličinu X považujeme počet autobusů, které se
v daném období vyhnou poruše. Tato veličina má binomické rozdělení
s parametry n (určujeme) a p = 0,8 (q = 0,2). S použitím integrální
Moivreovy - Laplaceovy věty dostaneme
⎛ X − 0,8n 50 − 0,8n ⎞
⎛ X − 0,8n 50 − 0,8n ⎞
P ( X ≥ 50) = P ⎜
≥
<
⎟ = 1− P ⎜
⎟≈
0,
4
n
0,
4
n
0,
4
n
0,
4
n
⎝
⎠
⎝
⎠
⎛ 50 − 0,8n ⎞
⎛ 50 − 0,8n ⎞
≈ 1− Φ ⎜
⎟ = Φ⎜−
⎟ = 0,9.
⎝ 0, 4 n ⎠
⎝ 0, 4 n ⎠
Z tabulky hodnot Laplaceovy funkce (viz příloha I) odečteme
123
−
a odtud spočteme n
50 − 0,8n
0, 4 n
1, 28
68.
Kontrolní úkoly
9.1. Pravděpodobnost, že součástka nevyhoví při kontrole spolehlivosti,
je 0,05. Určete pravděpodobnost toho, že při kontrole 100 součástek
nevyhoví:
• alespoň 5 součástek,
• méně než 5 součástek,
• 5-10 součástek.
9.2. Pravděpodobnost nastoupení jevu A v jednom pokusu je rovna
0,05. Kolik je nutno provést nezávislých pokusů, aby s pravděpodobností
0,8 jev A nastal nejméně pětkrát?
Uvažme náhodnou veličinu X ∼ Bi( n, p). Je zřejmé, že numerický
výpočet pravděpodobnosti P ( X = k ) podle vzorce (6,1) je při velkých
hodnotách n, k značně obtížný. K řešení uvedeného problému se využívá
následující věty.
Věta 9.2 (lokální Moivreova - Laplaceova věta). Nechť náhodná
veličina X značí počet úspěchů v sérii nezávislých Bernoulliových pokusů
s konstantní pravděpodobností p dosažení úspěchu v každém jednotlivém
pokusu. Pak pravděpodobnost P ( X = k ) splňuje pro n → ∞ limitní vztah
npqP ( X = k )
⎧ 1 ⎡ k − np ⎤ 2 ⎫
1
⎪
⎪
exp ⎨− ⎢
⎥ ⎬ → 1,
2π
⎪⎩ 2 ⎢⎣ npq ⎥⎦ ⎪⎭
a to stejnoměrně pro všechny hodnoty k, pro něž
(9.2)
( k − np )
npq leží
uvnitř nějakého konečného intervalu.
Důkaz je uveden např. v učebnici [4].
Ñ
Význam lokální Moivreovy - Laplaceovy věty spočívá tedy v tom, že
umožňuje rychle a jednoduše stanovit přibližné hodnoty uvažovaných
pravděpodobností pro binomické rozdělení.
V praxi se užívá vztahu (9.2) ve tvaru
P( X = k ) ≈
⎛ k − np ⎞
1
ϕ⎜
⎟,
npq ⎜⎝ npq ⎟⎠
kde ϕ značí hustotu veličiny s normovaným normálním rozdělením.
Příklad 9.3. Pravděpodobnost vyrobení zmetku je rovna 0,005. Jaká je
pravděpodobnost toho, že mezi 10 000 náhodně vybranými výrobky bude
právě 40 zmetků?
Řešení. Počet zmetků mezi 10 000 výrobky (náhodná veličina X) má
binomické rozdělení s parametry n = 10 000 a p = 0,005 (q = 0,995).
Spočteme np = 50, npq = 49,75,
124
k − np
10
=−
−1, 42.
npq
49, 75
K přibližnému určení hledané pravděpodobnosti užijeme lokální
Moivreovy - Laplaceovy věty
2
1
P ( X = 40) ≈
e −1,42 / 2 0, 0206.
49, 75.2π
Kontrolní úkol 9.3. Přístroj sestává z 1000 elektronických prvků.
Pravděpodobnost poruchy každého jednotlivého prvku v průběhu jednoho
roku je rovna 0,001 a nezávisí na stavu ostatních prvků. Určete
pravděpodobnost poruchy právě dvou prvků za rok.
9.3. Ljapunovova formulace centrální limitní věty
Nejobecnější formulace centrální limitní věty pochází od Ljapunova.
Věta 9.3 (integrální Ljapunovova věta). Nechť je dána posloupnost
sdruženě nezávislých náhodných veličin X 1 , X 2 , ..., X n ,..., které mají
střední hodnoty EX i = µi , rozptyly DX i = σ i2 a absolutní centrální
(
)
momenty třetího řádu E | X i − EX i |3 , i = 1, 2, ..., n, ... .
Označme
n
n
i =1
i =1
Bn2 = D( X 1 + X 2 + ... + X n ) = ∑ DX i = ∑ σ i2 .
Nechť je dále splněna podmínka (tzv. Ljapunovova podmínka)
1 n
∑ E | X i − EX i |3 → 0 pro n → ∞.
Bn3 i =1
(
)
(9.3)
Pak normovaná náhodná veličina
Un =
X 1 + X 2 + ... + X n − ( µ1 + µ 2 + ... + µ n )
Bn
splňuje vztah
P (U n < x) → Φ ( x) pro n → ∞,
a to stejnoměrně vzhledem k x.
Důkaz nalezne čtenář např. v učebnicích [4,16,20].
Ñ
Předpoklady Ljapunovovy věty jsou postačujícími podmínkami pro
platnost této věty, jsou však neobyčejně blízké k podmínkám nutným. Z
Ljapunovovy podmínky (9.3) lze odvodit, že
DX i
→ 0 pro n → ∞,
Bn2
tj., že rozptyl každé jednotlivé náhodné veličiny tvoří jen malou část
celkového rozptylu součtu X 1 + X 2 + ... + X n . Kdyby tomu tak nebylo,
např. kdyby se veličina X 1 měnila podstatně více než ostatní veličiny
125
X 2 , X 3 , ..., X n , pak by bylo rozdělení součtu X 1 + X 2 + ... + X n
v zásadě určeno veličinou X 1 . V takovém případě by nebyl důvod
očekávat, že součet X 1 + X 2 + ... + X n bude mít přibližně normální
rozdělení.
Ljapunovova podmínka (9.3) bývá při praktických aplikacích splněna
téměř vždy. Speciálně je splněna pro nezávislé náhodné veličiny
X 1 , X 2 , ..., X n s identickým zákonem rozdělení, které mají střední
hodnotu, rozptyl a absolutní centrální moment 3. řádu. Pak totiž existují
kladné konstanty c, d tak, že pro i = 1, 2, ..., n platí
DX i = c,
(
)
E | X i − EX i |3 = d .
V takovém případě
n
n
∑ E (| X
Bn2 = ∑ DX i = nc,
i =1
i =1
)
− EX i |3 = nd ,
i
a proto
1
Bn3
n
∑ E (| X
i =1
i
)
− EX i |3 =
nd
( nc )
32
→ 0 pro n → ∞.
Také v případě, kdy považujeme náhodné veličiny X 1 , X 2 , ..., X n za
přibližně „rovnocenné“, lze ukázat, že je Ljapunovova podmínka splněna.
Přibližnou rovnocennost náhodných veličin je možno vyjádřit
matematicky takto: Existují kladné konstanty c1 , c2 , d1 , d 2 tak, že pro i = 1,
2, ..., n platí
(
)
c1 ≤ DX i ≤ c2 , d1 ≤ E | X i − EX i |3 ≤ d 2 .
Odtud plyne
n
n
∑ E (| X
Bn2 = ∑ DX i ≥ nc1 ,
i =1
i =1
i
)
− EX i |3 ≤ nd 2 ,
takže
1 n
nd 2
E | X i − EX i |3 ≤
→ 0 pro n → ∞.
3 ∑
Bn i =1
(nc1 )3 2
(
)
Centrální limitní věta je z hlediska přírodovědce velmi dobrou větou
v tom smyslu, že zůstává v platnosti i při jistém porušení svých
předpokladů. Dokonce i její základní předpoklad o sdružené nezávislosti
veličin X 1 , X 2 , ..., X n lze dosti silně oslabit. Proto se všeobecně soudí, že
celkové chyby měření, které jsou úhrnem mnohých, částečně závislých,
částečně nezávislých faktorů, mají normální rozdělení.
Příklad 9.4. Přístroj se skládá z 50 částí, jež nezávisle na sobě mohou
mít poruchu. Bylo zjištěno, že střední hodnoty a rozptyly počtu poruch
jednotlivých částí během jistého časového intervalu (tj. náhodné veličiny
X 1 , X 2 , ..., X 50 ) jsou EX i = 0, 05i, DX i = 0, 02i pro i = 1, 2, ..., 50. Jaká je
126
pravděpodobnost toho, že celkový počet poruch částí přístroje během
uvažovaného časového intervalu bude menší než 74?
Řešení. Náhodná veličina X představující celkový počet poruch částí
přístroje je dána součtem sdruženě nezávislých veličin X i pro
50
i = 1, 2, ..., 50, tj. X = ∑ X i .
i =1
Předpokládejme, že každá z veličin X 1 , X 2 , ..., X 50 má absolutní
centrální moment 3. řádu. Pak jsou předpoklady Ljapunovovy věty zřejmě
splněny. Proto lze neznámé rozdělení veličiny X nahradit normálním
rozdělením se střední hodnotou
50
EX = ∑ EX i = 0, 05.
i =1
50
.(50 + 1) = 63, 75
2
a rozptylem
50
DX = ∑ DX i = 0, 02.
i =1
50
.(50 + 1) = 25,5.
2
Pro hledanou pravděpodobnost dostaneme
⎛ X − 63, 75 74 − 63, 75 ⎞
<
P ( X < 74) = P ⎜
⎟
⎜
25,5
25,5 ⎟⎠
⎝
≈ Φ (2, 03) 0,97882.
⎛ X − 63, 75
⎞
< 2, 03 ⎟ ≈
P⎜
⎜
⎟
25,5
⎝
⎠
Kontrolní úkol 9.4. Náhodná veličina Y je aritmetickým průměrem
3200 sdruženě nezávislých náhodných veličin, které mají identická
rozdělení se střední hodnotou EY = 3 a rozptylem DY = 2. Určete
pravděpodobnost toho, že veličina Y nabude hodnoty v mezích od 2,95 do
3,075.
9.4. Užití centrální limitní věty
Centrální limitní věta se obvykle aplikuje podle následujícího schématu
(viz řešení příkladů 9.1 a 9.4). Je třeba určit pravděpodobnost toho, že
součet S n = X 1 + X 2 + ... + X n nabude hodnoty ležící v některém
nedegenerovaném intervalu a, b , tj. hodnotu P(a ≤ Sn ≤ b). Při řešení
této úlohy postupujeme takto:
1. ověříme předpoklady centrální limitní věty;
2. určíme číselné charakteristiky náhodné veličiny Sn , tj. ES n a DSn ;
3. vytvoříme normovanou náhodnou veličinu
Un =
S n − ES n
DSn
a použijeme zřejmé identity
127
⎛ a − ES n
b − ES n ⎞
≤ Un ≤
P (a ≤ S n ≤ b) = P ⎜
⎟;
⎜ DS
⎟
D
S
n
n ⎠
⎝
4. nahradíme pravou část této identity přibližným výrazem
⎛ b − ES n ⎞
⎛ a − ES n ⎞
Φ⎜
⎟−Φ⎜
⎟,
⎜ DS ⎟
⎜ DS ⎟
n ⎠
n ⎠
⎝
⎝
kde Φ značí Laplaceovu funkci.
Odhad chyby, které se dopouštíme při aproximaci skutečného rozdělení
náhodné veličiny Sn normálním rozdělením, se provádí jen výjimečně,
v podstatě pouze v čistě teoretických pracích.
Otázka k zamyšlení
Centrální limitní věty se v praxi využívá pro generování
pseudonáhodných čísel s normovaným normálním rozdělením N(0,1).
Přitom se vychází z předpokladu, že je k dispozici generátor
pseudonáhodných čísel s rovnoměrným rozdělením na intervalu 0,1 .
Dokázali byste navrhnout příslušný algoritmus?
A. Pravidlo 3σ
Jestliže zvolíme konstanty a, b tak, aby platilo
a = ESn − 3 DSn = ESn − 3σ Sn ,
b = ES n + 3 DS n = ES n + 3σ Sn ,
pak
P (a ≤ Sn ≤ b) = P (| S n − ESn |≤ 3σ Sn ] ≈ Φ (3) − Φ (−3) = 2Φ (3) − 1 0,99730.
Pravidlo 3σ
Můžeme tedy prakticky s jistotou tvrdit, že se hodnoty náhodné veličiny
Sn liší od její střední hodnoty ESn nejvýše o 3σ Sn . Uvedené tvrzení je
známo pod názvem „pravidlo 3 σ ". Toto pravidlo však platí striktně jen
pro náhodnou veličinu se skutečně normálním rozdělením. Je-li
X ∼ N µ , σ 2 , pak lze s pravděpodobností 0,99730 očekávat, že hodnoty
(
)
veličiny X padnou dovnitř intervalu
µ − 3σ , µ + 3σ . Pravidlo 3σ se
významně uplatňuje při statistickém vyhodnocování experimentu.
B. Pravděpodobnost a relativní četnost
Pokusíme se zodpovědět otázku, do jaké míry se může relativní četnost
v rámci Bernoulliova schématu lišit od pravděpodobnosti p při daném
počtu pokusů n.
Nechť náhodná veličina X udává počet úspěchů v sérii n
Bernoulliových pokusů s konstantní pravděpodobností p úspěchu
v každém jednotlivém pokusu. S použitím integrální Moivreovy Laplaceovy věty dostaneme
128
⎛ X − np ε n ⎞
⎛ X
⎞
P ⎜ | − p |< ε ⎟ = P ⎜ |
|<
⎟≈
⎜
⎟
npq
pq
⎝ n
⎠
⎝
⎠
⎛ε n ⎞
⎛ ε n⎞
⎛ ε n⎞
≈ Φ⎜
⎟ − Φ⎜−
⎟ = 1 − 2Φ ⎜ −
⎟.
⎜ pq ⎟
⎜
⎜
pq ⎟⎠
pq ⎟⎠
⎝
⎠
⎝
⎝
1
Jelikož pro p + q = 1 zřejmě platí pq ≤ , můžeme psát
4
⎛ ε n⎞
X
⎛X
⎞
P ⎜ − ε < p < + ε ⎟ ≈ 1 − 2Φ ⎜ −
⎟ ≥ 1 − 2Φ −2ε n .
⎜
⎟
n
pq
⎝n
⎠
⎝
⎠
(
)
Známe-li tedy počet úspěchů X v sérii n Bernoulliových pokusů, můžeme
sestrojit interval
X
⎛X
⎞
⎜ − εα , + εα ⎟ ,
n
⎝n
⎠
který obsahuje neznámou hodnotu pravděpodobnosti p úspěchu
v jednotlivém pokusu, a to s libovolně velkou zadanou pravděpodobností
1 − α . K tomu je zapotřebí pouze určit εα ze vztahu
(
)
2Φ −2εα n ≤ α .
C. Aplikace na aritmetický průměr
Nechť X 1 , X 2 , ..., X n jsou sdruženě nezávislé náhodné veličiny se
střední hodnotou EX i = µ a rozptylem DX i = σ 2 , i = 1, 2, ..., n, a nechť
ε > 0. Aplikujeme-li centrální limitní větu (v integrální formě) na
aritmetický průměr veličin X 1 , X 2 , ..., X n , dostaneme
⎛ X + X 2 + ... + X n − nµ ε n ⎞
⎛ X + X 2 + ... + X n
⎞
P ⎜| 1
− µ |< ε ⎟ = P ⎜⎜ | 1
|<
⎟≈
n
σ ⎟⎠
σ n
⎝
⎠
⎝
⎛ ε n⎞
≈ 1 − 2Φ ⎜⎜ −
⎟⎟ .
⎝ σ ⎠
Např. pro ε n = 3σ je tato pravděpodobnost rovna 0,99730. Jestliže
interpretujeme X 1 , X 2 , ..., X n jako výsledky jednotlivých pozorování
(měření), pak limitní chyba záměny µ za ( X 1 + X 2 + ... + X n ) n je při
zadané hodnotě pravděpodobnosti nepřímo úměrná odmocnině z počtu
pozorování, tj. ε ∼ 1 n. Je zajímavé, že tento typ závislosti na počtu
pozorování platí skoro vždy. Někdy ovšem bývá lepší použít přesnějšího
měřícího přístroje, než očekávat, že se přesnost zvýší v důsledku většího
počtu pozorování.
Pojmy k zapamatování:
• Laplaceův div
• Ljapunovova věta
129
• integrální Moivreova-Laplaceova věta
• lokální Moivreova-Laplaceova věta
• pravidlo 3σ
Shrnutí:
Tato závěrečná kapitola poskytuje tři formulace centrální limitní věty:
především Ljapunovovu větu, která představuje formulaci nejobecnější,
dále integrální a lokální Moivreovu-Laplaceovu větu. Zvláštní pozornost je
přitom věnována aplikacím centrální limitní věty. Uvádíme jednak obecný
postup při použití centrální limitní věty v praxi, jednak některé speciální
aplikace, z nichž je pro Vaše další samostatné studium patrně
nejdůležitější pravidlo 3σ.
130
LITERATURA
[1]
Anděl, J. Matematická statistika. Praha: SNTL 1978.
[2]
Anděl, J. Základy matematické statistiky. [Preprint]. Praha: MFF UK 2002.
[3]
Feller, V. An Introduction to Probability Theory and Its Applications. Vol. 1. New
York Wiley 1950, Vol. 2. New York Wiley 1966.
[4]
Gnedenko, D. V. Kurs teorii verojatnostej. 5. vydání. Moskva: Fizmatgiz 1969.
[5]
Hajkr, O., Mičulka, B., Tošenovský, J. Pravděpodobnost a statistika. Ostrava:
vydavatelství VŠB 1986. 270 s.
[6]
Hebák, P, Kahounová, J. Počet pravděpodobnosti v příkladech. Praha: SNTL 1978.
[7]
Hellwig, Z. Elementy rachunku prawdepodobieňstva
Warszawa: Paňstvove wydawnictvo naukowe 1978.
[8]
Jarušková, D. Pravděpodobnost a matematická statistika 1. Praha: vydavatelství ČVUT
1999. 120 s.
[9]
Jurečková, J. Úvod do počtu pravděpodobnosti. Skriptum MFF UK. Praha: SPN 1978.
i statystyki matematycznej.
[10] Kolmogorov, A. N., Fomin, S. V. Základy teorie funkcí a funkcionální analýzy. Praha:
SNTL 1975.
[11] Komenda, S., Klementa, J. Analýza náhodného v pedagogickém výzkumu a praxi.
Praha: SPN 1981. 320 s.
[12] Komenda, S. Základy pravděpodobnostních a statistických metod v psychologickém a
pedagogickém výzkumu. Praha: SPN 1969. 174 s.
[13] Likeš, L., Machek, J. Počet pravděpodobnosti. MVŠT X. Praha: SNTL 1981.
[14] Pluciňska, A., Pluciňski, E. Zadania z rachunku prawdopodobienstwa i statyatyki.
Warszava: Paňstvove vydavnictwo naukove 1978.
[15] Potocký, B., Kalas, J., Komorník, J., Lamoš, F. Zbierka úloh z pravdepodobnosti a
matematickej štatistiky. Bratislava: Alfa 1991. 392 s.
[16] Renyi, A. Teorie pravděpodobnosti. Praha: Academia 1972.
[17] Riečan, B., Lamoš, F., Lenárt, C. Pravdepodobnosť a matematická štatistika.
Bratislava: Alfa 1984. 320 s.
[18] Štěpán, J. Teorie pravděpodobnosti. Praha: Academia 1987. 448 s.
[19] Štěpán, J., Machek, J. Pravděpodobnost a statistika pro učitelské studium. Praha: SPN
1985. 240 s.
[20] Tutubalin, V. N. Teorie pravděpodobnosti. Praha: SNTL 1978.
[21] Vilenkin, N. J. Kombinatorika. Praha: SNTL 1977.
131
132
132
Příloha I.
Distribuční funkce normovaného normálního rozdělení (Laplaceova funkce)
u
1
exp(− x 2 / 2)dx.
Φ (u ) =
∫
2π −∞
7
8
9
0,0
u
0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392
0
1
2
3
4
0,52790
0,53188
0,53586
0,1
0,53983 0,54380 0,54176 0,55112 0,55567 0,55961 0,56356
0,56749
0,57142
0,57535
0,2
0,57926 0,58317 0,58796 0,59095 0,59483 0,59811 0,60257
0,60642
0,61026
0,61409
0,3
0,61791 0,62112 0,62552 0,62930 0,63307 0,63683 0,64058
0,64431
0,61803
0,65173
0,4
0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724
0,68082
0,68439
0,68193
0,5
0,69146 0,69497 0,69847 0,70194 0,10540 0,70884 0,11226
0,71566
0,71904
0,71240
0,6
0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537
0,74857
0,75115
0,75490
0,7
0,75804 0,76115 0,76421 0,76130 0,71035 0,71337 0,77637
0,77935
0,78230
0,78524
0,8
0,78814 0,79103 0,79389 0,19613 0,79955 0,80234 0,80511
0,80785
0,81057
0,81327
0,9
0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147
0,83398
0,83646
0,83891
1,0
0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543
0,85769
0,85993
0,86214
1,1
0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698
0,87900
0,88100
0,88298
1,2
0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617
0,89796
0,89973
0,90147
1,3
0,90320 0,90490 0,90658 0,90824 0,90988 0,91169 0,91309 0,91466.
0,91621
0,91774
1,4
0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786
0,92922
0,93056
0,93189
1,5
0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062
0,94179
0,94295
0,94408
1,6
0,94520 0,94630 0,94138 0,94845 0,94950 0,95053 0,95154
0,95254
0,95352
0,95449
1,7
0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080
0,96164
0,96146
0,96327
1,8
0,96407 0,96485 0,96562 0,96638 0,96112 0,96784 0,96856
0,96926
0,96995
0,97062
1,9
0,97128 0,97193 0,97257 0,97320 0,91381 0,97441 0,97500
0,97558
0,97615- 0,97670
2,0
0,97725 0,97178 0,97831 0,97882 0,97932 0,97982 0,98030
0,98077
0,98121
0,98169
2,1
0,98244 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461
0,98500
0,98537
0,98574
2,2
0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809
0,98840
0,98870
0,98899
2,3
0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086
0,99111
0,99134
0,99158
2,4
0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305
0,99324
0,99343
0,99361
2,5
0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477
0,99492
0,99506
0,99520
2,6
0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609
0,99621
0,99632
0,99643
2,7
0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711
0,99720
0,99728
0,99736
2,8
0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788
0,99795
0,99801
0,99807
2,9
0,99813 0,99819 0,99825 0,99831
0,99841 0,99846
0,99851
0,99856
0,99861
3,0
0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889
0,99893
0,99896
0,99900
3,1
0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921
0,99924
0,99926
0,99929
3,2
0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944
0,99946
0,99948
0,99950
3,3
0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961
0,99962
0,99964
0,99965
3,4
0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973
0,99974
0,99975
0,99916
3,5
0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981
0,99982
0,99983
0,99983
3,6
0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987
0,99988
0,99988
0,99989
3,7
0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992
0,99992
0,99992
0,99992
3,8
0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994
0,99995
0,99995
0,99995
3,9
0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996
0,99996
0,99997
0,99997
4,0
0,99997 0,99997 0,99997 0,99997 0,99997 0,99997 0,99998
0,99998
0,99998
0,99998
4,1
0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998
0,99998
0,99999
0,99999
1,2
0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999
0,99999
0,99999
0.99999
4,3
0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999
0,99999
0,99999
0,99999
4,4
0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000
1,00000
1,00000
1,00000
0,998 6
5
6
133

Podobné dokumenty

Zajimave ulohy z fyziky

Zajimave ulohy z fyziky Když už Křemílek s Vochomůrkou měli na potoce jezírko, vyrobili si jedno užitečné zařízení, jehož název je ukryt v tajence. Až ho odhalíte, napište, k čemu toto zařízení Křemílek a Vochomůrka použí...

Více

ponuka na predaj - jún 2013 - Štátna vedecká knižnica v Banskej

ponuka na predaj - jún 2013 - Štátna vedecká knižnica v Banskej Kádár,J. Jeníček,V. Jeníček,V. Šusta,A. Chovanec,J. Chovanec,J. Vaněk,V. Malpass,E. Stingl,M. Clarke,K. Doolaard,A. Doolaard,A. Lenin,V.I. Loukotka,J. Potužník,V. Pohunek,M. Osterloff,W.K. Pechlát,...

Více

Neuronové sítě jako modely analogových výpočtů

Neuronové sítě jako modely analogových výpočtů článek [3] ve své úvodní části obsahuje přehled výsledků o časové složitosti učení neuronových sítí. Navíc níže v kapitole 4 začleníme výsledky disertace do kontextu celkového výzkumu ve výpočetní ...

Více

Dva texty k článku P. Miškovského Úvod do studia matematiky

Dva texty k článku P. Miškovského Úvod do studia matematiky aktérů. Oba tyto uvedené příklady jsou ukázkou toho, že kolem nás je mnoho jevů ovlivněných mnoha okolnostmi, které se v podstatě ani nedají matematicky vyjádřit. Kromě popsaných situací se můžeme ...

Více