Náhodný výběr a statistika - Math and Stats Support Centre

Transkript

Náhodný výběr a statistika - Math and Stats Support Centre
Náhodný výběr a statistika
I
Náhodný výběr
Začněme příkladem. Chceme získat informace o platech v ČR, např. průměrný plat nebo nás
zajímají rozdíly mezi platy mužů a žen. Za tímto účelem je potřeba sesbírat data - ptát se
jednotlivých občanů na jejich plat. Samozřejmě, že když se zeptáme všech, budeme naprosto
přesní a budeme mít kompletní informace. Jenže tento postup je dost nákladný a dost obtížně
proveditelný. Proto z celku všech lidí zvolíme náhodně pouze některé – čímž získáme náhodný
výběr.
Nový pojem: Náhodný výběr
Náhodný výběr je uspořádaná n-tice náhodných veličin X1 , X2 , . . . , Xn , které jsou stochasticky nezávislé a mají stejné rozdělení.
Upořádaná n-tice proto, abychom ji mohli zapsat do sloupcového vektoru (pokud se jedná
o vícerozměrné rozdělení, tak do matice). Realizací náhodného výběru jsou pak konkrétní hodnoty, které značíme malými písmeny x1 , x2 , . . . , xn . Rozsah náhodného výběru je n.
Interpretační poznámka. Rozdělení, které mají náhodné veličiny X1 , X2 , . . . , Xn musí být stejné, ale nepotřebujeme jej konkrétně znát. Důležitý předpoklad je dostatečná nahodilost –
zkoumáme-li výšku příjmů vysokoškoláků, nestačí poptat se svých spolužáků. Je třeba zahrnout
všechny vysoké školy nebo změnit studii na „Výška příjmů mých spolužáků“ .
Podle toho, na jaké otázky hledáme odpověď, můžeme rozlišit dva směry statistiky:
• Statistická indukce (inference) – podle informací z náhodného vyběru vyslovíme závěry o
celém základním souboru, odhadneme parametry rozdělení, ze kterého data pochází apod.
V našem příkladě přejdeme od průměrného platu v získaném výběru k střední hodnotě
platu v celé populaci.
• Testování hypotéz – hledáme odpovědi na otázky, které se váží k populaci, například „Je
průměrný plat v ČR vyšší, než 25 000 Kč?“ nebo „Liší se průměrný plat mužů a žen v
ČR?“ .
Protože ale pracujeme s náhodnými výběry a ne celým základním souborem informací, dopouštíme se chyby. Pro statistiku je důležité umět tuto chybu kvantifikovat – takto umíme určit,
která metoda je lepší. Obvykle chyba, se kterou pracujeme klesá s rostoucí velikostí náhodného
výběru n. V praxi je důležitý výpočet velikosti náhodného výběru (sample size estimation) při
návrhu studie. Náhodný výběr musí být dostatečně velký, aby riziko chyby bylo malé (obvykle
5%), na druhou stranu získat pozorování může být dosti nákladné.
II
Statistika?
Slovo statistika má dva významy. První, známější, je věda, která získává informace z dat. Druhý
význam, se kterým budeme často pracovat, je statistika jakožto funkce.
Handout
1
Statistika 2
II. kapitola
II. Základní pojmy matematické statistiky
Math & Stats
Support Centre
Nový pojem: Statistika
Statistika je libovolná funkce náhodného výběru.
Interpretační poznámka. To znamená, že je to nějaká formulka, do které dosadíme hodnoty,
které jsou obsaženy v náhodném výběru. Takže se tam vyskytují náhodné veličiny Xi (při
samotném výpočtu dosazujeme ale realizace xi – naměřené hodnoty) a možná taky n – velikost
náhodného výběru.
Dále je uveden seznam některých často používaných statistik (jejich podrobnému vysvětlení
jsou věnovány samostatné materiály).
Rozmyslete si, že každá z níže uvedených náhodných veličin je statistika, tedy funkce náhodného
výběru.
V následující tabulce vždy uvažujeme náhodný výběr X1 , X2 , . . . , Xn , rozsah je tedy n.
název
výběrový průměr
medián
modus
výběrový rozptyl
výběrová směrodatná
odchylka
výběrová kovariance
výběrový korelační
koeficient
empirická distribuční
funkce v bodě x
Handout
značení
X̂
S2
S
výpočet
P
M = ni=1 Xni
Prostřední hodnota uspořádaného náhodného výběru
pro n liché, jinak aritmetický průměr dvou
prostředních hodnot.
Nejčetnější hodnota náhodného výběru.
Pn
1
2
S 2 = n−1
i=1 (Xi − M )
√
S = S2
S12
R12
Pn
1
S12 = n−1
i=1 ((Xi − M1 )(Yi − M2 ))
S12
R12 = S1 S2
F (x)
F (x) =
M
X0,5
card{i,Xi ≤x}
n
2
Statistika 2
II. kapitola

Podobné dokumenty

Zatížení letounu - Ústav letadlové techniky

Zatížení letounu - Ústav letadlové techniky Použití: náběžné hrany křídel, centroplán (např. MIG-29)

Více

ponsse activeframe

ponsse activeframe nízko (na úrovni nápravy). Tím jsou otřesy kabiny eliminovány tak efektivně, jak je to jen možné.

Více

Prezentace Ivlev

Prezentace Ivlev obtížné porozumět

Více

czech version 2014 / 2015

czech version 2014 / 2015 Ideální pro rodiny s dětmi Stylově vybavená koupelna s vanou nebo sprchovým koutem Zdobné stropní štuky Postel velikosti „king size“ (možnost oddělených postelí)

Více

prezentace a grafické objekty

prezentace a grafické objekty na záložce Velikost nastavujeme velikost obrázku, tlačítkem Obnovit se – v případě, že je obrázek větší než šířka nebo výška stránky nebo byl zmenšen – obrázek vrátí do původních rozměrů. Měřítko (...

Více

King Meter - Elektrokola

King Meter - Elektrokola 0-3 nebo 1-3: PAS1 také ukazuje, ECO, PAS2 také ukazuje TOUR, PAS3 také ukazuje BOOST. 0-5 nebo 1-5: PAS1 také ukazuje, ECO, pAS2 také ukazuje CITY, PAS3 také ukazuje TOUR, PAS4 také ukazuje POWER,...

Více

Vyšetření slzného filmu - THE VISION CARE INSTITUTE®, LLC

Vyšetření slzného filmu - THE VISION CARE INSTITUTE®, LLC lze zaznamenat rychlé odpařování slz. Situace se může zhoršit, když pacient plně nemrká, neboť to brání tomu, aby se celá čočka náležitě zvlhčila. Postupně vede nahromadění usazenin na povrchu RGP ...

Více

Základní operace s maticemi Determinant matice °ádu 2 × 2

Základní operace s maticemi Determinant matice °ádu 2 × 2 Základní operace s maticemi Determinant matice °ádu 2 × 2 Kaºdá £tvercová matice m·ºe být charakterizována £íselnou hodnotou, kterou nazýváme determinant. Determinanty jsou uºite£né nap°. p°i studi...

Více

LESSON SEVENTEEN: REVISION UNIT 2 1. Hello song 2. Captain

LESSON SEVENTEEN: REVISION UNIT 2 1. Hello song 2. Captain What have you got for us, Captain Jack? Pencil cases! Here you are! What´s in your pencil case? A pencil, a crayon, a rubber! 3. Can I have …? Učitel se ptá svých žáků dle obsahu jejich pouzder: Ca...

Více