Příručka

Transkript

Příručka
107,23 102,05 95,47
87,98 107,77 95,73 102,54 89,07 109,17 84,26 117,30 97,00 123,96 114,06 98,39 100,62 97,54
108,15 107,62 111,14 120,81 95,11 106,76 91,63 108,03 108,14 113,42 91,35
100,27 102,89 91,55
83,73
93,70 119,10 93,60 106,41 108,06 102,76 89,28 103,38 99,44 108,57 92,73
91,62

PRO ZPRACOVÁNÍ
A ANALÝZU DAT
88,52 107,81 74,08 85,47 92,51 94,23 87,37 109,44 97,52
107,51 110,78 97,77 103,43 113,07 118,80 114,90 110,41 96,95
84,25 106,11 102,52 98,26 100,58 95,26
91,35 104,01 110,17 102,64 104,50 100,91 80,39
110,96 95,30 104,17 112,68 91,53 115,67 106,98 107,29 94,16 120,47 98,31
96,02
92,14 106,97 92,42
Příručka
97,56
105,00 88,25
96,79
94,57
85,42 103,73 115,97 101,40 76,87 112,80 106,06 116,87 91,70
97,26 125,45 100,05 103,93 108,02 99,07
90,24
92,80
80,25
87,48
97,20
99,01 115,19 106,70 87,77
98,40
79,25 102,33 104,37 103,42 119,40 107,07 97,05
98,04 101,78 94,14 117,49 91,19
97,62
98,12
89,55
86,91 126,11 109,27 105,35 108,31 97,76
92,96
86,35
105,08 110,71 120,48 87,88 106,44 112,62 91,77
92,11
80,85 115,28 96,67
99,81 111,03 104,99 94,79 103,90 89,90 113,11 106,16 105,17 97,37
95,26 122,73 80,81
96,65 108,10 93,15
87,96
F-test
86,09 102,91
99,84 114,80 123,42 86,43
99,29
83,30 104,65 118,27 87,00
102,88 80,39
90,32 110,67 104,16 78,91 107,79 90,45
86,21
Soubor91,14
1
Soubor
2 84,67 113,28 96,22 109,11 127,48
97,57 118,79 90,98 102,83 96,46 106,26 87,21 100,42 95,07 100,03 100,87 117,38 107,65
106,25
117,06 113,40 97,16 107,91 104,91 101,02 109,86 103,64 108,06 104,62 118,79 90,90
85,76 119,19 90,38
90,07 108,81
hodnota 81,94
99,4911173
92,27stř. 116,61
87,5697,6875634
98,73 93,54 102,67 103,60 116,91 99,78
rozptyl
122,617713
98,31 124,96
102,23 101,21
92,47119,575281
98,06 109,11 101,36 103,18 96,98
96,70
104,81 92,34
pozorování
39
40 91,65 112,62 120,26 98,00
99,02 110,80 82,49 108,95 89,81 105,28 114,04 99,47 104,45 105,55 107,27
100,66 88,63 102,48
101,75
85,48
109,08 98,21
93,00
89,45
81,31 102,48 92,94
93,74
96,49
97,89
97,13
99,94 100,28 99,12
98,25
96,14
95,89
96,39 118,03 97,87 115,63 108,40 91,90
105,61 82,82
(1)
98,60 103,15 105,01 106,08 97,2510103,32 92,76 112,34 86,44 101,57 98,68P(F<=f)
83,12
97,27
99,81
98,12
94,71 103,64 94,45
107,51 faktor
96,57
92,29
98,73
98,34 109,64 113,09 108,11 110,55 91,35
5
92,22
87,99 součet
94,15 107,39
95,07 109,46 112,00S596,45
výběr 109,38 počet
průměr 89,53
rozptyl 94,46
S3 91,76
85,12 sloupec
100,151 103,38 106,20
89,20
115,28 88,36 103,53 103,35
39 3880,
154 115,29
99,49112 96,77
122,6177
sloupec 3
108,02 80,23
95,36
93,77 115,89 98,24
F krit (1)
94,93
39 3795,
477 97,31993
117,1737
088,88
91,20
109,71
95,93 90,89
1,70873449
97,38 104,92 200
91,27 104,05 92,73
14128,95
160
96,67
91,67
150 99,24
87,94 103,13
86,80 101,23 91,95
90,15
88,47 102,39 103,92 106,21 114,05 112,09
100
100
90,82 103,35 110,18 108,73
107,89 87,60 119,86 98,40 101,89
99,01
80
93,08 100,34 91,29
109,67 122,12 1113,16
86,88
40
98,23
116
99,44
96,23
99,72 106,55 101,07 103,82 103,75 98,94
100
40
95,88 102,16 78,68
20
84,08 105,21 111,78
92,62 102,55 102,22 106,76 110,48
50
40
89,64 110,10 102,86 105,34 87,17
98,48
95,31
95,06 115,29 104,51 109,21 98,48
0
79,42 104,46 99,73 100,51 96,13
60
111,40 99,23 109,62
81,50 113,96 88,94 113,73 115,63 106,03 104,93 114,65 97,94
98,71
98,59 102,79 84,05
60
83,38 116,15 111,58 102,26 110,77
114,89 105,64 106,72 105,20 89,93 102,11 100,29 103,47 106,34
20
93,84 1101,85
111,34 88,87 115,52 90,34 115,63 110,88 96,66
112,07 93,08 102,59
96,35
80
99,28
Četnost
240
114 111,46
122,8364 99,81
108,95 všechny
112,43výběry
101,1214003,35
100,28 107,64
220
77,34
99,08 101,67
85,47 113,80 91,68 107,22 88,86 105,43
90,10
89,01
86,35 105,75 98,60 118,33
104,65 82,52 103,22 111,89 115,61 90,50
110,25 95,83
82,17
93,28
114,14 86,29
90,36
95,20 104,16 107,50
92,28
90,40
98,47 112,37 102,21 109,59 103,55
98,22
93,95
Popisná statistika
102,36 110,26
98,9687
86,56 81,10
1,8055 110,51
100,07
99,6059
97,74 116,10 S1
98,27 92,38
99,44 100,71
1
2
#N/A 79,41
94,89 102,23 115,04 102,02 93,01 109,04
109,61 103,42 104,58 119,19
89,01 103,08 101,83 106,27
3 4 114,38
250 93,45 101,45 98,49 114,22 98,26 98,64 63,69 102,44 391,06 98,71 89,55 modus
5
97,12 118,10 83,57 108,55 112,71 103,05 97,15 108,23 95,06 101,56 102,90 107,48 98,87 109,68 94,75 89,64 103,88 111,66 91,47 290,62 104,97 96,19 102,81
109,16 96,24 111,36
sm. odchylka
11,4188 119,10
39 3882, 206 99,54374 128,7177
200 92,25 116,26 100,14 101,37 107,99 108,67 92,47
93,16 102,85 108,91
85,46
88,52
1 112,65 103,29 103,40 111,61 83,66 87,70
88,50
stř. hodnota
91,16 96,73 86,88 98,73 111,65 83,34 106,01 99,60 112,88 99,50 117,43 90,77 101,92 121,00 103,43 100,82
hodnoty 96,92
Plot
89,29 107,45 101,18 107,96 102,05 105,98 102,67 98,99 99,06 92,40 89,71 Norm
104,97al Probability
92,07 chyba
89,29 stř.
109,32
medián
92,62 106,27 97,58 102,39Histogram
102,57 97,51 102,61 92,02 83,54 105,26 4104,04 95,00 105,21 102,35 107,12 107,48
88,89 106,95 111,54 96,04 118,23 121,42 119,02 101,86 97,47
88,43
79,26
107,29 83,17 118,59 110,00 120,34 97,45
0, 3401632
92,84 102,95 95,15 118,17 sloupec
89,15 2 78,99
89,09
112,28 Zdroj
98,40variace
99,73 SS
91,84 rozdíl
93,91 101,66
93,25
MS 128,34
F 103,95
hodnota95,73
P
F krit
92,01 mezi
108,20
117,12 96,962Pareto
108,65
106,78
89,74
97,63
výběry87,30125,6075
62,80374 92,82
0,51128
0,601096
3,075854
180
93,36
1
96,91 117,99 sloupec
104,611 126,26 110,17
113,25 91,57 105,19 101,20 103,33 106,22 90,05
108,92 ANOV
108,24
77,29 108,00 98,45 106,59 107,81 80,26 113,65 116,96 89,87
A
celkem
91,95
Box
Whisker
Plot 89,13 118,67 100,94
99,78and
106,37
90,02
0,46857906
sloupec85,89
1 sloupec
2
97,22
89,07 100,93 102,94 117,28 109,20
96,04
105,99 112,00 83,86
99,88 102,61 96,32
91,92 100,98 91,54 106,31 103,30 94,22 104,82 98,72 114,85 96,56
97,90
107,04 sloupec
90,012 99,80
99,30
38
88,45 Funkce
99,54 dvou
99,92 prom
87,92ěnných
87,41 113,50 99,06rozdíl
111,07 91,55 103,50
91,3939 106,91 111,21 98,06 100,20 117,89 113,69 87,15 116,58
102,72 D281,13 100,20
D1
D3 86,27 95,11
1,02544365
Korelace
79,07 99,70F 105,86 91,25
110,27 91,35 116,56 91,55 112,68
107,08 111,50 97,46 107,74 101,49 86,03 X 99,19 102,18 112,02 102,78
92,69
83,41 107,89 98,27
Anova: jeden faktor
99,05 116,64
130
101,99 96,19
120
95,79 98,48
110
108,00 107,33
100
97,37 100,69
90
91,89 92,55
80
109,40 102,62
70
20
91,18
96,87 115,68 105,21 89,47 109,32 102,34 83,88 111,68 86,21
108,94 111,22 105,03
97,55 110,03 111,12 95,86 101,37 92,71
114,74 76,65
0
0
99,02
94,40
94,27 103,14 102,54 103,85 89,13
87,48
98,78 108,70 100,10 100,02 85,77
96,98
111,48 108,64 106,80 101,09 112,62 102,75 95,43
94,74
74,89 196,04 91,16 91,70 rozptyl
91,09 výběru
87,50
85,21 115,52 091,37 106,38 97,14 101,69
špičatost 90,27
89,10 110,29 96,93 113,49-1104,98 100,20 92,53 112,64 90,60
šikmost
103,97 108,49 92,86 115,11 105,23 113,48 103,53 102,58 100,81
-2
rozdíl max-min
98,42 65,74 92,42 102,01 96,94 92,64 95,42 85,25 101,81
-3
minimum
98,02 87,25 122,75 108,49 82,66 94,05 98,49 107,36 85,24
-4
maximum
97,11 98,30 87,80 84,08 103,23 87,14 89,05 94,03 110,86
70
90
110
93,72 117,01 93,98 106,94 87,24 93,70 106,49 součet
71,01 102,30
Value
80,17 120,72 91,94 107,52 102,69 111,52 91,67 102,91 92,05
90,95 102,90 90,14 119,70
88,40
Hodnota
91,83 114,29 90,27
98,77 117,49 96,55 102,25 90,53 109,16 98,35
90,92 116,85 87,53 106,20 94,99
95,26
97,05 105,33 87,78
98,22 108,47 100,49 107,82 103,25 99,24 126,97 108,86 70,87 108,52 85,58
98,22 102,01 82,72 101,30 100,73 103,65 104,71 93,80
84,13
96,27 114,72
82,16 102,52 76,90 107,13 99,52
Multiple of
84,60
92,25
94,51 102,58 117,19 99,78
85,28 106,34 113,68 122,55 103,54 98,04 111,12 104,69 113,47 114,04
Y
89,87
97,55
93,16
97,63 114,27 100,72 104,89 97,05
96,10 106,81 94,22
94,29 109,97 113,29 115,35 112,27 106,07 88,71 100,03 108,49 99,11
89,93 103,23 87,62
81,27
89,82 106,19 106,31 95,09 106,52 115,32 111,57 117,19 104,80 99,60
112,88 107,53 112,30 98,73
92,51
99,61
98,19 107,35 120,75 107,83 104,10 99,75 102,16 108,18 110,18 105,15 102,99 90,19 107,46 132,63 108,58 102,56 110,75 125,28 109,88 124,87 114,39
88,80 108,89 100,42 109,28 101,65 92,35
100,92 110,27 87,83 102,16 114,95 100,10 98,13
80,40
96,05 115,86 102,08 98,25 101,97 109,35 90,47 112,61 111,37
90,06 103,72 103,67
96,94 107,78 117,66 117,82 97,63POUŽITÍ
92,71 95,33 105,63 PROGRAMU
103,63 97,63 89,05 112,04 102,85
89,20 101,27 110,27 107,35
87,27 123,87 107,78 88,19 104,92
KURZ
PRAKTICKÉHO
Microsoft
EXCEL
87,43 103,72 99,67 98,04 77,89 112,71 98,60 97,92 106,56 100,98 88,75 108,64 107,78 94,27 93,12 100,18 111,19 85,48 97,81 106,23 96,86 83,82 101,65 105,79
104,74 84,73 100,68 109,03 93,54
94,64
90,43
90,95 103,67 103,29 97,74 110,06 95,00 101,02 104,44 93,68
86,43
94,26
85,85 111,54 102,50 89,46
98,70
98,41
95,52
89,10
počet
40,0000 110,74
96,69 119,09
93,15 100,21 128,52
98,16
80,68
3,6519 94,91
97,86
94,97 106,60 94,23 115,20 102,98 96,61 104,60 85,95 104,59 109,97
2.2 114,98 94,09
81,68 103,06 110,55 103,02
94,99
věrohodnost
(95,0%)
97,55 107,28
99,53
99,60 104,33 96,87 101,82 101,44 98,20 104,35 108,81 102,41
95,85 114,74 109,26 101,69 93,01 102,65 101,70 99,07
89,29
97,96 112,44
130,3900115,95
106,95 97,56
-0,5087 96,83
90,67 106,97 83,82
-0,0137
101,49 111,37 107,30
46,1525
98,76 103,47 102,30
78,5949
110,82 117,91 104,14
124,7474
104,94 91,01 92,82
130
86,38 3958,7484
124,12 95,66
99,12 117,23 83,62
82,36 103,53 87,79
91,55
99,91
98,54 107,74 102,83 105,63 114,90
76,19 111,89 93,73
95,52
88,48
96,88
88,62
Úvod
Microsoft, Visual Basic a Windows jsou registrované ochranné známky společnosti Microsoft
Corporation.
Tato příručka, a soubory na CD "Štatistické kurzy" jsou určeny pouze pro účastníky kurzu. Jiné
použití je možné po dohodě s firmou VPS s.r.o. .
V úvodě každého listu je navozen problém, který se týká vzorových dat a pak nástin řešení. Obvykle
v levé části listu je popsán postup použití příslušného nástroje a v pravé části další možnosti použití,
anebo interpretace výsledků (z prostorových důvodů může být toto rozdělení na některých listech
jiné).
Použití symbolů:
1
Příručka byla připravena pro potřeby kurzu praktického použití programu Microsoft® EXCEL pro
zpracování a analýzu dat. Příručka není učebnicí ani uživatelským manuálem programu Microsoft ®
EXCEL. Kurz je koncipován pro EXCEL 2002. Většina zpracovaných témat je platná také pro nižší
verze EXCELu.
V příručce jsou stručně a většinou názorným způsobem popsaná jednotlivá témata probírána v kurzu,
má tedy sloužit účastníkům kurzu pro rychlé připomenutí postupů použití některých nástrojů EXCELu,
nebo interpretace jejich výsledků.
Každé téma je zpracováno na jednom listu. V patě listu jsou informační údaje. Je zde odkaz na
vzorová data a také na soubor uživatelských funkcí, pokud si jej popisované téma vyžaduje. Pata listu
Úvod slouží pouze k vysvětlení významu informací.
2
!
pořadová čísla kroků postupu
důležitá upozornění
Použití písma:
Arial
Text, vzorce
Arial, Bold
Názvy nástrojů, nabídek, dialog. oken, funkcí a pod.
Courier New
Hodnoty v textu
Probírána témata jsou rozdělena do tří typů:
" informace, vysvětlení, teorie, nastavení
# standardní nástroje EXCELu
! nástroje vyžadující instalaci souboru *.XLA nebo speciální přípravu
Tato příručka byla připravena pomocí programu Microsof t® EXCEL 2002 pod operačním
systémem WINDOWS 98.
!
Značka pro typ listu / tématu
Zde je uveden název souboru, pokud
popsaný nástroj vyžaduje jeho instalaci.
Zde je uvedeno číslo listu, kde je návod jako popsaný
nástroj připravit (pokud není standardním nástrojem).
Název listu / tématu
!
UFU.XLA (16)
Krabicový diagram
Pata tohoto listu slouží jako příklad
!
Čísla listů se souvisejícími tématy
V případě, že je pro nástroj / téma běžně
používaný anglický název, je uveden zde.
(Box and Whisker Plot)
Číslo listu / tématu
Název souboru se vzorovými daty,
v závorkách je název příslušného listu.
KURZ1.XLS (Krab. dia.)
(7, 9)
1
Přepočet automaticky/ručně
Užitečná nastavení
Problém:
Řešení:
Zejména na pomalejších počítačích
mohou některé akce EXCELu probíhat
neúnosně dlouho.
Rychlost startu EXCELu se dá výrazně ovlivnit
počtem otevřených doplňků.
Při použití velkého množství funkcí nebo
rozsáhlých vstupních dat je vhodné nastavit
manuální ovládání výpočtů.
Přes nabídku Tools - Options otevřete dialogové okno Options - Calculation a označte Calculation
- Manual. Přepočet listu proběhne až po stisknutí klávesy F9. Nastavení se ukládá se sešitem. Po
startu nového sešitu EXCELu je vždy nastaveno Calculation - Automatic.
1
Otevření (zavření) doplnků (Add-Ins)
Přes nabídku Tools - Add-Ins otevřete dialogové okno Add-Ins. V okénkách zaškrtněte jen ty doplňky,
které opravdu potřebujete k práci. Zbytečně otevřené doplňky zpomalují start EXCELu a také zabírají
operační paměť počítače. Toto nastavení můžete kdykoli změnit.
1
2
!
Užitečná nastavení
(Add-Ins, Calculation)
2
2
Automatické řady a seznamy - přetažením v listu
1
2
3
4
5
6
7
8
9
10
11
12
13
A
B
C
120
130
140
150
160
170
180
190
200
pondělí
úterý
středa
čtvrtek
pátek
sobota
neděle
D
Problém:
Další možnosti
Časté vytváření různých seznamů bývá
zdlouhavé.
EXCEL se při těchto operacích chová inteligentně. Z hodnoty teplota1 dostanete řadu teplota1,
teplota2, ... . Příklady jsou na obrázcích.
Řešení:
EXCEL umí automaticky vytvářet seznamy podle
prvního členu, nebo aritmetickou řadu podle
prvních dvou členů.
Pokud nechcete vytvářet automatický seznam, ale pouze
kopírovat, podržte při tažení myší stisknuté tlačítko Ctrl
(objeví se malé znaménko +).
1
2
Vytvoření automatického seznamu v listu
1
Podobně můžete vytvářet řady a seznamy také v řádcích
2
3
Napište první dva členy
aritmetické řady a označte je.
Pak umístěte kurzor myši na
značku v pravém dolním rohu
označené plochy, až se objeví
křížek. Stiskněte levé tlačítko
myši a táhněte směrem dolů.
Po uvolnění tlačítka myši bude
označena oblast vyplněna členy
aritmetické řady.
Ikona v dolní části
řady nabízí menu
s dalšími
možnostmi pro
vytvořenou řadu.
3
Podobně vytvoříte i jiné řady
například názvy dnů týdne,
nebo názvy měsíců. V těchto
případech stačí napsat první
člen řady. Pokud se seznam
nevytvoří, doplňte jej do
rejstříku seznamů (list 4).
!
Automatické řady a seznamy - přetažením v listu
(4)
3
2
Přidání seznamu do rejstříku seznamů
A
1
2
3
4
5
6
7
8
9
10
11
12
13
B
helium
neon
argon
krypton
xenon
radon
C
Problém:
Časté vytváření různých seznamů které nejsou v
EXCELu standardní.
Řešení:
Přidejte potřebné seznamy do rejstříku seznamů.
Postup
Napište seznam na libovolné místo v listu a označte jej. Pak přes nabídku Tools - Options otevřete
dialogové okno Options. V něm zvolte záložku Custom Lists. Kliknutím na tlačítko Import se seznam
z listu přenese do rejstříku seznamů.
3
1
Nový seznam nyní můžete používat standardním způsobem.
!
Přidání seznamu do rejstříku seznamů (Custom List)
4
Zvolte Type - Growth a zaškrtněte Trend (v tom případě parametr Step value nemá vliv).
Automatické řady a seznamy - nástrojem Series
A
B
1
1,2
2
3
1,8
4
2,7
5
4,05
6
6,075
7 9,1125
8 13,6688
9 20,5031
10 30,7547
11 46,132
12 69,198
13
C
12.9.02
13.9.02
14.9.02
15.9.02
16.9.02
17.9.02
18.9.02
19.9.02
20.9.02
21.9.02
22.9.02
3
D
Problém:
Vytvořit geometrickou řadu s prvními dvěma členy
1,2 a 1,8 .
Vytvořit seznam pracovních dnů od 12.9.02
Řešení:
Pomocí nástroje Series můžete vytvářet
aritmetické, geometrické a kalendářní řady.
Vytvoření kalendářní řady
Vytvoření geometrické řady
Napište první datum řady, pak označte oblast, která má být vyplněná, včetně prvního data. Přes
nabídku Edit - Fill - Series otevřete dialogové okno Series. Zvolte Type - Date, Date unit Weekday, Step value 1.
Napište první dva členy řady, pak označte oblast, která má být vyplněná, včetně prvních členů. Přes
nabídku Edit - Fill - Series otevřete dialogové okno Series.
1
2
2
1
Pozor, Date unit Weekday v tomto případě znamená vyplnění oblasti
pouze pracovními dny, ne krok jeden týden. Ostatní jednotky
znamenají velikost kroku.
!
Pozor, při tomto postupu vytváření řad se
zkopírují také formáty prvních buněk.
!
Automatické řady a seznamy - nástrojem Řady (Series)
!
5
Pravidla
Databáze a tabulky
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
B
C
Reaktor A
DATUM
TYP
12.8.02 MC78L
13.8.02 MC78L
13.8.02 MA78
15.8.02 MA78
16.8.02 MA78
16.8.02 TL431
18.8.02 TL431
19.8.02 MA78
19.8.02 MA78
R
3,40
3,35
3,25
3,00
3,15
3,30
3,30
2,80
3,40
Reaktor B
DATUM
TYP
17.8.02 TL431
18.8.02 TL431
18.8.02 TL431
18.8.02 TL431
18.8.02 MC78M
18.8.02 MC78M
18.8.02 MC78M
18.8.02 MC78M
R
2,80
2,90
3,20
3,55
3,20
3,35
3,55
3,50
D
E
F
G
H
Databáze
DATUM
12.8.02
13.8.02
13.8.02
15.8.02
16.8.02
16.8.02
17.8.02
18.8.02
18.8.02
18.8.02
18.8.02
18.8.02
18.8.02
18.8.02
18.8.02
19.8.02
19.8.02
TYP
MC78L
MC78L
MA78
MA78
MA78
TL431
TL431
TL431
TL431
TL431
TL431
MC78M
MC78M
MC78M
MC78M
MA78
MA78
R
3,40
3,35
3,25
3,00
3,15
3,30
2,80
3,30
2,90
3,20
3,55
3,20
3,35
3,55
3,50
2,80
3,40
REAKT
A
A
A
A
A
A
B
A
B
B
B
B
B
B
B
A
A
Problém:
I
Uspořádat data co nejuniverzálnějším způsobem.
Řešení:
Existují jisté nesrovnanosti v pojmech TABULKA (TABLE), SEZNAM (LIST) a DATABÁZE
(DATABASE). V nápovědě EXCELu nejsou někdy rozlišeny. V této příručce budeme používat pojmy
TABULKA a DATABÁZE v tom smyslu, jako byly uvedeny zde, SEZNAM pak bude mít význam podle
listů Automatické řady a seznamy - ... .
!
1
2
3
4
5
6
7
8
9
10
11
12
13
A
B
C
D
DATUM
12.8.02
13.8.02
13.8.02
15.8.02
16.8.02
16.8.02
17.8.02
18.8.02
18.8.02
18.8.02
18.8.02
TYP
MC78L
MC78L
MA78
MA78
MA78
TL431
TL431
TL431
TL431
TL431
TL431
R
3,40
3,35
3,25
3,00
3,15
3,30
2,80
3,30
2,90
3,20
3,55
REAKT
A
A
A
A
A
A
B
A
B
B
B
Záhlaví (header) databáze
Záznamy (records) databáze
Databázi vytvářejte vždy ve svislém směru. Tedy
nahoře záhlaví, pod ním záznamy.
Pokud máte na jednom listu více databází, umístěte je
pod sebe.
Dbejte na to, aby databáze a tabulky byly vždy
ohraničeny prázdnými buňkami.
Používejte záhlaví.
sloupec - Pole (field) databáze
Při dodržení těchto pravidel vám budou dobře sloužit nástroje EXCELu určené na zpracování
databází, jako jsou Sort, Filter, Form, Subtotal, Pivot Table atd. .
Pro práci s databázemi a tabulkami je užitečné přidat do panelu nástrojů ikonu nástroje Výběr oblasti.
Pomoci této ikony vyberete rychle celou oblast tabulky nebo databáze.
Vytvořit databázi.
Na obrázku, ve sloupcích A, B, C, jsou dvě tabulky. Jedna pro reaktor A druhá pro reaktor B. Hodnoty
z tabulek můžete použít pro vyhodnocení reaktoru A nebo B.
Přes nabídku View - Toolbars z nabítky vyberte Customize.
Získáte dialogové okno
Customize. Označte záložku
Commands. Zvolte Edit a pak
z plochy Commands přesuňte
ikonu Select Current Region
na panel nástrojů.
Pro komplexní analýzu je výhodnější uspořádání dat tak, jako ve sloupcích E, F, G, H. Zde jsou stejná
data, ale je přidaný další sloupec REAKT, ve kterém je uvedeno zda data pocházejí z reaktoru A anebo
B. Z takto uspořádaných dat je možné získat ty samé výsledky, jako z předchozích tabulek, navíc, je
možné získat další informace.
Ve sloupcích E, F, G, H je vytvořena DATABÁZE (DATBASE).
Vytváření databází je výhodné, protože z databáze lehko vytvoříte libovolné tabulky (naopak je to
obtížné). Z databází je možné získat i další informace, které v separovaných tabulkách zanikají.
Pokud tedy chcete řešit specifický problém a data jsou získána pouze pro tento účel, vytvářejte
specifické tabulky. Ale pokud chcete data analyzovat, vytvořte databázi.
!
Databáze a tabulky
KURZ1.XLS (Dbaze)
6
Další možnosti
Automatický filtr (AutoFilter)
A
1 DATUM
2 2.9.02
3 2.9.02
4 3.9.02
5 3.9.02
6 3.9.02
7 4.9.02
8 4.9.02
9 4.9.02
10 5.9.02
11 5.9.02
12 5.9.02
13 5.9.02
14 6.9.02
15 6.9.02
16 7.9.02
17 7.9.02
18 8.9.02
19 8.9.02
20 8.9.02
21 8.9.02
22 9.9.02
23 9.9.02
24 9.9.02
TYP
MA78
MA78
MA78
MA78
TL431
TL431
MA78
MA78
MC79
MC79
MC79
MC79
MA78
MA78
TL431
MC79
MC79
MA78
MA78
MA78
MA78
MA78
MA78
C
D
T
15,00
15,33
14,60
14,88
14,98
14,90
15,08
14,90
14,80
14,83
14,98
14,88
15,10
15,03
14,65
15,55
15,43
15,18
15,13
15,48
15,30
15,25
15,18
R
3,60
3,25
3,30
3,45
3,30
3,30
3,25
3,35
3,15
3,30
3,35
3,35
3,55
3,35
2,90
3,35
3,25
3,35
3,35
3,30
3,50
3,55
3,35
1
Problém:
Automatický filtr můžete zrušit opět přes nabídku Data Filter - Autofilter.
Z databáze vybrat pouze řádky s typem MC79.
Volba položky Show All zruší všechny podmínky filtrace,
ale nezruší filtr.
Řešení:
Použití automatického filtru umožňuje rychle
skrýt řádky nevyhovující zadané podmínce.
Zruší všechny podmínky
v daném sloupci
Spuštění automatického filtru
Označte libovolnou buňku uvnitř databáze. Pak přes
nabídku Data - Filter - AutoFilter zapněte režim
filtrování.
V nejvyšším řádku databáze, nebo v záhlaví se objeví
tlačítka. Klikněte na tlačítko ve sloupci Typ. Otevře
se nabídka pro podmínky filtrace. Zvolte hodnotu
MC79. Filtr skryje všechny řádky, ve kterých hodnoty
buňek nevyhovují podmínce. Podobně můžete
přidávat podmínky do dalších sloupců.
Pokud chcete zobrazit data v určitém
intervalu, nastavte podmínky filtrace v
dialogovém okně Custom....
2
Otevře dialogové okno
vlastních podmínek
Volba operátora
Volba hodnoty
3
1
Podmínka pro
dolní hranici
intervalu
2
Podmínka pro
horní hranici
intervalu
3
4
Pokud před spuštěním filtru označíte nějakou oblast databáze (více jako jednu buňku), bude filtr
působit pouze na řádky označené oblasti a níže.
!
Automatický filtr skryje celé řádky, tedy i buňky mimo oblast databáze.
"
Automatický filtr
(AutoFilter)
KURZ1.XLS (Aut. filt.)
(6, 9)
!
7
2
Rozšířený filtr (Advanced Filter)
A
B
C
1
TYP
Odpor
2
MC79
=(C5+D5)/2>3,3
3
4 DATUM TYP
R1
5 2.9.02
MA78
3,40
6 2.9.02
MA78
3,30
7 3.9.02
MA78
3,40
8 3.9.02
MA78
3,50
9 3.9.02 TL431
3,30
10 4.9.02 TL431
3,40
11 4.9.02
MA78
3,20
12 4.9.02
MA78
3,40
13 5.9.02
MC79
3,30
14 5.9.02
MC79
3,40
15 5.9.02
MC79
3,50
16 5.9.02
MC79
3,50
17 6.9.02
MA78
3,60
18 6.9.02
MA78
3,40
19 7.9.02 TL431
3,00
MC79
3,60
20 7.9.02
21 8.9.02
MC79
3,10
22 8.9.02
MA78
3,50
MA78
3,70
23 9.9.02
24 9.9.02
3,40
D
R2
3,80
3,20
3,20
3,40
3,30
3,20
3,30
3,30
3,00
3,20
3,20
3,20
3,50
3,30
2,80
3,10
3,40
3,20
3,30
3,30
Filtrace zkopírováním hodnot - extrakce
Filtrace skrytím řádků
Oblast databáze včetně záhlaví databáze
E
Při použití rozšířeného filtru je vhodné
ponechat nad databází několik volných
řádků (3 a více) pro umístění podmínek
filtrace.
Oblast podmínek včetně záhlaví podmínek
Oblast do které bude umístěn výsledek
(pouze v případě extrakce)
!
Při použití rozšířeného filtru musí mít
databáze i oblast podmínek záhlaví
Výsledek v oblasti F5:I8
3
!
Problém:
Z databáze vybrat pouze řádky s typem
MC79 a průměrem R1 a R2 větším 3,3.
Řešení:
Rozšířený filtr EXCELu umožňuje
použití složitých podmínek obsahujících
matematické funkce. Umožňuje také
provést filtraci skrytím řádek, jako
automatický filtr, nebo překopírování dat
vyhovujících podmínce na jiné místo
listu.
Další možnosti
Porovnávací podmínka
Záhlaví stejné jako záhlaví příslušného
sloupce databáze
1
2
3
A
B
TYP
MC79
Odpor
C
=(C5+D5)/2>3,3
Mezi hodnotami v jednom
řádku platí operátor AND
Spuštění rozšířeného filtru
Napište podmínky filtrace (v příkladu buňky A1:B2). Označte libovolnou buňku uvnitř databáze, pak
přes nabídku Data - Filter - Advanced Filter otevřete dialogové okno.
1
K
Vzorec musí obsahovat aspoň jeden odkaz na buňku
databáze (C5, D5).
Hodnota, nebo hodnota s logickým operátorem.
Podmínka <>MC79 by zobrazila typy jiné jako MC79.
Mezi hodnotami v různých
řádcích platí operátor OR
D
E
F
1 DATUM TYP
2
4.9.02 MC79
3 Typ MC79 dne 4.9.02
J
1 DATUM
2 <4.9.02
3 >7.9.02
D
Odkazovací podmínka
Záhlaví musí být odlišné od záhlaví databáze.
L
G
DATUM
7.9.02
H
TYP Zobrazí všechny typy dne 4.9.02,
v ostatních dnech pouze typ MC79.
MC79
M
DATUM DATUM
Zobrazí dny 4.9.02 až 7.9.02
>=4.9.02 <=7.9.02
Vyloučí dny 4.9.02 až 7.9.02
Filtr v módu filtrace skrytím řádků skryje celé řádky, tedy i buňky mimo oblast databáze.
"
Rozšířený filtr
(Advanced Filter)
KURZ1.XLS (R. filt.)
(6,7, 9)
!
8
Graf s filtrovanými daty
Práce s filtrovanými daty
A
B
C
1 DATUM TYP
R
2 4.9.02 TL431
3,20
3 4.9.02
MA78
3,15
4 4.9.02
MA78
3,35
5 5.9.02
MC79
3,15
6 5.9.02
MC79
3,30
7 5.9.02
MC79
3,35
8 5.9.02
MC79
3,35
9
3,26
10
=AVERAGE(C2:C8)
11
12
13
14
15
D
Problém:
1
Chcete zobrazit pouze den 4.9.02 a vypočítat
průměr ze sloupce R také pouze pro tento den.
Při aplikaci automatického filtru na data bude
skryta i buňka C9 se vzorcem, protože ji filtr
považuje za data nevyhovující podmínce. V
případě, že oddělíte buňku se vzorcem od dat
prázdným řádkem, buňka se vzorcem skryta
nebude, ale protože funkce AVERAGE počítá i
se skrytými buňkami, výsledek nebude závislý
na podmínce filtru.
Pokud chcete, aby graf zobrazoval
pouze hodnoty, které jsou
výsledkem filtrace, skontrolujte
označení políčka Plot visible
cells only v záložce Chart.
Označte graf a přes nabídku Tools
- Options otevřete dialogové okno
Options. Objeví se záložka Chart.
Políčko Plot visible cells only
musí být označené.
Automatický filtr
2
Řešení:
A
12 DATUM
13 4.9.02
14 4.9.02
15 4.9.02
16 5.9.02
17 5.9.02
18 5.9.02
19 5.9.02
20
21
22
23
24
25
26
27
!
B
C
TYP
TL431
MA78
MA78
MC79
MC79
MC79
MC79
R
3,20
3,15
3,35
3,15
3,30
3,35
3,35
3,26
3,00
5,00
8,00
4,00
7,00
19,00
=SUBTOTAL(1;C13:C19)
SUBTOTAL(funkce, odkaz) je funkce umožňující
provádět výpočty s filtrovanými daty. Ignoruje všechny
skryté buňky a buňky s funkcí SUBTOTAL.
Chybí průměr
SUBTOTAL(funkce, odkaz):
Funkce je číslo od 1 do 11, které určuje typ
funkce použité pro výpočet. Například 1 znamená
průměr, 9 součet (nápověda funkce).
3
Funkce SUBTOTAL v buňce C20 bude počítat
pouze s hodnotami zobrazenými filtrem.
Funkce SUBTOTAL v buňce C27 ignoruje
hodnotu 8 v buňce C24, protože je výsledkem
jiné funkce SUBTOTAL.
=SUBTOTAL(9;C22:C23)
=SUBTOTAL(9;C22:C26)
Nástrojem Kopírovat - Vložit přenesete pouze
filtrem zobrazená data!
Práce s filtrovanými daty
!
Toto nastavení platí pro každý graf individuálně!
KURZ1.XLS (Filt. data)
!
(7, 8)
9
Souhrn (Subtotal)
Formuláře a souhrny (Form, Subtotal)
A
1 DATUM
2 4.9.02
3 4.9.02
4 4.9.02
5 6.9.02
6 6.9.02
7 7.9.02
8 7.9.02
9 8.9.02
10 8.9.02
11 8.9.02
12 8.9.02
13
B
C
D
TYP
TL431
MA78
MA78
MA78
MA78
TL431
MC79
MC79
MA78
MA78
MA78
T
14,90
15,08
14,90
15,10
15,03
14,65
15,55
15,43
15,18
15,13
15,48
R
3,30
3,25
3,35
3,55
3,35
2,90
3,35
3,25
3,35
3,35
3,30
Označte některou buňku databáze. Přes nabídku Data - Subtotals otevřete okno Subtotal.
Problém:
Zjednodušit zadávání nebo úpravy dat. Rychle
vypočítat průměry v jednotlivých dnech.
2
1
Vyberte sloupec, podle
kterého se má řídit
vytváření souhrnů.
Řešení:
Nástroj Form slouží ke zjednodušení úprav
databází.
Nástroj Subtotals vytvoří potřebné souhrnné
výpočty.
Vyberte funkci pro
souhrn.
Označte sloupce, do
kterých mají být
souhrny přidané.
Označte některou buňku databáze. Přes nabídku Data - Form vytvoříte formulář pro editaci
databáze. Pomocí formuláře můžete měnit údaje v jednotlivých záznamech, přidávat záznamy,
nebo je odstraňovat.
Odstraní všechny
souhrny.
2
1
3
Ovládací lišta přehledů
Pomocí ovládacích
prvků přehledů můžete
skrývat nebo
zobrazovat části
tabulky.
Pokud chcete vyhledat konkrétní
záznam, klikněte na tlačítko
Criteria, zapište hodnotu kterou
chcete vyhledat (nebo také
porovnávací operátor >3,3 a pod.) a
klikněte na tlačítko Find Prev
anebo Find Next.
!
Formuláře a souhrny
(Form, Subtotal)
KURZ1.XLS (Form)
10
4
Kontingenční tabulka (Pivot Table)
A
1 DATUM
2 6.9.02
3 6.9.02
4 6.9.02
5 6.9.02
6 6.9.02
7 7.9.02
8 7.9.02
9 8.9.02
10 8.9.02
11 8.9.02
12 9.9.02
13 9.9.02
14 9.9.02
15 9.9.02
16 9.9.02
17 9.9.02
18 6.9.02
19 6.9.02
20 6.9.02
21 7.9.02
22 7.9.02
23 7.9.02
24 7.9.02
25 9.9.02
26 9.9.02
27
B
C
D
TYP
MA78
MA78
MA78
MA78
MA78
MC79
MC79
MC79
MA78
MA78
MA78
MA78
MA78
MA78
MA78
MA78
MA78
MA78
MA78
MC79
MC79
MC79
MC79
MA78
MA78
REAKT
A
A
A
A
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
R
3,55
3,45
3,35
3,25
3,35
3,20
3,35
3,25
3,35
3,30
3,50
3,30
3,55
3,35
3,35
3,20
3,30
3,30
3,45
3,30
3,25
3,15
3,20
3,15
3,50
Kontingenční tabulka může být
vytvořena na novém listu.
Problém:
Sestrojit tabulku přehledu zpracování typů v
jednotlivých dnech.
Řešení:
Nástroj Pivot Table umožňuje vytvářet z
databází křížové tabulky.
Označte některou buňku databáze. Přes nabídku
Data - Pivot Table otevřete okno PivotTable and
PivotChart Wizard.
Kontingenční tabulka
5
1
Pro každý typ bude vytvořen sloupec.
Pro každé datum bude vytvořen řádek.
2
Ikonu přeneste
pomocí myši
6
3
!
Klikněte na tlačítko Layout a vyberte
oblast, ve které se má označený výběr
zobrazit nebo na tlačítko Finish a pak
vyberte oblasti zobrazení výběrů v
otevřeném okně Pivot Table Field
List.
(Pivot Table)
7
Zde můžete vybrat reaktor, kterého
data mají být zobrazena.
KURZ1.XLS (Kont. tab.)
11
Použití ovládacích prvků
A
1 DATUM
2 2.9.02
3 2.9.02
4 3.9.02
5 3.9.02
6 3.9.02
7 4.9.02
8 4.9.02
9 4.9.02
10 5.9.02
11 5.9.02
12 5.9.02
13 5.9.02
14 6.9.02
15 6.9.02
16 7.9.02
17 7.9.02
18 8.9.02
19 8.9.02
20 8.9.02
21 8.9.02
22 9.9.02
23 9.9.02
24 9.9.02
B
C
D
TYP
MA78
MA78
MA78
MA78
TL431
TL431
MA78
MA78
MC79
MC79
MC79
MC79
MA78
MA78
TL431
MC79
MC79
MA78
MA78
MA78
MA78
MA78
MA78
T
15,00
15,33
14,60
14,88
14,98
14,90
15,08
14,90
14,80
14,83
14,98
14,88
15,10
15,03
14,65
15,55
15,43
15,18
15,13
15,48
15,30
15,25
15,18
R
3,60
3,25
3,30
3,45
3,30
3,30
3,25
3,35
3,15
3,30
3,35
3,35
3,55
3,35
2,90
3,35
3,25
3,35
3,35
3,30
3,50
3,55
3,35
Problém:
Označte buňku F2. Tažením za značku v pravém dolním rohu směrem vpravo zkopírujte vloženou
funkci i do buněk G2 - I2. Upravte formát buňky F2 na "Date". Změnou hodnoty v buňce I4 se v poli
G2 - I2 zobrazí odpovídající záznam.
3
1
Rychle zobrazit záznam databáze podle aktuální
požadavky.
4
5
6
Řešení:
Pomocí funkce OFFSET vytvořte odkaz na
databázi, který umožní vyhledat a v definované
oblasti zobrazit určený počet řádků a sloupců z
této databáze.
=OFFSET(A1;$I$4;0;1;1)
Postup
Do buňky I4 napište číslo udávající počet řádku, o
kolik se posune začátek zobrazení hledaného
záznamu od začátku databáze. Označte a
zkopírujte hlavičku databáze a vložte ji do buňky
F1. Do buňky F2 vložte funkci OFFSET(v kategorii
Lookup & Reference) a zadejte vstupní hodnoty
podle obrázku.
Pro snadnější ovládání této funkce
vložte ovládací prvek Scroll Bar z
panelu nástrojů Forms do listu.
Přes pravou myš umístěnou na
tomto prvku vyberte z nabídky
Format Control a v dialogovém
okně zadejte hodnoty podle
obrázku.
7
1
8
2
3
!
Použití ovládacích prvků
(Controls)
KURZ1.XLS (Ovl. pr.)
12
Databázové funkce EXCELu
A
1 DATUM
2 2.9.02
3 2.9.02
4 3.9.02
5 3.9.02
6 3.9.02
7 4.9.02
8 4.9.02
9 4.9.02
10 5.9.02
11 5.9.02
12 5.9.02
13 5.9.02
14 6.9.02
15 6.9.02
16 7.9.02
17 7.9.02
18 8.9.02
19 8.9.02
20 8.9.02
21 8.9.02
22 9.9.02
23 9.9.02
24 9.9.02
B
C
D
TYP
MA78
MA78
MA78
MA78
TL431
TL431
MA78
MA78
MC79
MC79
MC79
MC79
MA78
MA78
TL431
MC79
MC79
MA78
MA78
MA78
MA78
MA78
MA78
T
15,00
15,33
14,60
14,88
14,98
14,90
15,08
14,90
14,80
14,83
14,98
14,88
15,10
15,03
14,65
15,55
15,43
15,18
15,13
15,48
15,30
15,25
15,18
R
3,60
3,25
3,30
3,45
3,30
3,30
3,25
3,35
3,15
3,30
3,35
3,35
3,55
3,35
2,90
3,35
3,25
3,35
3,35
3,30
3,50
3,55
3,35
3
Problém:
Získat průměr hodnot T pro typ TL431 z celé
databáze.
Řešení:
Funkce DAVERAGE umožňuje výpočet průměru
pouze hodnot vybraných z databáze podle kritérii
specifikovaných v podmínce výběru.
Postup
Do buněk F1 a F2 vložte podmínku výběru z
databáze. Do buňky H4 vložte funkci DAVERAGE
(v kategorii Database) a zadejte vstupní hodnoty
podle obrázku.
1
Podmínka výběru z databáze
4
2
=DAVERAGE(A1:D24;"T";F1:F2)
Podmínky výběru pro databázové funkce se tvorí stejným způsobem jako pro
rozšířený filtr (Advanced Filter) (list 8).
Stejný postup lze použít pro všechny funkce z kategorie Database.
!
Databázové funkce EXCELu
(Database Functions)
KURZ1.XLS (Dbaze fun.)
(8)
!
13
Hledání závislostí (Auditing)
Výpočty a závislosti (Calculations, Auditing)
V některých případech jsou výpočty v listu tak složité, že ztrácíte přehled. Jindy se může vyskytnout
chyba. Přehled v závislostech mezi buňkami získáte pomocí nástroje Formula Auditing. Označte
buňku o níž chcete zjistit, kde všude její hodnota vstupuje. Pak přes nabídku Tools -Formula
Auditing - Trace Dependents získáte znázornění závislostí přímo v listu.
Přesnost výpočtů
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
A
B
C
T1
944,6
946,5
890,7
894,6
880,7
880,6
945,5
940,4
950,4
946,7
934,2
931,4
890,8
894,3
881,0
T2
944,5
946,8
890,7
894,6
880,8
880,8
945,4
940,5
950,3
946,6
933,7
930,6
890,7
894,8
881,0
Rozp.
0,30
0,00
0,00
0,10
0,20
0,10
0,10
0,10
0,10
0,50
0,80
0,10
0,50
0,00
D
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
E
F
Hodn.
0,1
Počet
0
=SUM(D2:D16)
=IF(C2=$E$2;1;0)
=ABS(A2-B2)
Problém:
Sčítat, kolik rozpětí 0,1 se
nachází ve sloupci Rozp.
Standardní postup vede k
výsledku, že hledaná rozpětí
neexistují. Výsledek v buňce
F2 je 0, i když ve sloupci
Rozp. je sedm rozpětí 0,1.
Příčina:
Roztáhněte sloupec C tak, aby
do něj vešlo alespoň 15
desetinných míst, pak nastavte
počet zobrazených desetinných
míst na 15.
Je vidět, že vypočtená rozpětí
nejsou přesné hodnoty, ale jsou
zatížená malou chybou, která
vzniká při výpočtu v pohyblivé
řádové čárce, nicméně při
porovnávání s přesnou
hodnotou je zjištěna nerovnost
hodnot.
Řešení:
Jednou z možností je vhodné
zaokrouhlení výpočtů pomocí funkce
ROUND(číslo; číslice). Další možností je
nastavení Precision as displayed.
V oblasti C2:C16 nastavte číselný formát 0,00. Přes nabídku Tools - Options otevřete dialogové
okno Options - Calculation.
1
2
3
Nastavení Precision as displayed platí pro celý sešit a ukládá se s ním. Nastavení je aktuální pouze
pro buňky s číselným formátem, který má pevný počet desetinných míst.
!
!
Výpočty a závislosti
2
1
(Calculations, Auditing)
Když chcete získat představu o tom, které hodnoty
vstupují do výpočtu, označte buňku se vzorcem a
zvolte Trace Precedents.
Pokud v nekteré buňce vznikne výpočtová chyba,
označte ji a zvolte Trace Error. Získáte
znázornění postupu výpočtu a šíření chyby.
!
Všechny šipky zrušíte volbou Remove All Arrows.
KURZ1.XLS (Vypocet)
(2)
14
Funkce a pole
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
A
81,45
114,27
96,33
90,29
107,69
94,62
100,42
90,4
101,17
B
A
104,76
89,17
87,89
B
95,54
101,64
88,62
88,13
108,48
86,28
90,35
108,88
86,32
114
94,49
87,43
89,3
105,87
C
114,2
110,07
113,62
106,84
79,18
124,11
86,85
127,87
94,16
99,38
113,75
98,59
D
E
84
88
92
96
100
104
108
112
116
2
Problém:
Připravit data pro sestrojení histogramu.
Hranice tříd jsou v sloupci E.
3
Řešení:
4
Umístit kurzor do vstupního řádku
Funkce FREQUENCY provede
rozdělení dat do zadaných tříd. Její
výstupem je pole.
Funkce FREQUENCY vrátí pole v rozsahu jeden sloupec a
počtem rádků rovným počtu hranic tříd + 1. V první třídě
jsou spočteny všechny hodnoty od - nekonečna po první
hranici. V poslední třídě pak hodnoty od poslední hranice po
nekonečno.
Výstupem funkce FREQUENCY - v tomto příkladu - bude
tedy vertikální 10 prvkové pole.
Postup
Označit výstupní oblast
Podobně se vkládají i další funkce jejichž výstupem jsou pole.
Označte buňku ve které má být první četnost. Vložte funkci FREQUENCY (v kategorii Statistical).
Zadejte vstupní hodnoty podle obrázku.
Oblast vstupních hodnot
V buňce G2 je nyní vložena funkce. Označte oblast
výstupního pole G2:G11, pak stiskněte F2 (nebo
umístěte kurzor do vstupního řádku) a pak kombinaci
kláves Ctrl - Shift - Enter. Označená oblast pak bude
vyplněna výstupními hodnotami funkce.
Oblast hranic tříd
1
Pole jsou také vstupem funkce FREQUENCY. Ve vstupních polích dat jsou ignorovány nečíselné
hodnoty.
Během označování výstupního pole sledujte okénko v levém horním rohu sešitu, kde je zobrazen
rozměr označené oblasti. Nemusíte pak počítat buňky.
Rozměr označené oblasti.
R znamená řádky (Rows)
C znamená sloupce (Columns)
!
Funkce a pole
KURZ1.XLS (F. pole)
15
2
Datová tabulka (Table)
A
B
P=
FH =
105
270
h=
16,78
C
D
3
Problém:
kW
l/min
Pro tloušťku vrstvy byla experimentem zjištěna
rovnice h=14,38+0,064*P-0,016*FH , kde h je
tloušťka v µ, P je výkon v kW a FH je průtok
vodíku v l/min. Je třeba sestavit tabulku tloušťky,
pro výkon P v rozsahu 105 až 115 kW a průtok
vodíku FH od 260 do 380 l/min.
µ
=14,38+0,064*B1-0,016*B2
Řešení:
Sestrojte datovou tabulku se dvěma vstupy.
Sestrojení datové tabulky
Podle obrázku sestrojte záhlaví tabulky a levý sloupec. Vzorec musí být umístěn v levém horním rohu
tabulky a nesmí být navázán na žádnou buňku budoucí tabulky. Pak označte oblast B5:I16 a přes
nabídku Data - Table otevřete dialogové okno Table. Odkaz pro Row input cell bude B2 a pro
Column input cell bude B1.
"
B
P=
FH =
105
270
h=
16,78
105
106
107
108
109
110
111
112
113
114
115
C
D
kW
l/min
260
E
F
G
H
I 1
=14,38+0,064*B1-0,016*B2
vzorec v levém horním rohu tabulky
Průtok H2 [l/min]
300
320
340
280
360
5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Datová tabulka
B
P=
FH =
105
270
h=
16,78
105
106
107
108
109
110
111
112
113
114
115
C
D
E
F
G
H
I
360
15,34
15,40
15,47
15,53
15,60
15,66
15,72
15,79
15,85
15,92
15,98
380
15,02
15,08
15,15
15,21
15,28
15,34
15,40
15,47
15,53
15,60
15,66
kW
l/min
260
16,94
17,00
17,07
17,13
17,20
17,26
17,32
17,39
17,45
17,52
17,58
280
16,62
16,68
16,75
16,81
16,88
16,94
17,00
17,07
17,13
17,20
17,26
Průtok H2 [l/min]
300
320
340
16,30
15,98
15,66
16,36
16,04
15,72
16,43
16,11
15,79
16,49
16,17
15,85
16,56
16,24
15,92
16,62
16,30
15,98
16,68
16,36
16,04
16,75
16,43
16,11
16,81
16,49
16,17
16,88
16,56
16,24
16,94
16,62
16,30
Další možnosti
5
6
7
8
9
10
11
12
13
14
15
(Table)
A
380
Hodnoty pro průtok vodíku
Hodnoty pro výkon
A
Výkon [kW]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
4
Výkon [kW]
1
2
3
4
5
6
7
8
9
L
M
N
Úhel
0
10
20
30
40
50
60
70
80
90
Sin
0
cos
1
O
=COS(RADIANS(L6))
=SIN(RADIANS(L6))
Můžete vytvořit také datovou tabulku s jedním
vstupem, ale pro více vzorců.
Označte oblast L6:N15, přes nabídku Data - Table
otevřte okno Table a zadejte L6 jako Column input
cell.
KURZ1.XLS (Dat. tab.)
16
Spuštění makra
Makra
1
2
3
4
5
6
7
8
9
10
11
12
A
A
0,44584
C
0,97729
E
A
B
C
D
E
B
0,34214
B
0,49217
D
0,41337
C
0,55531
0,18882
0,75652
0,9613
0,37165
D
A
B
C
D
E
E
F
0,66274
Problém:
0,59844
Ve všech oblastech uspořádat
0,71783 čísla a písmena tak, jako
0,68654 v oblasti A1:B5.
0,97461
A
B
C
D
E
0,50395 Nástroj Makro slouží
0,34608 k automatizování opakované
0,50295 činnosti.
0,46086
0,12815
Nyní, když máte připravený nástroj, můžete jej aplikovat na každou oblast.
Označte buňku v levém horním rohu oblasti (A8). Přes nabídku Tools - Macro otevřete
dialogové okno Macro. Zvolte makro Uspořádat a klikněte na tlačítko Run.
1
Řešení:
2
Záznam makra
Označte buňku E1. Přes nabídku Tools - Macro - Record New Macro... otevřete dialogové okno
Record Macro. Napište Macro name: - Uspořádat a klikněte na OK. Objeví se tlačítka pro ukončení
makra a pro použití Relative Reference. Klikněte na tlačítko Relative Reference a upravte buňky v
oblasti E1:F5 podle vzoru v A1:B5. Záznam makra ukončete kliknutím na tlačítko Stop Recording.
2
3
!
Makra
4
Při použití relativních odkazů se činnost makra provádí vždy vzhledem k označené buňce před
spuštěním makra. Pokud chcete aby činnost makra byla nezávislá, nesmí být zapnuta možnost
Relative Reference před spuštěním záznamu.
KURZ1.XLS (Makro1, Makro2)
17
Vložení spojnice trendu
Graf
A
B
C
D
Problém:
1 Hodnoty pro zobrazení přímky y=x
2
X
Y
3
1
1
4
2
2
5
3
3
6
5
5
7
8
8
8
12
12
9
15
15
10
Správně zobrazit přímku a rovnici spojnice
trendu. Zobrazení uvedených dat grafem Line
nevede k správnému výsledku.
Klikněte na některý bod zobrazené řady údajú a pak pravým tlačítkem myši vyvolejte místní nabídku.
Zvolte Add Trendline, vyberte záložku Type a označte Linear, a vyberte záložku Options a označte
položku Display equation on chart.
4
1
Řešení:
Pro správné zobrazení funkce použijte graf
XY (Scatter).
Line Type Chart
20
15
2
y = 2,3929x - 3
Y
10
5
Nesprávné použití grafu typu 0
"Line" pro zobrazení funkce. -5 1
2
3
4
5
6
7
X
XY (Scatter)
3
Označte oblast A3:B9 a pomocí Chart Wizard sestrojte XY (Scatter) graf.
1
3
Kopírování grafů
Při kopírování grafu bude jeho kopie napojena na původní
data a jakákoli změna v datech se projeví jak v originálu, tak v
kopii grafu.
Když chcete uchovat kopie nezměněné, stiskněte Shift,
označte graf a Copy. Pak vložte zkopírovaný graf přes
nabítku Edit nástrojem Paste Special a zvolte Picture.
2
2
!
Graf
(Chart)
KURZ2.XLS (Graf)
18
A
B
C
D
DATUM
10.8.02
11.8.02
12.8.02
13.8.02
15.8.02
16.8.02
18.8.02
19.8.02
20.8.02
21.8.02
22.8.02
23.8.02
24.8.02
25.8.02
26.8.02
27.8.02
28.8.02
29.8.02
31.8.02
R
3,63
3,28
3,4
3,3
3,18
3,23
3,27
3,31
3,33
3,31
3,36
3,41
3,48
3,33
3,38
3,34
3,33
3,31
3,31
Dolní
2,6
Horní
4
Problém:
2
Každý měsíc zobrazit pohyb hodnoty R v mezích
Dolní a Horní. Je jednoduché vytvořit potřebný
graf. Soustavné nastavování formátu grafu je však
zdlouhavé.
Označte graf, pak pravým
tlačítkem myši vyvolejte místní
nabídku. Zvolte Chart Type,
čímž otevřete okno Chart Type.
Zde vyberte Custom Types,
pak User-defined a Add....
Napište název nového vlastního
typu grafu a zvolte OK.
Řešení:
Vytvořte potřebný formát a pak jej uložte jako typ
grafu definovaný uživatelem. Ten pak můžete
kdykoli vyvolat.
Postup
3
4
Označte oblast A1:D20, pak pomocí Chart
Wizard sestrojte Line chart, sub-type 4.
2,6
4
Nastavte graf tak, aby se meze zobrazovaly
jako vodorovné čáry. Upravte formát, zrušte
legendu, přizpůsobte velikost písma.
2
1
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
Použití vlastního typu grafu
Rad1
Rad2
Rad3
10
.8
.0
12 2
.8
.0
15 2
.8
.0
18 2
.8
.0
20 2
.8
.0
22 2
.8
.0
24 2
.8
.0
26 2
.8
.0
28 2
.8
.0
31 2
.8
.0
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Nyní, když máte vytvořený formát jaký
potřebujete, uložte jej jako User-defined Type.
1
Uživatelem definovaný typ grafu
Označte sestrojený graf. Přes nabídku Tools Options otevřete okno Options a záložku Chart.
Označte volbu Plot empty cells - Interpolated.
Toto nastavení umožňuje zadávat pouze krajní body
úseček (v tomto případě mezí v buňkách C2, D2,
C20, D20).
Označte oblast vstupních dat. Pomocí ikony Chart Wizard otevřete okno Chart Wizard. Zde vyberte
Custom Tytes, pak User-defined a vyberte vhodný typ grafu.
1
2
3
"
Uživatelem definovaný typ grafu
(User-Defined Chart Type)
KURZ2.XLS (Aut. form.)
19
2.2
UFU - užitečné funkce
Po instalaci a aktivování doplňku UFU máte k
dispozici 22 nových funkcí. 4 z nich, BOXPLOT,
HISTOGRAMF, NORMPROBPLOT a PARETO, je
určených k vytvoření polí dat potřebných k sestrojení
odpovídajících grafů. Tyto funkce jsou popsané v
listech, které se zabývají grafy.
Instalační soubory, návod na instalaci a podrobný
manuál k funkcím UFU jsou na přiloženém CD.
!
UFU - užitečné funkce
(21, 22, 23, 24)
20
Sestrojení histogramu
Histogram
15,4
15,5
15,4
15,1
15,4
15,3
15,4
15,5
14,7
15,5
15,4
14,6
14,8
14,6
14,9
15,3
14,8
15
14,8
Problém:
Znázornit rozložení hodnot tloušťky.
Řešení:
Rozložení hodnot lze velmi dobře znázornit
histogramem.
2
Histogram
Levý okraj
Pravý okraj
3
4
Hodnoty
Třídní znak - střed třídy
Šířka třídy
Hranice tříd
Histogram znázorňuje rozložení hodnot prostřednictvím četností jejich výskytu v jistém počtu stejně
širokých intervalů - tříd. Počet tříd je zaokrouhlenou odmocninou z počtu hodnot, nejméně však 5 a
nejvíce 20. Do každé vnitřní třídy padnou hodnoty > dolní hranice a <= horní hranice třídy. Do levé
krajní třídy padnou všechny hodnoty <= její horní hranice, do pravé krajní pak hodnoty > její dolní
hranice. Histogram může být sestrojen jako kumulativní, kdy do každé třídy padnou hodnoty <= její
horní hranice. Pravá krajní třída pak obsahuje všechny hodnoty. Zobrazení četností může být relativní,
kdy se zobrazuje poměr počtu hodnot v každé třídě k celkovému počtu hodnot. Levý okraj a Pravý
okraj nemají matematický smysl. Existují pouze pro jednodušší zadávání do funkce Histogram.
14; 3; HGR
Avg
15,0776
Std
0,23071
Count
76
Value
Abs. freq. Bord.
14,6
4 14,6563
14,7125
2 14,7688
14,825
7 14,8813
14,9375
10 14,9938
15,05
23 15,1063
15,1625
13 15,2188
15,275
7 15,3313
15,3875
6 15,4438
15,5
4
Průměr ze vstupních hodnot
1 Tloušťka, náh. výběr z 12.02
2
15,1
15
15,2
3
14,9
15,1
15,2
4
15
15
15,1
5
14,7
14,9
14,9
6
15
15,1
15,2
7
14,9
15
15,2
8
14,9
14,9
15,1
9
15
15,1
15,2
10
15,3
15,1
14,8
11
15,1
15,2
15,3
12
15
15,2
15,2
13
15,2
14,6
15,1
14
15,1
14,6
15,2
15
15,1
14,9
15,2
16
15,2
14,9
15,2
17
15,1
14,8
14,8
18
15,1
14,8
15,3
19
15,4
15
15,5
20
15,3
14,9
15,3
21
1
D
Směrodatná odchylka
C
Počet vstupních hodnot
B
Četnosti
A
V této buňce bude v případě kumulativního
histogramu označení
Cumul.
V záhlaví sloupce četností bude v případě
relativních četností označení
Rel. freq., anebo Dens. v případě hustoty
pravděpodobnosti
5
Histogram můžete sestrojit pomocí nástroje EXCELu Analýza dat - Histogram. Dále můžete použít
funkce FREQUENCY, popsané na listu 15. V obou případech musíte předem připravit hranice tříd.
Pokud máte nainstalovaný doplněk UFU, můžete použít jeho funkci HISTOGRAMF. Výstupem funkce
HISTOGRAMF je pole.
!
Doplněk
UFU
(20)
Histogram
KURZ2.XLS (Hist.)
(15)
21
Sestrojení grafu
Grafický test normality
A
B
C
1 Tloušťka, náh. výběr z 12.02
2
15,10
15
15,20
3
14,90
15,1
15,20
4
15,00
15
15,10
5
14,70
14,9
14,90
6
15,00
15,1
15,20
7
14,90
15
15,20
8
14,90
14,9
15,10
9
15,00
15,1
15,20
10 15,30
15,10
14,80
11 15,10
15,20
15,30
12 15,00
15,20
15,20
13 15,20
14,60
15,10
22
23 Tloušťka, náh. výběr z 1.03
24 14,80
14,80
15,00
25 14,90
14,90
15,10
26 14,80
15,10
15,10
27 15,00
14,90
15,10
28 14,90
14,90
15,10
29 14,70
14,90
14,90
30 14,80
14,80
15,00
31 14,80
14,80
15,00
32 14,80
14,90
15,00
33 15,00
14,90
15,1
!
Doplněk
UFU
(20)
D
15,40
15,50
15,40
15,10
15,40
15,30
15,40
15,50
14,70
15,50
15,40
14,60
1
Problém:
Je předpoklad, že data z 12.02 a z 1.03
pocházejí z normálního rozdělení. Je možné
tento předpoklad zamítnout, nebo ne?
Řešení:
2
Použijte funkci UFU NormProbPlot.
3
4
15,20
15,20
15,40
15,30
15,20
15,20
15,20
15,10
15,20
15,20
Grafický test normality
5
(Normal Probability Plot)
KURZ2.XLS (Norm.)
(28)
22
Sestrojení grafu
Krabicový diagram (Box and Whisker Plot)
B
C
T1
15,0
15,3
15,1
14,6
15,2
14,6
15,0
15,1
15,4
15,2
15,1
14,4
15,2
14,9
15,4
15,3
15,3
15,9
15,0
15,3
T2
14,4
14,8
14,8
15,0
15,4
14,8
14,9
14,9
15,3
15,0
14,6
15,3
14,9
15,2
14,5
15,1
14,9
15,3
14,8
15,6
T3
15,4
14,8
14,7
14,8
15,0
15,1
14,9
14,7
15,1
14,8
15,2
15,2
15,3
14,3
14,7
14,6
15,7
14,7
15,3
15,0
1
D
T4
15,1
Problém:
15,0
Čtyři skupiny dat z tabulky je třeba zobrazit
14,8
takovým způsobem, aby byl z grafu patrný jednak
15,2
vzájemný vztah skupin, jednak rozložení hodnot v
15,3
každé skupině.
14,8
14,9
15,9
Řešení:
15,2
Každou skupinu dat zobrazit krabicovým
14,7
diagramem. Ten je obrazem rozdělení dat ve
15,0
skupině, vzájemná poloha diagramů pak vyjadřuje
15,1
vztah mezi skupinami. Pro sestrojení grafu
15,2
použijte funkci UFU BoxPlot.
15,0
15,0
14,8
14,8
Krabicový diagram
15,4
(Box and Whisker Plot)
15,3
Extrémní hodnota (outlier)
14,7
Maximum
Minimum
50%
Dolní kvartil (DQ)
25
Medián
75% hodnot
Horní kvartil (HQ)
100% hodnot
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
A
2
4
5; 13
T1
T2
T3
T4
Doplněk
UFU
(20)
Krabicový diagram
25%Min.
Max.
50%
OutMinOrOutMaxO 75%
AVG
15 Počet
14,6řádků 15,4
14,4
15,9
15,3 15,1111
a sloupců15,15
výstupní oblasti
15
14,4
15,6
14,9
14,9
14,9 15,225 14,975
15
14,3
15,7
14,95
14,95
14,95
15,2 14,965
15
14,7
15,4
15
15
15,9
15,2 15,0158
Názvy skupin
Krabicový diagram zobrazuje rozložení hodnot ve čtyřech částech po 25% hodnot. Hranice těchto
oblastí jsou kvartily. Krabice (box) znamená dvě střední části a krabici přesahující úsečky
(whiskers - vousy) zobrazují dvě krajní 25% části. Nesymetrické uspořádání hranic částí - kvartilů
ukazuje na nesymetrické rozdělení. Extrémní hodnoty (outliers) jsou hodnoty větší jako
HQ + 1,5 x (HQ - DQ), anebo menší jako DQ - 1,5 x (HQ - DQ). Hodnoty pro sestrojení grafu jsou
pak přepočítány bez těchto extrémních hodnot. Funkce BoxPlot nevyhodnocuje extrémní
hodnoty.
!
3
5
(Box and Whisker Plot)
Hodnoty kvartilů
Oblast hodnot pro graf
STD
Count
Outli
0,23487
18 -13 19
Četnosti skupin
0,30758
20
0,32811
20
0,21412
19
9
Průměry skupin
Extrémní hodnoty
(outliers), pokud se
vyskytují, jinak medián
Směrodatné odchylky skupin
Pořadová čísla extrémních hodnot (outliers) ve skupinách.
Záporná čísla znamenají extrémní hodnoty na straně minima.
Z extrémních hodnot (otliers) jsou zobrazeny grafem pouze největší anebo nejmenší.
KURZ2.XLS (Krab. dia.)
!
23
Sestrojení grafu
Paretův diagram (Pareto Chart)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
A
B
TYP
MA78
MA7809
MA7812
MA78L
MC78
MC7805
MC782
MC78L
MC78M
MC79
MC7912
MC79L
TL431
POČET
500
2
3
1
63
3
2
97
68
112
7
2
190
1
C
Problém:
Znázornit přehled typů podle jejich jejich podílu
na vytěžení výrobní linky.
Řešení:
Na zobrazení je vhodné použít Paretův
diagram. Pro přípravu dat použijte funkci UFU
Pareto.
2
3
4
15; 3; PR SumOfSig
1050
Group
Value
Cumul.
MA78
500 47,619
TL431
190 65,7143
MC79
112 76,381
MC78L
97 85,619
MC78M
68 92,0952
MC78
63 98,0952
MC7912
7 98,7619
MA7812
3 99,0476
MC7805
3 99,3333
MA7809
2 99,5238
MC782
2 99,7143
MC79L
2 99,9048
MA78L
1
100
Paretův diagram
60
50
40
30
20
100
80
Kumulativní
křivka
10
0
60
40
20
0
Osa kumulativní křivky
[%]
Stupnice významnosti
(Pareto)
Kategorie (příčiny, jevy ...) uspořádané
podle jejich významnosti
5
Názvy kategorií
Významnosti
Kumulativní hodnoty
!
Doplněk
UFU
(20)
Paretův diagram
(Pareto Chart)
KURZ2.XLS (Pareto)
24
Zobrazení funkce dvou proměnných
Řešení:
Experimentem byla pro tloušťku vrstvy zjištěna
rovnice h=14,38+0,064*P-0,016*FH , kde h je
tloušťka v µ, P je výkon v kW a FH je průtok vodíku
v l/min. Je třeba sestrojit graf závislosti tloušťky,
pro P v rozsahu 105 až 115 kW a průtok vodíku od
260 do 380 l/min.
Připravte datovou tabulku hodnot. Pak
hodnoty zobrazte 3D grafem.
Výkon [kW]
Problém:
16,78
105
106
107
108
109
110
111
112
113
114
115
Sestrojení datové tabulky
B
P=
FH =
Výkon [kW]
h=
105
270
16,78
105
106
107
108
109
110
111
112
113
114
115
C
D
kW
l/min
260
E
F
G
H
I
280
Průtok H2 [l/min]
300
320
340
280
16,62
16,68
16,75
16,81
16,88
16,94
17,00
17,07
17,13
17,20
17,26
Průtok H2 [l/min]
300
320
340
16,30
15,98
15,66
16,36
16,04
15,72
16,43
16,11
15,79
16,49
16,17
15,85
16,56
16,24
15,92
16,62
16,30
15,98
16,68
16,36
16,04
16,75
16,43
16,11
16,81
16,49
16,17
16,88
16,56
16,24
16,94
16,62
16,30
360
15,34
15,40
15,47
15,53
15,60
15,66
15,72
15,79
15,85
15,92
15,98
380
15,02
15,08
15,15
15,21
15,28
15,34
15,40
15,47
15,53
15,60
15,66
Sestrojení grafu
=14,38+0,064*B1-0,016*B2
vzorec v levém horním rohu tabulky
Obsah buňky B5 přesuňte mimo tabulky, označte oblast B5:I16 a pomocí Chart Wizard
sestrojte graf typu Surface. Po dokončení grafu přesuňte vzorec na původní místo.
360
380
1
Hodnoty pro průtok vodíku
Hodnoty pro výkon
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
260
16,94
17,00
17,07
17,13
17,20
17,26
17,32
17,39
17,45
17,52
17,58
2
3
Vzorec přesunout
mimo tabulky
Další postup sestrojení datové tabulky je popsaný na listu 16.
Vzorec vrátit na
původní místo
Pro účel vytvoření 3D grafu funkce dvou proměnných je důležité, aby řady hodnot pro obě proměnné
byly tvořeny aritmetickými řadami. 3D graf v EXCELu umí na osách x, y zobrazit pouze pořadí hodnot
a ne jejich polohu. Hodnoty v záhlaví tabulek budou zobrazeny pouze jako popisky os.
4
5
Pro jednoduché sestrojení grafu je důležité, aby v levém horním rohu tabulky vstupních dat byla
během sestrojování grafu prázná buňka.
!
"
Zobrazení funkce dvou proměnných
KURZ2.XLS (F. 2 prem.)
(16)
25
Generátor pseudonáhodných čísel (Random ...)
3
Řešení:
Problém:
Pro ověření funkce statistických nástrojů vytvořit
množinu 100 čísel, která bude reprezentovat výběr
z normálního rozdělení se střední hodnotou 100 a
směrodatnou odchylkou 10.
Na vytvoření množiny náhodných čísel
s definovaným rozdělením použijte nástroj
Random Number Generation.
Počet sloupců
Počet řádků
Použití generátoru
Přes nabídku Tools - Data Analysis otevřete dialogové okno Data Analysis. Pak vyberte Random
Number Generation.
Volba typu
rozdělení
1
2
Buňka levého horního rohu
výstupní oblasti
Po klepnutí na OK bude oblast A1:A100 vyplněna pseudonáhodnými čísly, která reprezentují náhodný
výběr z normálního rozdělení se střední hodnotou 100 a směrodatnou odchylkou 10.
Random Seed (základ generátoru) může nabývat hodnot 1 - 32767 a ovlivňuje start generátoru. Při
stejném základu generátoru dostanete stejná pseudonáhodná čísla.
V dialogovém okně Random Number Genaration zadejte vstupní hodnoty podle obrázku:
Number of Variables - počet sloupců výstupu
Number of Random Numbers - počet řádků výstupu
Mean - střední hodnota
Standard Deviation - směrodatná odchylka
V rámečku Output Options zvolte Output Range a zadejte buňku levého horního rohu výstupní
oblasti.
!
Doplněk
Analytické
nástroje
(2)
Generátor pseudonáhodných čísel (Random Number Generation)
KURZ3.XLS (Nahod. cisla)
26
Vzorkování (Sampling)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
993
994
995
996
997
998
999
1000
1001
A
T
15,5
15,6
16
15,5
15,7
15,5
15,5
15,5
15,5
15,4
15,4
15,4
14,9
15,2
B
C
D
3
Problém:
Z 1000 hodnot získaných z technologického
deníku náhodně vybrat 100 hodnot pro test
normality
Řešení:
Nástroj Sampling umožňuje provést náhodný
výběr.
Použití nástroje Vzorkování
Přes nabídku Tools - Data Analysis otevřete
dialogové okno Data Analysis. Pak vyberte
Sampling.
1
15,1
15,1
15,1
15,3
15
15
15,1
15
15,5
2
Nástroj Sampling provede vzorkování s opakováním.
!
Jiná možnost
V dialogovém okně Sampling zadejte vstupní hodnoty podle obrázku:
A
B
1
2
3
T
15,5
15,6
0,70002
0,87532
###
15
15,5
0,70997
0,36081
###
Input
Labels (označte, pokud jste zadali vstupní oblast včetně záhlaví)
Sampling Method (zvolte Random)
C
=RAND()
Do sloupce B vedle čísel vložte funkci
RAND(). Pak označte oblast A1:B1001 a
pomocí nástroje Seřadit uspořádejte
hodnoty podle sloupce B. Nyní vyberte ze
sloupce A prvních 100 hodnot.
=RAND()
Tímto způsobem provedete náhodný výběr
bez opakování.
V rámečku Output Options zvolte Output Range a zadejte buňku levého horního rohu výstupní
oblasti.
!
Doplněk
Analytické
nástroje
(2)
Vzorkování
(Sampling)
KURZ3.XLS (Vzorka)
27
Pořadová statistika a percentily (Rank ...)
A
1
2
3
4
5
6
7
8
9
10
11
T
15,1
14,9
15
14,7
15
14,9
14,9
15
15,3
15,1
75
76
77
78
14,8
15
14,8
B
C
D
Hodnota
Pořadí podle velikosti
Původní pořadí
Hodnota percentilu
Problém:
Graficky znázornit distribuční funkci hodnot
získaných náhodným výběrem.
4
Řešení:
Pomocí nástroje Rank and Percentile můžete
vypočítat hodnoty výběrové distribuční funkce a
pak ji graficky znázornit.
Použití nástroje Pořadová
statistika a percentily
Přes nabídku Tools - Data Analysis otevřete
dialogové okno Data Analysis. Pak vyberte Rank
and Percentile a zadejte hodnoty podle obrázku.
1
2
Označte oblasti G2:G77 a I2:I77. Pomocí Chart Wizard sestrojte XY (Scatter).
5
3
!
Doplněk
Analytické
nástroje
(2)
Pořadová statistika a percentily
(Rank and Percentile)
KURZ3.XLS (Percentil)
28
Popisná statistika (Descriptive Statistics)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
A
B
T1
15,1
15,3
15,6
15
15,1
15,2
15,1
15,1
15,1
15,1
14,9
14,9
14,4
14,8
T2
15,1
15,3
15,5
15
15,2
15,1
15,1
15,2
15,10
15,00
14,80
14,70
14,50
14,90
C
D
sm. odchylka
Výsledky pro T1
počet
Problém:
Při výpočtech statistických charakteristik může
být vkládání funkcí, označování oblastí atd.
zdlouhavé.
Výsledky pro T2
4
Řešení:
Nástrojem Descriptive Statistics můžete
najednou získat základní statistické
charakteristiky jedné, nebo více skupin dat.
Použití nástroje Popisná statistika
Přes nabídku Tools - Data Analysis otevřete dialogové okno
Data Analysis. Pak vyberte Descriptive Statistics.
1
2
3
Skupiny dat jsou ve sloupcích
Kurtosis (Špičatost)
Vyjadřuje relativní špičatost rozdělení, vhledem k normálnímu rozdělení. Kladná Špičatost znamená,
že rozdělení je strmější, jako normální (hodnoty jsou více soustředěny kolem střední hodnoty).
Naopak, záporná Špičatost známená příliš ploché rozdělení. Stejnou hodnotu vrátí funkce KURT.
Pokud není zaškrtnuto, bude
použita hodnota 95%, jinak podle
zadání
Stupeň spolehlivosti pro určení
intervalu spolehlivosti střední
hodnoty.
Stupeň spolehlivosti = 100(1 - α)%,
kde α je hladina významnosti
Pokud je zaškrtnuto, bude ve
výstupní tabulce také k-tá největší,
nebo nejmenší hodnota
!
Doplněk
Analytické
nástroje
(2)
Popisná statistika
(Descriptive Statistics)
Skewness (Šikmost)
Vyjadřuje asymetrii rozdělení. Kladná Šikmost znamená posun k větším hodnotám, záporná posun k
menším hodnotám. Stejnou hodnotu vrátí funkce SKEW.
V jiných programech (nebo literatuře) mohou být výsledky pro špičatost a šikmost poněkud
odlišné. Většinou se liší pouze o konstantu.
KURZ3.XLS (Popis)
!
29
Korelace (Correlation)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
A
B
C
t1
97,5
93,6
93,1
93,2
95,7
97,7
92,1
93,7
97,1
94,9
92,8
96,1
93,1
94,7
92,5
t2
1000,4
997,3
1004,0
997,8
1000,7
997,6
999,1
997,8
1001,2
998,9
1001,6
999,0
999,9
994,5
997,6
T
1054,1
1000,0
1001,3
1011,7
1027,9
1037,2
995,4
1021,0
1029,3
1003,0
993,6
1013,0
1014,3
1022,4
993,5
Použití nástroje
Korelace
Přes nabídku Tools - Data Analysis
otevřete dialogové okno Data Analysis.
Pak vyberte Correlation.
D
Na obrázku vidět, že pouze hodnota 0,8455 může
znamenat významnou závislost.
R2=0,7148, proveďte tedy test hypotézy H0, že T a
t1 jsou nezávislé.
4
Problém:
Zjistit, zda je velká variabilita tloušťky T
způsobená změnou teploty t1 nebo t2 anebo ani
jednou z nich.
z´=FISHER(0,8455)=1,24 SQRT(15-3)*z´=4,3
4,3 > 1,96 proto se H0 zamítá.
Výsledek potvrdil, že variabilitu tloušťky výrazně
ovlivňuje právě změna teploty t1.
Řešení:
Použít nástroje Correlation k vytvoření korelační
matice. Podle velikostí korelačních koeficientů
posoudit závislosti. Korelační koeficient dvou
skupin dat vypočítá také funkce CORREL.
Další možnosti
I
Korelační koeficient R vyjadřuje vzájemnou závislost
dvou skupin dat.
R=0 skupiny jsou nezávislé
R=1 nebo R=-1 skupiny jsou lineárně závislé
Test hypotézy H0, že dvě skupiny dat jsou vzájemně
nezávislé (pro rozsah výběru n > 10, α=0,05).
T
13,69
14,02
14,49
100
13,93
14,56
101
1. Vypočítat R a pak hodnotu z´=FISHER(R)
2. Hypotézu H0 zamítáme pokud SQRT(n-3)*z´ > 1,96
2
3. Hypotézu H0 obvykle zamítáme když R2>0,8
1
2
3
1
2
3
4
1
2
3
4
5
6
7
8
9
10
11
12
A
13,69
14,02
Problém:
J1
Zjistit, zda v časové řadě není závislost mezi předcházejícími
a následujícími hodnotami - autokorelace.
Řešení:
Zkopírujte hodnoty z oblasti I2:I101 postupně do H3:H102,
G4:G103, ... A10:A109. Potom pomocí nástroje Correlation
vytvořte korelační matici pro vstupní oblast A10:I101 do
výstupní oblasti začínající v buňce K1. (tentokrát
nezaškrtávejte políčko Záhlaví v prvním řádku).
B
13,69
14,02
14,49
C
13,69
14,02
14,49
14,77
D
13,69
14,02
14,49
14,77
15,08
E
13,69
14,02
14,49
14,77
15,08
16,14
F
313,69
14,02
14,49
14,77
15,08
16,14
15,18
G
13,69
14,02
14,49
14,77
15,08
16,14
15,18
13,87
H
I
13,69
14,02
14,49
14,77
15,08
16,14
15,18
13,87
13,94
T
13,69
14,02
14,49
14,77
15,08
16,14
15,18
13,87
13,94
15,25
Ve výslední matici je vidět že je výrazná korelace
mezi sloupci 1 a 8, 2 a 9 atd.
!
Doplněk
Analytické
nástroje
(2)
Korelace
(Correlation)
KURZ3.XLS (Korel, Akorel)
30
Regrese (Regression)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
A
B
t1
97,5
93,6
93,1
93,2
95,7
97,7
92,1
93,7
97,1
94,9
92,8
96,1
93,1
94,7
92,5
T
1054,1
1000,0
1001,3
1011,7
1027,9
1037,2
995,4
1021,0
1029,3
1003,0
993,6
1013,0
1014,3
1022,4
993,5
C
D
4
SUMMARY OUTPUT
Korelační koeficient R
R2
Regression Statistics
Multiple R 0,84546
R Square 0,7148
Adjusted 0,69286
Standard 9,77599
Observati
15
Problém:
Vytvořit lineární model závislosti T na t1 a zjistit
jeho statistickou významnost.
Řešení:
Upravené R2 (Adj R )
2
Reziduální odchylka
Počet stupňů volnosti (dF)
p - hodnota Fisherova rozdělení pro F
Použijte statistický nástroj Regrese.
ANOVA
Použití nástroje Regrese
df
Regressio
Residual
Total
Přes nabídku Tools - Data Analysis otevřete
dialogové okno Data Analysis. Pak vyberte
Regression.
SS
MS
F
Significance F
1 3113,79 3113,79 32,5813 7,2E-05
13 1242,41 95,5699
14 4356,2
Coefficients Standard Err
1
t Stat
P-value
MSRegrese
MSRe zidua
Lower 95% Upper 95% Lower 95,0%Upper 95,0%
Intercept 267,892 130,827 2,04768 0,06135 -14,743 550,526 -14,743 550,526
t1
7,89909 1,38386
5,708 7,2E-05 4,90943 10,8887 4,90943 10,8887
a
2
regresní přímka: y = α + βx
odhad α = a odhad β = b
b
3
t1 Line Fit Plot
Hodnoty pro zadanou
úroveň věrohodnosti,
pokud bylo zaškrtnuto
políčko Úroveň
věrohodnosti.
1060,0
T
1040,0
Pokud je zaškrtnuto, bude regresní
přímka procházet počátkem
Hranice intervalů
spolehlivosti pro
odhad parametrů
regresní přímky
1020,0
1000,0
980,0
90,0
T
Predicted T
92,0
94,0
t1
96,0
98,0
Statistická významnost modelu
Hypotéza H0, že model je statisticky nevýznamný, se zamítá jestliže vypočtená p - hodnota
(Significance F) je menší, jako předem zvolená hladina významnosti (0,05).
Vypočtený model platí pro průměry, přičemž konstanty a, b jsou odhadem parametrů regresní přímky
(α, β). Hranice intervalů spolehlivosti pro tyto hodnoty jsou ve sloupcích Lower 95% a Upper 95% .
!
Doplněk
Analytické
nástroje
(2)
Regrese
(Regression)
KURZ3.XLS (Regres)
(32, 34, 35)
31
F-Test Two-Sample for Variances
F - Test
T
14,5
14,5
14,9
14,7
14,8
15,2
13,5
14,3
13,9
15,4
13,3
15,1
16,2
15,6
14,6
16,6
14,3
15,9
T1
14,8
14,8
14,4
15,9
15,5
15,1
13,6
14,9
14,3
T2
14,7
14,4
14,4
15,8
15,4
14,2
15,0
15,5
14,9
0,878
0,675
Problém:
Ve sloupci A jsou hodnoty tloušťky a v buňce A:21
je směrodatná odchylka. Protože pro výrobní
účely je příliš velká, byly provedeny různé úpravy
zařízení a pak technologické zkoušky. Výsledky
jsou ve sloupcích B a C. Směrodatné odchylky v
řádku 21 naznačují, že by mohlo jít o zlepšení.
Nyní je nutno ověřit, jestli změny směrodatné
odchylky jsou výsledkem technologických úprav
nebo jsou pouze náhodné.
Řešení:
Statistický nástroj F - Test umožňuje provést test hypotézy, že dva
výběry pocházejí z rozdělení se stejným rozptylem. Postavte hypotézu
H0: výběry T a T1 pocházejí z rozdělení se stejným rozptylem a
hypotézu H1: výběr T1 pochází z rozdělení s menším rozptylem, jako
výběr T. Podobně pro T2. Když pomocí F - testu zamítnete hypotézu
H0, můžete považovat zlepšení směrodatné odchylky za výsledek
technologických úprav.
Použití nástroje F - Test
Přes nabídku Tools - Data Analysis otevřete dialogové okno Data
0,554
Analysis. Pak vyberte F-Test Two -Sample for Variances.
1
Výběr s větším rozptylem
Výběr s menším rozptylem
Zvolená hladina významnosti
Do vstupního pole 1. soubor zadávejte vždy výběr s větším
rozptylem.
Výběry musejí pocházet z normálního rozdělení!
!
Doplněk
Analytické
nástroje
(2)
F - Test
!
Počty stupňů volnosti
D
Počty hodnot
C
Odhady rozptylů
B
Odhady středních hodnot
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
A
2
T
T1
Mean
14,85 14,8111
Variance 0,77088 0,45611
Observati
18
9
df
17
8
F
1,69012
P(F<=f) o 0,22828
F Critical 3,1867
Hypotéza H0 se zamítá, když F > F krit (1),
anebo P(F<=f) (1) je menší jako zvolená
hladina významnosti.
Dvoustranní p-hodnotu vrátí také funkce
FTEST, anebo UFU funkce XFtest.
P(F<=f)(1) = P(F<=f)(2) / 2
Hodnota testového kritéria
Jednostranní p-hodnota
Jednostranní kritická hodnota
F-rozdělení
1,6901 < 3,1867, tedy hypotézu, že výběry T a T1 pocházejí z rozdělení se stejným rozptylem
nemůžete zamítnout. Podobný výsledek je také pro T a T2 (2,5115 < 3,1867). Zdá se tedy, že
snížení směrodatných odchylek pro T1 a T2 je pouze náhodné.
Na následujícím obrázku byly malé výběry T1 a T2 nahrazeny doplněnými výběry T1d a T2d. Nyní s
těmito výběry opět proveďte F - test.
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
A
B
C
T
14,5
14,5
14,9
14,7
14,8
15,2
13,5
14,3
13,9
15,4
13,3
15,1
16,2
15,6
14,6
16,6
14,3
15,9
T1d
14,8
14,8
14,4
15,9
15,5
15,1
13,6
14,9
14,3
17,0
13,5
15,7
14,9
15,5
14,9
14,5
16,1
15,5
T2d
14,7
14,4
14,4
15,8
15,4
14,2
15,0
15,5
14,9
14,5
14,9
14,7
14,7
15,4
15,3
14,4
14,7
15,3
0,878
0,862
0,458
V případě T1d se hypotéza H0
opět nezamítá. Také směrodatná
odchylka odhadnuta z výběru T1d
(0,862) je blízká původní hodnotě
0,878. Je patrné, že rozdílná
hodnota odhadnutá z výběru T1
(0,675) byla pouze náhodní
(protože výběr T1 je malý).
V případě T2d se hypotéza H0
zamítá (3,6812>2,2719).
V tomto případě můžete pokládat
zmenšení směrodatné odchylky za
výsledek úpravy zařízení.
KURZ4.XLS (F - Test)
(36)
32
t-Test: Two-Sample Assuming Equal Variances
t - test
14,993
15,507
Problém:
Po poruše zařízení vzniklo podezření, že byla zvětšená
střední hodnota. Stav před poruchou je reprezentovaný
výběrem T, stav po poruše pak výběrem T1. V řádku 18
jsou odhady středních hodnot. Je třeba ověřit, zda skutečně
došlo ke zvýšení střední hodnoty, anebo je výsledek pouze
náhodný.
Řešení:
Pro testování hypotézy o rovnosti středních hodnot, nebo jejich
definovaném rozdílu slouží statistický nástroj t - test.
Postavte hypotézu H0: výběry T a T1 pocházejí z rozdělení se
stejnými středními hodnotami
a hypotézu H1: výběr T1 pochází z rozdělení s větší střední hodnotou
jako výběr T.
Když pomocí t - testu zamítnete hypotézu H0, můžete prohlásit, že
vlivem poruchy byla zvětšena střední hodnota.
Počet stupňů volnosti
T1
15,6
15,2
16,0
15,7
15,0
15,5
15,2
16,2
15,6
15,4
16,1
15,1
15,5
15,4
15,1
Počty hodnot
T
15,7
14,9
14,5
14,5
14,8
14,9
15,1
14,7
15,0
15,0
14,6
15,3
15,8
14,6
15,5
C
Odhady rozptylů
B
Odhady středních hodnot
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
A
2
T
T1
Mean
14,9933 15,5067
Variance 0,17495 0,13781
Observati
15
15
Pooled Va 0,15638
Hypothes
0
df
28
t Stat
-3,555
P(T<=t) o 0,00068
t Critical o 1,70113
P(T<=t) tw 0,00137
t Critical t 2,04841
Sdružený rozptyl (pooled variance)
Definovaný rozdíl mezi středními
hodnotami
Hodnota testového kritéria
Jednostranní p-hodnota
p-hodnotu vrátí také funkce TTEST.
Jednostranní kritická hodnota T-rozdělení
Dvoustranné hodnoty
Hypotéza H0 se zamítá, když t stat > t krit (t stat < -t krit), anebo P(T<=t) je menší jako zvolená hladina
významnosti.
Když je H1 definována tak, že jeden výběr pochází z rozdělení se střední hodnotou pouze větší (menší)
jako střední hodnota druhého rozdělení pak se použijí jednostranné hodnoty. V případě definice H1, že
výběry pocházejí z rozdělení s různými středními hodnotami, se použijí dvoustranné hodnoty.
p-hodnoty vrátí také funkce TTEST, anebo UFU funkce XTtest.
Použití nástroje T - Test
V tomto případě použijte jednostranné hodnoty. -3,555 < -1,7011, tedy hypotézu, že výběry T a T1
pocházejí z rozdělení se stejnými středními hodnotami můžete zamítnout.
Přes nabídku Tools - Data Analysis otevřete dialogové okno Data
Analysis. Pak vyberte Two -Sample Assuming Equal Variances.
Byla provedena oprava zařízení. Po opravě by měla být střední hodnota snížena přibližně o 0,5. Stav
po opravě je reprezentován výběrem T2.
1
Postavte hypotézu H0: výběry T1 a T2 pocházejí z rozdělení se stejnými středními hodnotami
a hypotézu H1: výběry T1 a T2 pocházejí z rozdělení s různými středními hodnotami.
Nula pro hypotézu H0, že výběry
pocházejí z rozdělení se stejnou
střední hodnotou.
Zvolená hladina významnosti
Definovaný rozdíl středních
hodnot pro hypotézu H0, že
výběry pocházejí z rozdělení s
definovaným rozdílem středních
hodnot.
Pokud bude F-testem zamítnuta hypotéza o rovnosti rozptylů, použijte nástroje Two - Sample
Assuming Unequal Variances (to však vede ke snížení počtu stupňů volnosti).
Výběry musejí pocházet z normálního rozdělení!
!
Doplněk
Analytické
nástroje
(2)
t - test
Když pomocí t - testu zamítnete hypotézu H0, můžete prohlásit, že opravou byl dosažen posun
hodnoty.
21
22
23
A
B
T1
15,6
15,2
T2
14,7
15,7
34 15,5
35 15,4
36 15,1
37
38 15,507
Položku Hypotesized Mean Difference
zadejte 0.
C
Je vidět, že 3,2227 > 1,7011 ale také
3,2227 > 2.0484. Hypotézu, že rozdíl
mezi středními hodnotami je 0 můžete
zamítnout, tedy oprava byla účinná.
Sestrojením konfidenčních intervalů
(funkce UFU Estimation) pro průměry ve
výběrech T1 a T2 se přesvědčte, jakého
posunu střední hodnoty bylo dosaženo.
15,5
14,5
14,7
15,027
!
KURZ4.XLS (t - test)
(36)
33
Anova
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
A
B
C
D
T1
14,5
16,8
16,8
16,0
14,8
14,8
14,7
15,4
16,7
14,0
13,7
15,7
15,3
14,6
15,0
T2
15,1
14,6
14,8
15,4
16,2
15,6
14,4
14,8
13,6
13,7
15,5
16,6
16,8
13,5
15,1
T3
15,7
14,7
16,7
14,4
14,4
15,4
14,5
14,6
13,8
14,2
15,3
14,8
14,5
14,5
15,5
T4
16,5
15,3
14,7
13,5
13,8
13,6
15,2
14,4
15,5
13,9
14,3
14,9
14,0
14,2
13,4
15,253
15,047
14,867
14,480
2
Problém:
Výběry T1, T2, T3, T4 pocházejí ze čtyř různých
zařízení. Otázka zní, zda jsou stejné střední
hodnoty produkce z těchto čtyř strojů.
Řešení:
Problém by bylo možno rozřešit testováním všech
dvojic pomocí t-testu. To by ale bylo značně
nepohodlné a také nespolehlivé. EXCEL poskytuje
vhodnější nástroj - ANOVA (Analysis of Variance).
Postavte hypotézu H0: výběry pocházejí z
rozdělení se stejnými středními hodnotami
a hypotézu H1: výběry pocházejí z rozdělení s
různými středními hodnotami.
Použití nástroje Anova
Přes nabídku Tools - Data Analysis otevřete
dialogové okno Data Analysis. Pak vyberte Anova:
Single Factor.
1
Hypotéza H0 se zamítá, když F > F krit,
anebo hodnota P je menší jako zvolená
hladina významnosti.
Anova: Single Factor
SUMMARY
Groups Count
T1
15
T2
15
T3
15
T4
15
Sum
228,8
225,7
223
217,2
Počty stupňů volnosti (dF)
ANOVA
Source of Varia SS
Between 4,84983
Within Gr 45,952
Total
50,8018
Součty čtverců
df
Average
15,2533
15,0467
14,8667
14,48
Variance
0,95838
1,03552
0,53238
0,756
Testové kritérium F - testu =
MS
3 1,61661
56 0,82057
MSMezi výběry
MS Vse
š chny výběry
F
P-value
F crit
1,9701 0,12892 2,76943
Jednostranní kritická hodnota
F - rozdělení
59
Střední kvadratické
odchylky
Jednostranní p - hodnota testového kritéria
1,9701 < 2,7694, tedy hypotézu, že výběry T1 až T4 pocházejí z rozdělení se stejnými středními
hodnotami nemůžete zamítnout.
ANOVA zkoumá, jestli je možné rozlišit rozdíl mezi odhady středních hodnot jednotlivých skupin,
vzhledem k rozptylům hodnot uvnitř skupin.
Výsledek testu s výběry T1 až T4 tedy říká, že mezi nimi není možné zjistit rozdíl, protože je velký
rozptyl uvnitř výběrů - každé zařízení pracuje s velkým rozptylem. Jiná situace by nastala, kdyby se
snížily rozptyly (seřízením). Pak by se mohly projevit rozdíly.
Zvolená hladina významnosti
!
Doplněk
Analytické
nástroje
(2)
Anova
(ANOVA)
KURZ4.XLS (Anova)
(36)
34
určit pravděpodobnost s jakou se vyskytne právě tato hodnota.
Vysvětlení k testům hypotéz
Proveďme myšlenkový pokus. Máme několik pytlů, v
nichž jsou černé a bílé kuličky. Pytle jsou označeny
podle procenta černých kuliček. Někdo přinese 100
kuliček a řekne že je vybral z pytle 40%. Jeho
hypotéza tedy je: Přinesené kuličky pocházejí z pytle
40%. Označme ji H0. Pak někdo jiný tvrdí, že kuličky
byly vybrány z jiného pytle. Máme další hypotézu:
Kuličky pocházejí z jiného pytle jako 40%. Tuto
hypotézu označme H1.
0,6
80% 100%
50% 30%
70%80%
60%
Obr. 1
Nyní máme dvě hypotézy postavené proti sobě. Dokážeme nějakým způsobem získat důkazy o tom,
že první tvrzení je velice málo pravděpodobné a naopak, že pravdivost druhého tvrzení je vysoce
pravděpodobná ? Dokážeme tedy zamítnout hypotézu H0 ve prospěch hypotézy H1?
Taková rozhodnutí jsou možná, musíme ale mít k dispozice vhodné nástroje. Připravme si je.
0,3
40%, rozsah 5
Zkusme zjistit, zda skupina náhodně vybraných kuliček z jednoho pytle
nese informaci o svém původu.
0,2
0,1
0
0,3
40%, rozsah 10
0,2
0,1
0
0,4
40%, rozsah 20
0,3
0,2
0,1
0
0,6
40%, rozsah 100
0,4
Z pytle 40% vybereme náhodně pět kuliček a zjistíme procento
černých. Toto provedeme 100 krát. Ze zjištěných hodnot sestrojíme
histogram relativních četností. Je na Obr.2 označený 40%, rozsah 5.
Je vidět, že nejčastěji se vyskytovaly výběry, které obsahovaly něco
mezi 30% a 40% černých. Hodně bylo také 5 procentních výběrů ale i
70 procentních.
Nyní zvětšíme rozsah výběru na 10, pak na 20 a 100. Příslušné
histogramy jsou na Obr.1.
Zdá se že se zvyšováním rozsahu výběru, se informace zlepšuje. Je to
tím, že ve větším výběru, pokud je náhodný, je větší počet prvků, které
mohou mít různé hodnoty. Každý má volnost nabýt libovolnou hodnotu,
ale má hodnotu charakterizující právě místo jeho původu. Při větším
rozsahu výběru je více prvků majících volnost nabývat různých hodnot máme větší počet stupňů volnosti.
Histogramy na Obr. 2 reprezentují rozdělení pravděpodobnosti výskytu
hodnot procenta černých kuliček ve výběru pro 40% pytel. Procento
černých kuliček ve výběru je tedy parametr obsahující informaci o tom,
z kterého pytle pochází a může sloužit jako testové kritérium (též
testová statistika) pro odhad místa původu výběru.
0,2
0
"
Obr. 2
Máme testové kritérium a poznáme pro něj rozdělení pravděpodobnosti
s různým počtem stupňů volnosti. Jinými slovy, když poznáme velikost
výběru (počet stupňů volnosti) a procento černých ve výběru, můžeme
Vysvětlení k testům hypotéz
0,4
Máme vyhráno. Provedeme výběr z pytle, zjistíme procento černých a z
rozdělení pravděpodobnosti pro pytel 40% zjistíme zda hodnota testového
kritéria není pro pytel 40% málo pravděpodobná. Když víme, že pro
některý jiný pytel je tato hodnota vysoce pravděpodobná, můžeme
zamítnout předpoklad, že výběr pochází z pytle 40%. Zůstává určit co je
málo pravděpodobné, tedy určit takovou hodnotu pravděpodobnosti, že
všechny menší už jsou to "málo". Této hodnotě říkáme hladina
významnosti (označovaná α).
0,4
90%
40%
10%
Nyní zkusme jiné pytle. Na Obr. 3 jsou histogramy pro pytle 20% a 70%
porovnány s histogramen pytle 40%, vše pro rozsah výběru 100. Je
patrné, že histogramy neboli rozdělení se liší. Jinak, hodnoty procenta
černých (testového kritéria), které jsou málo pravděpodobné pro výběry z
pytle 40%, mohou být naopak vysoce pravděpodobné pro některé jiné
pytle.
20%, rozsah 100
0,2
0
0,6
40%, rozsah 100
0,2
0
0,6
70%, rozsah 100
0,4
0,2
0
Na Obr.1 jsou znázorněny pytle s kuličkami, jsou tam 10%, 30% tedy
menší jako 40% a také větší. Pokud bude hodnota testového kritéria
Obr. 3
pro nějaký výběr například 2 procenta, je malá pravděpodobnost, že
pochází z pytle 40%, ale velká, že pochází třeba z pytle 5%. Podobně pro hodnotu testového kritéria
85. Na obou stranách rozdělení pro 40% pytel tedy nacházíme rozdělení pro jiné pytle které nám dávají
vysokou pravděpodobnost, že výběr pochází z nich, i když je pravděpodobnost pro 40% pytel malá. Na
každé straně rozdělení pro 40% pytel můžeme zamítnout hypotézu H0, že výběr pochází ze 40% pytle
ve prospěch hypotézy H1, že výběr pochází z jiného pytle. Protože to jde na obou stranách, hovoříme o
dvoustranném testu.
Na Obr. 4 je jiná situace. Zde chybějí pytle 10%, 20%, 30%, jsou jen 40% a větší. Kdyby byla hodnota
testového kritéria jakkoli nízká a pravděpodobnost pro 40% pytel jakkoli malá, nenajdeme pytel, který
by poskytoval větší pravděpodobnost. Na levé straně rozdělení pro 40% pytel tedy není možné
hypotézu H0 zamítnout. Hypotéza H1 může mít v tomto případě tvar: Výběr pochází z pytle, kde je podíl
černých kuliček větší jako 40%. Zde se jedná o jednostranný test.
Všimněte si formulace hypotéz H1 pro dvoustranný a jednostranný test. V prvním případě se vyskytuje
slovo "jiný" ve druhém "větší".
Při takovémto statistickém přístupu k testování se
můžeme dopustit dvou chyb. Chyba prvního
druhu vznikne když zamítneme H0 a ona je
pravdivá. Chyby druhého druhu se dopustíme,
když H0 pravdivá není a my ji nezamítneme. Možnost
vzniku chyby prvního druhu omezíme snížením
hladiny významnosti. Možnost vzniku chyby druhého
druhu omezíme zvyšováním počtu stupňů volnosti.
50%
80% 100%
70%
90%
40%
60%
Obr. 4
35

Podobné dokumenty

Kapitola VII. ANALYSA ROZPTYLU – ANOVA.

Kapitola VII. ANALYSA ROZPTYLU – ANOVA. Jde nyní o to, zda rozdíly mezi analytiky jsou významné nebo zda jsou pouze důsledkem běžných náhodných odchylek. Celková variabilita v datech je dána kombinací rozptýlení výsledků jednoho každého ...

Více

PDF obsahující názvy všech funkcí Excelu v Angličtině a

PDF obsahující názvy všech funkcí Excelu v Angličtině a Vrátí maximální hodnotu z vybraných položek databáze. Vrátí minimální hodnotu z vybraných položek databáze. Vynásobí hodnoty určitého pole záznamů v databázi, které splňují daná kritéria. Odhadne s...

Více

adjustable precision shunt regulators

adjustable precision shunt regulators The TL431 and TL431A are 3-terminal adjustable shunt regulators with specified thermal stability over applicable automotive, commercial, and military temperature ranges. The output voltage can be s...

Více

Náhrada AD převodníku

Náhrada AD převodníku desku s plošnými spoji, kterou pøes konektorovou redukci nasuneme do pùvodní objímky. Na spoji je vytvoøen i externí zdroj referenèního napìtí. Obvod TL431 je zdroj pøesného napìtí (2,5 V) pro oper...

Více

Program Směnárna 5.12 - příručka uživatele

Program Směnárna 5.12 - příručka uživatele spuštění po vložení CD ROM média) a dále postupujte podle pokynů instalačního programu. Při instalaci ze souboru získaného stažením z webových stránek www.fortia.cz nebo zaslaného elektronicky spus...

Více