ýeské vysoké uţení technické v Praze BAKALÁ SKÁ PRÁCE

Transkript

ýeské vysoké uţení technické v Praze BAKALÁ SKÁ PRÁCE
eské vysoké uení technické v Praze
Fakulta elektrotechnická
Katedra mení
BAKALÁSKÁ PRÁCE
Subjektivní mení a objektivní modelování
srozumitelnosti a vnímání kvality penosu hlasu v pípad zátže
i afektu posluchae
Jií Novák
Vedoucí práce: doc. Ing. Jan Holub, Ph.D.
Studijní program: Elektrotechnika a informatika
Obor: Kybernetika a mení
erven 2009
PROHLÁŠENÍ
Prohlašuji, že jsem bakaláskou práci „Subjektivní mení a objektivní modelování srozumitelnosti a vnímání kvality penosu hlasu v pípad zátže i afektu posluchae“ vypracoval samostatn a použil k tomu úplný výet citací použitých pramen, které uvádím
v seznamu piloženém k bakaláské práci.
Nemám námitky proti pjování, zveejnní a dalšímu využití práce ve smyslu § 60 zákona .121/2000 sb., o právu autorském, o právech souvisejících s právem autorským a o
zmn nkterých zákon (autorský zákon), pokud s tím bude souhlasit katedra mení Fakulty elektrotechnické VUT v Praze.
PODKOVÁNÍ
Rád bych tímto podkoval vedoucímu bakaláské práce doc. Ing. Janu Holubovi, Ph.D.
za cenné rady pi návrhu, realizaci a zpracování výsledk subjektivních test kvality penosu hlasu. Dále podkování patí všem zúastnným osobám praktického experimentu,
který byl nedílnou souástí této práce. Jedná se o 24 osob, které se dostavily ve svém volném ase a s velkou ochotou. V neposlední ad za dobe fungující spolupráci kolegm,
s kterými jsem praktické experimenty našich bakaláských prací spolenými silami realizoval.
V Praze 3.6. 2009
____________________
Jií Novák
ABSTRAKT
Cílem této bakaláské práce je zkoumat odlišnosti a závislosti mezi vnímáním kvality
peneseného hlasu po telekomunikaním kanále a stavem psychické zátže uživatele telekomunikaních služeb.
K provedení práce je nutné navrhnout experiment, pi nmž skupina poslucha hodnotí
v laboratoi zvukové vzorky hlasových záznam, upravených pro poteby simulace penosu v praxi používaných druh kódování hlasu. Dále je nutné navrhnout metodu, pomocí
které je poslucha uveden do krátkodobého afektu, aby mohl hodnotit skupinu hlasových
vzork ve dvou odlišných stavech svého psychického zatížení. Poslechové testy vybraných
lidí je nutné provést v souladu s normou ITU-T P.800, jež se týká realizace poslechových
test.
Vzhledem k tomu, že testy subjektivního vnímání kvality penosu zvuku jsou vtšinou
provádny na posluchaích v klidovém stavu, bude výsledkem této práce práv analýza
odlišností mezi kvalitou peneseného hlasu, kódovaného rznými typy v praxi využívaných metod, a psychickým zatížením posluchae.
ABSTRACT
The aim of this bachelor thesis is to examine the difference in the perception of the quality of transmitted voice over telecommunication channel by listeners at rest, i.e. in the absence of deflection from the normal behavior, and after its entry into the mental or physical load, i.e. at the stage of overacting.
In the laboratory to carry out the work it is necessary to propose an experiment in
which a group of listeners assess samples of audio voice recordings, adjusted for the needs
of the individual transmission simulation, applied in practice, the encoding of the voice. It
is also necessary to propose a method by which the listener is put into short overacting in
order to evaluate a group of voice samples in two different states of his mental load. Listening tests of selected people to be made in compliance with ITU-T P.800, which covers
the implementation of listening tests.
Given that the subjective perception of the quality tests of sound transmission is usually
carried out at the audience at a standstill, the result of this work will be the analysis of
differences between the quality of voice transmitted, encrypted by different types of
methods used in practice, and mental load listener.
OBSAH
1
Úvod
2
Kvalita ei
2.1
Definice pojmu kvalita ei
2.2
Mení kvality ei
2.2.1 Subjektivní mení kvality ei
2.2.2 Objektivní mení kvality ei
2.2.3 Rozdíly použitých metod
2.2.4 Nároky na prostedí testu
2.2.5 Nároky na techniku
2.2.6 Nároky na posluchae (subjekty)
7
7
7
8
10
10
11
12
12
3
Penos hlasu
3.1
Zdroje chyb v komunikaním etzci
3.2
Kódování hlasu
3.2.1 Vlastnosti kodér
14
14
15
16
4
Zátž lovka
4.1
Psychická zátž
4.1.1 Míkšíkova interakní koncepce
4.1.2 Formy psychické zátže
4.1.3 Vztah mezi zátží a kvalitou hlasu
17
18
18
18
19
5
Návrh testu
5.1
Prostedek pro psychickou zátž
5.1.1 Návrh zátžového testu
5.1.2 Realizace zátžového testu
5.2
Návrh subjektivního testu
5.3
Realizace poslechových test
21
21
21
23
24
24
6
Vyhodnocení a zpracování experimentu
6.1
Namené hodnoty
6.2
Objektivní modelování
6.2.1 Základní pojmy statistiky
6.3
Zpracování výsledk
6.4
Odhad nejistot
25
25
26
26
28
33
7
Závr
34
8
Použitá literatura
8.1
Literární publikace
8.2
Ostatní zdroje informací
36
36
36
9
Seznam tabulek, obrázk a graf
37
10 Pílohy
6
38
Úvod
1. ÚVOD
Posuzování kvality penosu hlasu je dležitým faktorem pi návrhu, realizaci a využívání
zvukové techniky. S nástupem digitalizování díve analogových technologií se musí nyní
dbát draz na mnoho aspekt. Výhody digitalizování penášeného hlasu po telekomunikaním kanále nelze popít. Vezmeme-li v úvahu vlivy prostedí, kde se služba využívá,
nároky na technické parametry pístroj, komunikaní kanál nebo poet uživatel, digitalizace služeb je nezbytná. Umožní nám flexibilnjší zacházení se záznamy, jejich snadnou
modifikaci a rzné další úpravy napíklad pomocí výpoetní techniky.
Nevýhoda digitalizování hlasu, penesení telekomunikaní sítí a následné dekódování
pro reprodukci mže zpsobit pesto adu problém. Nkteré z nich pozorujeme i u ady
jiných odvtví, než je kódování hlasu. Digitalizace s sebou obecn nese nap. chybu kódování a kvantování. Pi penosu po reálném telekomunikaním kanále se nám mohou do
užiteného signálu modulovat rzné šumy nebo další rušivé vlivy, jako je útlum telekomunikaního kanálu, ztráta v rozboovaích apod. To vše mže zpsobit ztrátu dat. Otázkou
je, jak se tyto chyby a rušivé vlivy projeví po dekódování na reprodukním zaízení. Vnímaní lidského sluchového ústrojí je vývojem uzpsobeno spojitým signálm, které jsou
pro nho pirozené. Vnímaní takového zvuku ale samozejm záleží pedevším na technologiích, které se pi kódování hlasu používají.
K úelu odhalení závislosti mezi danou technologií a lidským vnímání slouží práv subjektivní testy kvality ei, penesené po telekomunikaním kanále. Pro jejich pípravu, realizaci a vyhodnocení byla vydána norma ITU-T P.800 [1].
Vtšina test je ale realizována pi klidovém psychickém i fyzickém stavu poslucha.
Technologie navržené na základ výsledk tchto test jsou ale v praxi využity asto i v
prostedích, kde jsou posluchai vystaveny daleko náronjším psychickým i fyzickým
podmínkám, než posluchai pi testech. Proto je zajímavou otázkou, zda napíklad lidské
vnímání dané technologie není závislé na aktuálním psychickém stavu posluchae a
v pípad že ano, tak jakým zpsobem, na jaké technologii nebo jak mže ovlivnit i zkreslit celkový výsledek subjektivního testu. Mohli bychom se pak zamyslet, zda je taková
technologie pro konkrétní dosavadní praktické využití vbec vhodná nebo by ji bylo zapotebí vylepšit, ba i dokonce nahradit.
Jií Novák
Strana 6
Kvalita ei
2. KVALITA EI
Kvalita ei je pojem, který se zaal asto používat v dob, kdy se na poli klasických telekomunikaních sítí zaaly vynoovat technologie, které mly za úkol tmto klasickým
sítím konkurovat. Tato konkurenceschopnost byla založena na nejrznjších kategoriích
vlastností spojení mezi dvma úastníky: levnjší volání, mobilita úastník, pínos nových služeb, kvalita služeb atd. Poslední zmínný pojem kvalita služeb úzce souvisí s termínem kvalita ei, který dominuje pedevším v sítích VoIP. Telefonování pes internetovou sí je v asovém mítku již, dá se íci, historická záležitost, avšak práv v dnešní dob
dochází k velmi prudkému rozvoji tohoto druhu mezilidské komunikace a otázka jako je
kvalita hovoru (kvalita ei) je velmi klíovou záležitostí. Další informace k tématu této
kapitoly je možné najít v publikaci [2], z které je v této kapitole erpáno.
2.1. DEFINICE POJMU KVALITA EI
Úkol definovat kvalitu ei je velmi obtížný, protože kvalita je velmi individuální záležitostí. A už dojdeme sebelepším zpsobem k njakému íslu reprezentující ohodnocení
kvality njakého úseku hovoru, vždy se najde nkdo, komu bude daná kvalita nadmíru
vyhovovat, a naopak nkdo, kdo bude danou kvalitu považovat za nepijatelnou. Dá se
dokonce íci, že jeden a ten samý pozorovatel bude považovat kvalitu jistého degradovaného hovorového signálu po každém pozorování jinak, protože bude záležet i na tom, jakou má pozorovatel napíklad náladu nebo bude ovlivnn jiným hovorovým signálem, který mu byl pehrán díve. Je tedy prakticky nemožné oznait njaký úsek hovorového signálu (promluvu) konkrétním ohodnocením, které bude vždy, všude a pro každého stejné.
2.2. MENÍ KVALITY EI
Prvním zpsobem je subjektivní testování, kdy je hodnocení systému ponecháno pouze
na lovku a jeho subjektivním dojmu. Druhým velmi astým zpsobem je hodnocení pomocí objektivních mících metod, kde využíváme více i mén sofistikovaných metod za
pomoci výpoetních schopností poíta nebo jiného speciálního hardwaru. Tetí zpsob
ohodnocení kvality systému je ponkud odlišný od prvních dvou. Využívá se pouze parametrického popisu daného systému a empirických hodnot kvality, které jsou daným parametrm vlastní. Takovýto zpsob nezohleduje dynamické jevy, které mohou v systému
Jií Novák
Strana 7
Kvalita ei
nastat, a proto se tento zpsob používá zejména k pibližnému popisu a tedy k odhadu kvality pi návrhu njakého nového systému. Pozdji bude první a druhý zpsob hodnocení
kvality detailnji popsán.
Dále je teba rozlišovat další dv skutenosti. Experiment k posouzení kvality systému
lze koncipovat bu jako poslechový, nebo jako konverzaní. U poslechového experimentu
je vyžadována pítomnost jednotlivých subjekt, které hodnotí kvalitu hlasového signálu
na konci telekomunikaního etzce. Ve skutenosti ani není poteba, aby testující subjekt
ml k dispozici telekomunikaní systém, v praxi se realizují poslechové testy tak, ze jsou
subjektu pehrávány zvukové nahrávky do sluchátek napíklad z poítae. U konverzaního experimentu je do hodnocení kvality zapojena dvojice subjekt. Spojení tchto subjekt
zajišuje celý telekomunikaní etzec.
2.2.1. SUBJEKTIVNÍ MENÍ KVALITY EI
Subjektivní metody jsou založeny na poslechových nebo konverzaních testech, pi kterých posluchai hodnotí kvalitu pehrávaných promluv. Pro subjektivní testy existují rzné
metodiky vyhodnocování, nap.:
x
ACR (Absolute Category Rating)
x
Quantal-Response Detectability Tests
x
DCR - Degradation Category Rating method
x
CCR - Comparison Category Rating Metod
x
The treshold method
Nejastjší zpsob vyhodnocení je ACR, který ve svém principu využívá pímého hodnocení kvality ei tak, že každé promluv je testujícím subjektem piazeno ohodnocení
využívající stupnice MOS s rozsahem od 1 do 5. Tento zpsob vyhodnocení je použit také
ve výsledcích této práce. Druhý zpsob vyhodnocení (Quantal-Response Detectability
Tests) je uren zejména pro testování prahových úrovní. DCR metoda je modifikací metody ACR, používá nedegradovaný a degradovaný signál a testuje se jak moc je degradace
výrazná. Používá se hlavn pro systémy s pevážn dobrou kvalitou. Metoda CCR je mírnou modifikací metody DCR. Poslední metoda (The treshold metod) se používá pro pímé
porovnání dvou systém, hodnotí se signály z referenního a testovaného systému a uruje
Jií Novák
Strana 8
Kvalita ei
se pouze to, který signál je lepší. Více o tchto metodách lze najít v doporuení P.800 [1].
Velikou výhodou subjektivních test jsou jejich nenahraditelné výsledky, které se dají považovat za takka absolutn pesné. Zvolíme-li totiž dostatený soubor testujících subjekt
a vyjde-li nám ze statistického zpracování výsledných dat vysoký interval spolehlivosti,
mžeme pak považovat vyhodnocené výsledky za referenní hodnoty, kterých bychom
žádným jiným zpsobem nedosáhli. Jak už bylo díve naznaeno, existují dva typy pístup pro testování. Poslechový test ke své existenci v podstat nevyžaduje testovaný systém.
V poslechovém testu se hodnotí jedna nebo více specifických vlastností, které se v systému
dají izolovat (typicky napíklad rušení signálu typu výpadky paket, šum, diskontinuity
fáze pi navazování obnovených segment ei, harmonické zkreslení, saturace eového
signálu atd.). V konverzaním testu se pak provádí testování v rámci celého systému, kdy
se do hlasového signálu promítnou všechny rušivé signály a tyto nelze úpln odstranit,
pouze se mohou jednotlivé rušivé vlivy cílen eliminovat (typická úloha je odstraování
echa), a do výsledného kvalitativního skóre se pak uplatní i všechna ostatní rušení (sidetone, doba šíení), s ímž je poteba pi zpracování výsledk poítat.
Tab. 1 – Hodnoty stupnice MOS
MOS
Kvalita
Popis
5
Vyníkající Neznatelné rušení
4
Dobrá
3
Prmrná Rušení lze rozpoznat a mírn obtžuje
2
Nízká
Rušení obtžuje, je nutno vyvinout úsilí pi snaze porozumt
1
Špatná
Rušení velmi obtžuje, e je nesrozumitelná
Jií Novák
Rušení lze rozpoznat, ale není obtžující
Strana 9
Kvalita ei
2.2.2. OBJEKTIVNÍ MENÍ KVALITY EI
Jak již bylo zmínno, objektivní testy jsou asto používaným nástrojem pro mení kvality ei. Využívá se sofistikovaných matematických algoritm, pomocí nichž lze nahradit
testy subjektivní. Jejich obrovská výhoda spoívá v délce trvání procedury mení. Zatímco subjektivní testy jsou asov velmi zdlouhavé, vhodn navržený matematický algoritmus pracuje nesrovnateln rychleji. Navržené metody objektivních test se dále dlí na 2
základní kategorie:
x
intrusivní
x
neintrusivní
Intrusivní metody pro svoji innost potebují ke správnému hodnocení kalibraci ve form
nezkresleného eového signálu. Následné zkreslení a deformace je pak na základ této
kalibrace vyhodnocena. Je-li nemožná kalibrace pomocí nezkresleného eového signálu,
nap. pi monitoringu reálného provozu na pijímací stran telekomunikaního kanálu, využívá se metoda neintrusivních metod. Mezi intrusivní metody patí nap.: PAMS, PSQM,
PESQ. Mezi neintrusivní pak nap.: LCQA, 3SQM.
2.2.3. ROZDÍLY POUŽITÝCH METOD
V nkterých pípadech je velice vhodné zjistit rozdíl objektivního a subjektivního výsledku na konkrétním zkoumaném hlasovém vzorku. Míru korelace mezi objektivními a
subjektivními metodami lze urit pomocí korelaního koeficientu. Ten je definován tzv.
Pearsonovým vztahem (1) a nabývá hodnoty v intervalu 0 až 1.
(1)
Koeficienty xi a yi pedstavují jednotlivé výsledky subjektivní a objektivní metody u odpovídajících si mení.
Podle toho, jaký zpsob hodnocení kvality systému se používá, se rozlišují i jednotky
kvality. Pehled všech variant MOS hodnocení je shrnut v následující tab. 2 a lze jej rovnž
nalézt v doporuení ITU-T P.800 [1].
Jií Novák
Strana 10
Kvalita ei
Tab. 2: Upesující varianty MOS skóre
MOS
Poslechový Konverzaní
Subjektivní
MOSLQS
MOSCQS
Objektivní
MOSLQO
MOSCQO
Odhadovaný
MOSLQE
MOSCQE
Obr. 1: Princip innosti jednotlivých typ poslechových test [2]
2.2.4. NÁROKY NA PROSTEDÍ TEST
Reprodukní zaízení by mlo být umístno v tiché místnosti o objemu mezi 30 a 120 m3
s dobou dozvuku menší než 500 ms, ješt lépe kolem 250 ms. Hluk v místnosti musí být
menší než 30dB bez pípadné dominantní špiky ve výkonovém spektru zvukového vlnní
v daném prostedí.
Okolní hladinu hluku je teba držet na tak nízké úrovni, jak je to možné. Praktické dvody, jako napíklad pravidelná výmna vzduchu v místnosti, by mly být pi konání test
potlaeny. Cílem je horní limit NC25 [1] nebo NR25 (viz. ISO 1996). Tyto hodnoty reprezentují pibližn hlukové hladiny v domech, nemocnicích nebo knihovnách.
Jií Novák
Strana 11
Kvalita ei
2.2.5. NÁROKY NA TECHNIKU
Poslechový systém
Pro poteby subjektivních test kvality penosu hlasu se zvolí jedno z uvedených reprodukních zaízení:
x
telefon
x
IRS
x
reproduktor
Zvolený systém by ml být kalibrován dle odpovídající normy P.64, piemž bychom mli
dobe znát frekvenní charakteristiky zaízení.. Doporuuje se, aby se frekvenní charakteristiky použitého zaízení mily nejmén dvakrát, vždy ped zaátkem a po konci experimentu. Z namených hodnot by nemly být patrné žádné rozdíly. To vše záleží na vedoucím experimentu, aby situaci zhodnotil a nedošlo tak k zneplatnní namených hodnot.
Hlasový materiál
Hlasový materiál by se ml skládat z jednoduchých, smysluplných a krátkých vt, náhodn vybíraných, které jsou snadné k pochopení (nap. z bžné netechnické literatury
nebo novin). Tyto vty by mly být náhodn vloženy do seznamu, aby mezi nimi nebyla
jakákoliv návaznost. Mli bychom se vyvarovat velmi krátkých a velmi dlouhých vt, ale
zamit se na vty o 2-3 sekundách.
2.2.6. NÁROKY NA POSLUCHAE (SUBJEKTY)
Výbr posluchae
Posluchai jsou vybíráni náhodn a musejí splovat následující podmínky:
x
Nejsou pímo zapojeni do práce spojené se zkoumáním technických parametr telefonních nebo penosových zaízení, v oboru zameném na kódování hlasu nebo
v jiných oborech týkající se problematiky penosu hlasu.
Jií Novák
Strana 12
Kvalita ei
x
Nezúastnili se žádného subjektivního experimentu nejmén po dobu šesti msíc
ani subjektivního poslechového testu po dobu jednoho roku.
x
Nikdy se nesetkali v minulosti se stejným hlasovým materiálem, který se chystají
hodnotit.
x
Netrpí žádnou sluchovou vadou, která by mohla zkreslit výsledky experimentu a jejich celkový zdravotní stav dovoluje experiment provést.
Není poteba dlat njaké pomry mezi muži a ženami jakožto subjekty testu, pokud to
pímo nevyžaduje experimentu. Jestliže experiment vyžaduje spárování nebo tvorbu skupin
poslucha, lze tak uinit libovoln již pi jeho návrhu, pokud tomu nebrání speciální požadavky na experiment. To platí pro pípad experiment, u kterých je nutné využít striktn
páry poslucha, nap. pi konverzaních testech. Potom vedoucí experimentu musí rozdlení poslucha peliv zvážit již pi návrhu.
Instrukce posluchai
Instrukce by mly být sdleny ješt ped zaátkem experimentu. Je poteba poslucham
zopakovat systém hodnocení MOS, slovn vyjádit, co mají pesn na hlasovém materiálu
hodnotit a jakým stylem. Jedna možnost je pomocí tištného formuláe, kde poslucha
hodnotí manuáln za použití psacích poteb, nebo pomocí elektronického hlasovacího zaízení. O variant použité pi daném testu a konkrétní realizaci hodnocení rozhodne vždy
vedoucí experimentu.
Až poslucha porozumí instrukcím, ml by si poslechnout pedbžný seznam a dostat od
vedoucího experimentu názory na jednotlivé vzorky hlasového materiálu. Testované osob
by se nemlo nic íkat o tom, že pedbžný seznam pokryl celou škálu kvality vzork, jak
je ale zapotebí, nebo vyerpal jen úzký rozsah. Po pedbžném seznamu by ml být dostatený as k tomu, aby poslucha vznesl dotazy. Dotazy týkající se pímo principu hodnocení nebo upesnní cíle, který mají posluchai pesn hodnotit, by mly být zodpovzeny
ihned, avšak na technické dotazy by se mlo automaticky odpovdt nap.: “Nemžeme
Vám o tom íci nic, dokud experiment neskoní.“
Jií Novák
Strana 13
Penos hlasu
3. PENOS HLASU
Jak již bylo zmínno v pedchozí kapitole, subjektivní i objektivní metody mení úzce
souvisí s penosem hlasu. Výsledky MOS jsou samozejm ve velké míe závislé na zvoleném druhu kódování, penosové cest a dekódování. Nejprve je dležité definovat základní
pojmy týkající se penosu hlasu. Komunikaním, též penosovým, etzcem rozumíme
celou proceduru spojenou se snímáním, zpracováním, penosem a reprodukcí hlasu. Komunikaní kanál je zpsob penosu informace. Mže to být nap. jeden z kabelových penos nebo penos bezdrátový. Pro pehlednost je tato skutenost graficky znázornna na
obr. 2. Levá ást penosového etzce zastupuje mluvího, též vysílací stranu, pravá ást
penosového etzce zastupuje posluchae, též pijímací stranu. Následn si pak nkteré
skupiny chyb, které jsou souástí systému penosového etzce, mžeme uvést a blíže vysvtlit.
Obr. 2 – schéma komunikaního etzce
3.1. ZDROJE CHYB V KOMUNIKANÍM ETZCI
x
Chyby aditivním šumem
Mže ho zpsobit nap. zesilova vstupního signálu, nelinearity v obvodech pro
zpracování signálu nebo to mže být kvantizaní šum v A/D a D/A pevodnících
x
Chyby zpsobené pevodem hlasu na elektrický signál
Nejastjší chybou v A/D pevodnících je chyba pevodu, zpsobená dynamikou pevodníku, a chyba kvantování.
Jií Novák
Strana 14
Penos hlasu
x
Chyby zpsobené kodérem
U kodéru je nutné brát v úvahu nap. chybu kódování. Nkteré navržené kodéry
dokáží potlait aditivní šum. Mžou ale také negativn ovlivnit spektrum penášeného signálu a tím ho výrazn zkreslit.
x
Chyby v komunikaním kanále
Pojem komunikaní kanál je velmi rozmanití a svým zpsobem dosti abstraktní.
Mže v sob zahrnovat celou strukturu penosu informace od místa mluvího
k místu posluchae. Dále se dá dlit na penosové médium, vysílací a pijímací
obvody, rzné rozboovae apod. Velkou výhodou digitalizace analogových dat
je práv minimalizování chyb v komunikaním kanále. Mžeme se setkat nap.
se ztrátou datového paketu, avšak problémy spojené s tmito druhy chyb jsou
ve srovnání s chybami pi penosu analogového signálu o dost menší. To je také
jeden z hlavních dvod digitalizace signálu.
x
Chyby zpsobené dekodérem, D/A pevodníkem a pevodem elektrického signálu na hlas pomocí reprodukního zaízení
Zde se setkáváme s chybami obdobnými na vysílací stran komunikaního etzce. Dležité je si uvdomit, že chyby zpsobené vysílací stranou se na pijímací stran mžou ješt zvýraznit. Aditivní analogový šum, modulovaný do
signálu na vysílací stran je podroben všem výše uvedeným chybám a po reprodukci se mže jevit jako velmi nepíjemný. Lidské sluchové ústrojí je vývojem uzpsobeno spojitým signálm, by i zašumným spojitým analogovým
šumem. Spektrum takového šumu se mže po penosu na pijímací stranu dost
zmnit a to mže zpsobit práv velmi negativní ohlas na kvalitu peneseného
hlasu na pijímací stran.
3.2. KÓDOVÁNÍ HLASU
Definuje zpsob, jakým vhodn pedpipravit signál z A/D pevodníku pro následný penos komunikaním kanálem. Jeho úkol je i komprimovat signál, aby tento kanál píliš nezatžoval svým objemem dat, popípad v nm mže být ásten potlaen i šum. Více než
strukturou je dležitjší pro tuto práci se zabývat parametry takového kodéru. Pro bližší
piblížení jsou nkteré z nich shrnuty do tab. 3. Tyto informace jsou erpány z publikace
[3].
Jií Novák
Strana 15
Penos hlasu
3.2.1. VLASTNOSTI KODÉR
x
Typ kódování
Zpsob jakým je signál kódován.
x
Zpoždní [ms]
Pi kódování signálu dochází ke zpoždní, píliš velké zpoždní (cca
200 ms) psobí problémy pi komunikaci, ím menší zpoždní kodek zpsobuje, tím lépe.
x
Výpoetní složitost [MIPS]
Udává náronost na výkon procesoru.
x
Pamová náronost [kByte]
Velikost pamového prostoru nutného pro realizaci kodeku.
x
MOS [Mean Opinion Score]
Kritérium k hodnocení kvality eového signálu. MOS je ureno íselnou
stupnicí, kde íslo 1 znamená nejhorší kvalitu, 5 pedstavuje kvalitu nejlepší. Kvalitu vždy posuzuje skupina lidí, z jejichž názoru se potom statisticky
urí MOS.
x
Bitrate [kbit/s]
Penosová rychlost potebná k plynulému penosu zakódovaných dat.
Standard
Algoritmus
G.711
PCM
G.723.1
MP-MLQ
G.723.1
MIPS Penosová rychlost [kbit/s]
MOS
64
4,1
16
6,3
3,9
ACELP
20
5,3
3,65
G.726
ADPCM
1
32
3,85
G.728
LD-CELP
30
16
3,61
G.729A
CS-ACELP
11
8
3,7
G.729
CS-ACELP
20
8
3,92
GSM 06.10
RPE-LP
10
13
3,5
Tab. 3 : Pehled používaných kodér a jejich parametry
Jií Novák
Strana 16
Zátž lovka
4. ZÁTŽ LOVKA
Zátž organismu je výsledkem psobení ady initel. Z hlediska zmn v innosti jsou
asto oddlovány rzné aspekty zátže, akoliv jeden má zpravidla dominantní vliv. Vyplývá totiž ze vztahu mezi požadavky a nároky, které klade okolí nebo jedinec sám na sebe, a pipraveností jak je zvládat. Pimená zátž je žádoucí a vede k rozvoji osobnosti.
Naopak zátž nepimená zpsobuje vyšší fyziologickou odpov organismu. Zátž mžeme obecn rozdlit na biologickou, fyzickou a psychickou. Rozpoznáváme ji od stresu
tak, že zátž chápeme jako úrove požadavk kladených na lovka, zatímco stres jako
nepimenou zátž pro jedince. Psychický stres mže mít krom nepíznivých úink (míra subjektivní zranitelnosti), kdy byla pekroena mez individuální tolerance (extremní
zátž), také úinky pozitivní. Psobení stresor má proadaptaní význam. Je-li jedinec vystaven psychologickému tréninku zvyšování odolnosti i vi psychickým stresorm, mluvíme o zvyšování zátžové tolerance, o otužilosti i nezdolnosti - viz výcvik bhem vojenské služby, speciální výcvik policist a hasi. Toto je výtah základních pojm z publikace
[4].
Zátž mžeme dle míry psobení rozdlit do nkolik tíd:
x
optimální zátž
Faktory psobící na lovka jsou v ideálních mezích, pináší uspokojení a
umožují pesn a bezpen vykonávat pracovní innost. Jde o stav pracovní
pohody.
x
mírná zátž
Pi níž nkteré faktory pesahují optimální hodnoty, lovk pociuje narušení
pracovní pohody, avšak neprojeví se to ani ve výkonu, ani trvalými pocity únavy.
x
velká zátž
Vtšina faktor výrazn pesahuje doporuené hodnoty. Dochází k výrazným
projevm odezvy organismu a snížení výkonu.
x
nepijatelná zátž
Hodnoty faktor pekraují povolené meze. Dochází k nevratným následkm ohrožení zdraví. Pracovní výkon je pro prmrného lovka nemožný.
Jií Novák
Strana 17
Zátž lovka
Další dlení mže být provedeno podle typu zdroje zátže. Základní typy pedstavují psychická a fyzická zátž. Vzhledem k rozmanitosti pojm se zde s fyzickou zátží zabývat
nebudeme, nebo s ní v pípad této práce do styku nepijdeme.
4.1. PSYCHICKÁ ZÁTŽ
Definovat pojem psychické zátže není tak jednoduché, jak se na první pohled mže
zdát. Vysvtlení pojmu autor knih z odvtví psychologie se také velmi liší. Odlišnosti
závisí hlavn na koncepci, na které je metodika zkoumání psychické zátže založena a jak
ji definuje její autor. Pro piblížení základního pohledu do oblasti psychické zátže bude
dostaovat struný výtah z vybrané teorie. Autor je Oldich Mikšík. Problematika je
podrobn popsána v jeho publikaci [5], z které je taktéž v této kapitole erpáno.
4.1.1. MIKŠÍKOVA INTERAKNÍ KONCEPCE
Mikšíkova interakní koncepce posouzení psychické zátže vychází ze vztahu vnjších
vliv a vnitních podmínek. Pi tomto druhu zátže nemusí podnt psobit pímo, jak je
tomu pi zátži fyzické, ale jen v, na první pohled symbolické, podob ve form okolních
vjem, které osoba vnímá.
Pro lovka je uritá míra psychické zátže nezbytná, protože pozitivn ovlivuje rozvoj
jeho osobnosti. Jsou-li požadavky vnjšího prostedí v souladu s možnostmi a schopnostmi
lovka, mluvíme o optimální zátži (hypostres). Pesahují-l i požadavky jeho možnost i
nebo dojde k rozporu mezi vnitními pedpoklady a nároky okolí, jedná se o tzv. „mezní i
extrémní zátž“ (hyperstres), protože lovk není schopen danou situaci ešit i se na ni
adaptovat. Psychická zátž tak vzniká v nadlimitních situacích, které mají pro daného lovka njaký osobnostní význam. Tyto situace vyžadují okamžité rozhodování, emocionální
a myšlenkové petížení, ohrožují jeho hodnoty nebo vyžadují zvýšenu odpovdnost.
4.1.2. FORMY PSYCHICKÉ ZÁTŽE
x
senzorická zátž
Vyplývá z požadavk na innost senzorických orgán a jim odpovídajících
struktur centrálního nervového systému.
Jií Novák
Strana 18
Zátž lovka
x
mentální zátž
Vyplývá z požadavk na zpracování informací, kdy jsou velké nároky kladeny
na psychické procesy jako jsou pam, pozornost, myšlení, rozhodování, aj.
x
emoní zátž
Vyplývá ze situace a požadavk, které vyvolávají afektivní odezvu. Alternativním názvem pro tento druh psychické zátže mže být „psychosociální stres“,
který vyplývá ze skutenosti, že se vše odehrává ve spoleenském kontextu.
4.1.3. VZTAH MEZI ZÁTŽÍ A KVALITOU HLASU
Dležitou otázkou je, jak se vliv psychické zátže mže vázat na kapitolu 1, tj. tvorbu,
provedení a vyhodnocení poslechových a konverzaních test kvality penosu hlasu. V
norm pro realizaci poslechových test ITU-T P.800 – ást Annex A [1], se doteme, že
test by se ml provádt na subjektech, které jsou v klidném psychickém stavu a není na
nich pozorována zvýšená psychická zátž. Z výše uvedeného však vyplývá, že psychická
zátž je tak rozmanitým a nejednoznaným pojmem, že je u vybraných subjekt na poslechové testy velmi náron pozorovatelná, ba i dokonce identifikovatelná. Není možné proto vylouit, že výsledky subjektivních test hodnocení kvality ei nebudou zatíženy njakou chybou. Pedpokládat, že praktické využití všech hlasových zaízení bude sloužit pro
uživatele pi psychické zátži konvergující k absolutn klidovému stavu, je velmi nereálné.
Vzhledem k tomu, že výše uvedené typy psychické zátže se dají simulovat nedaleko poslechové místnosti, kde subjekty hodnotí kvalitu ei, je možné tento krok zahrnout do celkového experimentu. Jedná se pedevším o mentální i senzorickou zátž. V prostedí, kde
se experiment odehrává, bude nejlepší využít nap. zvukové a visuální vjemy, nebo využít
jiné alternativy, o kterých vždy rozhodne vedoucí experimentu. Typické a hlavní zdroje
psychické zátže jsou pro lepší orientaci uvedeny také v tab. 4. Poté je možné v závislosti
na psychickém vytížení modelovat rozdíly MOS hodnot, získaných od subjekt. Zjištné
rozdíly ve výsledcích mžou zpsobit uritý druh nejistoty. Protože matematické algoritmy
objektivních test penosu kvality hlasu jsou vyvinuty práv na základ test subjektivních, je pravdpodobné, že nejistota zpsobená psychickou zátží testovaného subjektu se
penese i do test objektivních. Snaha piblížit tyto nejistoty a blíže je prozkoumat, najít
urité systematické vazby, bude pedmtem dalších kapitol této práce. Na základ výsledk bude moci být vystavené doporuení pro korekci velmi asto doporuených matematic-
Jií Novák
Strana 19
Zátž lovka
kých algoritm objektivních test penosu kvality ei, a to dokonce v konkrétních pípadech. Uvedení do problematiky ukazuje obr. 3.
testovaný vzorek
subjektivní
hodnocení
kvality ei
vliv psychického
zatížení
+
+
MOS hodnoty zatížené nejistotou
výsledek testu
Obr. 3 – Subjektivní test kvality penosu hlasu zatížený psychickou zátží
Tab. 4 – Zdroje psychické zátže s píklady výskytu i vzniku
íslo zdroje:
Název zdroje:
Píklad innosti:
1
Množství informací Velký poet sdlova, sledování provozu (idi, operátor)
2
Nedostatek
informací
3
Monotónnost
4
Trvalá zátž
5
Zmny informace
6
Nevhodná kódování Informace jsou nejasné, nezetelné, nejednoznané
7
Špatné prostedí
Špatné osvtlení, kou, mlha, déš znesnadující píjem
informací (operátor, idi)
8
Vysoká pesnost
Poteba vysoké pesnosti pi vykonávání práce
9
Zodpovdnost
10
Nároky na pam
11
12
Složité
vyhodnocování
Obtížná
rozhodování
13
Rizikovost práce
14
asový stres
15
Jií Novák
Minimální až nulový písun operací, žádná jiná innost. Vede
k útlumu
Jednoduchá fyzická práce nevyžadující psychické procesy
(pásová výroba)
Nutnost stálé pozornosti. Trvalé sledování sdlova, situace,
tvar, atd.
Pi rychlých zmnách podnt, které je nutno registrovat
(operátor, idi)
Nároky na zodpovdnost za hmotné statky nebo lidské životy.
Zklamání dvry
Práce vyžaduje zapamatování složitých postup, uchování
množství informací
Informace je teba hodnotit ve vazbách, píliš mnoho variant
Pro rozhodnutí není dostatek informací, nebo jsou nejasné a
nejednoznané
Je reálné nebezpeí úrazu, onemocnní nebo havárie
Je nedostatek asu na provedení práce, blížící se termín,
nemožnost ovlivtit prbh akce
Osoba je si vdoma svých osobních (fyzických, psychických,
Vdomí nedostatku
kvalifikaních apod.) nedostatk
Strana 20
Návrh testu
5. NÁVRH TESTU
Jak již bylo mnohokrát zmínno, tato bakaláská práce se zabývá rozdíly mezi subjektivním mením kvality penosu hlasu u posluchae v klidovém psychickém stavu, tj. bez
známek psychického zatížení, a ve fázi, kdy poslucha jeví známky psychické zátže.
K tomuto úelu je poteba vybrat vhodný prostedek psychického zatžování a daný subjektivní test, popsaný v norm ITU-T P.800, viz píloha [1], k nmu pizpsobit. Vzhledem
k form subjektivního testu a prostedí, kde se odehrává, bylo zamítnuto vymýšlet prostedek pro testy po fyzické zátži. Proto se zamíme dále jen na zátž psychickou.
5.1. PROSTEDEK PRO PSYCHICKOU ZÁTŽ
Z kapitoly 3 mžeme vyíst základní informace potebné k sestavení takového prostedku, budeme jej dále popisovat jako zátžový test. Úkolem zátžového testu posluchae
hodnotícího penos kvality hlasu je jej psychicky zatížit v co možná nejkratším ase a pijatelné spoleenské form. Takové testy již existují a používají se velmi asto. Je možné
uvést píklady hasi i policist. Nedílnou souástí pijímacího ízení tchto skupin do
služby jsou mimo jiné i testy psychické zátže. Od takového testu jsou vyžadovány 2 základní funkce. Zaprvé se testovaná osoba musí uvést njakou formou do požadované zátže, a potom je poteba míru této zátže též vyhodnotit. První ást je nejastji realizována
podobou tištných test nebo pomocí poítaového programu. Vyhodnocení takového testu
není avšak vbec jednoduché. Je doporueno pro vrohodnjší výsledky pizvat dokonce
odborníka z oblasti psychologie, který na základ dosažených výsledk testy vyhodnotí.
Musí brát pitom v úvahu i okolní vlivy a kritéria, pi kterých je test konán. Testovaná osoba jist vykazuje známky nervozity, musí pracovat v asové tísni, pod tlakem, ve velkém
kolektivu, jsou hlídány povenou osobou, která je mže pi testech rozptylovat, apod.
Všechny tyto aspekty mohou mít vliv na celkový výsledek, a proto vyhodnocení není tak
jednoduché. V pípad této práce není ovšem nutné výsledky zátžových test vyhodnocovat, nýbrž využijeme pouze první uvedenou vlastnost. Tím se práce výrazn zjednoduší.
5.1.1. NÁVRH ZÁTŽOVÉHO TESTU
Nejprve je nutné dobe promyslet, jak požadovaný test bude fungovat, aby plnil co nejefektivnji svj úel. Musíme ho také pizpsobit podmínkám subjektivních test, které
posluchai vykonávají. Jedná se zejména o technické prostedky a asovou náronost zátžového testu. Pro konkrétní podobu zátžového testu byla zvolena zjednodušená metoda
tzv. sedmikového testu.
Jií Novák
Strana 21
Návrh testu
Sedmikový test se realizuje nejastji na PC. Testovanému je pedložen na monitoru íselný tverec 10u10, v nmž jsou rzn rozmístna ísla od 1 do 100 (jejich rozmístní je
stálé bhem celé doby testování). Vedle tverce se vždy objeví íslo, které se má vyhledat
a urit jeho souadnice na monitoru. Série ísel, která se má postupn vyhledat, se opakuje
ptkrát po šestiminutových blocích, ale stídav se mní podmínky. Bu testovaný pracuje
spontánním tempem, nebo je asový tlak zvýšen. Nenajde-li íslo v uritém limitu, monitor
signalizuje neúspch a je nabízeno další íslo k pokusu.
Je patrné, že sedmikový test je velice výhodný vzhledem k technickým prostedkm
v laboratoi, kde se provádjí subjektivní testy kvality penosu hlasu. Jedinou nevýhodou je
jeho asová náronost, protože trvá 30 min. Pro poteby této bakaláské práce není, jak již
bylo uvedeno, vyhodnotit výsledky takového testu, proto je tím práce ješt výrazn zjednodušena. Kvli asové náronosti testu je tento test po osobní konzultaci s odborníkem
z oboru psychologie upraven, avšak jeho základní struktura zstává zachována.
Ze sedmikového testu se udlá soutž mezi úastníky test. Každý ze soutžících je
motivován hlavní cenou za první místo. To alespo ásten motivuje testovanou osobu
uspt. Na monitoru se zobrazí íselný tverec, stejný jako u sedmikového testu. Vedle se
soutžícímu zobrazí náhodn vybrané íslo a jeho úkolem je v co nejkratším ase zamit
polohu ísla klikem myši. Poátení asový limit, za který musí soutžící íslo najít, je
nastaven na 20 vtein. Poet ísel je 75. Dvod je, že doba takového testu trvá cca 13 min.
V prbhu testu se ale zaznamenává as, za který soutžící stihne íslo najít. Pvodní limit
20 vtein je poté dynamicky modifikován aritmetickým prmrem jeho 3 pedchozích výsledk, a tak spoítán nový asový interval pro následující íslo. Jestliže se íslo nepodaí
najít nebo se najde jiné než požadované, do dalších prmr bude poítáno s limitem 20
vtein. Soutžící je motivován i pomocí bod. V každém kole je k dispozici 20 bod. Pidlený poet je ale úmrný asovému intervalu, za který soutžící íslo najde. Soutžící je
ped testy motivován mylným doporuením, že má pracovat co nejrychleji. Tato strategie
nejastji nevyhrává. Je velice pravdpodobné, že úspch v jednotlivých kolech nebude
vyrovnaný, což zpsobuje velkou ztrátu bod. Naopak vyrovnané hodnocení je obvykle
cílem úspchu. Soutžící vidí své vlastní aktuální body, 10 kol ped koncem se ovšem
skryjí, aby nevdl pesný výsledek. Ten mu bude sdlen dávno po skonení všech test
jako vedlejší efekt. Jestliže porovnáme návrh tohoto testu s tab. 4, zamyslíme se nad prin-
Jií Novák
Strana 22
Návrh testu
cipem takto navrženého zátžového testu, najdeme celou adu analogií, které mohou být
píinou vzniku psychické zátže. Pesn na této bázi je tento test realizován.
5.1.2. REALIZACE ZÁTŽOVÉHO TESTU
Struný návod, jak zhotovit zátžový test, dává pedchozí kapitola. Otázkou ale stále je,
jak konkrétní produkt, se kterým pijdou testované osoby do styku, realizovat. Nejjednodušší zpsob je na základ daného návodu test vlastnorun vytvoit. K takovému kroku je
možné pistoupit se základní znalostí poítaového programování v nkterém z jazyk.
Zátžový test, použitý v rámci této bakaláské práce, je naprogramován v objektov orientovaném jazyce C#. Zdrojové kódy tíd i vlastní funkní aplikace jsou souástí elektronické pílohy. Na obr. 4, kde je pro pedstavu znázornn tento zátžový test, mžeme vypozorovat adu vedlejších efekt. Testovaná osoba je dokonce za využití sluchátek doprovázena
rznými zvukovými signály. Úkol všech tchto efekt je testovanou osobu co nejvíce rozptýlit.
Obr. 4 – zmenšený obrázek zátžového testu v pomru 1:3
Jií Novák
Strana 23
Návrh testu
5.2. NÁVRH SUBJEKTIVNÍHO TESTU
Jestliže je k dispozici nástroj pro uvedení testovaného subjektu do stavu se zvýšenou
psychickou zátží, je možné pistoupit k samotné realizaci subjektivního testu v kombinaci
práv s testem psychické zátže. Doporuení, jak pipravit, provádt a vyhodnocovat subjektivní testy penosu kvality hlasu již bylo popsáno v kapitole 1. Nejprve je poteba mít
k dispozici hlasový materiál. V pípad této práce se jedná o soubor 4 rzných vt, nahraných mluvími obou pohlaví (2 muži, 2 ženy). Nahrané hlasové vzorky jsou v našem pípad zakódovány 16 kodéry, kterými se signál kóduje. Potom se ke každému vzniklému
produktu ješt vytvoí vzorek s pidaným aditivním šumem a spolu s kódováním tak
vznikne hlasový materiál o 128 vzorcích. Nkteré deformace jsou tak znané, že by byla
velká pravdpodobnost hodnocení vtšiny poslucha velmi nízkým ohodnocením, a tím
by hodnota této informace byla velmi nízká. Takové vzorky jsou ze zvukové báze vyazeny. Výsledná zvuková báze tedy ítá 105 vzork.
Hlasový materiál nyní mžeme po reprodukci využít k subjektivnímu mení kvality
penosu hlasu a získat tím výsledky v podob MOS hodnot u jednotlivých vzork. Naším
úkolem je ale zjistit závislost tchto MOS hodnot v závislosti na psychické zátži posluchae. Proto provedeme první kolo mící procedury hned na zaátku experimentu, kdy
jsou posluchai nejvíce odpoatí. Po zatížení posluchae pomocí testu psychické zátže
následuje bezprostedn druhé kolo poslechových test pi stejných okolních podmínkách
jako pi kole prvním. Dá se pedpokládat, že poslucha si práv odnese svj psychický stav
od test psychické zátže, a tím budou ovlivnny i výsledky druhého kola.
5.3. REALIZACE POSLECHOVÝCH TEST
Zvolíme-li si variantu subjektivních test, je nutné zapojit velké množství poslucha.
To je z hlediska organizace a prostedí, kde se testy odehrávají, velmi nároná záležitost.
Ostatn to je hlavní nevýhoda celého systému subjektivního testování. Vedoucí experimentu musí proto všechny organizaní záležitosti dkladn naplánovat. Musí se dodržet pestávky mezi jednotlivými ástmi experimentu, zajistit oberstvení, technické prostedky
apod. Dalším jeho úkolem je vhodn vybrat množinu poslucha. Experimentu by se ml
zúastnit srovnatelný poet muž a žen, aby namené MOS hodnoty vzork byly co nejvíce objektivní. Nyní si mžeme vybrat zpsob hodnocení jednotlivých hlasových vzork.
Prvním zpsobem je použít elektronické hlasovací zaízení. Výhoda takového prostedku
spoívá v automatické digitalizaci namených hodnot, vhodné pro zpracování výsledk.
Jií Novák
Strana 24
Návrh testu / Vyhodnocení a zpracování experimentu
Takový systém má integrovanou pam, která data mže do konce experimentu uchovat.
Vezmeme-li v úvahu množství namených hodnot, které se pohybují vzhledem k potu
poslucha v ádech nkolika tisíc, je tento zpsob dosti pohodlný. Jsou na nj ovšem
kladeny vysoké nároky na bezchybný chod. Pi chybách, kdy poslucha nap. zapomene
nebo nestihne vzorek ohodnotit, mže dojít nejen ke ztrát dat, ale i k znehodnocení ostatních ohodnocených výsledk, nebo se tím ztratí jednoznané piazení ke konkrétnímu
hlasovému vzorku. To už ale velmi úzce souvisí s technickým provedením hlasovacího
zaízení. Z dvodu uvedeného rizika se proto dále velmi asto používá tištného formuláe
k záznamu MOS hodnot. Poslucha zaznamenává svoje výsledky na tento formulá a má
nad nimi dostatený pehled po celou dobu hodnocení hlasového materiálu, takže nedochází obvykle ke ztrátám dat. Zpracování všech namených hodnot pomocí tištného formuláe je ale z hlediska potu poslucha logicky dosti asov nároné
6. VYHODNOCENÍ A ZPRACOVÁNÍ EXPERIMENTU
6.1. NAMENÉ HODNOTY
K experimentu bylo pozváno celkem 24 poslucha, z nichž bylo 12 muž a 12 žen.
Všem poslucham bylo v dob experimentu mezi 20-25 lety. Každý z nich hodnotil dle
stupnice MOS 105 vzork hlasového materiálu. Celá procedura byla stejná, až na úrove
psychické zátže posluchae. Proto byla celá procedura opakována dvakrát – ped zátží a
ihned po zátži. Záznam hodnot byl provádn formou tištného formuláe. Hlasový materiál byl seazen náhodn, avšak všichni posluchai jej hodnotili ve stejném poadí v obou
kolech experimentu. Dvod byl potlait zatížení hodnocení MOS hodnoty pedchozím
vzorkem. Poté bylo nutné výsledky digitalizovat a pisoudit je k jednotlivým typm kódování hlasového materiálu pesn tak, jakým zpsobem vznikly. Teoreticky ml tedy vzniknout soubor namených hodnot ítající 5040 MOS údaj. Vzhledem k tomu, že nkteí
posluchai nestaili njaký vzorek ohodnotit i nebyli schopni ohodnotit naráz celý hlasový materiál, reáln se podailo získat 5002 MOS údaj. Souhrn získaných hodnot je též
souástí elektronické pílohy. Nyní máme k dispozici záznamy MOS hodnot v závislosti
mezi typem kodéru, šumem, posluchaem, mluvím hlasového vzorku a stavem psychického zatížení posluchae.
Jií Novák
Strana 25
Vyhodnocení a zpracování experimentu
6.2. OBJEKTIVNÍ MODELOVÁNÍ
Objektivním modelováním namených hodnot se rozumí zpracovávat namené MOS
údaje pomocí aparátu matematické statistiky. V pedchozí kapitole je zmínno o rzných
závislostech mezi namenými hodnotami, které dále mžeme modelovat a graficky znázornit pozorované a teba i oekávané zákonitosti. Vzhledem k množství údaj se pak vyhodnocení dá považovat za objektivní.
6.2.1. ZÁKLADNÍ POJMY STATISTIKY
Obor statistiky je pi objektivním modelování namených údaj klíový. Je proto dležité si alespo ve strunosti charakterizovat pojmy, s kterými budeme dále pracovat.
Podrobnjší informace lze najít ve zdroji [7], z kterých je taktéž tento výtah erpán.
x
stední hodnota
Stední hodnota je parametr rozdlení náhodné veliiny, který je definován jako vážený
prmr daného rozdlení. V ei teorie míry se jedná o hodnotu:
E( X )
³ xdP( x)
(2)
R
kde P je pravdpodobnostní míra urující rozdlení náhodné veliiny X. Pokud výraz na
pravé stran nekonverguje absolutn, pak íkáme, že stední hodnota neexistuje.
Má-li náhodná veliina X diskrétní rozdlení kde P[X = si] = pi pro i  I nejvýše spoetnou
množinu rzných výsledk, pak:
E( X )
¦s p
i
(3)
i
I
x
smrodatná odchylka
Smrodatná odchylka je v teorii pravdpodobnosti a statistice asto používanou mírou
statistické disperze. Jedná se o kvadratický prmr odchylek hodnot znaku od jejich
aritmetického prmru. Zhruba eeno vypovídá o tom, jak moc se od sebe navzájem liší
typické pípady v souboru zkoumaných ísel. Je-li malá, jsou si prvky souboru vtšinou
navzájem podobné, a naopak velká smrodatná odchylka signalizuje velké vzájemné odlišnosti. Smrodatná odchylka je nejužívanjší míra variability. Dá se urit ze vztahu:
V
Jií Novák
D( X )
1
N
_
§
·
¦
¨ xi x ¸
¹
i 1©
N
2
(4)
Strana 26
Vyhodnocení a zpracování experimentu
_
kde xi jsou hodnoty, kterých mže náhodná veliina X nabývat, N je poet vzork a x je
aritmetický prmr definovaný vztahem (5)
_
x
x
1
N
N
¦x
(5)
i
i 1
rozptyl
Rozptyl je definován jako stední hodnota kvadrát odchylek od stední hodnoty. Odchylku od stední hodnoty, která má rozmr stejný jako náhodná veliina, zachycuje
smrodatná odchylka. Jedná se o charakteristiku variability rozdlení pravdpodobnosti
náhodné veliiny, která vyjaduje variabilitu rozdlení souboru náhodných hodnot kolem
její stední hodnoty. Pro diskrétní náhodnou veliinu jej mžeme definovat vztahem:
D( X ) V 2
N
¦ > x E ( X )@
2
i
N
pi
i 1
¦x
i 1
2
i
pi > E ( X ) @
2
(6)
kde xi jsou hodnoty, kterých mže náhodná veliina X nabývat (s pravdpodobnostmi pi) a
E ( X ) je stední hodnota veliiny X. Je-li pravdpodobnost všech diskrétních hodnot stejná,
pak se pedchozí vztah zjednoduší na:
D( X ) V 2
x
1
N
N
¦ ( x E ( x))
2
i
(7)
i 1
nejistota mení typu A
Je míra neuritosti dané hodnoty xi, které nabývá náhodná veliina X, a je stanovena z výsledk opakovaných mení statistickou analýzou série namených hodnot, obdobn jako
v pípad náhodných chyb mení. Její píiny se považují za neznámé a její hodnota klesá
s potem mení. Pomocí tohoto pojmu mžeme pikreslovat toleranní meze a považovat
tak získané hodnoty za objektivní mení. Mžeme pracovat také s pojmem rozšíená nejistota. Ta uruje ješt spolehlivjší výsledek. Základem je tzv. koeficient rozšíení, který
má obvykle hodnotu 2. Bližší informace k tématu nejistoty mení nalezneme nap.
v publikaci [6], z které je erpáno. Nejistotu typu A mžeme urit ze vztahu:
u A ( x)
V
(8)
N
kde V je smrodatná odchylka a N je poet vzork
Pi soutu, rozdílu, násobku a podílu N výskyt veliiny xi s nejistotou ui se výsledná nejistota této aritmetické operace projeví jako:
1
uC ( x)
Jií Novák
ª N º2
« ¦ ui »
¬i 1 ¼
(9)
Strana 27
Vyhodnocení a zpracování experimentu
6.3. ZPRACOVÁNÍ VÝSLEDK
Vzhledem k množství namených hodnot není možné prezentovat celou škálu možných
výsledk a závr experimentu. Budeme se hlavn zamovat na výsledky, které se co nejvíce týkají rozdíl MOS hodnot vzorku hlasového materiálu u posluchae ped zátží a po
zátži. Tab. 5 ukazuje souhrn výsledk pro jednotlivé kodéry. MOS známky jednotlivých
poslucha experimentu jsou zprmrovány pomocí aritmetického prmru. Tím dostaneme ke každému kodéru 4 hodnoty. Ty odpovídají vždy 4 vtám, které byly souástí hlasového materiálu. Zprmrováním tchto hodnot dostaneme v každém ádku tabulky práv
jednu hodnotu vyjadující vztah MOS hodnoty a daného typu kodéru.
Tab. 5 – souhrn výsledk MOS hodnot pro jednotlivé typy kodér
íslo
kodéru(na
ose x v
grafech)
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
11
11
12
12
13
13
14
14
15
15
16
16
prmry:
Jií Novák
název kodéru
TETRA
TETRA+šum
PR20
PR20+šum
TETRA-PR20
TETRA-PR20+šum
PR20-TETRA
PR20-TETRA+šum
TETRA-GSM
TETRA-GSM+šum
GSM-TETRA
GSM-TETRA+šum
TETRA-G.729
TETRA-G.729+šum
G.729-TETRA
G.729-TETRA+šum
PR20-G.729-TETRA
PR20-G.729-TETRA+šum
TETRA-G.729-PR20
TETRA-G.729-PR20+šum
GSM
GSM+šum
G.729
G.729+šum
PR20-G.729
PR20-G.729+šum
PR20-GSM
PR20-GSM+šum
G.729-PR20
G.729-PR20+šum
GSM-PR20
GSM-PR20+šum
hodnoty hodnoty
MOS ped MOS po
zatížením zatížení
4,281
3,219
2,115
1,083
1,583
1,583
2,833
1,208
3,490
2,938
3,750
2,802
3,948
3,250
3,375
2,490
3,125
1,469
2,104
1,417
3,010
1,625
3,885
1,875
3,375
1,250
2,802
1,139
2,188
1,479
1,885
1,375
2,436
3,998
2,746
2,135
1,043
1,742
1,391
2,708
1,208
3,614
2,640
3,576
2,506
3,820
2,906
3,428
2,314
3,219
1,419
2,283
1,438
3,139
1,944
3,709
2,125
3,113
1,354
2,716
1,224
2,227
1,583
1,800
1,231
2,384
rozdíl
MOS
hodnot
-0,283
-0,472
0,021
-0,040
0,159
-0,192
-0,125
0,000
0,124
-0,297
-0,174
-0,296
-0,128
-0,344
0,053
-0,175
0,094
-0,050
0,178
0,021
0,129
0,319
-0,177
0,250
-0,262
0,104
-0,086
0,085
0,040
0,104
-0,085
-0,144
-0,052
Strana 28
Vyhodnocení a zpracování experimentu
Pro lepší pehlednost mžeme hodnoty tab. 5 znázornit graficky spolu s hodnotou rozšíených nejistot urených ze smrodatné odchylky a potu vzork podle vztahu (8).
MOS hodnota
Graf závislosti MOS hodnot ped zátží na typu kodéru
5,0
4,5
4,0
3,5
3,0
bez šumu
2,5
2,0
1,5
1,0
0,5
0,0
se šumem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
íslo kodéru
Graf 1 – souhrn údaj pro jednotlivé kodéry MOS hodnot ped zátží posluchae
Graf závislosti MOS hodnot po zátži na typu kodéru
MOS hodnota
5,0
4,5
4,0
3,5
3,0
2,5
2,0
bez šumu
se šumem
1,5
1,0
0,5
0,0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
íslo kodéru
Graf 2 – souhrn údaj pro jednotlivé kodéry MOS hodnot po zátži posluchae
Jestliže provedeme rozdíl jednotlivých údaj grafu 1 a 2, dostaneme graf, který ukazuje,
jak se liší hodnoty MOS na jednotlivých typech kodér vetn nejistot urených jako nepímé mení zdrojových dat podle vztahu (9).
Jií Novák
Strana 29
Vyhodnocení a zpracování experimentu
Graf závislosti rozdílu MOS hodnot "po zátži mínus ped zátží" na typu kodéru
1,0
0,8
rozdíl MOS hodnot
0,6
0,4
0,2
bez šumu
0,0
-0,2
se šumem
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
-0,4
-0,6
-0,8
-1,0
íslo kodéru
Graf 3 – souhrn údaj pro rozdíly v hodnotách MOS pro typy kodér
Nyní se mžeme podívat jako vypadá vliv zatížení a tím zmna hodnocení MOS u jednotlivých poslucha, kteí experiment absolvovali. Graf 4 udává závislost mezi zprmrovanými hodnotami jednotlivých poslucha ped zatížením a po nm. Záporné hodnoty
grafu tedy odpovídají stavm, kdy poslucha hodnotí sadu vzork he než ped zatížením
a konkrétní hodnota na ose y udává onen prmrný rozdíl.
Rozdíl hodnot ped zatížením a po zatížení nezašumných a zašumných vzork u
jednotlivých lidí
0,8
rozdíl hodnot MOS
0,6
0,4
bez šumu
0,2
se šumem
0
-0,2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
-0,4
-0,6
íslo posluchae
Graf 4 – souhrn údaj pro rozdíly v hodnotách MOS jednotlivých poslucha
Jií Novák
Strana 30
Vyhodnocení a zpracování experimentu
Jestliže již známe z výsledk vliv hodnoty MOS u jednotlivých poslucha a u jednotlivých kodér, mžeme se ješt podívat, jak souvisí zkoumané rozdíly, jestliže vezmeme
v potaz pohlaví mluvích hlasového materiálu a poslucha. Hodnotit budeme zase jednotlivý typ závislosti na typech kodér. Znázorníme tedy 4 grafy. Ty budou postupn ukazovat, jak se liší vliv hodnoty zatížení, jestliže poslucha je muž a mluví žena, obrácen a
hodnotí-li vzorek poslucha stejného pohlaví jako mluví. Zdrojová data, z kterých je erpáno, jsou souástí pílohy.
Graf závislosti rozdílu MOS hodnot na typu kodéru
0,4
rozdíl hodnot MOS
0,2
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
-0,2
bez šumu
se šumem
-0,4
-0,6
-0,8
íslo kodéru
Graf 5 – souhrn údaj jestliže je poslucha muž a mluví žena
Graf závislosti rozdílu MOS hodnot na typu kodéru
0,6
rozdíl hodnot MOS
0,4
0,2
bez šumu
se šumem
0,0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
-0,2
-0,4
íslo kodéru
Graf 6 – souhrn údaj jestliže je poslucha žena a mluví muž
Jií Novák
Strana 31
Vyhodnocení a zpracování experimentu
Graf závislosti rozdílu hodnot MOS na typu kodéru
0,6
rozdíl hodnot MOS
0,4
0,2
bez šumu
0,0
se šumem
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
-0,2
-0,4
-0,6
íslo kodéru
Graf 7 – souhrn údaj jestliže je poslucha muž a mluví muž
Graf závislosti rozdílu hodnot MOS na typu kodéru
0,4
rozdíl hodnot MOS
0,2
0,0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
bez šumu
se šumem
-0,2
-0,4
-0,6
íslo kodéru
Graf 8 – souhrn údaj jestliže je poslucha žena a mluví žena
Porovnáním graf 5-8 je možné vypozorovat nkteré zajímavé odlišnosti. Pro ukázku
uvedeme jeden z nich. Graf 9 znázoruje rozdíl jednotlivých hodnot (sloupc) mezi grafem
5 a grafem 8. Mžeme zde vypozorovat o jak mnoho se posluchai mužského i ženského
pohlaví liší v hodnocení ped zátží a po zátži, hodnotí-li vzorek mluvený mluvím opaného pohlaví. Kladné hodnoty ukazují, že ženy jsou více zatíženy než muži, záporné naopak.
Jií Novák
Strana 32
Vyhodnocení a zpracování experimentu
Graf závislosti rozdílu mezi muži a ženami v hodnocení MOS na typu kodéru
rozdíl mezi muži a ženami v
hodnocení MOS
0,4
0,2
0
1
-0,2
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
bez šumu
se šumem
-0,4
-0,6
-0,8
-1
íslo kodéru
Graf 9 – souhrn údaj v rozdílu vlivu psychické zátže na pohlaví poslucha
i mluvích
6.4. ODHAD NEJISTOT
Mžeme si všimnout, že graf 3 je díky zobrazenému tolerannímu pásu nejistot zcela
nevypovídající. Je to zpsobeno proto, že zobrazujeme výsledky, které se zjišují nepímou
metodou mení (v našem pípad rozdíl namených MOS hodnot). Nejistoty takového
typu mení se poítají dle vztahu (9). Když si ale uvdomíme, že celková nejistota klesá
s druhou odmocninou potu hodnot, tedy množstvím poslucha, viz. vztah (8), mžeme
odeíst maximální hodnotu nejistoty uAmax, pisoudit ji potu testovaných subjekt (u nás
N=24), a zvolit si hodnotu maximální požadované nejistoty ux, aby hodnoty výsledku byly
o nem vypovídající a nebyly pekryty pásem nejistot. Odhadneme tak množství poslucha Nx, které by bylo poteba pizvat k experimentu, aby výsledky nepímého mení
nepekrýval pás nejistot. Využijeme k tomu vztah (8).
u A max
0, 610; N
24; u x
0, 2; N x
?
_____________________________________________________
ua
ux
V
N
V
Nx
Ÿ 0, 610
Ÿ 0, 2
V
24
ŸV
2,99
Ÿ Nx
Nx
0, 610 ˜ 24
2,992
0, 22
2,99
224
Abychom mohli vyhodnotit rozdíly MOS hodnot poslucha po zatížení a ped zatížením
spolu s nejistotami a dobrat se tak vrohodnjších výsledk, potebovali bychom na subjektivní testy penosu kvality hlasu pizvat cca 224 poslucha.
Jií Novák
Strana 33
Závr
7. ZÁVR
Cílem této bakaláské práce bylo navrhnout metodu, jak zjistit závislost mezi psychickou
zátží posluchae a subjektivní metodou mení kvalitu penosu hlasu. Nejprve bylo nutné
nastudovat potebné materiály pro tvorbu poslechových a konverzaních test z normy
ITU-T P.800 [1]. Poté se bylo možné zamit na obor psychologie lovka. Draz byl kladen pedevším na téma psychická zátž, konkrétn vznik a zdroje psychické zátže. Získané vdomosti byly následn použity pro návrh experimentu.
Dalším krokem bylo experiment realizovat. Nejvtší problém spoíval v organizaci 24
poslucha, kteí se experimentu zúastnili. Vzhledem k velikosti laboratoe, kde se experiment odehrával, bylo nutné provádt experiment s menšími skupinami poslucha vícekrát. Samotné subjektivní testy probhly ale bez komplikací, nenastaly závažné technické
ani organizaní potíže.
Výsledky byly objektivn modelovány a nejdležitjší byly pomocí grafického vyjádení
publikovány této práci. Z graf 1, 2, 3 je patrné, že opravdu existuje závislost mezi MOS
hodnotou hlasového vzorku a zátží posluchae. Bohužel nebyly zjištny bližší systematické závry, nap. z hlediska použitých kodér nebo jestli je hlas se šumem i bez nj.
Dležitou informací je, že smrodatná odchylka namených hodnot je po uvedení posluchae do stavu zvýšené psychické zátže vtší než na zaátku. Obdobné výsledky dává i
stední hodnota hodnocení MOS, kterou mžeme vyíst z posledního ádku tab. 5. To je
také dkaz rozptýlení posluchae. Problém ale nastane, chceme-li do našeho experimentu
zavést problematiku nejistot mení. Vyhodnocení rozdílu MOS hodnot z hlediska zátže
posluchae je svým zpsobem nepímou metodou mení. Pro prezentaci takových údaj
by bylo teba pizvat na experiment daleko více poslucha, výpotem cca 224. S takovým
množstvím poslucha by experiment pinesl možná ješt lepší výsledky, avšak z dvodu
nedostatku finanních prostedk a místa konání experimentu, by to bylo v našem pípad
nemožné.
Z grafu 4 mžeme vypozorovat, že psychická zátž má na hodnocení experimentu u každého posluchae jiný vliv. Nkteí posluchai dokonce hodnotí hlasový materiál po zátži
lépe než ped zátží. Je možné si ale všimnout, že odchylka u nkterých poslucha pesahuje hodnotu 0,6 stupn MOS, což je pomrn hodn. Vzhledem k tomu, že monitoring
provozu hlasových penos v celé ad firem je proveden pomocí objektivních metod m-
Jií Novák
Strana 34
Závr
ení kvality penosu hlasu, je možná pomrn výrazná odchylka výsledk, nebo v úvahu
je bráno, že uživatelé tchto služeb jsou v identické situaci, jako posluchai našeho experimentu ped zátžovým testem. Je-li tato hodnota nastavena na kritickou mez, kde hodnoty nižší signalizují poruchu systému, výsledky této práce ukazují míru tolerance, s kterou
by ml návrhá monitorovacího zaízení poítat. Vezmme v úvahu nejpesimistitjší variantu. Návrhá nastaví kritickou hranici 2,6 MOS hodnoty, kvli vzniklé toleranci pi zátži
posluchae, by ml radji poítat s 3,2 MOS. Poítat totiž tím, že všichni uživatelé hlasových služeb budou vykazovat nulové známky psychické zátže, je velmi nereálná myšlenka.
Další zajímavé výsledky je možné získat, rozdlíme-li namené hodnoty podle pohlaví
poslucha a mluvích hlasového materiálu. tyi vzniklé varianty je možné pozorovat na
grafickém znázornní výsledk grafu 5, 6, 7, 8. Z tohoto hlediska je zajímavý graf 5, posluchai jsou muži a mluví ženy. Pi tomto rozložení je vidt, že posluchai jsou mnohem
více ovlivnny psychickým zatížením než v ostatních výsledcích. Jinými slovy lze íci, že
pokud zákazník užívající službu je muž a operátor žena, psychická zátž v hodnocení kvality penosu hlasu hraje nejvtší význam. Graf 9 pro doplnní dokládá, že muži poslouchající ženy jsou daleko více závislí na psychické zátži, než když ženy poslouchají muže. Ve
speciálních pípadech využití hlasových služeb, nap. armáda, toto zjištní mže hrát významnou roli.
Jií Novák
Strana 35
Použitá literatura
8. POUŽITÁ LITERATURA
8.1. LITERÁRNÍ ZDROJE
[1]
ITU-T, Recommendation P.800: Methods for subjective determination of transmission quality, Ženeva, 1996
[2]
BRADA M., ZELENKA J.: Posuzování kvality hlasu, VUT FEL, Katedra telekomunikaní techniky, 11/2008
[3]
ŠIMÁK B.: Principy zpracování hlasu v klasické a IP telefonii, VUT FEL, Katedra telekomunikaní techniky, 5/2004
[4]
MUSIL J.: Sociální psychologie, UTB Zlín, 2005
[5]
MIKŠÍK O.: Psychologie hromadného chování, UK Praha, 1980
[6]
HEJTMANOVÁ D., DRAXLER K., KAŠPAR P., ŠIM
NEK M.: Elektrická mení, laboratorní cviení, VUT FEL, Katedra mení, 2001
8.2. OSTATNÍ ZDROJE INFORMACÍ
[7]
http://www.wikipedia.org
[8]
http://www.odbornecasopisy.cz/index.php?id_document=28705
Jií Novák
Strana 36
Seznam tabulek, obrázk a graf
9. SEZNAM TABULEK, OBRÁZK A GRAF
x
seznam tabulek
íslo
1
2
3
4
5
x
název tabulky
kapitola
strana
Hodnoty stupnice MOS
Kvalita ei
9
Upesující varianty MOS skóre
Kvalita ei
11
Pehled používaných kodér a jejich parametry
Penos hlasu
16
Zdroje psychické zátže s píklady výskytu i vzniku
Zátž lovka
20
Souhrn výsledk MOS hodnot pro jednotlivé typy kodér
Vyhodnocení
28
seznam obrázk
íslo
1
2
3
4
x
název obrázku
kapitola
strana
Princip innosti jednotlivých typ poslechových test
Kvalita ei
11
Shéma komunikaního etzce
Penos hlasu
14
Subjektivní test kvality penosu hlasu zatížený zátží
Zátž lovka
20
Zmenšený obrázek zátžového testu v pomru 1:3
Návrh testu
23
seznam graf
íslo
název grafu
kapitola
strana
1
Souhr údaj pro jednotlivé kodéry MOS hodnot ped zátží
Vyhodnocení
posluchae
29
2
Souhr údaj pro jednotlivé kodéry MOS hodnot po zátži
posluchae
Vyhodnocení
29
3
Souhrn údaj pro rozdíly v hodnotách MOS pro typy
kodér
Vyhodnocení
30
4
Souhrn údaj pro rozdíly v hodnotách MOS jednotlivých
poslucha
Vyhodnocení
30
5
Souhrn údaj jestliže je poslucha muž a mluví žena
Vyhodnocení
31
6
Souhrn údaj jestliže je poslucha žena a mluví muž
Vyhodnocení
31
7
Souhrn údaj jestliže je poslucha muž a mluví muž
Vyhodnocení
32
8
Souhrn údaj jestliže je poslucha žena a mluví žena
Vyhodnocení
32
9
Souhrn údaj v rozdílu vlivu psychické zátže na pohlaví
poslucha i mluvích
Vyhodnocení
33
Jií Novák
Strana 37
Pílohy
10. PÍLOHY
Hlavní pílohou bakaláské práce je kompletní báze MOS hodnot všech poslucha subjektivních test v elektronické podob hlavni_baze.xls, jež je nedílnou souástí této práce.
Souástí této pílohy jsou jak originální namené údaje seazené v náhodném poadí, tak
i údaje seazené podle píslušného klíe dle typ kodéru, pítomnosti aditivního šumu
a mluvích hlasového materiálu. Další píloha modelovani_vysledku.xls v elektronické
podob obsahuje celé objektivní modelování této práce nad namenými daty. Nkteré
dležité výsledky z této pílohy jsou prezentovány v kapitole 6. Vzhledem k potu tchto
hodnot a pehlednosti není vhodné tyto hodnoty prezentovat v tištné podob. Poslední
významnou elektronickou pílohou je spustitelný program „Zátžový test.“ Ten je zkomprimován do souboru zatezovy_test.rar.
x
Klí hlasových vzork podle názvu
Jií Novák
Strana 38
Pílohy
x
Náhodn vygenerované poadí vzork hlasového materiálu. Údaje obsahují íslo
vzorku a název, jež písluší konkrétní identifikovatelné hodnot dle píslušného klíe.
Jií Novák
Strana 39
Pílohy
x
Subjektivní testy byly provedeny kvli úspoe finanních prostedk, asu i poslucha zpsobem, kdy skupina poslucha hodnotila 3 typy test ke 3 bakaláským
pracím. Pro lepší organizaci byl vytvoen asový plán organizace test.
Jií Novák
Strana 40