Sborník LDD16 v pdf - SAMI - Signal Analysis, Modelling, and

Transkript

Sborník LDD16 v pdf - SAMI - Signal Analysis, Modelling, and
VI. LETNÍ DOKTORANTSKÉ DNY 2016
SBORNÍK PŘÍSPĚVKŮ
Editoři sborníku
Doc. Ing. Roman Čmejla, CSc.
Ing. Jan Rusz, Ph.D.
Ing. Jan Sedlák
ČERVEN 2016
Název: VI. LETNÍ DOKTORANDSKÉ DNY 2016
šestý ročník prezentací doktorandů Katedry teorie obvodů
2. června 2016
ČVUT FEL, blok C3, posluchárna T2:C3-54
Publikované příspěvky doktorandů vznikly v rámci řešení následujících projektů:
- GAP102/12/2230 "Analýza hlasu a řeči pacientů s onemocněními centrální nervové soustavy"
- NT14489 "Pochopení funkční organizace neuronálních okruhů epilepsie temporálního laloku za
účelem zkvalitnění předoperační diagnostiky a predikce výsledku chirurgické léčby"
- GA14-02634S "Dynamika a kritické chování neuronálních populací a jejich význam v přechodu do
epileptického záchvatu"
- SGS15/198/OHK3/3T/13 "Analýza a zpracování biologických signálů"
- SGS14/191/OHK3/3T/13 "Pokročilé algoritmy číslicového zpracování signálů a jejich aplikace 14--16"
- SGS15/199/OHK3/3T/13 "Akustické analýzy a zpracování řečových signálů u pacientů s
onemocněním centrální nervové soustavy 15--17"
Editoři sborníku: Doc. Ing. Roman Čmejla, CSc.; Ing. Jan Rusz, Ph.D.; Ing. Jan Sedlák
Vydalo: České vysoké učení technické v Praze
Zpracovala: Fakulta elektrotechnická
Kontaktní adresa: Technická 2, 166 27 Praha 6 – Dejvice
Telefon: 224 352 236
Web: http://sami.fel.cvut.cz/LDD16/, http://obvody.feld.cvut.cz/
Počet stran: 52
Datum vydání: červen 2016
Vydání: 1.
ISBN: 978-80-01-05959-3
2
Program LDD’ 2016 – seznam příspěvků
čtvrtek, 2. června 2016, 13:00-16:20, přednášky
13:00
Oficiální zahájení
téma: OBVODY, SYSTÉMY, BIOSIGNÁLY
13:05
Ing. Aleš Havránek
Linearizace modelu magnetovacího zařízení kompenzačního ferometru ……………………………………….…. 5
13:15
Ing. David Matoušek
Vliv hodinového kmitočtu a velikosti tranzistorů na účinnost inovativní nábojové pumpy ........……….. 10
13:25
Ing. Jan Marek
Modelování funkčních bloků křížově vázané nábojové pumpy ...........................……………………………….. 18
13:35
Ing. Naděje Havlíčková
Od měření geometrie výbrusu bižuterních kamenů k jejich opticko-estetickému hodnocení ..…….…… 24
13:45
Ing. Jan Dvořák
Neinvazivní screening aterosklerózy .....................................…………………………………………………………….. 29
13:55
Ing. Matouš Pokorný
Volba statistických parametrů dat reprezentujících fyzickou aktivitu biomedicínského modelu
Huntingtonovy choroby ……………………………………................................................................................... 30
14:05
Ing. Filip Paulů
Metody měření parametrů tekutin....................………....…………………………………….................................. 31
14:15
Ing. Michaela Poplová
Zobrazování oxidativních procesů na kůži pomocí ultra slabé emise fotonů ..........….……………………….. 32
14:25
Ing. Jan Sedlák
Vliv obuvi na svalovou koordinaci při chůzi a běhu ............................……………………………………..……….. 33
14:35
Přestávka
téma: EEG, ŘEČ
15:00
Ing. Martin Dobiáš
Klasifikace pohybového EEG pomocí paralelních HMM ........................................................…….……….. 34
15:10
Ing. Vladimír Černý
Vliv prezentace zpětné vazby na BCI ....................……………………………………………………………………………… 35
15:20
Ing. Tomáš Havel
Porovnání metod detekce vysokofrekvenčních oscilací u epileptických pacientů .....................………… 36
15:30
Ing. Jiří Balach
Intrakraniální EEG – Studie pacientů s fokální kortikální dysplasií typu I a II .....…………………………………. 37
15:40
Ing. Jan Kudláček
Mikrozáchvaty spolehlivě lokalizují epileptogenní oblasti v tetanotoxinovém modelu temporální
epilepsie..............................................................................................................................................…. 38
3
15:50
Ing. Jan Bartošek
Prozodie a její využití v řečových technologiích.....................................................…………………………….. 45
16:00
Ing. Petr Mizera
Přínos artikulačních příznaků v úloze rozpoznávání fonémů a LVCSR ............…………………………………… 46
16:10
Ing. Jan Hlavnička
Robustní detektor základní frekvence hlasivek pro dysartrickou řeč ..………………………………………………..47
4
Linearizace modelu magnetovacího zařízení
kompenzačního ferometru
Aleš HAVRÁNEK1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Měření parametrů otevřených vzorků magneticky měkkých
materiálů při střídavém magnetování je náročné z hlediska systému řízení
magnetovacího procesu, neboť se jedná o nelineární systém k jehož
nelinearitě významně přispívá měřený vzorek. Systém řízení magnetovacího
procesu kompenzačního ferometru musí zajistit splnění požadavků na tvar
napětí indukovaného v měřicím vinutí a podmínky nulového napětí
indukovaného v Rogowskiho-Chattockově potenciometru (RCP). Tento
příspěvek se zabývá návrhem řízení pomocí linearizace modelu
magnetovacího zařízení kompenzačního ferometru a navazuje tak na
příspěvek z předchozího ročníku. Výsledkem je předpis zpětné vazby, která
zajistí správné magnetování vzorku a přesné měření. Správnost výpočtů je
ověřena pomocí simulace na modelu magnetovacího zařízení kompenzačního
ferometru s parametry určenými z reálného zařízení.
1.
Model magnetovacího zařízení kompenzačního ferometru
Model magnetovacího zařízení (Obr. 1) popisuje závislost výstupů: napětí indukované
v měřicím vinutí u2 (V) a napětí indukované v RCP uRCP (V) na vstupech: magnetovací napětí
u1 a kompenzační napětí uc. Součástí modelu je i model hysterezní smyčky měřeného vzorku.
uc
u1
u2
uRCP
Obr. 1: Magnetovací zařízení
5
Pro odvození jsou podstatné pouze vlastnosti modelu magnetovacího zařízení, proto pro
odvození zpětné vazby pomocí strukturálních metod stačí pracovat s tvarem modelu, který je
zachycen v následujících vztazích.
di di


f  u1 , i1 , 1 , c , Lc  = 0
dt dt


di di


f  u c , ic , c , 1 , L1  = 0
dt dt


(1)
 dB dH 

L1 = f 
,
 dH di1 
 dB dH 

Lc = f 
,
 dH dic 
(2)
B = f (H , s )
 dH 
s = f

 dt 
(3)
f (H , B, i1 , ic ) = 0
 dB 
u2 = f  
 dt 
(4)
 dH di1 
u RCP = f 
, 
 dt dt 
(5)
Rovnice (1) tvoří algebro-diferenciální soustavu pro magnetovací proud i1 (A) a
kompenzační proud ic (A). Rovnice (2) jsou diferenciální indukčnosti magnetovacího a
kompenzačního vinutí. Hysterezní smyčka měřeného vzorku je modelována pomocí rovnic
(3), kde B (T) je magnetická indukce, H (A/m) je intenzita magnetického pole a proměnná s
rozlišuje mezi rostoucí a klesající částí hysterezní smyčky. Proměnná s nabývá pouze dvou
hodnot. Intenzita magnetického pole je určena implicitní rovnicí (4). Výstupy modelu jsou
popsány rovnicemi (5). Vstupy modelu u1 (V) a uc (V) jsou funkcemi času t (s). [1]
2.
Transformace systému
Komplikací je algebro-diferenciální soustava, ze které nejdou vyjádřit derivace proudů
pomocí ekvivalentních úprav. Za pomoci derivace algebraické rovnice to lze, ale objeví se
závislost na derivaci vstupů modelu. Se závislostí na derivacích vstupů se lze vypořádat
následující transformací do nových proudů i1n (A) a icn (A), kde N1 a Nc jsou počty závitů
magnetovacího a kompenzačního vinutí a R1 (Ω) a Rc (Ω) jsou jejich odpory. Konstanta vazby
mezi magnetovacím a kompenzačním vinutím je k.
N c2 k
N c N1
u1 +
uc
2
2
Rc N1 + N c kR1
Rc N12 + N c2 kR1
(6)
N c kN 1
N12
icn = ic +
u1 −
uc
Rc N12 + N c2 kR1
Rc N12 + N c2 kR1
(7)
i1n = i1 −
Touto transformací přejde soustava rovnic (1) do tvaru obyčejné diferenciální rovnice.
Tento tvar je výhodný i pro numerické řešení. Diferenciální indukčnosti se od sebe liší jen
násobnou konstantou, proto se společná část označí L (H).
Ze symetrie soustavy rovnic po transformaci a podmínky na střídavé magnetování
vyplyne vztah mezi novými (transformovanými) proudy. Oba výstupy jsou závislé na
derivacích, proto se zavedou výstupy v2 a vRCP dané integrálem původních výstupů přes čas.
Po zavedení označení funkcí přejdou rovnice (1), (4), (5) do tvaru daného rovnicemi (8), (9),
(10).
6
di1n
= g (u1 , u c , i1n , L )
dt
i1n =
N c kR1
icn
Rc N1
f (H , B, i1n ) = 0
v 2 = h 1 (B )
(8)
(9)
v RCP = h 2 (H , i1n , u1 , u c )
(10)
Zbylé rovnice (2) a (3) zůstávají v platnosti. Požadavky na výstupy musejí být
integrovány přes čas. To nečinní potíže, protože tyto požadavky známe. Integrační konstanty
určíme z požadavku na střídavé magnetování. [3]
3.
Linearizace systému
Rovnice (11) definuje transformaci systému do nových souřadnic a rovnice (12) definují
nové vstupy v1 a vc.
ξ = h 1 (B )
v1 =
dh 1
g(u1 , u c , i1n , L )
di1n
(11)
vc = h 2 (H , i1n , u1 , u c )
(12)
Po transformování systému do nových souřadnic pomocí (11) a (12) získáme
diferenciální rovnici (13) a rovnice (14) pro výstupy.
dξ
= v1
dt
v2 = ξ
(13)
vRCP = vc
(14)
Výsledkem je přesná zpětnovazební linearizace systému, pro kterou se navrhne řízení.
Tato linearizace platí na intervalu, kde existuje inverze k transformaci (11). Tato inverze pro
dané s existuje pro celou reálnou osu. Systém má relativní stupeň jedna. [3]
4.
Řízení pomocí zpětné vazby
Úkolem řízení je sledovat zadaný průběh napětí u2, tedy stabilizovat chybu sledování
referenční trajektorie ξref na nulu. Vztahem (15) se zavede chyba sledování e.
de dξ dξ ref
=
−
dt dt
dt
(15)
Z transformačních vztahů plyne, že požadovaná derivace referenční trajektorie ξref je
přímo požadované napětí u2ref. Systém pro chybu sledování referenční trajektorie a jeho
výstupy je dán rovnicemi (16) a (17).
de
= v1 − u 2 ref
dt
v2 = e + ∫ u 2ref dt
(16)
vRCP = vc
(17)
Tento systém se stabilizuje stavovou zpětnou vazbou popsanou rovnicí (18), kde kf je
kladná konstanta stavové zpětné vazby. Trajektorie nelineárního systému v uzavřené smyčce
7
jsou přesným obrazem trajektorií stabilního lineárního systému, proto i nelineární systém
s touto zpětnou vazbou je stabilní.
v1 = − k f e + u 2ref
(18)
Po přepočtu do původních nelineárních souřadnic získáme předpis pro určení vstupů do
systému. Počet závitů měřicího vinutí je N2, Sm (m2) je průřez měřeného vzorku, Sv (m2) je
průřez magnetovacího vinutí zmenšený o průřez měřeného vzorku, µ0 (H/m) je permeabilita
vakua, l1 (m) je délka měřeného vzorku (délka jha), Rm (H-1) je magnetický odpor jha.
Reference pro integrál napětí, které se indukuje v RCP se zahrnutými konstantami je vRCPref.
Tato reference je z principu kompenzační metody rovna nule.
(
)
dB


N1 − k f N 2 S m B + k f ∫ u 2ref dt + u 2ref  S m
+ S vµ 0 
 dH
+Ri
u1 =
11
dB
N2Sm
dH
(19)
N1 Rc (Hl1 + Rm S m B + Rm S v µ 0 H ) − N12 Rc + N c2 R1k i1 + N c2 ku1
uc =
N1 N c
(20)
(
H =−
)
vRCPref − N1i1
d
(21)
Výsledná zpětná vazba je stavová tj. z proudu i1, který je měřený pro výpočet H. Pro její
zavedení je potřeba znát hysterezní smyčku měřeného vzorku a její derivaci. Ta je ale
ferometrem měřena. Postup pro správné fungování je následující: nejprve se začne
magnetovat bez zpětné vazby, takto se získá odhad hysterezní smyčky, který se následně
použije ve stavové zpětné vazbě. Po tomto kroku se pro stavovou vazbu bude používat
aktuálně měřená hysterezní smyčka. Vazba je závislá na výstupu u2 přes měřenou hysterezní
smyčku. Pro odvození byl použit lineární model jha, proto mohou vzniknou drobné odchylky
od referencí hlavně u uRCP. Tyto odchylky potlačí výstupní zpětná vazba.
5.
Simulace
Simulace byla provedena pro parametry, odpovídající reálnému jhu a měřenému vzorku
s ostrým přechodek do nasycené oblasti. Na grafu výstupních napětí je vidět vliv zpožděného
přepnutí regulátorů (změna s), který odpovídá vzorkování 50 kHz.
Obr. 2: Vstupní napětí u1 a uc
Obr. 3: Proudy i1 a ic
8
Obr. 4: Výstupní napětí u2 a uRCOP
6.
Obr. 5: Hysterezní smyčka
Závěr
Navržený zpětnovazební systém řízení má mnoho výborných vlastností. Řeší oba
požadavky na výstupy najednou, dříve byly řešeny odděleně jako kompenzace a korekce.
Nepředpokládá nic o požadavku na napětí u2, které tedy může být stanoveno libovolně.
Automaticky udržuje systém ve stavu požadované amplitudy magnetické indukce.
Nevyžaduje inverzi hysterezní smyčky.
Navržená zpětná vazba zatím nemohla být vyzkoušena, protože to neumožňuje
hardware stávajícího kompenzačního ferometru. Nový ferometr, který otestuje tuto vazbu
bude postaven s využitím desky Red Pitaya, která je osazena čipem Xilinx Zynq 7010 SoC.
Tento čip kombinuje FPGA s dvěmi ARM jádry a má tak architekturu vhodnou pro
navrženou zpětnou vazbu.
Poděkování
Tato práce byla podpořena grantem Studentské grantové soutěže ČVUT číslo SGS14/
191/OHK3/3T/13 Pokročilé algoritmy číslicového zpracování signálů a jejich aplikace.
Reference
[1]
Havránek, A.: Model magnetovacího zařízení kompenzačního ferometru. In V. Letní
doktorandské dny 2015. Praha: ČVUT FEL, Katedra teorie obvodů, 2015, díl 5, s. 6-11.
ISBN 978-80-01-05749-0.
[2]
Havránek, A. - Zemánek, I.: Compensation Ferrometer Magnetizing Process Control. In
Journal of Electrical Engineering, 2015, vol. 66, no. 7s, p. 22-25, ISSN 1335-3632.
[3]
Čelikovský, S.: Nelineární systémy. Nakladatelství ČVUT, Praha, 2006.
9
Vliv hodinového kmitočtu a velikosti
tranzistorů na účinnost inovativní nábojové
pumpy
David MATOUŠEK1, Jiří HOSPODKA1, Ondřej ŠUBRT2,1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
2
ASICentrum, Praha
[email protected]
Abstrakt: Nábojové pumpy jsou obvody, které vytváří napětí vyšší velikosti,
než odpovídá napájecímu napětí. V současnosti se nábojové pumpy staly
nedílnou součástí elektronických zařízení. Integrace nábojových pump přímo
do systému dovolují výrobcům napájet komplexní systémy s mnoha
specifickými napájecími požadavky z jednoho napájecího zdroje. Účinnost
nábojových pump je však omezována mnoha nepříznivými vlivy. Tento
příspěvek je zaměřen na otázku účinnosti uvedené varianty nábojové pumpy.
Pomocí simulací provedených v prostředí Eldo je zkoumána účinnost
v závislosti na počtu stupňů pumpy, odebíraném proudu, taktovacím
kmitočtu a rozměrech použitých MOSFE tranzistorů. Smyslem této práce je
určení vlivu rozměrů MOSFE tranzistorů na výslednou účinnost a hodnotu
výstupního napětí. Komplexní optimalizace obvodu pumpy bude provedena
v navazující práci, kdy již nebude třeba nahlížet na méně podstatné vlivy.
1.
Úvod
Základní variantou nábojové pumpy je Dicksonova nábojová pumpy (DNP) [1]. Vztahy
pro návrh DNP jsou shrnuty v [2]. Diferenční napětí U mezi uzly n and n+1 je:

ΔU  U n1  U n  U E  U T 

kde UE je napěťový zisk, UT je prahové napětí použitých tranzistorů.
Optimální hodnota napěťového zisku odpovídá amplitudě hodinového signálu. Reálně
však není možno této hodnoty dosáhnout, protože napěťový zisk je snížen vlivem
rozptylových kapacit uzlů:
 CT
U Ε  
 CT  CS


  U CLK 


kde UE je napěťový zisk, CT je kapacita přenosových kondenzátorů, CS je rozptylová
kapacita uzlů, UCLK je amplituda hodinového signálu.
Pro výstupní napětí pak platí:



U OUT  U IN  N  U Ε  U T  U T 

kde UOUT je hodnota výstupního napětí, UIN je hodnota vstupního napětí, N je počet stupňů
pumpy, UE je napěťový zisk, UT je prahové napětí použitých tranzistorů.
10
Prahové napětí použitých tranzistorů má obvykle rozhodující vliv na výslednou
hodnotu výstupního napětí. Prahové napětí omezuje implementaci DNP zvláště pro napájecí
napětí pod 1 V. Z tohoto důvodu používají systémy napájené nižším napětím než 1 V
odlišných variant nábojových pump [3], [4].
Jednou z obecně používaných technik potlačení vlivu prahového napětí je změna
zapojení přenosového tranzistoru z diodového režimu (pasivního spínače) do režimu
aktivního spínače [5], [6], [7]. V tom případě není napěťový úbytek mezi dvě uzly dán
prahovým napětím ale pouze saturačním napětím.
2.
Popis použité varianty nábojové pumpy
Předkládaná varianta nábojové pumpy [8] používá dvoufázový hodinový signál. Jedna
buňka jako základní stavební blok uvedené nábojové pumpy je uvedena na obrázku 1. Buňka
je tvořena pěti MOSFE tranzistory (M1 až M5) a přenosovým kondenzátorem (CT).
Uvedená buňka je buzena dvěma vzájemně se překrývajícími hodinovými signály dle
obrázku 2. Sestupné hrany obou hodinových signálů jsou souběžné.
V první fázi (CLK1 = UDD, CLK2 = UDD) jsou tranzistory M1, M3 a M5 sepnuty. Takže
přenosový kondenzátor je CT nabit na napájecí napětí UDD.
Ve druhé fázi (CLK1 = 0, CLK2 = 0) jsou sepnuty tranzistory M2 a M4. Tranzistor M2
udržuje „předepínací“ transistor M5 v rozpojeném stavu. Transistor M4 pak připojí přenosový
kondenzátor CT mezi vstup (výstup předchozí buňky) a výstup. Proto je výstupní napětí
zvýšeno o napětí přenosového kondenzátoru z předchozí fáze.
VDD
M5
output
input
M2
M4
M1
M3
CT
CLK1
CLK2
Obr. 1: Jedna buňka použité varianty nábojové pumpy [8]
V závěrečné fázi (CLK1 = 0, CLK2 = UDD) jsou všechny tranzistory v rozpojeném
stavu.
W1
CLK1
VDD
0
t
CLK2
VDD
0
W2
PER
t
Obr. 2: Časové průběhy dvoufázového hodinového signálu
11
Použité hodinové signály se vyznačují vzájemným překryvem, jak dokumentuje
obrázek 2. Symbol PER označuje periodu obou signálů. Optimální hodnoty parametrů W1, W2
pro dosažení optimálního poměru mezi hodnotou výstupního napětí a výslednou účinností
byly odhadnuty v předchozí studii [8].
3.
Návrhový postup pumpy
Návrhová pravidla pro počáteční odhad základních parametrů sledované nábojové
pumpy jsou shrnuta v níže uvedených krocích. Pro ilustraci konkrétního případu zadání jsme
vyšli z této specifikace nábojové pumpy:
 napájecí napětí UDD = 0,7 V, minimální napětí v ustáleném stavu UOUT = 4 V,
 zatěžovací kapacita na výstupu CL = 300 pF, proud odebíraný z výstupu IL = 4 A,
 maximální doba náběhu výstupu tr = 150 s.
3.1.1.
Počet stupňů pumpy N
Výchozí odhad počtu stupňů pumpy N byl proveden výpočtem poměru výstupního
napětí UOUT a napěťového zisku jednoho stupně UE (v ideálním případě je napěťový zisk
stejný jako hodnota napájecího napětí):

3.1.2.
N
U OUT
4

 6 
UE
0,7

Výchozí hodnota taktovacího kmitočtu fCLK
Výchozí hodnota hodinového signálu byla zvolena fCLK = 20 MHz.
3.1.3.
Výchozí velikost přenosových kondenzátorů CT
Kapacita přenosových kondenzátorů CT byla určena ze známé hodnoty zatěžovací
kapacity CL, počtu stupňů nábojové pumpy N, doby náběhu tr a hodinového kmitočtu fCLK [2]:
CT  CL
3.1.4.
N
6
 300 1012
 0,6 pF 
6
tr  f CLK
150 10  20 106

Velikost použitých tranzistorů W/L
MOSFE tranzistory M3 až M5 a MD, které slouží pro přenos náboje, musí mít vodivost
minimálně 10× vyšší než odpovídá vodivosti pro daný výstupní proud [2], výchozí rozměry
těchto tranzistorů tak byly odhadnuty z V-A charakteristik.
MOSFE tranzistory M1 až M2 mohou způsobovat ztráty náboje, navíc jsou tyto
tranzistory použity pouze pro buzení tranzistoru M5. Proto lze rozměry těchto tranzistorů volit
jako relativně malé.
Přenosový kondenzátor CT je realizován tranzistorem MCT, jeho parazitní kapacita byla
určena z derivace V-A charakteristiky. Tranzistory MBUFA a MBUFB jsou použity v budičích
hodinových signálů.
Modely nmos_hvt a pmos_hvt odpovídají “vysokonapěťovým” tranzistorům s relativně
vysokou hodnotou prahového napětí. Model nmos_na18v odpovídá tranzistoru pro
technologii 1,8 V.
Parametry použitých tranzistorů jsou souhrnně uvedeny v tabulce 1.
12
Tab. 1: Parametry tranzistorů
Tranzistor
M1
M2
M3
M4
M5
MCT
MD
MBUFA
MBUFB
W [m]
0,2
1
0,5
2,5
2,5
30
20
5
12,5
model
nmos_hvt
pmos_hvt
nmos_hvt
pmos_hvt
pmos_hvt
nmos_hvt
nmos_na18
v
nmos_hvt
pmos_hvt
L [m]
0,1
0,1
0,1
0,1
0,1
10
0,8
0,1
0,1
Odhadovaná plocha čipu pro realizaci uvedené nábojové pumpy je zaznamenána
v tabulce 2. Symbol N odpovídá počtu stupňů pumpy, SBUNĚK je plocha čipu potřebná pro
realizaci buněk (stupňů), SBUDIČE je plocha pro realizaci budičů hodinových signálů a
výstupního detektoru, SCELK je celková plocha potřebná pro realizaci uvažované pumpy
s určeným počtem stupňů.
Tab. 2: Odhadovaná plocha pro realizaci nábojové pumpy
N
1
2
3
4
5
6
4.
SBUŇEK [m2]
469
998
1497
1996
2495
2994
SBUDIČE [m2]
30
30
30
30
30
30
SCELK [m2]
499
1028
1527
2026
2525
3024
Studie vlivu hodinového kmitočtu na účinnost a výstupní napětí
Hlavním smyslem první části simulací je určit vliv hodinového kmitočtu primárně
na výslednou účinnost a sekundárně na hodnotu výstupního napětí.
Schéma zapojení simulované nábojové pumpy je uvedeno na obrázku 3. Jedná se
o 6-stupňovu nábojovou pumpu (N = 6). Pro ostatní případy se pouze mění počet stupňů (tedy
buněk). Hodinové signály jsou posíleny silnými buffery (invertory). Do posledního stupně je
zapojen diodový detektor realizovaný pomocí tranzistoru MD. Rezistor RL a kondenzátor CL
modelují výstupní zátěž. Uváděná pumpa je napájena napětí UDD = 0,7 V a oba hodinové
signály mají amplitudu rovněž 0,7 V. Symbol IS označuje odebíraný proud. Výstupní napětí
při zatížení je označeno UOUT.
IS
VDD
MD
STAGE
1
STAGE
3
STAGE
4
;
STAGE
5
STAGE
6
RL
CLK1
CLK1'
CLK2'
STAGE
2
CL VOUT
CLK2
Obr. 3: Zjednodušené schéma zapojení simulované nábojové pumpy pro N=6
13
Počet stupňů pumpy N se při simulacích měnil od 1 do 6, kmitočet hodinových signálů
byl nastavován na hodnoty 10; 13,3; 20; 27; 40 MHz. Závislost účinnosti a výstupního napětí
na kmitočtu hodinových signálů je vyobrazena formou obrázků 4 a 5.
Celková účinnost byla stanovena dle vztahu (6)

 
2
U OUT
100 % 
U DD  I S  RL

kde UOUT je výstupní napětí, UDD je napájecí napětí, IS je odebíraný proud, RL je výstupní
zátěž.
Účinnost se měnila přibližně o 10 % (z hodnoty 38,47 % při kmitočtu 10 MHz
na hodnotu 28,64 % při kmitočtu 40 MHz) při nominálním odběru IL = 4 A. Za stejných
podmínek se výstupní napětí měnilo v rozsahu 3,741 V až 4,051 V.
Obr. 4: Účinnost jako funkce odebíraného proudu IL pro N=6
Obr. 5: Výstupní napětí jako funkce odebíraného proudu IL pro N=6
Výsledky simulací pro různý počet stupňů nábojové pumpy jsou shrnuty v tabulce 3.
Tab. 3: Účinnost a výstupní napětí při proměnlivém počtu stupňů pumpy a odběru 4 A
N
1
2
3
4
5
6
 ()
42,13 to 30,33
35,63 to 25,26
30,76 to 21,07
23,75 to 16,02
20,37 to 13,94
37,47 to 28,64
14
VOUT (V)
1,275 to 1,290
1,919 to 1,950
2,540 to 2,590
3,130 to 3,120
3,638 to 3,762
3,671 to 4,051
5.
Studie vlivu velikosti tranzistorů na účinnost a výstupní napětí
Smyslem této části simulací bylo určit vliv velikosti MOSFE tranzistorů na výslednou
účinnost a hodnotu výstupního napětí. Za tímto účelem byla měněna velikost všech
tranzistorů. Při simulacích byl vždy měněn jen jeden z parametrů, ostatní parametry dle
tabulky 1 byly ponechány beze změny. Výstupní zátěž byla nastavena na hodnotu RL = 1 M.
Simulace byly nyní prováděny pouze pro případ 6-stupňové nábojové pumpy.
Níže je popsáno šest variant simulací, které byly provedeny za účelem určení vlivu
rozměrů tranzistorů.
Varianta 1: šířky kanálů tranzistorů M4 a M5 byly rozmítány od 0,5 m do 50 m. Bylo
zjištěno, že velikost těchto tranzistorů má silný vliv na obě zkoumané veličiny, viz obrázek 6.
Obr. 6: Varianta 1: Účinnost a výstupní napětí jako funkce W4,5
Varianta 2: šířka detektoru MD byla měněna od 0,5 m do 50 m. Velikost tranzistoru
transistor MD má vliv primárně na účinnost, viz obrázek 7.
Obr. 7: Varianta 2: Účinnost a výstupní napětí jako funkce WD
Varianta 3: šířka tranzistoru M3 byla měněna od 0,2 m do 10 m. Velikost transistoru
M3 má vliv primárně na hodnotu výstupního napětí, viz obrázek 8.
15
Obr. 8: Varianta 3: Účinnost a výstupní napětí jako funkce W3
Varianty 4, 5: šířky tranzistorů M1 a M2 byly měněny od 0,2 m do 10 m resp.
od 0,2 m do 20 m. Bylo zjištěno, že optimální je použít tranzistory M1 a M2 malých
rozměrů, viz obrázek 9.
Obr. 9: Varianty 4, 5: Účinnost a výstupní napětí jako funkce W1,2
Varianta 6: šířka tranzistoru MCT byla měněna od 6 m do 60 m. Optimální velikost
transistoru MCT je kompromisem mezi účinností a hodnotu výstupního napětí, viz obrázek 10.
Obr. 10: Varianta 6: Účinnost a výstupní napětí jako funkce WCT
Varianta 7: šířka tranzistoru MBUFA byla měněna od 1 m do 20 m a současně s tím
byla šířka tranzistoru MBUFB měněna od 5 m do 100 m. Maximální hodnota účinnosti
 = 33,67 % při UOUT = 4,006 V nastala pro WBUFA=1 m a WBUFB=5 m. Tato varianta není
vyobrazena, protože změny účinnost a hodnoty výstupního napětí jsou relativně nízké.
6.
Závěr
V článku je popsána studie vlivu hodinového kmitočtu a velikosti MOSFE tranzistorů
na účinnost a výstupní napětí. Parametry tranzistorů a časovací schéma bylo použito
z předchozí studie [8]. Simulace byly provedeny pomocí simulátoru Eldo verze 2010.2b. Eldo
je „SPICE like“ simulátor od firmy Mentor Graphics.
16
První část simulací demonstrovala skutečnost, že účinnost se zvyšuje se zvyšujícím
odběrem a snižuje s hodinovým kmitočtem. Závislost výstupního napětí má obrácený
charakter, výstupní napětí se zvyšuje s klesajícím odběrem a zvyšujícím hodinovým
kmitočtem.
Z druhé části simulací vyplývá možnost optimalizovat účinnost uvedené nábojové
pumpy. Hodnoty účinnosti a výstupního napětí jsou  = 33,43 % a UOUT = 4,008 V pro
výchozí hodnoty tranzistorů dle tabulky 1 a zátěž RL = 1 M.
Škálování rozměrů tranzistorů dovoluje zvýšit hodnotu účinnost zhruba o deset procent.
Rozměry tranzistorů M4, M5, MD a MCT mají silný vliv na účinnost, tranzistor M3 má silný
vliv na výstupní napětí. Vliv ostatních tranzistorů má předvídatelný charakter a můžeme jej
zanedbat. Výsledky z této studie mohou být použity pro komplexní optimalizační studii
provedenou v dalším období.
Platnost uváděných výsledků je omezena na pre-layoutové simulace. Parazitní vlivy
vyšších řádů (například kapacita mezi vrstvami, kapacita mezi metalickými spoji atd.) nejsou
uvažovány. Tyto parazitní vlivy mohou mít významný vliv na dosažitelné výsledky.
Reference
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
J. F. Dickson, “On-Chip high-voltage generation in NMOS integrated circuits using an
improved voltage multiplier technique”, IEEE Journal of Solid-State Circuits, vol. 11,
no. 3, pp. 374-378, 1976.
F. Pan, T. Samaddar, “Charge pump circuit design”, McGraw-Hill, New York, 2006.
G. Palumbo, D. Pappalardo, “Charge pump circuits: An overview on design strategies
and topologies”, IEEE Circuits and Systems Magazine, First Quarter 2010, 1531636X/10, IEEE 2010, pp. 31-45.
D. Matousek, “Comparison of selected architectures of negative Charge Pumps with
new design”, In: Proceedings of the 24th International Conference Radioelektronika,
Bratislava, 2014, pp. 1-4.
T. Yamazoe, H. Ishida, Y. Nihongi, “A Charge Pump that generates positive and
negative high voltages with low power-supply voltage and low power consumption for
non-volatile memories”, In: International Symposium ISCAS, Taipei, Taiwan, 2009,
pp. 988-991.
O.-Y. Wong, R. Wong, W.-S. Tam, C.-W. Kok, “An overview of charge pumping
circuits for Flash memory applications”, In: Proceeding of the 9th International
Conference ASICON, Xiamen, China, pp. 116-119, 2011.
O.-Y. Wong, H. Wong, W.-S. Tam, C.-W. Kok, “On the design of power- and areaefficient Dickson charge pump circuits”, Analog Integr Circ Sig Process, 2014, pp.
373-389.
D. Matousek, O. Subrt, J. Hospodka, “Charge Pump Design for Use in NVM Device
Test and Measurement”, In: MEASUREMENT 2015, Proceedings of the 10th
International Conference, Smolenice, 2015, pp. 203-206.
17
Modelovánı́ funkčnı́ch bloků křı́žově vázané
nábojové pumpy
Jan Marek, Jiřı́ Hospodka, Ondřej Šubrt
České vysoké učenı́ technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: V tomto článku je uveden rozbor buňky křı́žově vázané nábojové
pumpy použı́vané pro napájenı́ nı́zkopřı́konových obvodů. V úvodu jsou
uvedeny základnı́ složky pumpovacı́ch ztrát a jejich důsledky v reálném
obvodu. V hlavnı́ části je provedena optimalizace základnı́ch bloků–invertoru a spı́nače za účelem dosaženı́ maximálnı́ho napět’ového zisku. Optimalizačnı́ proces zahrnuje analytický popis a elementárnı́ simulace přı́slušných charakteristik (statických, dynamických) těchto bloků v profesionálnı́m návrhovém prostředı́ Mentor Graphics, se zahrnutı́m reálných
prvků dostupných v knihovně MGC Design Kit. Modely dı́lčı́ch bloků
jsou sestaveny na základě rovnic BSIM modelu MOSFET tranzistorů,
zjednodušených pro konkrétnı́ aplikaci. Přı́nosem práce jsou jednak zı́skané
analytické vztahy pro návrh invertoru a spı́nače a jednak vytvořený ekvivalentnı́ nelineárnı́ model buňky nábojové pumpy, jež je použitelný pro
sestavenı́ návrhového algoritmu.
1.
Úvod
Popis diskrétně analogových soustav (DisAs), do nichž nábojové pumpy [5] spadajı́,
jsou vzhledem k diskretizaci v čase velmi problematické. Metody přı́stupu a specifikace
DisAs jsou uvedeny v [1]. Popis křı́žově vázané nábojové pumpy [2] na obrázku 1 se
opı́rá předevšı́m o modelovánı́, elementárnı́ simulaci dı́lčı́ch bloků a srovnánı́ s reálným
zapojenı́m.
Obr. 1: Zapojenı́ křı́žové vázané nábojové pumpy se znázorněnı́m zpětného
přenosu náboje
18
Činnost zpětnovazebnı́ smyčky v obvodu předpokládá dostatečně velké řı́dı́cı́ napětı́
na gatu spı́nacı́ho tranzistoru (triodová oblast), podmı́něné korektnı́ funkcı́ invertoru,
tj. překročenı́m prahového napětı́ tranzistorů MP i a MN i . Zobecněná podmı́nka činnosti
pumpy je dána následujı́cı́ relacı́:
|VT HM P i (VBS )| + VT HM N i (VSB )
VT HM si (VSB )
< ∆V >
,
2
2
(1)
kde VT H je prahové napětı́, silně závislé na předpětı́ source-bulk (body effect).
Klesne-li přı́růstek napětı́ vlivem narůstajı́cı́h ztrát pod definovanou úroveň, zpětnovazebnı́ smyčka se rozpojı́ a výstupnı́ napětı́ pumpy (účinnost) skokově změnı́ svou hodnotu. Následujı́cı́ část zkoumá dvě významné složky ztrát, které jsou podrobeny důkladné
analýze: přı́čný proud invertoru a zpětný přenos náboje spı́nacı́m tranzistorem. Základnı́
motivacı́ je odvozenı́ vztahů pro modelovánı́ uvedeného typu pumpy.
2.
Modelovánı́ a optimalizace CMOS invertoru
Požadavky na návrh invertoru se odlišujı́ od návrhu invertoru pracujı́cı́ho v digitálnı́m obvodu [3]. Na základě výsledků simulacı́ bylo zjištěno, že převážná část ztrát
v pumpě je způsobena přı́čným proudem, který invertorem teče v okamžiku, kdy je jeho
výstup z hlediska logických úrovnı́ v nedefinovaném stavu. V takovém přı́padě se invertor
chová jako zesilovač, nikoliv jako digitálnı́ prvek. Hlavnı́m kritériem návrhu je požadavek
minimálnı́ho statického výkonu, protože ztráta způsobená dynamickými vlastnostmi je
zanedbatelná. Odběrová charakteristika invertoru je popsána nespojitou funkcı́ pro tři
oblasti:


V2 + VT HN ≤ Vin ≤ VSP
IDsatN |VGS = Vin − V2 ,
(2)
Icross = IDsatP |VSG = V1 − Vin ,
VSP ≤ Vin ≤ V1 − |VT HP |


0,
jinde,
(a)
(b)
Obr. 2: Analýza napětı́ VSP : závislost na poměru R (a) a normovaná citlivostnı́
křivka (b).
19
(a)
(b)
Obr. 3: Střednı́ hodnota přı́čného proudu invertorem na poměru Wp /Lp (a) a
závislost střednı́ hodnoty výstupnı́ho napětı́ pumpy na ploše invertoru (b).
kde IDsat je saturačnı́ proud tranzistoru N/PMOS. Přı́čný proud dosáhne svého maxima
v bodě Vin = VSP , v zahraničnı́ literatuře označený jako switching point“ [3], jenž je pro
”
BSIM model [4] popsán modifikovaným vztahem:
p V(i+1) − |VT HM P i | + R ab V(i−1) + VT HNM N i
p
VSP =
.
(3)
1 + R ab
kde koeficienty a, b jsou vypočı́tány z pohyblivosti µef f a rovnice Abulk0 = Abulk |Vgstef f =0
při nulových předpětı́ch, dále z měrné kapacity oxidu coxe a rozměrů obou tranzistorů W,
L,
coxeN µef f N |VGS =VSB =0
coxeP µef f P |VSG =VBS =0
Wn Lp
a=
,b=
aR=
.
Abulk0N |VSB =0
Abulk0P |VBS =0
Ln Wp
Výpočet statického výkonu při přechodu mězi dvěma logickými úrovněmi na základě definičnı́ho vztahu je přı́liš složitý, proto byla odběrová charakteristika nejprve linerizována
interpolačnı́m polynomem ze dvou bodů na každém z intervalů, kde Icross 6= 0. Statický
výkon se snadno určı́ ze vztahu pro obsah trojúhlenı́ka1 .
Invertor má v aktivnı́ oblasti charakter proudového zdroje, jehož střednı́ hodnota
proudu se měnı́ lineárně s celkovou plochou obou tranzistorů v širokém rozsahu. Výstupnı́
napětı́ pumpy tedy klesá lineárně s plochou invertoru, Ainv = WN i LN i + WP i LP i , pro
VSP = konst. Z obrázku 1 je patrná vzájemná souvislost mezi závěrným proudem spı́nacı́ho
tranzistoru a výstupnı́m napětı́m invertoru v přechodovém pásmu napět’ové převodnı́ charakteristiky, ir = f(vinv ). Volbou vhodného poměru R (při konstantnı́ ploše) je možné snı́žit
velikost přı́čného proudu invertorem i při relativně vysokém poměru W/L obou tranzistorů. Střednı́ hodnotu přı́čného proudu se výrazně snı́žı́ posunutı́m bodu VSP k jedné z
hraničnı́ch hodnot, V2 + VT HN nebo V1 − |VT HP |, při které teoreticky dojde k zavřenı́
jednoho z tranzistorů. Uvedeného stavu však nenı́ možné reálně dosáhnout, a tak se optimálnı́ poměr R stanovı́ z poklesu maximálnı́ citlivosti napětı́ VSP (R) na požadovanou
,
hodnotu, vyjádřenou parametrem δ = CCmax
o pt
1
Bližšı́ informace jsou uvedeny v publikaci, která je v současnosti v recenznı́m řı́zenı́.
20
Copt (R) = δ · max
dVSP R
dR VSP
.
(4)
Parametr δ se typicky volı́ na hodnotu 0.5. Rovnice (4) má dvě řešenı́ Ropt1 a Ropt2 .
Pro návrh je vhodné použı́t hodnotu Ropt2 , protože požadované citlivosti je dosaženo při
výrazně menšı́ změně hodnoty R, než pro přı́pad R < Rcmax 2 . Nevýhodou uvedeného
návrhu je narušenost symetrie převodnı́ charakteristiky a důsledky z toho plynoucı́ [3],
avšak v uvedené aplikaci tato vlastnost nevadı́, naopak, jak bude ukázáno dále, je žádoucı́.
3.
Model stupně pumpy a optimalizace spı́nače
Spı́nacı́ tranzistor MSi umožňuje vedenı́ proudu oběma směry navzdory své primárnı́
funkci v obvodu-transport náboje do následujı́cı́ho stupně. Z tohoto důvodu nejsou elektrody Drain a Source vzájemně rozlišeny. Z hlediska návrhu nenı́ vhodné, aby měl tranzistor MSi v sepnutém stavu přı́liš malý odpor, protože vzrůstá velikost odčerpaného náboje
z hlavnı́ho kapacitoru. K odčerpávánı́ náboje docházı́ zejména během náběhu výstupnı́ho
napětı́ pumpy. Výsledky simulacı́ ukazujı́, že existuje optimálnı́ poměr Ws /Ls , při němž
výstupnı́ napětı́ v ustáleném stavu dosáhne svého maxima. Odhad velikosti spı́nacı́ho tranzistoru vyplývá z dynamické analýzy obvodu na obrázku 4a. Časové odezvy jsou odvozeny
ze statického modelu buňky pro obě konfigurace proudu IS . Pro tyto účely je hlavnı́ kapacitor nahrazen stejnosměrným zdrojem napětı́, jehož rozsah se může toreticky pohybovat v
rozsahu hodnot napájecı́ch“ napětı́ buňky V1 a V2 . Na obrázku 4b je znázorněna závislost
”
závěrného proudu spı́nacı́ho tranzistoru v závislosti na vstupnı́m napětı́. V okamžiku, kdy
vstupnı́ napětı́ dosáhne napět’ové úrovně VSP , tranzistor se skokově uzavře. Lze dokázat,
že pro Vin ∈ h0, V2 ) tranzistor pracuje vždy triodovém režimu.
(a)
(b)
Obr. 4: Schéma buňky pro statickou analýzu(a) a závislost závěrného proudu
spı́načem na vstupnı́m napětı́ (b).
2
Nesymetrie křivky vůči hodnoě Rcmax je fyzikálně zapřı́činěna nižšı́ pohyblivostı́ děr v PMOS
struktuře oproti pohyblivosti elektronům v NMOS struktuře.
21
Odezva systému na skokovou změnu vstupnı́ho napětı́ popisuje chovánı́ každého
stupně pumpy po přivedenı́ hodinového signálu. Napětı́ na kapacitoru vcF (t) narůstá
(id (t) > 0) v přı́padě, že výstup invertoru je v počátečnı́m čase uveden do úrovně H“.
”
Naopak, kapacitor je vybı́jen vcR (t) (id (t) < 0) v přı́padě, že jeho počátečnı́ napětı́ je
většı́ než V2 , přičemž nejvyššı́ hodnota tohoto napětı́, která ještě uvede tranzistor Ms do
sepnutého stavu odpovı́dá hodnotě VSP . Přechodové charakteristiky byly odvozeny na
základě stavové rovnice (Cauchyova úloha),
Z
C
dvc = t + K
(5)
ic
s obecnými počátečnı́mi podmı́nkami vcF (tF ) = VcF a vcR (tR ) = VcR . Optimálnı́ šı́řka
spı́nacı́ho tranzistoru byla nalezena z maximálnı́ho přı́rustku napětı́ (obr.5a), vcF (t) + vcR (t)
s krajnı́mi hodnotami počátečnı́ch podmı́nek vcF (0) = 0 a vcR (0) = VSP , na konci fáze
hodinového pulsu (viz obrázek 5a).
Výsledný analytický vztah je velmi složitý, proto je prvotnı́ odhad proveden metodou
linearizace přechodových charakteristik (analogie časové konstanty v lineárnı́m obvodu).
Využı́vá se zde té vlastnosti, že přechodové charakteristiky jsou na vyznačených časových
intervalech, ve kterých součet odezev dosáhne maxima Vmax , popsány toutéž funkcı́ (superpozice exponeciálnı́ch funkcı́). Vzhledem ke skutečnosti, že τR τF , pak celkový
2
nepřevýšı́ hodnotu V2 + Vof f (Vof f → 0) za dobu odpovı́dajı́cı́
přı́rustek napětı́ α = VVSP
k-násobku vybı́jecı́ časové konstanty,
{∆vCF + ∆vCR ≈ V2 }|t=k·τR +t0F =T /2 .
(6)
Vztah mezi parametry α a k lze nalézt z odvozeného vztahu časové odezvy: ∆vcR (t =
kτR ) = α [vc∞ − vc (0)]. Parametr τR je přibližně určen vybı́jecı́m proudem spı́nacı́ho tranzistoru ISR na počátku přechodového děje, kdy vCR = VSP . Výsledná šı́řka spı́nacı́ho
tranzistoru se určı́ z následujı́cı́ho vztahu:
(a)
(b)
Obr. 5: Přı́rustek napětı́ v pumpě pro určenı́ optimálnı́ šı́řky spı́nače (a) linearizace přechodových charakteristik (b).
22
WMSopt
kC(VSP − V2 ) IˆSR (T ct0 + 2at0 ) +
+
=
T IˆS
2T IˆS bt0
R
p
Dt0
,
(7)
R
kde IˆSR je proud drainu odvozený se statického modelu pro jednotkovou šı́řku WMs . Koeficienty at0 , bt0 , ct0 , Dt0 jsou vypočtené ze závislosti t0F = f(WMs ). Ze vztahu 7 jsou vyvozeny dva důležité poznatky. Za prvé, mı́ra ztrát spı́nacı́m tranzistorem závisı́ na návrhu
invertoru, požadavkem je minimalizace kritického napětı́ VSP , což je v souladu s tvrzenı́m uvedeným v rozboru invertoru. Poměr W/L spı́nacı́ho tranzistoru je velmi malý,
dle použité technologie a velikosti řı́dı́cı́ch napětı́ může být i menšı́ než 1. Za druhé, mı́ra
ztrát prakticky nezávisı́ na volbě W/L diodového tranzistoru WMd , přı́slušná velikost W/L
se určı́ z požadavků na velikost zatěžovacı́ho proudu, zvlněnı́ výst. napětı́, atd..
4.
Závěr
Elementárnı́ simulace jsou základnı́m krokem vedoucı́m k modelovánı́ nábojové
pumpy. Článek byl zaměřen na analýzu a posléze na návrh velikosti tranzistorů invertoru a spnače za účelem dosaženı́ maximálnı́ho zisku.
Použité vztahy lze aplikovat obecně pro N-stupňovou pumpu, ovšem s přihlédnutı́m
na velikost řı́dı́cı́ch napětı́ v obvodu odvozených z napájecı́ho napětı́. Dále byl vytvořen
nelineárnı́ model jedné buňky, jehož vnitřnı́ struktura je popsána funkcemi přı́slušných
podobvodů na bázi rovnic BSIM modelu MOSFET tranzistorů. V současnosti je model
testován v N-stupňové pumpě (analýza) a v přı́padě zjištěných nesrovnalostı́ bude dále
upravován. Primárnı́m účelem modelu je jeho použitı́ pro vývoj návrhového algoritmu
(syntéza) na základě vstupnı́ch požadavků (napájecı́ napětı́, výstupnı́ napětı́, zatěžovacı́
proud, kmitočet hodinového signálu,...)s cı́lem dosáhnout optimálnı́ho řešenı́.
Reference
[1] C. F. Kurth, G. S. Moschytz, Nodal analysis of switched-capacitor networks. IEEE
Transaction on Circuits and Systems, Vol. CAS/26, No. 2, February 1979, pp. 93-104.
[2] J. Marek, J. Hospodka, O. Šubrt, Analýza nábojové pumpy CTS-2. In V.
Letnı́ doktorandské dny 2015. Praha: ČVUT FEL, Katedra teorie obvodů.
ISBN 978-80-01-05749-0.
[3] R. Baker, CMOS: circuit design, layout, and simulation. 3rd ed. Hoboken, NJ: Wiley,
c2010, xxxiii, 1173 p. ISBN 978-04-70-88132-3.
[4] C. Hu, A. M. Nikenjad, W. Yang, D. Lu, BSIM4.6.4 MOSFET Model: User’s Manual.
UC Berkeley, 2009.
[5] F. Pan and T. Samaddar, Charge pump circuit design. McGraw-Hill, c2006, xv, 247 p.
ISBN 978-007-1470-452.
23
Od měření geometrie výbrusu bižuterních
kamenů k jejich opticko-estetickému hodnocení
Naděje HAVLÍČKOVÁ1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Tento článek se zabývá problematikou hodnocení kvality
bižuterních kamenů. Ukázalo se, že prosté hodnocení geometrie a hledání
hrubých výrobních vad těchto kamenů nenese dostatečnou informaci o jejich
opticko-estetických vlastnostech. Opticko-estetické vlastnosti kamenů, tedy
subjektivní vjem jejich líbivosti, je hlavní užitnou vlastností kamenů, z čehož
vyplívá potřeba hodnocení tohoto vjemu. Článek popisuje navrženou
metodiku objektivizace hodnocení opticko-estetických vlastností bižuterních
kamenů. Metodika je založena na analýze parametrů světla odraženého
osvětleným kamenem. Pro zachycení tohoto světla, reflexí kamene, byla
vyvinuta speciální optická soustava. Signifikance jednotlivých parametrů
reflexí při určování opticko-estetických vlastností kamenů je stanovitelná
z míry korelace těchto parametrů se subjektivními hodnoceními
opticko-estetických vlastností kamenů zkušenými hodnotiteli.
1.
Úvod
Výroba bižuterních a šperkových kamenů je jedním z významných průmyslových
odvětví. Bižuterní a šperkové kameny jsou zpravidla konvexními mnohostěny z průhledného,
čirého či zbarveného materiálu. Jejich geometrie je navrhována tak, aby na základě
elementárních fyzikálních optických principů dosahovaly opticko-estetických vjemů, jež
docení cílový hodnotitel. Bižuterní a šperkové kameny se od sebe liší materiály, z nichž jsou
vyrobeny. Bižuterní kameny (viz např. obr. 1) jsou zhotovovány zejména ze skla či plastů.
Surovinou pro výrobu šperkových kamenů jsou pravé (přírodní) kameny (drahokamy
a polodrahokamy) a syntetické kameny. [1]
Obr. 1: Příklad bižuterního kamene [2]
24
1.1. Opticko-estetické vlastnosti kamenů
Opticko-estetické vlastnosti kamenů vypovídají o subjektivním estetickém vjemu, který
může mít kámen na pozorovatele, a který je hlavní užitnou vlastností kamenů. Subjektivní
estetický vjem je dán např. optickými vlastnostmi kamene (jeho geometrií, materiálem,
kvalitou povrchů, …), osvětlením kamene (pozicí, svítivostí, spektrem a vyzařovacím úhlem
zdroje, počtem zdrojů), pozicí pozorovatele, vlastnostmi lidského zraku (šířkou zornice,
spektrální citlivostí sítnice, rozdíly mezi fotopickým (denním) a skotopickým (nočním)
viděním, jasovou nelinearitou a jasovou adaptibilitou oka, prostorovým a dynamickým
kontrastem, principem integrálního komparativního vnímání či binokulární fúzí obrazů
spojenou se stereoskopickým viděním), psychologickými aspekty pozorovatele (očekáváním
určitého vjemu, ovlivněním vnímání trhem a trendy, povahou) či pozadím za pozorovaným
kamenem. [3] [4]
Z popsané komplexnosti kvantifikace subjektivního estetického vjemu při pozorování
kamenů vyplývá, že standardně používané opticko-estetické parametry popisující optickoestetické vlastnosti (např.: brilance, oheň, jiskra) jsou pouze přibližným vodítkem při určování
líbivosti kamenů. Brilance je schopnost kamene měnit směr dopadajícího světla tak, aby
maximum světla vystupovalo žádoucími a minimum nežádoucími směry [1]. Oheň je
definován jako schopnost kamene rozkládat bílé (denní) světlo na jeho jednotlivé spektrální
složky tak, že v žádoucím směru a obvyklém místě pozorování je dosaženo maximální
intenzity a separovanosti spektrálních barev [1] [3] [4]. Jiskrou kamene se rozumí jeho
schopnost měnit intenzitu vystupujícího světla a barevných složek spektra při nepatrné změně
polohy zdroje, kamene nebo pozorovatele [5]. Roli ve vnímání jiskry hraje i relativní velikost
a kontrast jednotlivých světlých a tmavých oblastí i jejich prostorové rozložení [6] [7], tzv.
vzor (angl. pattern) kamene.
1.2. Hodnocení opticko-estetických vlastností kamenů
Existují různé motivace k hodnocení opticko-estetických vlastností šperkových
i bižuterních kamenů.
Jedním z důvodů k hodnocení opticko-estetických vlastností kamenů je hledání výbrusu
s optimálními opticko-estetickými vlastnostmi za účelem jeho následné hromadné výroby
a stanovení jeho hodnoty. Takovýto výbrus může být hledán jak pomocí matematických
modelů počítajících opticko-estetické parametry kamene ze světla z něj vystupujícího, tak
na základě experimentálních subjektivních hodnocení daných prototypů výbrusů zkušenými
hodnotiteli. Za účelem validace matematických modelů je nutná komparace výsledků
simulací s experimentálními subjektivními hodnoceními. Současný stav světového poznání
nedosahuje, i přes postupné zpřesňování definic opticko-estetických parametrů, plné shody
mezi predikcemi opticko-estetických vlastností a subjektivními hodnoceními daných typů
výbrusů [7].
Dalším důvodem k hodnocení opticko-estetických vlastností kamenů je hodnocení
kvality výroby daného výbrusu za účelem zjištění variability jakosti hromadné výroby,
vytřídění vadných kusů, sledování plíživých změn ve výrobě či optimalizace technologie
výrobního procesu k dosažení lepších opticko-estetických vlastností výbrusu. Při takovýchto
hodnoceních mají optické simulace a v nich prováděné výpočty opticko-estetických
parametrů smysl, pouze pokud je do simulací možné zavést výbrus s reálnými vlastnostmi.
V rámci hodnocení jednoho druhu a velikosti výbrusu právě za účelem hodnocení kvality jeho
hromadné výroby dále odpadá nutnost hodnocení jiskry ve smyslu vzoru (viz výše) i účelnost
dalšího zpřesňování definic ostatních opticko-estetických parametrů (brilance a ohně).
25
1.2.1.
Specifika hodnocení bižuterních kamenů
Hodnocení bižuterních kamenů vyžaduje v mnoha ohledech jiný přístup než hodnocení
šperkových kamenů. V první řadě, materiály pro výrobu bižuterních kamenů mají odlišné
optické vlastnosti. Sklo, jeden z nejběžnějších materiálů pro výrobu bižuterních kamenů, má
nižší index lomu i hodnotu optické disperse v porovnání se šperkovými kameny. Tomu musí
být přizpůsoben jak výbrus kamene (úhly mezi jednotlivými ploškami – facetami – jsou
modifikovány za účelem zachování správné směrovosti výstupního svazku světla za odlišného
indexu lomu), tak jeho povrchová úprava (zadní facety kamene jsou opatřovány reflexní
vrstvou – simili – zajišťující totální odraz světla i pro nižší úhly jeho dopadu). Další odlišností
hrající roli v hodnocení bižuterních kamenů oproti šperkovým je fakt, že u bižuterních
kamenů nejsou kladeny tak vysoké požadavky na preciznost výbrusu, ať už se jedná
o symetrii kamenů či rovinnost jednotlivých facet. Bižuterní kameny se vyrábí ve větším
množství a dosažení obdobné preciznosti jako u kamenů šperkových je, s ohledem na jejich
prodejní cenu i následné využití, zbytečné. Jak hodnotit vhodnost zvoleného výrobního
procesu broušení a leštění kamenů, který materiál je optimální pro similizaci, do jaké míry je
možné tolerovat odchylky od požadovaného tvaru výbrusu i konvexnost jednotlivých facet
(danou technologií výroby) je otázkou, ke které je třeba přistupovat prostřednictvím
hodnocení opticko-estetických vlastností namísto prostého hodnocení geometrických
vlastností (i křivý kámen může mít dobré opticko-estetické vlastnosti a naopak) a hrubých
výrobních vad (i kámen bez hrubých výrobních vad může vykazovat špatné opticko-estetické
vlastnosti). Existující simulační programy (např. DiamCalc [8], GemRay [9] apod.) i měřicí
zařízení (např. CFire [10]) pro šperkové kameny nejsou, s ohledem na výše popsaná specifika,
pro bižuterní kameny optimální. Vývoj metodiky pro objektivizaci porovnávání
opticko-estetických vlastností bižuterních kamenů se zaměřením na kvalitativní třídění
sériové výroby, sledování plíživých změn ve výrobě či hodnocení výrobního procesu
broušení, leštění a similizace je předmětem tohoto výzkumu.
2.
Metodika objektivizace hodnocení opticko-estetických vlastností
bižuterních kamenů
Za účelem objektivizace hodnocení opticko-estetických vlastností bižuterních kamenů
byla navržena, realizována a optimalizována optická soustava umožňující snímání reflexí
reálných kamenů. Soustava se skládá ze širokospektrálního osvětlovače umožňujícího
definované homogenní osvětlení hodnoceného kamene. Světlo odražené kamenem je
směřováno na reflexní plochu a tyto reflexe jsou zaznamenávány snímacím zařízením.
Podrobnější popis optické soustavy není možné uvést z důvodu připravovaného
patento-právního řízení.
Reflexe kamenů (viz např. obr. 2) jsou zaznamenávány ve formátu surových dat bez
přídavných automatických korekcí snímacího zařízení. Na barevných snímcích je prováděno
vyvážení bílé barvy na základě spektrální charakteristiky použitého zdroje světla. Snímky jsou
následně transformovány do různých barevných prostorů stanovených se zřetelem
na charakter zkoumaných příznaků. Za účelem jasové analýzy reflexí související s brilancí
jsou snímky transformovány do prostoru HSL. V kanálu L (z angl. luminance) daného
prostoru je počítán jas jednotlivých bodů (pixelů) snímku s ohledem na spektrální citlivost
lidského oka. Pro zjišťování informace o schopnosti kamenů rozkládat na ně dopadající
polychromatické světlo na jednotlivé spektrální složky (související s ohněm) je analyzován
v prostoru RGB každý barevný kanál snímků zvlášť a kanály jsou mezi sebou následně
komparovány.
26
Obr. 2 – Příklad reflexí bižuterního kamene pořízených vyvinutou optickou soustavou
Prostřednictvím segmentace obrazu jsou na snímcích hledány oblasti, které budou
klasifikovány jako světelné reflexe z kamene. Segmentace je prováděna několika různými
algoritmy.
První algoritmus je založen na přiřazování pixelů do tříd za současné minimalizace intratřídní a maximalizace inter-třídní variability. Práh mezi třídami je stanoven podmínkou
(μ1 + μ2) / 2 = thr, kde μ1 a μ2 jsou střední hodnoty úrovní jasu v daných třídách 1 a 2 a thr je
úroveň jasu stanovená jako práh mezi oběma třídami.
Další metoda kombinuje principy lokálního a globálního přístupu. Nejdříve jsou lokálně
(v plovoucím okně velikosti srovnatelné s předpokládanou velikostí hledaných reflexí)
potlačovány vlivy globálních jasových nehomogenit pozadí. Následně je takto korigovaný
snímek použit pro globální stanovení prahu pomocí některé ze standardních metod prahování,
např. metody clustering (přiřazování do tříd) popsané výše.
Poslední způsob segmentace hledá dostatečně jasné reflexe a u nich stanovuje práh
pro každou reflexi individuálně. Hodnota jasu prahu dané reflexe je stanovena jako
definovaný zlomek hodnoty jasu nejsvětlejšího pixelu dané reflexe.
Výše popsané algoritmy jsou dostatečně robustní pro identifikaci reflexí na snímcích jak
s nehomogenitami pozadí, tak s různou střední hodnotou intenzit reflexí, která může být dána
např. různou expoziční hodnotou snímacího zařízení či odlišnou velikostí zkoumaných
kamenů spojenou s jinou maximální možnou odraženou světelnou energií.
Zvolený práh významně ovlivňuje následné kvantitativní jasové analýzy reflexí. Optimální
metoda segmentace musí být stanovena na základě hodnot korelace výsledků následných
analýz reflexí se subjektivními hodnoceními opticko-estetických vlastností zkušenými
hodnotiteli.
U identifikovaných reflexí jsou počítány různé charakteristiky reflexí, které mohou mít
výpovědní hodnotu o opticko-estetických vlastnostech kamene.
Prvním hodnoceným parametrem byla vzájemná poloha jednotlivých reflexí zkoumaného
kamene, která by se v rámci jednoho druhu výbrusu neměla významně lišit a která vypovídá
o preciznosti výroby z hlediska symetrie výbrusu. Potvrdilo se, že symetrie výbrusu nemá
dostatečnou výpovědní hodnotu o kvalitě kamene s ohledem na opticko-estetické vlastnosti.
Další charakteristiky jsou analyzovány přímo nad reflexemi bez ohledu na jejich vzájemnou
polohu. Těmito charakteristikami jsou např. energie jednotlivých reflexí, jejich maximální
a střední intenzita, percentily intenzity, strmost nárůstu a poklesu intenzity, rozpětí
27
a homogenita intenzity, plocha a obvod reflexí, jejich kruhovitost a protažení, apod.
Signifikance jednotlivých charakteristik při určování opticko-estetických vlastností kamenů je
dána mírou korelace hodnot těchto charakteristik se subjektivními hodnoceními daných
kamenů zkušenými hodnotiteli. Pro stanovení relevantních charakteristik vypovídajících
o opticko-estetických vlastnostech kamenů je zapotřebí dostatečně velký počet kamenů
různých kvalit a s různými vadami, k nimž jsou k dispozici subjektivní hodnocení optickoestetických vlastností hodnotiteli.
3.
Závěr
Opticko-estetický vjem, tzv. líbivost, kamenů je jejich hlavní užitnou vlastností. Pouhé
měření geometrie bižuterních kamenů a hledání hrubých výrobních vad nenese dostatečnou
informaci o jejich kvalitě. Byla navržena metodika objektivizace hodnocení kvality
bižuterních kamenů s ohledem na jejich opticko-estetické vlastnosti. Tato metodika bude
využívána k hodnocení kvality hromadné výroby bižuterních kamenů. Relevance jednotlivých
nalezených charakteristik souvisejících s opticko-estetickými vlastnostmi bude stanovena
na základě komparace vypočtených hodnot těchto charakteristik se subjektivními
hodnoceními daných kamenů. Za tímto účelem jsou v současné době kompletovány
hodnotiteli popsané reprezentativní vzorky kamenů.
Reference
[1]
KOUCKÝ, J. a kol. Bižuterie: Základní učebnice zbožíznalství. 1. vyd. Jablonec n. N. :
Svaz výrobců bižuterie, 2005. 229 s.
[2]
Beadage. Glossary. [Online] [cit. 04. 2016]. http://beadage.net/glossary/chaton/.
[3]
Russian gemological server. Diamond cut study. [Online] [cit. 09. 2015].
http://www.gemology.ru/cut/index.htm.
[4]
SIVOVOLENKO, S. - SHELEMENTIEV, Y. - HOLLOWAY, G. - MISTRY, J. SEROV, R. - ZHULIN, S. - ZIPA, K. How diamond performance attributes:
Brilliance, Scintillation and Fire depend on human vision features. The Australian
Gemmologist. 25 (3), 2013, stránky 82 - 121. The Gemmological Association of
Australia. ISSN 0004-9174.
[5]
HOLLOWAY, G. Defining the Beauty and Desirability of Round Brilliant Diamonds.
[Online] [cit. 09. 2015]. http://www.diamond-cut.com.au.
[6]
LIDDICOAT, R. T. The GIA Diamond Dictionary. 3rd ed. New York : Gemological
Institute of America, 1993. 275 s. ISBN 978-0873110266.
[7]
MOSES, T. M. - JOHNSON, M. L. - GREEN, B. - BLODGETT, T. - CINO, K. GUURTS, R. H. - GILBERTSON, A. M. - HEMPHILL, T. S. - KING, J. M. KOMYLAK, L. - REINITZ, I. M. - SHIGLEY, J. E. A Foundation for Grading the
Overall Cut Quality of Round Brilliant Cut Diamonds. Gems & Gemology. 40 (3),
2004, stránky 202 - 228. Gemological Institute of America. ISSN 0016-626X.
[8]
OctoNus. DiamCalc. [Online] [cit. 04. 2016].
http://www.octonus.ru/oct/products/3dcalc/stúandard/.
[9]
GemCad, Computer-Aided Design Software for Faceted Gemstones. GemRay.
[Online] [cit. 04. 2016]. http://www.gemcad.com/gemray.html
[10]
OGI Systems Ltd. CFire, Visual Diamond Shape Light Performance. [Online]
[cit. 04. 2016]. http://www.ogisystems.com/cfire-diamond-light-performance.html.
28
Neinvazivní screening aterosklerózy
Jan DVOŘÁK
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt:
Ateroskleróza
je
jedním
z nejzávažnějších
problémů
kardiovaskulárního systému. To především proto, že je v raných stádiích jen
velmi obtížně diagnostikovatelná, avšak způsobuje postupné nevratné změny
KVS. Pro zhodnocení stupně poškození tepen tímto procesem existuje
aktuálně několik klinických metod, žádná však není široce uplatnitelná.
Při měření oscilometrických pulzací, jejichž snímání je základem pro
vyhodnocení krevního tlaku oscilometrickou metodou, je možné při vhodném
uspořádání měření získat některé sekundární parametry - hemodynamické
parametry kardiovaskulárního řečiště. Tyto parametry lze kalkulovat
pomocí kombinace standardních lékařských vyšetření, mezi nimiž je zejména
snímání elektrické aktivity srdce, fotopletysmografie a záznam
oscilometrických pulzací z manžety umístěné na končetině, případně i více
končetinách. Proto byla vytvořena databáze signálů s využitím komplexního
měřicího zařízení, umožňujícího synchronně zaznamenávat EKG, PPG a
oscilometrické pulsace z manžet během postupného napouštění a vypouštění.
Databáze je doplňována signály již 5 let a obsahuje i záznamy stejných
pacientů s časovým odstupem.
Na základě provedených měření byly prokazatelně zjištěny signifikantní
rozdíly středního arteriálního tlaku změřeného oscilometrickou metodou při
nafukování a vyfukování manžety. Tyto rozdíly byly větší než 5 mmHg u
48% pacientů seniorů, oproti skupině mladých lidí, kde tento rozdíl
vykazovalo pouze 11% pacientů. Tyto rozdíly mohou mít za následek
zkreslení detekce hodnoty středního arteriálního tlaku, potažmo výpočtu
systolického a diastolického tlaku, při měření oscilometrickou metodou. Dále
byla zjištěna významná korelace mezi MAP a ASI indexem. ASI index je
parametr, který je spojen se ztrátou elasticity tepen, která nastává právě při
ateroskleróze.
29
Volba statistických parametrů dat
reprezentujı́cı́ch fyzickou aktivitu
biomedicı́nského modelu Huntingtonovy
choroby
Matouš Pokorný1 , školitel specialista Jan Havlı́k
1
Biomedical Electronics Group, České vysoké učenı́ technické v Praze, Fakulta
elektrotechnická, Katedra teorie obvodů
[email protected]
Abstract: Tento text stručně popisuje problematiku volby statistických
parametrů pro zpracovánı́ dat reprezentujı́cı́ch fyzickou aktivitu mini
prasat měřenou pomocı́ telemetrického systému. Mini prasata se použı́vajı́ v Ústavu živočišné fyziologie a genetiky AV ČR v Liběchově jako
biomedicı́nský model pro výzkum Huntingtonovy choroby. Tento výzkum
se v dnešnı́ době zaměřuje předevšı́m na vývoj léčiv a léčebných postupů.
Huntingtonova choroba je dědičné neurodegenerativnı́ onemocněnı́ projevujı́cı́ se motorickými a psychiatrickými poruchami. Tyto poruchy byly
pozorovány i u nemocných mini prasat a lze tedy očekávat měřitelné
rozdı́ly v záznamech fyzické aktivity transgennı́ch (tgHD) a zdravých
(WT) jedinců.
Záznam fyzické aktivity je zı́skáván pomocı́ telemetrického systému, kde
každý vysı́lač obsahuje třı́osý akcelerometr a poskytuje tedy informaci
nejen o celkovém zrychlenı́, ale i o zrychlenı́ v jednotlivých osách x,
y, z. Našı́ studie se účastnı́ 6 WT a 6 tgHD jedinců. Experimentálnı́
měřenı́ probı́há kontinuálně několik dnı́ na všech zvı́řatech současně.
Výsledkem je tedy velké množstvı́ naměřených dat (vzorkovacı́ frekvence
100 Hz), která se dále redukujı́ a zpracovávajı́ do formy vhodné k závěrečné analýze.
Prvnı́, námi publikované, výsledky ukazujı́, že existuje signifikantnı́ rozdı́l
v záznamech fyzické aktivity WT a tgHD jedinců. Tyto závěry jsou
podloženy daty, která jsme zı́skali průměrovánı́m záznamu celkového zrychlenı́ každého jedince po oknech o délce 10 minut a následným výpočtem
průměru pro každou skupinu a časové okno (WT a tgHD). Jaký vliv
však má délka okna a výběr statistického ukazatele na výsledek? Je
výhodnějšı́ použı́t kratšı́ časové okno (jednotky minut) nebo delšı́ časové
okno (desı́tky minut)? Je možné, že napřı́klad maximálnı́ hodnota, medián
nebo rozptyl vı́ce zviditelnı́ rozdı́ly v zaznamené aktivitě?
Tato práce je realizována za podpory grantu SGS14/191/OHK3/3T/13
– Pokročilé algoritmy čı́slicového zpracovánı́ signálů a jejich aplikace.
30
Metody měřenı́ parametrů tekutin
Filip Paulů1 , Jiřı́ Hospodka1
1
České vysoké učenı́ technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Tekutiny majı́ velké množstvı́ fyzikálnı́ch a chemických vlastnostı́, které jsou denně měřeny nejen v průmyslu, ale jsou potřebné i v
každodennı́m životě.
Jsou vlastnosti, které je možné jednoduše změřit. Napřı́klad teplota, hustota, viskozita a dalšı́. Také existuje velké množstvı́ potřebných vlastnostı́,
které nelze změřit přı́mo. Jedná se o parametry charakterizujı́cı́ každou
tekutinu. Určujı́, jaké obsahuje množstvı́ vzduchu, tuku, nečistot a mnoho
dalšı́ho.
Měřenı́ těchto parametrů převážně vede k chemické analýze. Ta bývá
nevýhodná z finančnı́ch a časových důvodů. Směr zájmu se tedy ubı́rá k
neinvaznı́m metodám měřenı́ a metodám umožňujı́cı́m pracovat v reálném
čase.
Jsou prokázány nepřı́mé závislosti mezi těmito hledanými vlastnostmi
a měřenı́m veličin, které splňujı́ výše zmı́něná kritéria. Jako vhodné se
ukazujı́ permitivita, konduktivita, index lomu světla, optická absorpce,
propustnost a dalšı́.
Velmi užitečným nástrojem se také ukazujı́ různé spektrometry a to
jak optické, ultrazvukové i RF spektroskopie, tak elektricky impedančnı́
spektroskopie. Bohužel, většina těchto měřı́cı́ch přı́strojů je opět velice
drahá. Z výsledků je možné zjistit, které složky spektra jsou nejvı́ce
závislé na určitém žádaném parametru. Na základě nich bude snaha navrhnout jednoduchý přı́stroj k jejich změřenı́.
Hlavnı́m cı́lem je popis známých elektrických měřı́cı́ch metod tekutin.
Zejména ty, u kterých se předpokládá závislost s chtěnými vlastnostmi
tekutin. Zároveň je rozebrán jejich potenciál se snahou o jejich zjednodušenı́ a kombinace s jinými metodami, které pomohou zı́skat určité
vlastnosti. Je předpoklad, že nejen dı́ky modernı́m data miningovým a
machine learningovým metodám budou zı́skávány požadované parametry
s dostatečnou přesnostı́.
31
Zobrazování oxidativních procesů na kůži
pomocí ultra slabé emise fotonů
Michaela Poplová1,2, Michal Cifra2
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
2
Ústav fotoniky a elektroniky, Akademie věd České republiky
[email protected]
Abstrakt: Ultra slabá emise fotonů (UPE) je světelný fenomén, který vzniká
zářivým přechodem chemicky generovaných elektronově excitovaných stavů
molekul v biologických systémech. Tyto elektronově excitované stavy vznikají
v průběhu reakcí reaktivních forem kyslíku (ROS) s biomolekulami. Změna
v produkci ROS odráží fyziologické změny ve sledovaném objektu. Nárůst
UPE může souviset s přirozeným růstem, kdy pozorujeme pomalé změny v
čase nebo se zvýšenou produkcí ROS, která je spojena s reakcí objektu na
stresový podnět. Pokles UPE souvisí se zpomalením metabolických procesů či
postupným odumíráním. UPE má tedy vypovídající hodnotu o aktuálním
stavu zkoumaného objektu a v budoucnu by mohla být využita právě
k diagnostice jako nepřímá metoda monitorování oxidativních procesů.
Potenciální využití UPE by mohlo být v zemědělství (přítomnost herbicidů,
plísní a jiných patogenů), potravinářství (kontrola kvality potravin) či
dermatologii (účinnost opalovacích krémů, patologie).
Tato práce se zabývá pozorováním prooxidativních a antioxidativních
procesů na UPE z lidské kůže. Lidská kůže je složena ze třech částí a to
pokožky, škáry a podkoží, kdy největší příspěvek UPE pochází právě z vrchní
vrstvy. Jako prooxidant byl zvolen peroxid vodíku, který přirozeně vzniká
v biologickém systému po jednoelektronové redukci superoxidového
aniontového radikálu superoxid dismutázou a dále se podílí přímo na vzniku
dvou silných oxidantů a to hydroxylového radikálů (OH˙) a kyseliny chlorné
(HClO). Jako antioxidant byla použita kyselina askorbová, která odbourává
radikály kyslíku tím, že jako dárce vodíku vytváří relativně stabilní
askorbylový radikál. Antioxidanty obecně mohou inhibovat tvorbu ROS a
odstraňovat už vytvořené ROS.
Výsledkem této práce je kvantifikace UPE z dorsální strany ruky lidského
subjektu vyvolaného peroxidem vodíku (H2O2). Tento efekt byl pozorován jak
pomocí chlazené CCD kamery, kde se jednalo o lokální aplikaci tří rozdílných
koncentrací H2O2 v jednom měření, tak i pomocí fotonásobiče R2256-02, kde
byly různé koncentrace H2O2 aplikovány postupně na celou oblast ruky. Dále
je možné pomocí obou metod určit i míru oxidace. Kyselina askorbová
intenzitu indukované UPE snížila, což bylo možné opět pozorovat oběma typy
detektorů. CCD kamery by mohly sloužit jako vhodný nástroj pro prostorové
rozlišení distribuce UPE, zatímco pomocí fotonásobiče se získává vysoce
detailní časové rozlišení.
32
Vliv obuvi na svalovou koordinaci
při chůzi a běhu
Jan SEDLÁK
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Tento příspěvek je zaměřen na komparativní analýzu povrchově
snímaných EMG signálů pořízených s odlišným typem obuvi. Zkoumány
byly tři situace: bez bot, klasické celoodpružené a minimalistické boty.
Měření probíhalo na běžeckém pásu s pevně nastavenou rychlostí chůze 4
km/h a běhu 10 km/h. K výzkumu bylo vybráno deset zdravých probandů s
ustáleným svalovým stereotypem. Každé měření zahrnovalo cca 1 minutu
záznamu a následně byl vybrán 30 s úsek stabilního signálu. Pro tento
výzkum bylo snímáno 16 svalů dolních končetin. Bilaterální záznam byl
pořízen pro svaly Tibialis anterior, Peroneus longus, Gluteus maximus,
Gluteus medius, Gastrocnemius laterální a mediální část. Na pravé končetině
byly dále monitorovány svaly Biceps femoris, Quadriceps femoris v části
rectus femoris, vastus lateralis a medialis. K měření bylo užito zařízení
ME6000 od společnosti MEGA ELECTRONICS LTD. s vzorkovací
frekvencí 1000 Hz.
Více-kanálové EMG záznamy jsou předzpracovány horní propustí 6.
stupně s mezní frekvencí filtru 20 Hz za účelem eliminace nežádoucích
artefaktů. Signálové obálky využité při analýze byly vypočteny jako absolutní
hodnota signálu filtrována dolní propustí 6. řádu s mezní frekvencí 20 Hz.
Časové rozložení svalové aktivity je stanoveno s využitím detektoru
založeném na prahování signálové obálky. Hodnota prahu je nastavena jako
20 % maxima obálky analyzované aktivace. Separace pohybových cyklů
umožňuje časovou normalizaci segmentů EMG obálek s využitím lineární
interpolace. Díky časové normalizaci je možné stanovit průměrné obálky a
průměrnou svalovou aktivitu monitorovaných svalů vhodné ke komparativní
analýze. Hranice pohybových cyklů byly detekovány na základě analýzy
obálek signálů zkoumaných svalů s využitím vlastního algoritmu.
Komparativní analýza svalové koordinace byla stanovena na základě
průměrných signálových obálek a detekované svalové aktivitě. Jelikož není k
dispozici žádný dodatečný signál, který by umožňoval jednoznačnou
synchronizaci časové osy mezi jednotlivými měření, je možné provést pouze
méně přesnou synchronizaci. Synchronizace je vypočtena na základě
maximálních hodnot průměrných obálek jednoho vybraného svalu.
Procentuální hodnota pozice maxima pro tento sval bude tedy při srovnání
ve všech záznamech stanovena jako 0 %. Toto omezení lze eliminovat
stanovením parametrů nezávislých na synchronizaci jednotlivých záznamů.
V případě časově normalizovaných průměrných obálek se jako vhodný
parametr pro komparaci ukázal rozdíl pozic maximálních hodnot amplitud
dvou svalů. Další parametry jsou založené na základě detekované svalové
aktivity, např. rozdíl mediánů počátků aktivací dvou svalů. Tyto parametry
jsou dále vhodné pro aplikaci statistických testů jak t-test nebo ANOVA.
33
Klasifikace pohybového EEG pomocí
paralelních HMM
Martin DOBIÁŠ1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Tomto příspěvek se zaměřuje na použití paralelních skrytých
markovských modelů (Hidden Markov Model - HMM) ke klasifikaci
jemných pohybů prstu. Paralelní HMM představují jednu z cest, jak využít
informaci uloženou v několika EEG kanálech. V minulosti byl každý kanál
vyhodnocovaný zvlášť, zde se každá realizace klasifikuje na základě výstupní
věrohodnosti několika kanálů paralelně.
Pro klasifikaci jsou použity nahrávky EEG pořízené během extenze a flexe
pravého ukazováčku jedenácti osob. Průměrný počet realizací každého
pohybu byl 66,4±16,5 na osobu. Byly zkoumány signály na 9 elektrodách nad
sensorimotorickou oblastí kontralaterálně k pohybu. Použité frekvenční
pásmo bylo 5-40 Hz. Jako příznaky byly použity lineární FFT koeficienty
s rozlišením 1 Hz a krokem 200ms.
Ke klasifikaci bylo použito několik metod zpravování výstupní logaritmické
věrohodnosti HMM; první, kdy největší hodnota věrohodnosti přes několik
kanálu určuje druh pohybu; druhá, kdy maximální součet logaritmické
věrohodnosti každého typu pohybu určuje výsledný typ a třetí, kdy
nejpočetnější výstupní typ vyhrává. Pomocí druhé metody bylo dosaženo
nejlepších výsledů 83,1±0,7%, které jsou srovnatelné s referenční metodou
výběru nejlépe klasifikované elektrody. Není přitom potřebné spoléhat na
jedinou elektrodu, která dosahuje neustále dobrých výsledků. Tím pádem
není nutné v případné aplikaci do rozhraní mozek-stroj spoléhat na nízkou
variabilitu EEG mezi jednotlivými sezeními, čímž se zredukuje doba
inicializace.
Rozvinutím druhé metody, kdy se pro každou osobu a realizaci nesčítaly
všechny logaritmické věrohodnosti, ale pouze několik největších, bylo
dosaženo dalšího zlepšení o 1,1%. Ideální počet sčítaných kanálů je 4-5, tehdy
už má každý další přidaný kanál pouze marginální vliv. Pokud navíc pro
každou osobu vybereme nejlepší metodu, lze dosáhnou skóre 85,6±0,7%.
Metoda klasifikace pomocí paralelních HMM by se například dala s výhodou
použít spolu s metodou slepé separace zdrojů, kdy se redukuje počet kanálů
pomocí výběru signálových podprostorů se specifickými signálovými
vlastnostmi. Několik takovýchto vybraných kanálů pak může být
klasifikováno pomocí paralelních HMM.
34
Vliv prezentace zpětné vazby na BCI
Vladimı́r Černý
České vysoké učenı́ technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstract: Přı́spěvek se zabývá studiı́ vlivu zpětné vazby na rozhranı́ mozek
počı́tač (Brain Computer Interface - BCI). Naše skupina se zabývá klasifikacı́ EEG souvisejı́cı́ho s pohybem s cı́lem vyvinout v praxi použitelné
BCI. Každý BCI systém obsahuje zpětnou vazby, která vzniká tı́m, že
uživatel BCI systému vidı́ výsledek svého ovládánı́. Zpětná vazba může
být realizována mnoha způsoby. Může se lišit jak vizualizacı́ tak vlastnı́m
chovánı́m. Naše předchozı́ studie se zabývala různými vizualizacemi
zpětné vazby. Tento přı́spěvek porovnává chovánı́ zpětné vazby.
Zpětná vazba je ovládána výsledkem klasifikace. Tento výsledek může
být přı́slušnost k dané třı́dě a tedy diskrétnı́ nebo pravděpodobnost
přı́slušnosti k dané třı́dě a tedy spojitý. Zpětná vazba může zobrazovat tento výsledek přı́mo, nebo může pomocı́ výsledku klasifikace ovládat
rychlost změny, potom zpětná vazba zobrazuje integraci tohoto výsledku.
Tyto dvě možné dělenı́ umožňujı́ zařadit zpětné vazby do čtyř skupin.
Byl proveden experiment, který zkoumá vliv chovánı́ zpětné vazby na
úspěšnost klasifikace. Byly odzkoušeny čtyři typy chovánı́ zpětné vazby
(spojitá přı́má, spojitá integrujı́cı́, diskrétnı́ přı́má a diskrétnı́ integrujı́cı́).
Experiment byl proveden na čtyřech subjektech. Každý z nich se zúčastnil
třı́ sezenı́, v rámci kterých použı́val všechny čtyři druhy zpětné vazby. Pro
experiment byl použity náš vlastnı́ systém pro zpracovánı́ EEG v reálném
čase. Subjekty ovládali systém pomocı́ představovaných pohybů levé a
pravé ruky. Systém rozpoznával stranu na které si subjekty představujı́
pohyb. Pro jednotlivé druhy zpětné vazby by la vyhodnocena úspěšnost
klasifikace. Zároveň bylo pomocı́ dotaznı́ku měřeno subjektivnı́ hodnocenı́ funkce BCI systému.
Z hlediska úspěšnosti klasifikace dosahovala nejlepšı́ch výsledků přı́má
zpětná vazba (spojitá 65.5% a diskrétnı́ 65.9%). Diskrétnı́ přı́má zpětná
vazba byla ale nejhoršı́ podle subjektivnı́ho hodnocenı́, zatı́mco spojitá
byla druhá nejlepšı́. Ze studie tedy vycházı́ jako nejvhodnějšı́ přı́má spojitá zpětná vazba.
35
Porovnání metod detekce vysokofrekvenčních
oscilací u epileptických pacientů
Tomáš HAVEL1, Roman ČMEJLA1, Petr JEŽDÍK1,2
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
2
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra měření
[email protected]
Abstrakt: V posledních letech jsou vysokofrekvenční oscilace (High frequency
oscilations, HFO) označovány jako nový biomarker epileptogenní tkáně. Bylo
prokázáno, že tento typ grafoelementu má zvýšenou četnost výskytu v zóně
počátku záchvatu (seizure onset zone, SOZ) a pomáhá s určením lokalizace a
rozsahu SOZ. Navíc bylo zjištěno, že zahrnutí oblasti výskytu HFO do
resekce má pozitivní dopad na celkový výsledek chirurgického zákroku.
Manuální značení HFO v EEG záznamu je časově náročné a silně
subjektivní. Automatické algoritmy zase při zachování dobré senzitivity trpí
velkým počtem falešných detekcí. Je tudíž potřeba se zaměřit na vývoj
robustnějších metod automatické detekce, aby bylo možné vlastnosti HFO
plně využít jak ve výzkumu, tak pro klinickou praxi. Záměrem studie je
implementovat několik dříve publikovaných metod a porovnat je na stejné
testovací množině. Do hodnocení jsou navíc zahrnuty také tři algoritmy
vyvinuté ve skupině ISARG. Metody jsou testovány množinou záznamů 10
epileptických pacientů. Od každého pacienta bylo použito 2,5 minuty a
vybrány 3 kanály s vysokým a 3 kanály s velmi nízkým výskytem HFO.
Výběr byl ohodnocen dvěma experty a vytvořena tzv. Gold Standard
reference. Všechny detekční metody byly nejprve optimalizovány nastavením
jednotlivých parametrů a následně otestovány metodou křížové validace (120
kombinací, výběry 7 z 10 pacientů). Referenční množina obsahuje 240 HFO,
z toho 238 bylo identifikováno v aktivních kanálech. Při porovnání výsledků
křížové validace bylo nejlepší senzitivity dosaženo detektorem ISARG H.
(0,78±0,05) při PPV (0,16±0,03) a nejlepší PPV Wavelet detektorem
(0,3±0,03), to bylo ale spojeno s velmi nízkou senzitivitou (0,4±0,04). Dle
společného ukazatele, vzdálenosti k optimálnímu bodu, zvítězil Line Length
detektor se senzitivitou 0,71±0,04 a PPV 0,29±0,03.
36
Intrakraniální EEG – Studie pacientů s fokální
kortikální dysplasií typu I a II
Jiří BALACH1 , Petr JEŽDÍK 1,2 , Roman ČMEJLA1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
2
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra měření
[email protected]
Abstrakt: Fokální kortikální dysplasie (FCD) je jeden s nejčastějších typů
farmakoresistentní epilepsie (u dospělých pacientů tvoří až 20%). U pacientů
s FCD je nejčastěji volena chirurgická léčba, kde se odstraní epileptogenní
mozková tkáň, která je odpovědná za vznik záchvatů. Před samotnou operací
prochází pacient řadou neinvazivních vyšetření (skalpové EEG, MRI, CT,
PET, SPECT,…). Podle výsledků těchto vyšetření je vytvořen resekční plán
aby se zajistilo odstranění veškeré poškozené tkáně. U FCD typu II jsou
změny v tkáni natolik velké, že výsledná léze je viditelná z MRI snímků.
Oproti tomu léze FCD typu I, bývá na MRI kolikráte nepostřehnutelná. Oba
typy se mohou vyskytovat zároveň a tak není vždy jisté, kam až léze sahá.
Z tohoto důvodu se u pacientů s FCD často přistupuje i k invazivní EEG
(iEEG) monitoraci, která trvá přibližně týden. Pacientovi jsou implantovány
elektrody přímo do mozkové tkáně nebo na její povrch tam, kde je
předpokládaná léze nebo její okolí. Po celou dobu monitorace je nahráváno
EEG, které je následně lékaři prověřeno. Vzhledem k velkému množství dat
(obvykle se nahrává z cca. 100 kontaktů) je pro lékaře velice náročné
sledovat celý záznam. Pomocí matematické analýzy a metod zpracování
signálu, se snažíme ze záznamů vytěžit více informací, které by mohly přispět
k lepšímu rozhodování. V našem případě jsou detekovány typické epileptické
grafoelementy, které jsou přítomny v EEG. Jsou to již dlouho známé výboje
a experimentálně zkoumané vysokofrekvenční oscilace. U těchto dvou skupin
událostí se snažíme monitorovat oblast jejich výskytu a také jejich četnost. Ze
známých diagnóz pacientů, jejichž data jsou použita v této studii, se snažíme
nalézt souvislosti mezi výskytem a parametry grafoelementů a typem FCD.
Dále porovnáváme výsledný dlouhodobý stav pacienta po operaci
s množstvím resekovaných kontaktů, kde byly přítomny epileptické projevy.
U všech pacientů je porovnáván výskyt grafoelementů pouze v non-REM
spánku, kde se předpokládá, že je jejich výskyt nejvyšší, a že koreluje
s místem počátku záchvatu. Zpracovaná data jsme podrobili statistické
analýze, bohužel bez žádného signifikantního výsledku.
37
Mikrozáchvaty spolehlivě lokalizují
epileptogenní oblasti v tetanotoxinovém modelu
temporální epilepsie
Jan KUDLÁČEK1,2, Pavel VLK1,2, Ľubica DEMETEROVÁ2, Antonín POŠUSTA2, Jakub
OTÁHAL2, Tomáš HAVEL1, Vojtěch KUMPOŠT1, Přemysl JIRUŠKA2
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
2
Akademie věd České republiky, Fyziologický ústav, Oddělení vývojové epileptologie
[email protected]
Abstrakt: Cílem této studie bylo ozřejmit využitelnost mikrozáchvatů jako
biomarkeru epileptogenní léze v modelu epilepsie temporálního laloku. Byl
využit tetanotoxinový model v potkanovi, ve kterém je léze vytvořena
fokálně, mikroinjekcí tetanotoxinu do vybrané struktury. V této studii byl
toxin injikován u jedné skupiny do dorzálního hipokampu a u druhé skupiny
do entorhinální kůry. Potkanům byly implantovány elektrody bilaterálně do
6 limbických struktur a potkani následně video/EEG monitorováni nejméně
3 týdny. Prostorová distribuce mirkozáchvatů byla vyjádřena pomocí
výkonu signálu mikrozáchvatu normovaného na výkon signálu pozadí
v témže kanálu. Pro srovnání byla stanovena prostorová distribuce počátků
záchvatů, četnosti inter-iktálních výbojů a četnosti vysokrofrekvenčních
oscilací. Ukázalo se, že prostorová distribuce výkonu mikrozáchvatů
vykazuje největší rozdíl mezi hipokampálním a entorhinálním typem
epilepsie. Mikrozáchvaty jsou tedy slibným biomarkerem epileptogenní
tkáně.
1.
Úvod
Epilepsie je neurologické onemocnění postihující 0,5 až 1 % populace [1]. Nejčastějsí
formou epilepsie je epilepsie temporálního laloku, která je navíc v až 40 % případů
farmakorezistentní [2]. Některým farmakorezistentním pacientům však může pomoci
chirurgické odstranění (resekce) epileptogenní oblasti mozku. U třetiny resekovaných
pacientů však záchvaty recidivují [3]. Ke zvýšení úspěšnosti chirurgické léčby epilepsie je
potřeba lepší porozumění temporální epileptogenní síti a přesnější identifikace
epileptogenních oblastí. K lokalizaci epileptogenních oblastí se kromě rozličných
zobrazovacích metod využívá i invazivní EEG. V záznamech jsou identifikovány různé
grafoelementy a podle nich neurolog (případně počítačový algoritmus) lokalizuje
epileptogenní mozkovou tkáň. Takovéto grafoelementy jsou biomarkery epileptogenní tkáně.
Při studiu EEG epileptických potkanů jsme objevili dosud nepublikovaný typ
epileptiformní aktivity, který jsme nazvali mikrozáchvat. Jedná se o 1 až 8 sekund dlouhý
úsek fokální vysokoamplitudové rytmické EEG aktivity. Frekvence výbojů při mikrozáchvatu
je 8 – 15 Hz.
Cílem této studie bylo prostudovat využitelnost mikrozáchvatů jako EEG biomarkeru
epileptogenní léze a porovnat mikrozáchvaty s jinými biomarkery epileptogenní tkáně
(počátky záchvatů, inter-iktální výboje, vysokofrekvenční oscilace). Byl využit
38
tetanotoxinový model temporální epilepsie v potkanovi, přičemž u jedné skupiny potkanů
byla vytvořena epileptogenní léze v hipokampu a u druhé skupiny v entorhinální kůře.
Vznikly tak dvě skupiny, které budou dále nazývány hipokampální a entorhinální. Vhodnost
grafoelementu pro použití jako biomarkeru epileptogenní tkáně byla posuzována podle jeho
schopnosti rozlišit tyto dvě skupiny.
2.
Materiály a metody
2.1. Model epilepsie, nahrávání EEG
Potkanům kmene Wistar bylo v izofluranové anestezii (1,5%) injikováno 10 ng (1 µl
roztoku) tetanotoxinu (Quadratech Ltd, UK) do CA3 oblasti pravého dorzálního hipokampu
(n=7) a do pravé mediální entorhinální kůry (n=2).
Následně byly implantovány twistované registrační elektrody do 6 vybraných
limbických struktur obou hemisfér Obr. 1. Byly tedy nahrávány 2 kanály z každé struktury,
celkem 24 kanálů. Elektrody byly vyrobeny z poteflonovaného stříbrného drátu o průměru
180 µm (A-M Systems, Inc, Carlsborg, Washington, USA). Referenční elektrody byly
umístěny nad mozeček.
Obr. 1: Schéma implantace elektrod ve vztahu k lebce
Obr. 1: Schéma implantace elektrod ve vztahu k lebce
Po týdení rekonvalescenci byli potkani napojeni na dlouhodobý video-EEG monitoring.
Signál byl filtrován od 0,1 do 2300 Hz, zesílen a digitalizován na vzorkovací frekvenci 5000
Hz s rozlišením 16 bitů. Přímo na hlavě potkana byl umístěn napěťový sledovač pro omezení
pohybových artefaktů.
2.2. Zpracování EEG
V získaném 24 kanálovém záznamu byly pomocí algoritmů vytvořených v prostředí
Matlab detekovány záchvaty, inter-iktální výboje, vysokofrekvenční oscilace a
mikrozáchvaty.
2.2.1.
Počátký záchvaty
Záchvaty byly detekovány v bipolárním signálu (tj. rozdílu dvou kanálů z dané
struktury). Detektor byl založen na prahování integrální energetické obálky signálu
filtrovaného pásmovou propustí 15 až 45 Hz. Následně bylo vizuálně pro každý záchvat
stanoveno, ve které struktuře začal a pro hipokampální a entorhinální skupinu zvlášť
spočítáno, kolik procent záchvatů vycházelo ze které struktury [6].
39
2.2.2.
Inter-iktální výboje
Inter-iktální výboje byly detekovány pomocí detektoru popsaného v [4]. Následně bylo
pro hipokampální i entorhinální skupinu určeno, kolik procent výbojů bylo zaznamenáno ve
které struktuře.
2.2.3.
Vysokofrekvenční oscilace
Detektor HFO byl založen na sledování spektrálních změn [5]. Opět bylo pro
hipokampální i entorhinální skupinu určeno procento vysokofrekvenčních událostí v každé
struktuře.
2.2.4.
Mikrozáchvaty
Mikrozáchvaty byly detekovány na základě jejich periodického charakteru a vysoké
amplitudy signálu. Signál byl rozdělen na segmenty dlouhé 2 s, s 50% překryvem. V každém
segmentu byla spočítána autokorelační funkce a její spektrum. Součet amplitud spektrálních
čar v pásmu 8 – 15 Hz sloužil jako detekční parametr. Pro získání detekčního prahu byl
filtrován FIR filterm s impulzní odezvou Hammingovým oknem o délce 60 s a násoben
empiricky stanovenou konstantou 1,8.
Mikrozáchvaty jsou často viditelné nikoli v jedné, ale ve dvou i třech strukturách
zároveň. V různých struktrách mají však různou amplitudu a tvar. Jelikož neexistuje obecně
přijímaná definice mikrozáchvatu, není vždy možné říct, ve kterých strukturách je
mikrozáchvat přítomen. Proto četnost mikrozáchvatů není použitelná pro jejich posouzení.
Využili jsme proto přístup založený na výkonu signálu. V každém úseku, ve kterém se
vyskytoval mikrozáchvat alespoň v jednom kanále, byl pro každý kanál spočítán výkon
signálu a normován výkonem signálu v období 5 až 2 sekundy před mikrozáchvatem. Takto
získané normované výkony byly zprůměrovány přes všech 210 analyzovaných mikrozáchvatů
od potkanů injikovaných do dorzálního hipokampu. Následné byly průměrovány průměrné
normované výkony z kanálů nahrávaných v jedné struktuře.
Průměrný normovaný výkon signálu během mikrozáchvatu v každé struktuře byl určen
zvlášť pro hipokampální a entorhinální skupinu.
Byla tedy pro každý z uvedených grafoelementů získana informace o jejich rozložení
mezi struktury limbického systému. Následně byly hledány rozdíly v těchto rozloženích mezi
hipokampální a entorhinální skupinou. Jelikož v entorhinální skupině jsou pouze dva potkani,
nebylo možné počítat statistiky. Jedná se tedy o předběžné výsledky a pozorování.
3.
Výsledky
3.1. Počátky záchvatů
U všech analyzovaných záchvatů byla záchvatová aktivita je pozorována ve všech
strukturách limbického systému. Hypersynchronní počátek záchvatu s ručně označenými
počátky prvního záchvatového výboje je na Obr. 2.
40
Obr. 2: Typický počátek záchvatu. Počátek prvního záchvatového výboje byl ručně označen v každém kanálu.
Pir – Piriformní kůra, Amy – Amygdala, Prh – Peririnální kůra, DHipp – Dorzílní hipokampus, VHipp –
Ventrální hipokampus, EC – Entorinální kůra, R – pravý, L – levý
Rozložení počátků záchvatů pro hipokampální a entorhinální skupinu je na Obr. 3. U
obou skupin vychází nejvíce záchvatů z ventrálních hipokampů. Rozdělení je u obou skupin
prakticky stejné, podle počátků záchvatů tedy nelze rozlišit hipokampální a entorhinální
skupinu.
Obr. 3: Rozložení počátků záchvatů mezi struktury limbického systému. U obou skupin začíná nejvíce
záchvatů v ventrálních hipokampech. Symbol injekční stříkačky označuje strukturu, do které byl injikován
tetanotoxin.
3.2. Inter-iktální výboje
Analýza inter-iktálních výbojů ukázala mírný rozdíl v četnosti výbojů v mediální
entorhinální kůře obou hemisfér (MECR a MECL). Rozdíl mezi skupinami je však velmi
malý, jak je vidět na Obr. 4. Proto se četnost inter-iktálních výbojů nehodí k jejich rozlišení.
41
Obr. 4: Rozložení četnosti inter-iktálních výbojů. Entorhinální skupina vykazuje více výbojů v entorhinální
kůře. Pro rozlišení skupin se však četnost inter-iktálních výbojů nehodí. Symbol injekční stříkačky označuje
strukturu, do které byl injikován tetanotoxin.
3.3. Vysokofrekvenční oscilace
Četnost vysokofrekvenčních oscilací v jednotlivých strukturách vykazuje určité rozdíly
mezi skupinami, předvším u entorhinální skupiny je méně výbojů ve ventrálních
hipokampech Obr. 5. Nicméně ani vysokofrekvenční oscilace se nejeví jako spolohlivý
biomarker epileptogenní léze. Analýza inter-iktálních výbojů ukázala mírný rozdíl v četnosti
výbojů v mediální entorhinální kůře obou hemisfér (MECR a MECL). Rozdíl mezi skupinami
je však velmi
Obr. 5: Rozložení četnosti vysokofrekvenčních oscilací. Entorhinální skupina vykazuje méně
vysokofrekvenčních oscilací ve ventrálním hipokampu. Pro rozlišení skupin se však četnost vysokofrekvenčních
oscilací nehodí. Symbol injekční stříkačky označuje strukturu, do které byl injikován tetanotoxin.
3.4. Mikrozáchvaty
Typický mikrozáchvat je na Obr. 6. Četnost mikrozáchvatů byla průměrně 500/den a
jejich průměrná délka byla 3,6 ± 0,2 s. Ačkoli se charakter mikrozáchvatů mezi jednotlivými
zvířaty liší, jejich prostorová distribuce, vyjádřená pomocí normovaného výkonu, se jeví jako
velmi spolehlivý biomarker epileptogenní léze. Zatímco u hipokampální skupiny
42
mikrozáchvaty dominují v injikovaném pravém dorzálním hipokampu (DHippR), u
entorhinální skupiny zřetelně dominují v pravém ventrálním hipokampu (VHippR) (Obr. 7).
Normovaný výkon mikrozáchvatů je tedy biomarkerem vhodným pro rozlišení hipokamální a
entorhinální skupiny.
Obr. 6: Typický mikrozáchvat. Největší amplitudu má mikrozáchvat v pravém dorzálním hipokampu
(DHippR), nicméně slabou abnormální aktivitu vykazuje i kontralaterální dorzální hipokampus.
Obr. 7: Normovaný výkon mikrozáchvatů v jednotilivých limbických strukturách. Zatímco u hipokampální
skupiny je největší normovaný výkon mikrozáchvatů v pravém dorzálním hipokampu, u entorhinální skupiny
dominuje normovaný výkon v hipokampu ventrálním. Normovaný výkon mikrozáchvatů se jeví jako vhodný
biomarker pro rozlišení hipokampální a entorhinální skupiny. Symbol injekční stříkačky označuje strukturu, do
které byl injikován tetanotoxin.
4.
Závěr
Cílem práce bylo ozřejmit, zda mikrozáchvaty mohou sloužit jako biomarker
epileptogenní léze v tetanotoxinovém modelu epilepsie temporálního laloku. Ukázalo se, že
rozložení výkonu mikrozáchvatů mezi limbické struktury se výrazně liší mezi hipokampální a
entorhinální skupinou. Pro srovnání byla určena prostorová distribuce inter-iktálních výbojů,
vysokofrekvenčních oscilací a počátků záchvatů. Žádný z těchto biomarkerů neukázal
výraznější rozdíl, mezi skupinami, než normovaný výkon mikrozáchvatů. Na základě těchto
předběžných výsledků se mikrozáchvaty jeví jako velmi slibný biomarker epileptogenní
tkáně.
43
Poděkování
Tato práce byla podpořena granty AZV ČR (15-29835A), Nadačního fondu Neuron
(2012/10) a Grantové agentury České republiky (14-02634S, 15-08565S).
Reference
[1] Mula M, Cock HR (2015). More than seizures: improving the lives of people with
refractory epilepsy. Eur J Neurol 22:24-30
[2]
Lanerolle NC, Lee TS (2005). New facets of the neuropathology and molecular profile
of human temporal lobe epilepsy. Epilepsy & Behavior: 190-203
[3]
Thom M, Mathern GW, Cross JH, Bertram EH (2010). Mesial temporal lobe epilepsy:
How do we improve surgical outcome? Ann Neurol 68:424-434
[4]
Janca R, Jezdik P, Cmejla R, Tomasek M, Worrell GA, Stead M, Wagenaar J, Jefferys
JG, Krsek P, Komarek V, Jiruska P, Marusic P (2015). Detection of interictal
epileptiform discharges using signal envelope distribution modelling: application to
epileptic and non-epileptic intracranial recordings. Brain topography 28:172-183.
[5]
Havel T, Jezdik P, Cmejla R (2014). Detekce vysokofrekvenčních oscilací
v intrakraniálním EEG záznamu na základě spektrálních změn. IV. Letní doktorandské
dny, sborník příspěvků: 39-44
[6]
Kudlacek J, Jiruska P (2015). Časo-prostorový profil počátků záchvatů
v tetanotoxinovém modelu temporální epilepsie. V. Letní doktorandské dny, sborník
příspěvků: 41-44
44
Prozodie a jejı́ využitı́ v řečových
technologiı́ch
Jan Bartošek
České vysoké učenı́ technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstract: Přı́spěvěk se nejprve zabývá krátkým přehledem prozodie řeči a
poté nastiňuje jejı́ současné využitı́ v různých technologiı́ch dotýkajı́cı́ch
se zpracovánı́ řečového signálu. Předmětem přı́spěvku nenı́ konkrétnı́
jazyk, spı́še je snaha popsat obecné prozodické tendence, avšak s výsledným
důrazem a porovnánı́m s prozodiı́ českou.
Přednáška zprvu představı́ použı́vané prozodické (suprasegmentálnı́) akustické přı́znaky. Mezi ně patřı́ jednak ty obecně zažité a posluchačem
často snadno vnı́matelné: výška zákadnı́ho hlasivkového kmitočtu (F0),
intenzitnı́ popis či časový rozměr v podobě délky trvánı́ hlásek, rytmu
či mluvnı́ho tempa. Dále se dotkne v poslednı́ době opět zkoumaných
spektrálnı́ch charakteristik: spektrálnı́ho sklonu vokálů a fenoménu redukce jejich kvality (ta se však v češtině neuplatňuje).
Budou shrnuty základnı́ fonetické/fonologické funkce, kterých lze kombinacı́ výše zmı́něných prozodických akustických kvalit dosáhnout. Jmenovitě: změna významu slova v tonálnı́ch jazycı́ch, lexikálnı́ přı́zvuk, větná
prominence, emočnı́ rozpoloženı́ mluvčı́ho, členěnı́ promluvy na promluvné úseky a větná modalita.
V krátkosti budou představeny nejstěžejnějšı́ oblasti technologického využitı́
prozodie řeči a nastı́něn jejich současný stav jejich výzkumu. Jmenovitě:
klasifikace emocı́, rozpoznánı́ jazyka na základě prozodie, rozpoznánı́/ověřenı́
mluvčı́ho, dailogové systémy, převod textu na řeč (TTS), speech2speech
systémy (převod řeči v L1 na řeč v L2 se snahou o zachovánı́ prozodické informace). V klasickém rozpoznánı́ řeči (ASR) jde zejména o úlohu
dělenı́ promluvy na přı́zvukové takty a klasifikace modality a následné
vkládánı́ interpunkce v přı́padě diktovacı́ch systémů.
Posluchači budou nakonec seznámeni s aktuálnı́m stavem autorova výzkumu
právě v oblasti využitı́ prozodie v rozpoznávánı́ řeči, a to konkrétně se
dvěma zmı́něnými řešenými úlohami v češtině: 1) na mluvčı́m nezávislým
členěnı́m české řeči na přı́zvukové takty (čtené a spontánnı́ promluvy) a
2) na mluvčı́m nezávislou klasifikacı́ modality promluvy. Obě úlohy jsou
řešeny jen za využitı́ akustické informace signálu extrahované zhruba ze
středů slabičných jader.
45
Přínos artikulačních příznaků v úloze
rozpoznávání fonémů a LVCSR
Petr Mizera1, Petr Pollak1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Příspěvek se zabývá přínosem artikulačních příznaků v úlohách
počítačového zpracování řeči. Artikulační příznaky obsahují užitečnou informaci
o produkci lidské řeči, která může být využita v různých hlasových systémech,
např. rozpoznávání řeči, rozpoznávání řečníka, identifikaci jazyka, rozpoznávání
fonémů atd. Artikulační příznaky jsou používány samostatně nebo v kombinaci
s krátkodobými kepstrálními příznaky (MFCC/PLP), čímž mohou přispět
k lepšímu modelování procesů koartikulace, asimilace a redukce v úlohách
rozpoznávání neformální řeči nebo zvýšit robustnost uvedených systémů
v podmínkách s vyšší úrovní šumu. V tomto příspěvku je přínos artikulačních
příznaků prezentován v úlohách rozpoznávání řeči s velkým slovníkem (340k
slov) a rozpoznávání fonémů. První část se zaměřuje na samostatný odhad
artikulačních tříd. Dosažené výsledky odhadů artikulačních příznaků jsou
prezentovány pro následující jazyky: CZ, SK, HU, RU, PL, ENG, GE, FR. Pro
experimenty byly použity dostupné databáze SPEECON (CZ), SPEECHDAT
(CZ, SK, HU, RU, PL), TIMIT (ENG), GLOBALPHONE (GE, FR). Pro odhad
artikulačních příznaků byla použita standardní třívrstvá neuronová síť, která
provádí nelineární mapování do artikulačních tříd z prostoru kepstrálních
příznaků, které jsou extrahovány z řečového signálu. V další části jsou
prezentovány výsledky experimentů v úloze rozpoznávání fonémů pro 8 jazyků,
multilingvální rozpoznávání fonémů a je prezentován přínos artikulačních
příznaků v této úloze. V závěrečné části jsou shrnuty dosažené výsledky
experimentů zaměřených na rozpoznávání řeči s velkým slovníkem pro český
jazyk. LVCSR systém byl založen na TANDEM architektuře.
Poděkování
Tato práce vznikla za podpory grantu ČVUT SGS14/191/OHK3/3T/13
,,Pokročilé algoritmy číslicového zpracování signálů a jejich aplikace“.
Reference
[1] Mizera, P., Pollak, P. Improved Estimation of Articulatory Features Based on Acoustic
Features with Temporal Context. Text, Speech, and Dialogue (TSD 2015).
46
Robustní detektor základní frekvence hlasivek
pro dysartrickou řeč
Jan HLAVNIČKA1, Roman ČMEJLA 1, Jan RUSZ1
1
České vysoké učení technické v Praze, Fakulta elektrotechnická, Katedra teorie obvodů
[email protected]
Abstrakt: Studie prezentuje robustní metodu pro detekci základní frekvence
hlasivek (F0) u dysartrické řeči. Pro účely validace byly vytvořeny repliky
fonací na základě parametrů obálka F0, jitter, shimmer a harmonic-to-noise
ratio, které byly získány pomocí ročně kontrolovaného měření programem
PRAAT z rozsáhlé databáze 345 nahrávek pokrývající všechny základní
fonační nedostatky dysartrické řeči. Metoda je založena na výběru
maximálně věrohodného kandidáta F0 ze spektrální analýzy vzhledem
k pravděpodobnostnímu modelu F0 predikovaného Kalmánovým filtrem.
Metoda je schopna detekovat intervaly skoků F0 o oktávu dolů pomocí
kepstrální analýzy. Při porovnání s konvenčními metodami (PRAAT,
DYPSA, RAPT, PEFAC, SHRP) dosáhla prezentovaná metoda vysoké
přesnosti detekce.
1.
Úvod
Řeč představuje vůbec nejkomplexnější lidskou schopnost k jejímuž zvládnutí je zapotřebí
přesné koordinace více než 100 svalů [1]. Řeč tak může velmi dobře reflektovat aktuální stav
motoriky, přičemž je i velmi citlivým ukazatelem neurodegenerativních onemocnění.
Poruchy fonace patří mezi jedny z první projevů neurodegenerace. Měření kvality
fonace pomocí standardních metrik jako například rozptylu základní frekvence hlasivek
(stdF0), jitteru , shimmeru a odstupu harmonického signálu od šumu (HNR) vyžadují přesnou
detekci základního hlasivkového tónu (F0).
Úkolem detekce F0 užívané ve sdělovací technice je co nejvěrněji odhadnout F0
mluvčího často ve ztížených podmínkách šumového okolí. Naproti tomu úkolem detekce F0
pro dysartrickou řeč je přesně změřit fyziologickou produkci F0 měřenou sice v podmínkách
nízkého okolního šumu ovšem zatíženou lokální nestabilitou hlasivkového signálu z hlediska
amplitudy i frekvence, vysokou fluktuací melodie F0 a výskytem oktávových skoků F0 angl.
pitch break a přerušované fonace angl. voice break. Ačkoliv se detekce F0 pro účely
zpracování a přenosu řeči těší pozornosti výzkumů již řadu desetiletí, možnosti detekce F0
pro dysartrickou řeč jsou značně omezené.
Automatizované hodnocení hlasu nabízí např. software Multi-Dimensional Voice
Program (MDVP), CSpeech nebo SoundScope. Bohužel dostupné metody nepodávají na
standardních datech srovnatelné výsledky nebo výsledky validace nejsou známé [2,3].
Nejspolehlivějším přístupem je semi-automatické měření, kdy lze výstup detektoru korigovat
ručně, nastavováním např. mezních frekvencí F0. Typickým představitelem je program
PRAAT [4]. Publikován byl dosud pouze jeden plně automatický přístup [5], u kterého se
ovšem nejedná o detektor F0 pro dysartrickou řeč, ale pouze o informační fúzi deseti běžných
F0 detektoru validovaných na fonacích u PN. Velkou překážkou pro automatizaci hodnocení
fonace je také výběr úseku fonace, který reprezentuje přirozenou hlasovou kondici. Detektor
47
F0 pro dysarickou řeč tedy musí umět rozpoznat i nestandardní události ve fonaci např.
oktávové skoky.
Tato studie prezentuje vůbec první publikovaný plně automatický algoritmus detekce
F0 určený pro dysartrickou řeč a validovaný na rozsáhlém souboru dat dysartrických
mluvčích. Na základě metody byly ohodnoceny základní hlasové parametry stdF0, jitter,
shimmer, HNR a oktávové skoky F0 na souboru fonací HC, PD, MSA, PSP a HD.
2.
Metoda
2.1. Databáze
Účastníci studie byli rekrutování v rámci předchozích studií [6, 7]. Databáze sestává 22
pacientů Parkinsonovy nemoci (PD) (10 mužů, 12 žen), 20 pacientů Huntingtomovy nemoci
(HD)(9 mužů, 11 žen), 11 pacientů progresivní supranukleární paralýzy (PSP)(9 mužů, 2
ženy), 9 pacientů multisystémové atrofie (MSA)(3 muži, 6 žen) a 23 zdravých kontrol (HC).
Každý účastník studie stvrdil písemný informovaný souhlas. Studie byla schválena Etickou
komisí Všeobecné fakultní nemocnice v Praze. Charakteristiky účastníků studie jsou shrnuty
v Tab. 1.
Nahrávky byly pořízeny v tiché místnosti pomocí náhlavního kondenzátorového
mikrofonu (Beyerdynamic Opus 55) umístěného přibližně 5cm od úst. Řečové signály byly
vzorkovány frekvencí 48kHz s rozlišením 16bitů. Každý účastník byl instruován k provedení
TAB. 1: CHARAKTERISTIKY ÚČASTNÍKŮ STUDIE
Skupina (dominantní dysartrie)
Věk (roky)
Trvání onemocnění (roky)
Závažnost onemocnění #
Postižení řeči χ
Průměr /SD (rozsah)
Průměr /SD (rozsah)
Průměr /SD (rozsah)
Průměr /SD (rozsah)
PD (hypokinetická)
64.4 /9.6 (48–82)
9.3 /5.5 (1–24)
15.9 /7.6 (6–34)
0.7 /0.7 (0–2)
PSP (hypokineticko-spastická)
65.3 /5.2 (54–71)
3.5 /1.3 (1–5)
66.2 /29.0 (19–116)
1.9 /0.9 (0–3)
MSA (ataxicko-hypokinetická)
59.6 /3.6 (55–65)
3.8 /1.5 (2–6)
86.6 /17.6 (63–123)
1.9 /0.6 (1–3)
HD (hyperkinetická)
49.6 /14.8 (23–67)
6.4 /3.0 (2–13)
23.6 /11.8 (3–42)
0.6/0.5 (0–1)
HC
64.4 /10.5 (41–81)
–
–
–
# Hodnoceno škálou Unified Parkinson's Disease Rating Scale III (UPDRS III) pro PD (rozsah od 0 až 108), Natural history and
neuroprotection on Parkinson (NNIPPS) pro APS (rozsah od 0 do 332) a Unified Huntington's Disease Rating Scale (UHDRS)
motor subscore (rozsah od 0 do 124), vyšší skóre odpovídá vyššímu stupni postižení.
χ Hodnoceno podle UPDRS III položky 18 pro PD, NNIPPS subskóre Bulbární-pseudobulbarní příznaky položka 3 pro APS a UHDRS položka
dysartrie.
Všechna hodnocení řeči jsou v rozsahu od 0 do 4, přičemž 0 odpovídá normální řeči, 1 mírně postižené řeči, 2 středně postižené řeči (stále
srozumitelné), 3 značně postižené řeči (těžko srozumitelné), 4 nesrozumitelné řeči.
co nejdelší a nejstabilnější fonace na jeden nádech pro písmeno /a/ a písmeno /i/. Fonace
každého písmena byla provedena dvakrát. Účastníci, kteří nebyli schopní provést fonaci delší
než 6s, byli vyřazeni.
2.2. Repliky fonací
Motivací replik fonací je získat z databáze signály, které obsahují veškeré neduhy
dysartrického hlasu a jejichž parametry dopředu přesně známe. Repliky fonací slouží k
objektivnímu ohodnocení metody detekce F0. Jelikož neznáme skutečný průběh F0 ani
hlasové parametry v analyzovaných signálech, byly všechny fonace v databázi
parametrizovány na obálku F0, jitter, shimmer a HNR pomocí software Praat s ručně
nastaveným rozsahem F0 a ručně zvoleným úsekem měření. Na základě těchto parametrů byla
vygenerována posloupnost Rosenbergových pulsů. Signál byl následně filtrován koeficienty
LPC analýzy původního skutečného signálu. K této replice byl v poměru odpovídajícím HNR
přimíšen bílý šum rovněž filtrovaný koeficienty LPC původního skutečného signálu. Celý
proces je ilustrován na Obr. 1.
48
Obr. 1: Ilustrace replikování signálu fonace
(A) Výkonová obálka fonace, (B) Ruční měření parametrů dysfonie, (C) Generování impulsů F0, (D) Rosenbergovy glotální pulsy, (E) LPC
analýza v klouzavém okně, (F) Glotální pulsy filtrované modelem vokálního traktu, (G) Bílý šum filtrovaný modelem vokálního traktu, (H)
Výsledná replika vznikla součtem vokálního harmonického a vokálního šumového signálu.
2.3. Detekce F0
Navrhovaná metoda detekce F0 pro dysartrickou řeč spočívá v modelování
pravděpodobnosti F0 a maximálně věrohodném odhadu F0 ze spektra signálu. Kalmánův filtr
má za úkol predikovat model F0 na základě naměřených hodnot F0. Metoda pomocí
kepstrální analýzy detekuje skoky o oktávu dolů a následně provede korekci oktáv
naměřených hodnot F0. Výhodou takového přístupu je, že můžeme detekované úseky
oktávových skoků v signálu označit a nezahrnout do výpočtu fonačních parametrů. Základní
princip detekce je ilustrovaný na Obr. 1.
2.3.1.
Segmentace
Cílem segmentace je určit úseky fonace, ve kterých má smysl měřit F0 a fonační
parametry. Signál o vzorkovací frekvenci 8kHz byl normalizován na rozsah (0-1) a
parametrizován v klouzavém okně o délce 30ms s posuvem 10ms. Pro každou pozici okna byl
signál váhován hammingovým oknem a následně byl vypočten výkon signálu. Výkonová
obálka byla vyjádřena v decibelech a následně prahována na minimální hlasitost -30dB.
Úseky fonace kratší než 100ms a pauzy kratší než 50ms byly zamítnuty.
2.3.2.
Počáteční odhad modelu F0
Metoda detekce vyžaduje pravděpodobnostní model F0, který na začátku neznáme a
musíme ho přibližně odhadnout. Signál byl popsán pomocí spektrogramu o frekvenčním
rozsahu 60-500Hz s rozlišením 4Hz v klouzavém okně 50ms s krokem 10ms váhovaném
nuttalovým oknem. Výsledný spektrogram byl maskován frekvenční charakteristikou
třípólového integrátoru, který potlačí vyšší harmonické F0 zvýhodněné formantovou
strukturou. Spektrogram byl vyjádřen v logaritmické škále a následně normalizován na rozsah
0-1. Spektrogram byl z obou časových stran doplněn úsekem o délce 0.5s a hodnotě 1. Na
49
obou krajích doplněného spektrogramu byly zvoleny body o náhodné frekvenci a pomocí
algoritmu dynamického hledání nejkratší cesty s nejvyšší cenou mezi těmito body byla
odhadnuta obálka F0. Hodnoty F0 v doplněných krajích byly vyjmuty. Model F0 byl popsán
střední hodnotou a směrodatnou odchylkou F0.
2.3.3.
Měření F0
Měření bylo prováděno v klouzavém okně o délce 50ms s krokem 10ms. Signál byl
převzorkován na 500Hz, váhován Hammingovým oknem a doplněn nulami na délku 2048.
Následně byla provedena rychlá Fourierova transformace a filtrací modulu klouzavým
průměrem o délce 10 vzorků byla odhadnuta spektrální výkonová hustota (PSD). V rozsahu
65-500Hz byla detekována lokální maxima s minimálním odstupem 65Hz, tedy kandidáti F0.
Hodnoty kandidátů F0 byly váhovány frekvenční charakteristikou dvoupólového integrátoru
pro potlačené formantové struktury. Následně byla každému kandidátu úměrně jeho výkonu
přidělena pravděpodobnost, kterou odpovídají skutečné F0.
Výsledná hodnota měření F0 byla z kandidátů F0 a statistického modelu F0 vybrána
metodou maximální věrohodnosti.
Obr. 2: Ilustrace metody detekce F0
(A) Výkonová obálka fonace, (B) Pravděpodobnostní model F0 určený střední hodnotou a směrodatnou odchylkou (STD), (C) Spektrální
analýza F0 s detekovanými kandidáty F0, (D) Výběr maximálně věrohodného kandidáta F0, (E) Průběh výstupní predikce (plná čára) a
kovariance (přerušovaná čára) Kalmánova filtru v kontextu naměřených hodnot (červené kruhy), (F) Porovnání kepstra normální oktávy F0
(vpravo) a skoku F0 o oktávu dolů (vlevo), (G) Vizualizace časového průběhu naměřených hodnot F0 (plná červená čára) a výstupu
detektoru po korekci skoků o oktávu dolů (přerušovaná černá čára)
50
2.3.4.
Kalmánův filtr
Úkolem Kalmánova filtru bylo predikovat model F0. Vstupem Kalmánova filtru byla
výsledná hodnota měření F0. Výsledný odhad stavu Kalmanova filtru reprezentuje střední
hodnotu modelu F0. Výstupní kovariance stavu Kalmanova filtru určuje směrodatnou
odchylku modelu F0. Směrodatná odchylka byla počítána jako 5 násobek kovariance stavu,
čímž došlo k rozostření modelu pro případ neočekávaných fluktuací F0.
Parametry Kalmánova filtru 1. řádu byly odhadnuty metodou maximální věrohodnosti
na 5 vybraných fonacích, které reprezentovaly stabilní fonaci, fonaci s vysokou fluktuací F0,
fonaci s nízkým HNR, přerušovanou fonaci a fonaci s oktávovými skoky.
2.3.5.
Detekce oktávových skoků
Pakliže dojde v průběhu fonace ke skoku F0 o oktávu níže, Kalmánův filtr udrží
původní oktávu F0, která je přítomna nyní jako vyšší harmonická složka. Díky tomu lze
provést detekci oktávového skoku na základě kepstrální analýzy nepřevzorkovaného signálu.
Je-li lokální maximum v okolí poloviny naměřené F0 vyšší než lokální maximum v okolí
naměřené F0, je označena událost oktávového skoku dolů a výstupní hodnota F0 určena jako
polovina naměřené F0.
2.3.6.
Výstup
Výstupem detektoru jsou výstupní hodnoty F0, detekované oktávové skoky a příslušné
časové pozice.
2.4. Statistika
Metoda byla hodnoceny na replikách fonací porovnáním průběhů obálky F0 modelu a
naměřené obálky F0. Hodnocení proto bylo provedeno jen pro detekce F0 v časových
pozicích, kdy F0 byl v signálu repliky přítomen. Odchylka obálek F0 byla určena odečtením
obálek modelu a metody v semitónech. Ohodnocení bylo vyjádřeno jednak jako průměrná
odchylka obálek F0 a jednak jako směrodatná odchylka obálek F0.
Pro porovnání metody byly ohodnoceny také metody PRAAT [4], DYPSA [8], RAPT
[9], PEFAC [10], SHRP [11]. Pro porovnání byly nastaveny meze F0 na 65-500 Hz.
3.
Výsledky
3.1. Hodnocení detekce F0
Výsledky metod jsou shrnuty v Tab. 1. Prezentovaná metoda a Praat prokázaly vysokou
přesnost i stabilitu výsledků v porovnání s ostatními metodami. Všechny hodnocené metody
obstály pro detekci F0 u HC. Nejvyšším zdrojem chyb byly právě silně dysfonické hlasy.
4.
Závěr
Prezentovaná metoda projevila v porovnání s ostatními metodami dobrou účinnost
detekce F0 napříč celou databází replik 345 fonací od zdravých i dysartrických mluvčí.
Metoda je navíc schopna detekovat intervaly, kdy došlo k oktávovému skoku dolů. Jedná se o
vůbec první publikovaný detektor F0 určený pro dysartrickou řeč a metodu pro automatickou
detekci oktávových skoků dolů. Metoda nabízí kvalitní podporu pro ohodnocení fonačních
parametrů závislých na znalosti F0, tedy stdF0, jitter, shimmer a HNR.
51
Metoda
Prezentovaná
PRAAT
DYPSA
RAPT
PEFAC
SHRP
Tab. 1: Přehled výsledků ohodnocení detekce F0
Střední odchylka obálek F0
Směrodatná odchylka obálek F0
Průměr / SD (rozsah)
Průměr / SD (rozsah)
0.40 / 1.23 (0.01-12.13)
0.64 / 1.40 (0.01-8.03)
0.42 / 1.13 (0.009-11.89)
0.89 / 1.62 (0.01-7.3)
1.05 / 1.71 (0.08-11.50)
1.84 / 2.11 (0.08-10.30)
0.90 / 1.87 (0.03-11.88)
1.81 / 1.84 (0.04-9.33)
1.29 / 2.62 (0.04-15.00)
2.01 / 1.90 (0.02-8.72)
1.38 / 2.95 (0.05-18.50)
1.72 / 2.28 (0.04-12.35)
Poděkování
Tento výzkum byl podpořen granty SGS15/199/OHK3/3T/13 a AZV 15-28038A.
Reference
[1]
Duffy, J.R. Motor speech disorders: Substrates, differential diagnosis, and
management. Elsevier Health Sciences, 2013.
[2 ] Bielamowicz, S., Kreiman, J., Gerratt, B.R., Dauer, M.S., and Berke, G.S. Comparison
of voice analysis systems for perturbation measurement. Journal of Speech and Hearing
Research, 39, pp. 126–134. 1996.
[3]
Kent, R.D., Vorperian, H.K., Duffy, J.R. Reliability of the Multi-Dimensional Voice
Program for the analysis of voice samples of subjects with dysarthria. American Journal
of Speech-Language Pathology, 8, pp. 129–136. 1999
[4]
Boersma, P. and Weenink, D. Praat: doing phonetics by computer [Computer
program]. Version 6.0.17, retrieved 10 April 2016 from http://www.praat.org/
[5]
Tsanas, A., et. al. Robust fundamental frequency estimation in sustained vowels:
Detailed algorithmic comparisons and information fusion with adaptive Kalman
filtering. The Journal of the Acoustical Society of America, 135(5), 2885-2901. 2014.
[6]
Rusz, J., et. al. Speech disorders reflect differing pathophysiology in Parkinson's
disease, progressive supranuclear palsy and multiple system atrophy. Journal of
Neurology, 262(4 April), pp. 992-1001. 2015.
[7]
Rusz, J., et. al. Characteristics and occurrence of speech impairment in Huntington's
disease: possible influence of antipsychotic medication. Journal of Neural Transmission,
121, pp. 655-664. 2014
[8]
Naylor, P.A., Kounoudes, A., Gudnason, J., and Brookes, M. Estimation of glottal
closure instants in voiced speech using the DYPSA algorithm. Audio, Speech, and
Language Processing, IEEE Transactions on, 15(1), 34-43. 2007.
[9]
Talkin, D. (1995). A robust algorithm for pitch tracking (RAPT). Speech coding and
synthesis, pp. 495, 518.
[10] Gonzalez, S. and Brookes, M. A pitch estimation filter robust to high levels of noise
(PEFAC). In Signal Processing Conference: IEEE, 19th European, pp. 451-455. 2011.
[11] Sun, X. Pitch determination and voice quality analysis using subharmonic-to-harmonic
ratio. Acoustics, Speech, and Signal Processing: IEEE Vol. 1, pp. 333-336. 2002
52

Podobné dokumenty