umělé neuronové sítě v chemii kam kráčí analytická chemie?

Transkript

UMĚLÉ NEURONOVÉ SÍTĚ V CHEMII
KAM KRÁČÍ ANALYTICKÁ CHEMIE?
doc. RNDr. Vlastimil Dohnal, Ph.D.
studijní materiál ke kurzu Mezioborové dimenze vědy
Fakulta informatiky a managementu Univerzity Hradec Králové
Projekt Informační, kognitivní a interdisciplinární podpora výzkumu je spolufinancován
Evropským sociálním fondem a státním rozpočtem České republiky.
1. Úvod
Umělé neuronové sítě (artificial neural networks, ANN) jsou matematickým nástrojem,
který napodobuje funkci mozku. Přes všechny útrapy v průběhu vývoje adaptačních
a výpočetních algoritmů, jsou v současné době ANN sofistikovaným nelineárním
výpočetním nástrojem schopným modelovat prakticky jakkoliv složitou funkci. Jsou
schopny se „učit“, tedy hledat optimální strukturu, na základě již známých dat a následně
mohou být použity k predikci (předpovědi) průběhu funkce i v bodech, pro které nebyly
ANN předloženy hodnoty.
ANN pronikají do celé řady oborů a také přístrojů všedního života, počínaje některými
domácími spotřebiči a ekonomikou či přírodovědnými obory konče. Jedním z oborů,
kde se ANN uplatňují již delší dobu je i chemie [1].
Jednou z prvních obsáhlejších monografií zabývající se perspektivou využití ANN
v chemii byla kniha „Neural networks for chemists: An introduction“ autorů Jure Zupana
a Johanna Gasteigera [2], která vyšla na počátku 90. let 20. století. Od té doby nastal
ohromný rozvoj aplikací ANN v tomto vědním oboru. ANN patří mezi významné nástroje
mezioborového vědního oboru zvaného chemometrie.
Své uplatnění nacházejí umělé neuronové sítě zejména v oblasti modelování vztahu mezi
strukturou chemické látky a jejími fyzikálně-chemickými, farmakologickými a farmakodynamickými vlastnostmi, jako jsou například disociační konstanta [3] či bod varu [4].
Také jsou využívány v odhadu biokoncentrace [5] či toxického účinku látky či kombinace
látek [6].
Všeobecná snaha o minimalizaci počtu nutných experimentů na zvířatech a snížení finančních výdajů při testování chemických látek vede, zvláště nyní, v době registrace
chemických látek do systému REACH, k tomu, že jsou vyhledávány alternativní metody
testování toxicity. Vedle různých statistických metod jsou využívány různé QSAR
(quantitative structure-activity relationship) či QSPR (quantitative structure-property
relationship) modely, často i na bázi umělých neuronových sítí [7] respektive expertních
a fuzzy systémů [8]. Je možné využít obě skupiny ANN a to jak supervised, tak i unsupervised.
2. Molekulové deskriptory
Tradiční zápis chemické struktury sloučenin je zpravidla uváděn v symbolické podobě
(strukturními chemickými vzorci). Výpočetní nástroje, jako jsou různé statistické metody či ANN však vyžadují konverzi tohoto zápisu do formy numerické. K vyjádření
struktury molekuly se tak používá celá řada parametrů, které v numerické podobě popisují či charakterizují danou strukturu. Volba vhodného parametru či kombinace
parametrů není zcela triviální záležitostí a neustále jsou vyvíjeny nové parametry
s cílem ještě věrněji a lépe popsat danou molekulu. Souhrnně se tyto charakteristiky,
převádějící symbolický zápis na číselné veličiny matematicky či pomocí
standardizovaných experimentů, nazývají molekulovými deskriptory (MD) [9]. Tyto
deskriptory se dělí do dvou základních skupin a to na teoretické a experimentální.
První skupinou jsou teoretické deskriptory. Ty se tvoří matematickou či logickou transformací chemické informace zakódované ve strukturním vzorci. Tuto skupinu deskriptorů lze ještě rozdělit podle dimensionality na 0 až 4-rozměrné.
Do skupiny 0-rozměrných jsou řazeny ty informace, které jsou odvozeny přímo z chemického vzorce. Jsou to například molekulová hmotnost, zastoupení jednotlivých prvků
1
či počet atomů těchto prvků v molekule, van der Waalsovy objemy atomů a podobně.
Jednorozměrné deskriptory již vypovídají o substrukturách a fragmentech, ze kterých se
daná molekula skládá. Jedná se tedy o počet a druh funkčních skupin, cyklů, vazeb a substituentů. Tyto skupiny MD jsou často souhrnně nazývány jako konstituční MD.
Dvourozměrné deskriptory, tzv. topologické MD, popisují vlastní uspořádání atomů
v molekule, to jakým způsobem jsou mezi sebou propojeny. Mohou částečně popisovat
i interakce mezi nimi. Patří mezi ně například Weinerova matice vzdáleností atomů,
Randićovy indexy, Kier-Hallova konektivita, Balabánův J-index apod.
Další skupinou jsou 3D deskriptory. Jak již název vyjadřuje, jedná o ty, které jsou odvozeny z prostorového či geometrického uspořádání molekuly. Jedná se například o molekulový povrch apod.
Poslední skupinou, 4D, jsou deskriptory odvozené od stereo-elektronové reprezentace
molekuly. Jedná se o výsledky kvantově-mechanických výpočtů parciálních níbojů
atomů v molekule, dipólového momentu, polarizovatelnosti, uspořádání elektronů
v orbitalech, energie molekulových orbitalů, řád vazby, solvatací energie aj. Využívané
jsou i termodynamické MD, jako jsou vibrační, rotační a translační energie.
Experimentální molekulové deskriptory se získávají mnohem obtížněji než teoretické.
Mezi experimentální molekulové deskriptory patří různé fyzikálně-chemické vlastnosti
látek, naměřené za přesně definovaných podmínek. Jsou to například rozdělovací koeficienty či jejich logaritmy, teploty tání, varu, rozpustnost a podobně. Dále se mezi ně řadí
různé konstanty enzymových reakcí, například reaktivační účinnost, inhibiční a rychlostní konstanty. Získávání experimentálních MD je zpravidla časově, instrumentálně
i finančně náročné.
Každá z výše uvedených skupin MD obsahuje navíc i celou řadu deskriptorů odvozených
od těch původních. Do dnešního dne jich bylo publikováno již několik tisíc a tento počet
zcela jistě není konečný. Stále jsou vyvíjeny další, s cílem co nejlépe vystihnout strukturu
molekuly a také co nejvíce zjednodušit QSAR modely. Ne každý deskriptor je však
vhodný pro konstrukci modelu konkrétní biologické aktivity molekuly.
Pro výpočet MD jsou k dispozici různé specializované programy, jako jsou Dragon
(Talete srl., Itálie), který je v omezené verzi dostupný i on-line jako e-Dragon
(http://www.vcclab.org/lab/edragon/). Programy, které jsou určené přímo pro QSAR či
QSPR studie zpravidla obsahují výpočet MD. Příkladem je CODESSA (Semichem, USA).
Aktuální přehled nejběžnějších programů naleznete na
http://www.moleculardescriptors.eu/softwares/softwares.htm.
3. Selekce vhodných deskriptorů
Hlavním problémem budování QSAR či QSPR modelu není ani tak nedostatek teoretických a experimentálních molekulových deskriptorů, ale spíše výběr těch nejvhodnějších.
Každý deskriptor použitý v modelu sebou přináší i potřebu zvýšení počtu vstupních dat
(molekul), nutných pro vybudování modelu s určitou přesností predikce. To je v naprostém kontrastu s požadavkem praxe, kde je naopak cílem syntéza a testování co nejmenšího počtu látek. Nezbývá tedy nic jiného než redukce počtu deskriptorů, které budou
použity pro sestavení QSAR modelu a to za požadavku minimální ztráty chemické informace. K tomuto kroku je využíváno několika různých postupů. A to buď selekce těch
nejvýznamnějších deskriptorů pomocí korelační analýzy, kdy vzájemně korelované MD
jsou vyloučeny, neboť do systému nepřinášejí žádnou novou informaci, pouze obsahují
redundantní informaci a tím komplikují výpočetní proces. Jinými metodami aplikova2
nými pro redukci počtu MD jsou krokové multilineární regrese (MLR), genetické algoritmy (GA) či metody hlavních komponent (PCA). Z hlediska implementace lze tyto
algoritmy zařadit on-line či offline.
4. Tvorba modelu – výběr molekulových deskriptorů
Je-li k dispozici dostatečný počet dat, lze přistoupit k tvorbě modelu vztahu struktura
látky – její biologická aktivita nebo některá její fyzikálně-chemická vlastnost. Pro modelování je však nutné vybrat vhodné MD.
Korelační analýza je vhodnou metodou, je-li očekávána lineární závislost mezi deskriptorem a biologickou aktivitou (BA) ve formě BA = a + bx, kde BA je biologická aktivita, x
molekulární deskriptor a hodnoty a, b jsou regresními koeficienty. Výstupem je tzv. korelační matice, která vyjadřuje míru lineární vzájemné statistické závislosti dvou
proměnných, vyjádřené jako korelační koeficient r. Ten nabývá hodnot v intervalu od – 1
do 1. Hodnota r = 0 znamená, že proměnné jsou vzájemně nekorelované. Čím více se
blíží hodnota r k ±1, tím lépe lze jejich vzájemný vztah popsat lineární rovnicí.
Předpokládá-li se, že BA bude lineárně záviset na více deskriptorech, je vhodné použít
krokovou MLR. Jak název napovídá, jednotlivé proměnné jsou vybírány v krocích. Ty,
které mají ze statistického hlediska v daném kroku nejzřetelnější vliv na BA. Výběr je
ukončen, není-li již nalezen další statisticky významný deskriptor. Výsledkem je QSAR
model ve formě funkce, kde biologická aktivita je vyjádřena jako lineární kombinace vybraných deskriptorů. Kvalita modelu je opět hodnocena korelačním koeficientem r, či
jeho druhou mocninou r2.
Nevýhodou krokové metody výběru je, že v přítomnosti skupiny silně korelovaných
deskriptorů je vybrán jeden reprezentant a může tak být „ignorován“ mnohem vhodnější deskriptor. V těchto případech s vysoce korelovanými proměnnými je vhodnější
nalézt vhodné reprezentanty skupin pomocí metody hlavních komponent (PCA). Zde
jsou deskriptory reprezentovány latentními proměnnými. Latentní proměnné, v PCA
nazývané hlavní komponenty, jsou lineárními kombinacemi původních proměnných deskriptorů. Je jich výrazně méně než původních deskriptorů, jsou vzájemně nekorelované a vystihují téměř celou variabilitu souboru dat. Jejich pořadí je dáno velikostí popisované variability dat. První hlavní komponenta je tedy lineární kombinací vstupních
proměnných, která zahrnuje největší proměnlivost mezi všemi lineárními kombinacemi.
Touto metodou je možné snížit počet deskriptorů o jeden či více řádů bez významné
ztráty informace v nich obsažených. Nejběžnějším je zřejmě předzpracování dat pomocí
PCA.
Další metodou výběru vhodných deskriptorů jsou genetické algoritmy. Ty jsou založeny
na základních evolučních principech, jako je selekce, křížení, mutace a eventuelně elitářství. Na začátku výpočtu je vygenerována populace tzv. chromozomů složených z „genů“
kódujících hodnoty jednotlivých proměnných a vypočteny hodnoty účelové funkce (například kvalita proložení modelu QSAR). Dále jsou aplikovány evoluční principy, což
vede k vytvoření nové populace. Další generace jsou tvořeny vždy, pokud jsou či nejsou
splněna kriteria k ukončení procesu. Kriteriem může být maximální počet generací,
průměrná či nejlepší hodnota účelové funkce (kvalita modelu) apod. Aplikace GA výrazně zvyšuje možnost nalezení globálního minima/maxima účelové funkce a tím i nejlepšího QSAR modelu. Zde platí, že algoritmus může být aplikován na data ještě před
použitím ANN nebo jej může mít ANN v sobě přímo implementována.
3
Z hlediska uživatele jsou však zajímavější on-line metody, nejčastěji různé druhy
unsupervised ANN, jako například Kohonenovy samoorganizující se mapy (selforganising maps, SOM).
SOM algoritmus se používá k projekci mnohorozměrných dat do méně dimensionálního
prostoru (D), zpravidla 1-3 D. Algoritmus byl vyvinut finským vědcem Teuvo Kohonenem v roce 1982 [10]. Jedná se opět o unsupervised algoritmus (bez znalosti výstupní
informace). ANN implementující SOM má dvě plně propojené vrstvy, vstupní a výstupní.
Umělé neurony ve výstupní vrstvě ANN bývají v 2D uspořádány plošně zpravidla do
mřížky. Adaptace ANN probíhá kompetitivním způsobem. Výsledkem aplikace Kohonenovy ANN je mapa, kde jsou podobná data projektována do topologicky blízkých AN.
Vzdálenost mezi AN ve výstupní vrstvě udává „blízkost“ či podobnost. Tímto způsobem
je opět možné vyloučit z QSAR modelování deskriptory, které by jinak vnášely do modelu duplicitní informaci.
5. Tvorba modelu
Práce s ANN má dvě fáze – adaptační a predikční. V průběhu adaptace je za použití molekulových deskriptorů a biologických aktivit vytvářen model. Pro zaručení
správnosti modelu je nutné rozdělit data do dvou respektive tří skupin. Při vytváření
modelu za použití pouze jednoho data setu totiž může dojít k situaci, kdy model bude
velmi dobře interpretovat data použitá k adaptaci, ale výpočty pro data jiná než v adaptačním data setu budou dávat mylné výsledky (= špatný model). První skupina – adaptační - slouží k vlastnímu budování modelu, druhá eventuelně třetí (verifikační
respektive testovací) k ověření správnosti modelu.
Na závěr je třeba QSAR model statisticky ověřit, eventuelně validovat. Pro tento účel se
vyhodnocuje korelace mezi vypočtenými a experimentálně získanými hodnotami, r2,
dále F-test a podobně. Soubor dat (molekulární deskriptory a příslušné BA) bývá rozdělen do dvou či tří podskupin, kde jedna je použita k vytvoření modelu, druhá pak k jeho
verifikaci a v některých případech je třetí skupina testovací. Vysoké hodnoty r2 pro
všechny data sety jsou podmínkou pro dobrý model.
Na rozdíl od tradičních metod (lineární či kvadratické rovnice, multilineární regrese) užívaných k modelování QSAR, vedoucích k vyjádření vztahu struktury a aktivity
látky exaktně ve formě rovnice, aplikace ANN z principu toto nedovoluje. Tento jev je
způsoben paralelní distribucí výpočtů, kdy hodnota každého deskriptoru je
distribuována v ANN mezi umělými neurony jednotlivých vrstev váženými spoji. Pouze
důkladným zkoumáním modelu, velikostí jednotlivých vah, lze odhadnout některé závislosti a eventuelně extrahovat informace o významnosti jednotlivých deskriptorů.
6. Aplikace ANN v QSPR a QSAR
ANN jsou využívány jak v modelování vztahu struktura – biologická aktivita látky tak
i vztahu k vlastnostem látek. V případě QSPR se jedná zejména o vliv struktury látky na
její rozdělovací koeficient n-oktanol-voda [11], rozpustnost [12] a retenční faktor
v chromatografických metodách [13] či migrační čas a tím i rozlišení píků
v elektroforéze [14]. V QSAR ANN jsou velmi často aplikovány při modelování afinity
různých látek, léčiv a jejich analogů k receptorům či transportérům [15]. V biochemii
slouží k predikci průběhu enzymových reakcí – modelování inhibice enzymu.
Farmaceutické aplikace se zaměřují na vývoj nových léčiv, hledání tzv. „lead“ struktur,
sledování adsorpce léčiv, biokoncentračního faktoru [16]. Toxikologické aplikace jsou
zaměřeny hlavně na cytotoxicitu a mutagenicitu [17].
4
6.1. Optimalizace podmínek separačních metod
Optimalizace podmínek různých separačních metod patří mezi nejvýznamnější aplikace
ANN v analytické chemii. Hledání optima, vyjádřeno matematicky, spočívá v hledání
extrému funkce více proměnných. V případě optimalizace separačních metod jsou těmito proměnnými podmínky měření, funkcí, která charakterizuje např. kvalitu separace,
může být například rozlišení píků. S touto problematikou souvisí i modelování
retenčních časů v chromatografii [18]. Hledání nejlepších podmínek se může provést
několika způsoby, které lze rozdělit do dvou základních skupin.
1) Přístup teoretický
Tento způsob je založen na úplné znalosti fyzikálně-chemických dějů ve zkoumaném
systému. V tomto případě je možno optimální separační podmínky vypočítat a není
nutné provádět žádné experimenty, bohužel v praxi se tento případ vyskytuje velice
zřídka.
2) Přístup experimentální
Jak již název napovídá, jsou informace získávány z výsledků provedených pokusů. Při
jejich provádění se dá jít dvěma cestami
a. relaxační metoda („single variable approach“, SVA), kdy hledáme optimální hodnotu každého parametru zvlášť, zatímco všechny ostatní parametry jsou v dané chvíli konstantní. Tento postup je nejen v chemii
bohužel dosud velmi často používaný, může vést k cíli, ale je principielně
nesprávný a často zdlouhavý. Nalezení optima přitom velmi silně závisí na
podmínkách výchozího pokusu.
b. multivariační přístup („multivariable approach“, MVA). Hodnoty všech parametrů se mění současně. Do této skupiny patří například simplexová
metoda.
6.2. Metoda plánování pokusů (experimentální design)
Experimenty není vhodné provádět náhodně, nýbrž je preferováno jejich pečlivé plánování. Je prokázané, že při použití metody plánování pokusů a při stejném počtu experimentů je možno daný systém popsat lépe než při použití relaxační metody (SVA).
Podmínky analytických procesů bývají většinou ve vzájemné dosti složité interakci.
Experimenty je proto třeba volit tak, aby jich bylo nutné provést pouze minimální počet
a zároveň bylo dosaženo předpokladu maximální informační obsažnosti těchto pokusů,
týkajících se „optimalizovaného systému“. Toho lze docílit pečlivým plánováním pokusů.
Existuje celá řada metod, které se souhrnně označují jako metody plánování pokusů
(„experimental design“, ED) [19]. Plán experimentů, získaný jejich užitím, je založen na
statistických principech a zaručuje, že systém bude za použití daného počtu pokusů
popsán co nejlépe. Existuje celá řada ED, vhodných např. pro určování významnosti jednotlivých faktorů (Plackett-Burman), pro konstrukci hyperploch („central composite
design“), které jsou, ve spojení s chemometrickými metodami (obecná regrese, metoda
parciálních nejmenších čtverců či umělé neuronové sítě), účinným nástrojem pro
predikci optimálních podmínek separace.
5
7. Příklady aplikací
7.1. Separace morfinových antagonik [20]
Látky nalorfin, naloxon a naltrexon patří do skupiny látek, které jsou strukturně podobné morfinu. Váží se sice na stejné receptory v mozku, ale na rozdíl od něj mají
nulovou nebo zcela zanedbatelnou biologickou aktivitu. Proto se používají zejména jako
antidota při otravách opiáty ať již přírodními (zaschlá šťáva z nezralých plodů máku
setého – opium – obsahuje až 10 % bezvodého morfinu), či syntetickými jako je heroin.
Separované látky patří do skupiny kompetitivních antagonik.
Byl použit nový přístup k optimalizaci – ED + ANN. Jako metody plánování pokusů byly
vyzkoušeny dvě varianty a to „central composite“ plán pokusů a dvouhladinový
faktorový plán.
K adaptaci umělé neuronové sítě byly použity jako vstupní data podmínky měření –
separační napětí, doba dávkování vzorku koncentrace základního elektrolytu, výstupní
data pak parametry píků a separace – rozlišení píků naloxonu a naltrexonu, které bylo
nejkritičtějším parametrem, a k zamezení náhodné variability výsledků též výšky,
migrační čas a počty teoretických pater píků látek. Dva naměřené náhodně vybrané
experimenty byly vybrány a použity jako testovací data.
Adaptace začala s jedním neuronem ve skryté vrstvě. Bylo provedeno několik spuštění
výpočtu (pokaždé s náhodným nastavením váhových koeficientů a prahových hodnot
a s různou rychlostí učení). Ukázalo-li se, že výpočet nekonverguje k nule, bylo
přistoupeno ke zvýšení počtu neuronů ve skryté vrstvě. Tento proces se opakoval tak
dlouho, dokud nebyla daná umělá neuronová síť schopna predikovat trénovací
i testovací data s přesností na 0,1 %. Pro data získaná měřením pokusů „central
composite“ plánu byla vhodnou ANN síť s architekturou 3: 14: 10 (3 neurony ve vstupní
vrstvě, 14 neuronů ve skryté a 10 neuronů ve výstupní vrstvě). Pro dvouhladinový
faktorový plán byla vhodná ANN se strukturou 3: 7: 10.
Adaptovaných ANN bylo použito k predikci chování jednotlivých parametrů v celém
rozsahu experimentálních podmínek. Jako kritérium optimální separace byla zvolena
největší hodnota počtu teoretických pater (nejvyšší účinnost) a rozlišení píků naloxonu
a naltrexonu.
Optimální podmínky nalezené pomocí obou plánů pokusů se prakticky nelišily.
7.2. Optimalizace separace chirálních látek [21]
Enantiomery, též optické izomery, jsou dvě molekuly jedné látky, mající k sobě navzájem
stejný vztah jako předmět a jeho zrcadlový obraz, který s ním není ztotožnitelný. Chirální je každá molekula enantiomeru. Chiralita je vlastnost. Enantiomery mají stejné fyzikálně-chemické vlastnosti, kromě prostorové struktury.
Chirální látky mohou být separovány různými analytickými postupy, např. krystalizací,
ale využívají se hlavně chromatografické metody, jako je tenkovrstvá, plynová či vysokoúčinná kapalinová chromatografie.
Výběr vhodné metody závisí na faktorech, jako jsou fyzikálně-chemické vlastnosti látky
(těkavost, rozpustnost, apod.), doba a cena analýzy, její citlivost.
Jednou z nejuniverzálnějších metod je kapilární elektroforéza. Výhodou, kromě malé
spotřeby vzorku, je i možnost rychlé změny separačního média (v kapalinové chromatografii je třeba kolonu ekvilibrovat asi 1 hodinu) během vývoje nové metody a použití
6
velice malého množství drahých chirálních selektorů. Jednoduchost učinila z CE velmi
progresívní metodou v oblasti analýzy chirálních látek.
Protože oba enantiomery mají stejné fyzikálně-chemické vlastnosti, je k jejich rozdělení
nutné použít stereospecifických interakcí s tzv. chirálními selektory. Jedněmi
z chirálních selektorů jsou i cyklodextriny (CD). Rozdělení enantiomerů může být
vysvětleno interakcemi mezi CD, který má mnoho center chirality a analytem. Mechanismus separace je založen na stereospecifické inkluzi analytu do dutiny CD, kde jeden
optický izomer je vázán silněji než druhý. Za nízkého pH je elektroosmotický tok minimální a nederivatizované cyklodextriny nemigrují. Naopak bazické látky jsou protonovány a migrují směrem k záporné elektrodě. Jakmile je však analyt komplexován
zasunutím do dutiny CD, jeho mobilita se zmenší v závislosti na síle interakce. Pokud
konstanty stability obou enantiomerů s CD jsou rozdílné, je možné dosáhnout jejich rozdělení. Separace je samozřejmě možná i při vysokém pH, kde je analyt nositelem negativního náboje.
7.3. Dekonvoluce píků [22]
Kromě optimalizace separace byly ANN využity i k řešení dalšího častého problému a to
dekonvoluci signálů – píků. Ne vždy je možné dosáhnout separace dvou látek ze 100 %,
proto je nutné najít řešení pro jejich kvantifikaci i při částečné separaci. K tomuto úkolu
je možné využít ANN. V experimentu byl naměřen data set, sestávající z měření s různým
rozlišením píků, různými koncentracemi obou enantiomerů ve směsi. Po adaptaci byla
ANN použita k výpočtu zastoupení jednotlivých enantiomerů ve vzorku.
7.4. Modelování retenčních faktorů oximů [23]
Pyridiniové oximy jsou skupinou látek, která má schopnost reaktivovat enzym
acetylcholinesterázu. Tento enzym bývá inhibován především nervově paralytickými
látkami a také některými pesticidy, jako jsou organofosfáty. Pro kontrolu čistoty těchto
látek slouží běžně tenkovrstvá chromatografie (TLC). Látka je identifikována na základě
svého tzv. retenčního faktoru. Programem Dragon bylo vypočteno 1664 molekulových
deskriptorů, kterých po vyloučení konstantních, téměř konstantních a vzájemně korelovaných bylo použito 634. K modelování vztahu chemická struktura látky – retenční faktor byla využita prvně tzv. hybridní ANN, která sestávala ze vstupní Sangerovy vrstvy
s následným třívrstvým perceptronem. V první části ANN dochází k redukci počtu
proměnných on-line. Sangerův algoritmus provádí metodu hlavních komponent a tím
výrazně redukuje dimensionalitu vstupních dat. V uvedeném případě byl počáteční počet 634 vstupních neuronů promítnut do pouhých 8 neuronů. Výsledná ANN
s architekturou 634:8:3:1 byla schopna velmi dobře popsat závislost retenčních faktorů
sledovaných oximů na jejich chemické struktuře. Jelikož biologický účinek látek závisí na
jejich fyzikálně-chemických vlastnostech, otvírá modelování retenčních faktorů cestu
k modelování například rozdělovacího koeficientu logP, který pak souvisí s distribucí
látek v organismech.
7.5. Autentizace potravin [24]
Vzhledem k prakticky neomezené variabilitě ve své struktuře, jsou ANN využívány při
hodnocení potravin na základě různých chemických dat, které byly získány jednotlivými
analýzami či s využitím například pole senzorů, které emuluje funkci lidského čichu či
chuti. Výsledky pak slouží například k potvrzení místa původu potraviny respektive
k vyvinutí chuti potraviny co nejlépe odpovídající senzorickým preferencím spotřebitele.
7
Pro tyto účely jsou ANN využívány k modelování a identifikaci korelací mezi jednotlivými či více proměnnými a vlastnostmi jednotlivých skupin vzorů (patterns). ANN
nahrazují běžné jedno či vícerozměrné statistické metody a stejně jako ony umožňují
zpravidla projekci mnohorozměrného prostoru do méně rozměrného prostoru s malými
ztrátami chemické informace. Zvláště nelinearita ANN je výhodou oproti standardním
nástrojům, mezi něž patří například metoda hlavních komponent. Velmi často jsou využívány Kohonenovy samoorganizující se mapy (Self-organisisng maps, SOM), kde n-rozměrný prostor je redukován zpravidla do 1 či 2-rozměrného. Analýza získaných „map“
umožňuje vyhledávání skupin podobných dat (klastrování) eventuelně odlehlých
výsledků. Vzdálenost projekce dvou vzorů je nepřímo úměrná jejich podobnosti. SOM
tak mohou sloužit ke klasifikaci dat a jejich řazení do různých skupin [25].
Příkladem využití SOM je klasifikace vín dle místa původu na základě chemické analýzy,
kdy byl zjištěn obsah vybraných kovů v analyzovaných vzorcích [26,27]. Celkem 11
prvků (K, Na, Ca, Mg, Fe, Cu, Zn, Mn, Sr, Li a Rb) bylo stanoveno ve vzorcích suchých
a sladkých vín pocházejících ze tří Kanárských ostrovů – El Hierro, La Palma a Lanzarote.
Analýzou vah jednotlivých spojení mezi neurony bylo zjištěno, že vína pocházející
z ostrova Lanzarote mají nejvyšší obsah Na a Li, zatímco obsah Sr a Rb byl nejnižší ze
všech zkoumaných vzorků. Obsah Sr a Rb byl nejvyšší u vzorků z ostrova La Palma. U vín
z tohoto ostrova byl navíc patrný rozdíl mezi sladkými a suchými víny, kdy sladká vína
obsahovala vyšší koncentrace téměř všech sledovaných kovů než suchá. Tato skutečnost
je dána tím, že sladká vína jsou vyráběna z přezrálých hroznů. Obdobné výsledky byly
získány i clusterovou analýzou. Vína z ostrova El Hierro jsou zřejmě z geografických důvodů více podobná vínům z ostrova La Palma v porovnání s víny z Lanzarote.
Pro klasifikace vín dle místa původu byl využit i třívrstvý perceptron. Vytvořený model
byl v klasifikaci vín úspěšnější v porovnání s lineární diskriminační analýzou.
Jiní autoři využili ke klasifikaci vín výsledky analýzy polyfenolů kapilární elektroforézou
[28].
Dalšími aplikacemi jsou například klasifikace kultivarů rýže, olejů dle místa původu,
transferu kontaminantů v potravním řetězci v závislosti na potravním chování, zpracování dat senzorů, identifikace bakterií apod.
7.6. Klasifikace distribuce uranu [29]
Jinou možností využití ANN v chemii je modelování chemických pochodů v přírodě. Pro
modelování chemických procesů v jihoafrickém zlatém dole byla využita data o obsahu
jednotlivých iontů v různých částech dolu, jako jsou tůňky, potůčky, jezírka, výsypky
apod. Následným modelováním pomocí Kohonenových SOM byla získána projekce do 2D
prostoru a z vah jednotlivých spojení pak odvozena chemická podstata pohybu uranu,
který je doprovodným prvkem zlata. Zejména nižší pH, a vyšší obsah síranových iontů
vedl ke zvýšenému obsahu uranu. Podle distribučnch diagramů je migrace uranu
především ve formě rozpustných uranylových solí, které vznikají právě za těchto podmínek.
7.7. Klasifikace signálu biosenzoru [30]
Pro klasifikaci signálu biosenzoru byla též využita SOM. Biosenzor byl na bázi imobilizovaného enzymu acetylcholinesterázy. Počátek měření byl odstartován přídavkem
substrátu, acetylthiocholinu, po určité době byl přidán inhibitor a pak i syntostigmin.
Celý průběh signálu byl zaznamenáván. Pro ANN byl tento průběh navzorkován
s přihlédnutím ke klíčovým bodům, kterými byly přídavky jednotlivých látek. Takovýto
8
data set byl poté předložen SOM a následně došlo k promítnutí signálů do 2D SOM.
Z výsledků vyplynulo, že je možné rozlišit některé poruchy signálu.
7.8. Další aplikace
Určení chemické struktury na základě spekter z UV/VIS, IČ, NMR, MS apod., stanovení
toxicity látek [31].
8. Závěr
Umělé neuronové sítě patří mezi standardně využívané chemometrické metody
v různých oblastech chemie. Nacházejí své uplatnění při hledání optimálních podmínek
separačních procesů, klasifikaci potravin dle místa původu, vývoji nových léčiv, modelování environmentálních problémů či řízení chemických procesů. Velký důraz je kladen
zejména na výběr vhodných molekulových deskriptorů a na minimalizaci počtu prováděných experimentů. ANN jsou perspektivním a účinným nástrojem v řešení složitých
chemických problémů.
Literatura
[1]
F. MARINI, R. BUCCI, A.L. MAGRÌ, A.D. MAGRÌ: Artificial neural networks in
chemometrics: History, examples and perspectives. Microchem. J. 88 (2008) 178-185.
[2]
J. ZUPAN, J. GASTEIGER: Neural Networks for Chemists; An Introduction. VCH
Publishers New York, NY, USA, 1993.
G. STOJKOVIĆ, M. NOVIČ, I. KUZMANOVSKI: Counter-propagation artificial neural
networks as a tool for prediction of pKBH+ for series of amides. Chemom. Intell.
Lab. Syst. 102 (2010) 123-129.
S. ARUPJYOTI, S. IRAGAVARAPU: New electrotopological descriptor for prediction of
boiling points of alkanes and aliphatic alcohols through artificial neural network and
multiple linear regression analysis. Computers & Chemistry 22 (1998) 515-522.
M.H. FATEMI, M. JALALI-HERAVI, E. KONUZE: Prediction of bioconcentration factor
using genetic algorithm and artificial neural network. Anal. Chim. Acta 486 (2003)
101-108.
F. GAGNÉ, C. BLAISE: Predicting the toxicity of complex mixtures using artificial
neural network. Chemosphere 35 (1997) 1343-1363.
S.P. NICULESCU: Artificial neural networks and genetic algorithms in QSAR. J. Mol.
Struct. THEOCHEM 622 (2003) 71-83.
T.WAYNE SCHULTZ, MARK T.D. CRONIN, TATIANA I. NETZEVA: The present status
of QSAR in toxicology. J. Mol. Struct. THEOCHEM 62 (2003) 23-38.
[3]
[4]
[5]
[6]
[7]
[8]
[9] R. TODESCHINI, V. CONSONNI: Handbook of Molecular Descriptors. WILEY-VCH, 2000.
[10] T. KOHONEN: Self-organized formation of topologically correct feature maps. Biol.
Cyber. 43 (1982) 59-69.
[11] L. MOLNÁR, G.M. KESERŰ, Á. PAPP, Z. GULYÁS, F. DARVAS: A neural network based
prediction of octanol–water partition coefficients using atomic fragmental
descriptors. Bioorg. Med. Chem. Lett. 14 (2004) 851-853.
[12] A. JOUYBAN, M. MAJIDI, H. JALILZADEH, K. ASADPOUR-ZEYNALI: Modeling drug
solubility in water–cosolvent mixtures using an artificial neural network. Il
Farmaco 59 (2004) 505-512.
9
[13] Y.L. LOUKAS: Artificial neural networks in liquid chromatography: efficient and
improved quantitative structure–retention relationship models. J. Chromatogr. A
904 (2000) 119-129.
[14] A. BEN HAMEDA, S. ELOSTA, J. HAVEL: Optimization of the capillary zone
electrophoresis method for Huperzine A determination using experimental design
and artificial neural network. J. Chromatogr. A 1084 (2005) 7-12.
[15] R. HUANG, Q. DU, Y. WEI, Z. PANG, H. WEI, K. CHOU: Physics and chemistry-driven
artificial neural network for predicting bioactivity of peptides and proteins and
their design. J. Theor. Biol. 256 (2009) 428-435.
[16] S. AGATONOVIC-KUSTRIN, R. BERESFORD: Basic concepts of artificial neural
network (ANN) modeling and its application in pharmaceutical research. J. Pharm.
Biomed. Anal. 22 (2000) 717-727.
[17] I. VALKOVA, M. VRAČKO, S.C. BASAK: Modeling of structure–mutagenicity
relationships: counter propagation neural network approach using calculated
structural descriptors. Anal. Chim. Acta 509 (2004) 179-186.
[18] R.H. ZHAO, B.F. YUE, J.Y. NI, H.F. ZHOU, Y.K. ZHANG: Application of an artificial
neural network in chromatography—retention behavior prediction and pattern
recognition. Chemom. Intell. Lab. Sys. 45 (1999) 163-170.
[19] D.C. MONTGOMERY: Design and Analysis of Experiments. John Wiley & Sons, 2007.
[20] V. DOHNAL: Artificial neural networks for optimization in the capillary zone
electrophoresis. Chem. Listy 92 (1998) 669-672.
[21] V. DOHNAL, M. FARKOVÁ, J. HAVEL: Prediction of chiral separations using a
combination of experimental design and artificial neural network. Chirality 11
(1999) 616-621.
[22] V. DOHNAL, F. ZHANG, H. LI, J. HAVEL: Quantitative chiral analysis in capillary
electrophoresis from unresolved peaks using derivative electropherograms,
experimental design, and artificial neural network. Electrophoresis 24 (2003)
2462-2468.
[23] V. DOHNAL, V. RAČÁKOVÁ, K. KUČA: Use of hybrid artificial neural network for
prediction of pyridinium oxime retention factors. Manuskript v přípravě.
[24] B. DĘBSKA, B. GUZOWSKA-ŚWIDER: Application of artificial neural network in food
classification. Anal. Chim. Acta 705 (2011) 283-291.
[25] J. ZUPAN, M. NOVIČ, I. RUISÁNCHEZ: Kohonen and counterpropagation artificial
neural networks in analytical chemismy. Chemom. Intell. Lab. Syst. 38 (1997) 1-23.
[26] D. KRUZLICOVA, J. MOCAK, B. BALLA, J. PETKA, M. FARKOVA, J. HAVEL:
Classification of Slovak white wines using artificial neural networks and
discriminant techniques. Food Chem. 112 (2009) 1046-1052.
[27] S. FRÍAS, J.E. CONDE, M.A. RODRÍGUEZ, V. DOHNAL, J.P. PÉREZ-TRUJILLO: Metallic
content of wines from Canary Islands (Spain). Application of artificial neural
networks to the data analysis. Nahrung 46 (2002) 370-375.
[28] J. PAZOUREK, D. GAJDOŠOVÁ, M. SPANILÁ, M. FARKOVÁ, K. NOVOTNÁ, J. HAVEL:
Analysis of polyphenols in wines: Correlation between total polyphenolic content
and antioxidant potential from photometric measurements: Prediction of cultivars
and vintage from capillary zone electrophoresis fingerprints using artificial neural
network. J. Chromatogr. A 1081 (2005) 48-54.
10
[29] H. TUTU, E.M. CUKROWSKA, V. DOHNAL, J. HAVEL: Application of artificial neural
networks for classification of uranium distribution in the Central Rand goldfield,
South Africa. Environ. Model. Assess. 10 (2005) 143-152.
[30] V. DOHNAL, L. PODLOUCKÁ, Z. GROSMANOVÁ, J. KREJČÍ: Využití umělých
neuronových sítí pro klasifikaci signálů biosenzorů. Acta Universitatis Agriculturae
et Silviculturae Mendelianae Brunensis 2 (2008) 73-79.
[31] M. ALVAREZ-GUERRA, D. BALLABIO, J.M. AMIGO, R. BRO, J.R. VIGURI: Development
of models for predicting toxicity from sediment chemistry by partial least squaresdiscriminant analysis and counter-propagation artificial neural network. Environ.
Poll. 158 (2010) 607-614.
doc. RNDr. Vlastimil Dohnal, Ph.D.
Univerzita Hradec Králové, Přírodovědecká fakulta
Rokitanského 62, 500 03 Hradec Králové, Česká republika
e-mail: [email protected]
11

umělé neuronové sítě v chemii kam kráčí analytická chemie?

Transkript

Podobné dokumenty

Biochemici - UK_Benelux - Biotrend

Exnerův systém - Česká společnost pro Rorschacha a projektivní

Bioprospect - Biotechnologická společnost

Téma 14 - Excerpta z teoretické chemie

Results 2011

ČAS 2008 - Czech Aerosol Society

Text