Přednáška 5

Transkript

Přednáška 5
OPVK CZ.1.07/2.2.00/28.0184
Drug-design - racionální návrh léčiv
KFC/DD
05 – dokování
RNDr. Karel Berka, Ph.D.
ZS 2012/2013
Motto
… a my dnes ten klíč
budeme hledat…
Osnova
• Structure-based drug design (SBDD)
– Dokování a de novo design
• proč?
– hledání molekul, které se váží do aktivních míst
• čeho?
– knihovny léčiv
• jak?
– generování konformací ligandů
– skórovací funkce
• a hlavně rychle!
Racionální návrh léčiv – možnosti
Ligand–based DD
Structure–based DD
Hledání podobných ligandů
QSAR
Farmakofor
Dokování
Virtual screening
De novo design
Co je dokování?
V dokování se snažíme najít co nejlepší „fit“ mezi dvěma molekulami
Bill Watterson: Calvin a Hobbes
Protein-ligand docking
Výpočetní metoda, která mimikuje vazbu ligandu na protein
• Predikuje
• pózu molekuly ve
vazebném místě
=geometrie
• Vazebnou afinitu (skóre)
reprezentující sílu vazby
=energie
Image credit: Charaka Goonatilake, Glen Group,
University of Cambridge. http://wwwucc.ch.cam.ac.uk/research/cg369research.html
Protein-ligand docking II
Dokování má 2 hlavní kroky:
1. Algoritmus hledání
– Vytvoří se velké množství póz ve vazebném místě
2. Skórovací funkce
– Vypočítá skóre, nebo vazebnou afinitu pro partikulární pózu
• Problémy - komplexita problému
– Translace a rotace ligandu k pokrytí pokud možno celého
prostoru, konformace ligandu a flexibilita proteinu, role
solventu, čas…
Problém dokování I: Flexibilita
• První krok
– prohledání možných rotačních a translačních
možností ligandu
• Flexibilita ligandu
– tvorba ensemble všech možných konformací
ligandu
– vkládání do proteinu
– protein jako rigidní
9
Konformace ligandu
• Konformace – rotace kolem torzních úhlů rotovatelných molekul
• Pro molekulu s N rotovatelnými vazbami, kdy je každý torzní
úhel s rotacemi o θ stupňů (typicky 5°)
• Počet konformací je pak (360º/ θ)N
• Question
– If the torsion angles are incremented in steps of 30º, how many
conformations does a molecule with 5 rotatable bonds have,
compared to one with 4 rotatable bonds?
• Having too many rotatable bonds results in “combinatorial
explosion”
• Also ring conformations
Taxol
Image: IUPAC Gold Book
Lakdawala et al. BMC Chemical Biology
2001 1:2
Algoritmy hledání
• Monte Carlo
– Náhodný výběr
– hledání globálního minima
• Genetické algoritmy
– Učení se z předchozích generací
• Simulované žíhání
– Ohřev - překonání bariér
– Chlazení – hledání minim
• Postupný růst
– Výstavba ze základního skeletu
11
Příprava na docking
•
•
•
•
identifikace relevantní struktury proteinu
příprava struktury proteinu
příprava ligandu
rozhodnout co s dalšími jevy
– voda
– flexibilita receptoru
H. Jhoti & A.R. Leach (eds)
Springer 2007, chapter 8
Structure based drug discovery
12
Příprava receptoru
• Kam?
– identifikace vazebného místa
• Dobrá struktura
– nízké rozlišení (přesnost)
– nízké B-faktory (flexibilita)
– nízké R-free (pravdivost)
• Flexibilita
– dokování do více struktur –
vybrat nejlepší
– dokování do struktury s
největším vazebným místem
– použít flexible docking
13
Konformace proteinu
• Většina dokovacích programů bere protein jako rigidní
– Rigid Receptor Approximation
• Ale…
– Protein se může lehce deformovat, aby přijal různé ligandy
(ligand-induced fit)
– Aminokyseliny v aktivním místě mohou přijmout různé
konformace
• Flexible Receptor docking:
– Vedlejší řetězce aminokyselin mohou
rotovat kolem necyklických vazeb
– Zvětšuje to prohledávaný prostor!
• Větší pohyby proteinu mohou být brány v
potaz jen samostatným dokováním do
několika konformací proteinů
Image: Cláudio M. Soares, Protein
Modelling Laboratory,
http://www.itqb.unl.pt/labs/proteinmodelling/activities/psccip-pf
Příprava receptoru
• protonace residuí
– His (pKa ~ 6.04)
– záleží na okolí
(HIV proteáza)
• tautomerizace
• rotamery
• výběr změní výsledky!
15
Příprava ligandu
• Náboj a tautomerizace
– Vytvořit všechny a pak je dokovat?
– jak pak vybrat nejvyšší skore
• každý stav bude mít jinou relativní energii.
– Ask an expert! (organičtí chemici)
• flexibilita
– rotace kolem C-C vazeb, ale ne kolem C=C
– úhly jsou fixovány (což může být problém)
16
Skórovací funkce
1. Ohodnocení jednotlivých póz v průběhu
dockingu – objective function
2. Identifikace nejnižší volné energie
3. Seřadí vazebné volné energie mezi různými
ligandy
– Pro všechny kroky nemusí být vždy použita
stejná funkce
17
Energetika vaznosti
• Vazebná konstanta
Kd = [P...L] / [P][L]
odpovídá volné energii:
ΔGbind = -RT ln Kd = -RT ln 1/IC50
Volná energie je kombinace enthalpie a entropie
ΔGbind = ΔHbind - TΔSbind
18
Molekulární interakce - chemie
Enthalpie:
• Elektrostatika
– (dielektrická konstanta)
• Vodíkové vazby
• van der Waals
Entropie
• Konformace
• Solvatace
– (hydrofobní efekt)
– (disperze a repulze)
• Desolvatace
19
Scoring function
• Funkce, která ohodnotí vazebnou afinitu
• Funkce by měla lépe oskórovat správnou pózu, a lépe
se vázající ligand
• Parametrizovány proti známým vazebným volným
energiím a známým správným pózám.
• Většinou jsou nepříliš spolehlivé, ale rychlé
20
Typy scoring function
• Force-field – parametrizovány dle molekulárně mechanických silových polí
– Goldscore, DOCK, Autodock
• empirical – parametrizovány proti experimentálním vazebným afinitám(Kd,IC50)
– různé členy (H-vazby, hydrofobní kontakty)
– nutné trénování, rychlé
– ChemScore, PLP, Glide SP/XP
• knowledge based – vycházejí ze znalostí komplexů protein-ligand
– Boltzmannova hypotéza – co se často vyskytuje, to má silnou
vazebnou volnou energii
– PMF, DrugScore, ASP
21
Force-field scoring functions
• Silové pole pro docking
E = Ebond + Eangle + Edih + Ecoulomb + Evdw + Esolv
• časté použití gridu – šetří čas
– vyhledání v tabulce je jednodušší, než znovu počítat
interakční energie
– receptor je často jeden
a dokovaných látek je mnoho
22
Empirical scoring function
• Rozložení vazebné energie do chemicky
odpovídajících členů
• Zachycuje specifické interakce
– H vazby, π-π stacking
Linearizace členů je oblíbená
DGbind = DGsolvent + DGconf + DGrot + DGt + DGr + DGvib
23
Böhm’s empirical scoring function
• lineární suma jednotlivých příspěvků k vazbě
• Bohm’s scoring function
• vodíková vazba, interakce iontů,
lipofilické interakce a konformační člen
•
•
•
•
•
Vodíková vazba a interakce iontů
– závislé na geometrii interakce – velké odchylky jsou penalizovány
(ideal distance R, ideal angle α) being penalised.
Lipofilní člen
– proporční k ploše dotyku povrchů mezi proteinem a ligandem (Alipo)
Konformační entropický člen
– penalizace za zmražení interních rotací ligandu - entropie
– proporční k množství rotovatelných vazeb ligandu (NROT)
∆G hodnoty přiřazené jednotlivým členům jsou konstanty získané lineární
regresí na experimentálních vazebných datech pro 45 protein–ligand
complexů
Bohm, J. Comput.-Aided Mol.
Des., 1994, 8, 243
Chemscore
25
Chemscore
26
Chemscore úspěšnost
Korelační koefficient – r
r2 <-1, 0, 1>
27
Problémy empirických skórovacích funkcí
• Záleží na testovacím setu
• chybějící interakční členy
– metal-ion
• Parametrizovány na úspěch
– Většinou se při parametrizaci používají jen
molekuly, které se váží => takže pak se váže skoro
všechno
28
Knowledge-based funkce
Korelace strukturních dat z komplexů s volnou
energií vazby
A = -kT ln g(r)
– Platí pro soubor částic v plynu
– NE! nutně pak pro proteiny
29
Drugscore
30
Programy
• DOCK (I. D. Kuntz, UCSF)
• AUTODOCK (Arthur Olson, The Scripps Research
Institute)
• Vina (Arthur Olson, The Scripps Research Institute)
• RosettaDOCK (Baker, Washington Univ., Gray, Johns
Hopkins Univ.)
• ArgusLabs
• GOLD
• FlexX
• Hex
• Glide (Schrodinger)
31
de novo dokování
1) Určení povrchu (SASA - Connelly)
valením kuličky o velikosti molekuly vody po povrchu
2) Tvorba "negativního" obrazu receptoru z
kuliček na povrchu z kroku 1
3) Určení vzdáleností mezi jednotlivými
kuličkami
4) Konverze vzdáleností mezi kuličkami
možné vazebné vzdálenosti mezi atomy
5) Srovnání nalezených vzdáleností mezi
atomy se vzdálenostmi z databáze molekul
6) Výběr ligandů, které mají největší překryv
7) Spočítání ligand-receptor interakčních
energií pomocí skórovací funkce
Dostavování (Groupbuild)
• Stavění nových sloučenin komplementárních k cílovému vazebnému
místu náhodnými kombinacemi jednotlivých fragmentů
• Příklady fragmentů:
– kyselina mravenčí, formaldehyd, formamid, amin, benzen, cyklohexan,
cyklopentan, ethan, ethylen, voda, methanol, methan, sulfan, thiofen
Procedura:
1)
Tvorba gridu pro vazební místo
2)
Generování struktury
1)
2)
3)
4)
3)
Dokování základního "core" fragmentu
Dostavování (rozšiřování jádra o jednotlivé fragmenty)
Náhodně vybrat několik nejlepších struktur
Iterovat přes kroky 2 a 3 (i.e. pokračovat ve stavbě) dokud nejsou
splněna finální kritéria (počet kroků, minimální energie, energie na atom,
apod.)
Výběr struktur pro syntézu a analýzu
FlexX, AutoGrow
Groupbuild procedura
CH3
N
init ial core f ragment
f ragment t o be added
C
O
N
CH2
C
C
C
O
O
O
N
N
C
O
N
CH2
C
O
N
CH2
Analýza nalezených struktur
A) Visuální zkoumání vzniklých struktur, zda se
dají „uvařit“
B) Identifikace specifických pozic některých
skupni, které by mohly odpovídat známému
farmakoforu
C) Prohledání databáze pro podobné molekuly
Ukázka dostavby pro hypotetický receptor
O
H
H
N
Greceptor
Gsolution
-8
-10
-30
-80
-30
-20
O
H
O
H
N
O
O
H
O
H3C
O
H
N
G = Geq,2 – Geq,1 = Greceptor - Gsolution
Kontrola kvality
• Redocking zpátky do krystalu
– RMSD < 2A
– flexible ligand docking ~70%
– nutno otestovat, který docking
program dává pózu dobře
• test sety – validace programů
– GOLD test set, Astex set
– decoys – ZINC, DUD (podobné
fyz.chemické vlastnosti, odlišné
struktury)
• VS: obohacení
– Enrichment factor
– (BED)ROC křivky
– ΔGeff
a/n
EF = ----A/N
- top (např. top10)
a – aktivní
n - celkem
- total
ΔGeff = ΔGeff/NnonHatoms
37
Kvalita virtuálního screeningu
38
Metody na řazení
• ROC
– receiver operating
characteristic curve
• AUAC
– area under the accumulation
curve
• average rank of actives
• EF
– enrichment factor
• RIE
– robust initial enhancement
• BEDROC
– Boltzmann-enhanced
discrimination of receiver
operating characteristic
Published in: Jean-François Truchon; Christopher I. Bayly; J.
Chem. Inf. Model. 2007, 47, 488-508.
DOI: 10.1021/ci600426e
Copyright © 2007 American Chemical Society
Figure 9 Different accumulation curves from sampling (n = 50, N
= 25000) shown together with the corresponding ROC and
BEDROC values where α = 20.0. An exact CDF with λ = 20 is also
shown to highlight the fact that the BEDROC metric returns a
value of 1/2 for a curve close to this CDF.
Příklady použití
40
Příklady použití
41
Příště:
• Cvičení QSAR, dokování

Podobné dokumenty

ollp o ennoluls - E

ollp o ennoluls - E L aae^'ubp nlgurol e^ eugpop epnq '6gr;o.rd qcdulgpod guc?A guqn1sl1d eu dC luanoloqAn o:d u.r;c;fnnoqAn (y1'.) npoq oqgua)ewez srdod e Z'^'X ectupe1nos 'npoq olsJ? le^oL{esqo apnq !e11 'nle^l u?^o...

Více

Drug design - Racionální návrh léčiv - Biotrend

Drug design - Racionální návrh léčiv - Biotrend 1D reprezentace struktury – textová sekvence ................................................................. 37 2D reprezentace struktury – topologie ................................................

Více

Mistrovské podvody Jezuitů: Ukrýtí Placaté země a Lunárního Sabatu!

Mistrovské podvody Jezuitů: Ukrýtí Placaté země a Lunárního Sabatu! pohanském Juliánském kalendáři. Sám jezuitský astronom Christopher Clavius to přiznává. Clavius... potvrdil, že Juliánský kalendář vychází z čistého pohanství a nemá vůbec žádné vazby k Biblické ka...

Více

Otázky pro písemnou část zkoušky z předmětu Strukturní

Otázky pro písemnou část zkoušky z předmětu Strukturní 7. Jaké rozlišení map elektronové hustoty je nutné abychom byli schopni ve struktuře proteinu rozpoznat: 1) hlavní helixy 2)většinu sekundárních motivů 3) velkou část postranních řetězců a ligandy ...

Více