ANÀLISI DEL LOOP 90-130
REGIÓ DEL LOOP EN ELS TEMPLATES
TEMPLATE |
RESIDUS |
HELIX a |
CADENES b |
Ht0 B |
97-143 |
1 |
1 |
Axe A |
97 -143 |
- |
1 |
Ykf D |
88 -113 |
2 |
4 (3 d'un aa) |
Ped A |
88 - 113 |
2 |
4 (d'un aa) |
Kev C |
88 - 113 |
2 |
1 (d'un aa) |
ANÀLISI
DE L’ESTRUCTURA SECUNDÀRIA DEL LOOP
Un
dels punts dubtosos del loop en els diferents models era que apareixien
diferents estructures secundàries de pocs residus insertades, diferents per
cada model. De manera que es van utilitzar programes de predicció d’estructura
secundària per veure si aquesta regió corresponia a un loop o a alguna
estructura secundària concreta.
PSI-PRED:
indica que la regió del residu 88 al 139 ha de ser un loop (psipred)
PREDICT PROTEIN:
prediu que la regió del residu 89 al 126 ha de ser un loop (predprotloop)
Per
comprovar si els resultats eren fiables, es van utilitzar els mateixos
programes per predir l’estructura secundària dels templates en la regió del
loop:
TEMPLATE |
PDB |
PRED PROT |
PSI-PRED |
Ht0 B |
a1 ;
b1 |
a0
; b4 |
a0
; b2 |
Axe A |
a0
; b1 |
a0
; b2 |
a0
; b2 |
Ykf D |
a2
; b4 |
a0
; b3 |
a0
; b3 |
Ped A |
a2
; b4 |
a0
; b3 |
a1
; b4 |
Kev C |
a2
; b1 |
a0
; b3 |
a1
; b4 |
Com
no van donar els mateixos resultats que la cristal·lografia, es va concloure
que la predicció d’un loop en aquesta
regió per la proteïna problema no era fiable (fiabilitat del 70%). Degut a això
es van seguir altres estratègies per veure quina estructura tenia el loop.
ANÀLISI DE LA FUNCIÓ DEL LOOP
Per
tal de veure si el loop pertanyia a un domini funcional determinat amb
estructura coneguda, com per exemple domini d’unió a zinc o a cofactor. Es va analitzar
aquesta seqüència en diferents bases de dades de dominis funcionals de
proteïnes:
En cap de les bases de dades consultades es relacionà el loop amb un domini
funcional, és a dir, aquesta regió no corresponia a cap dels dominis coneguts
de les ADHs. Per tant, per aquest mètode tampoc es podia suggerir cap
estructura secundària per al loop 90-130.
CLASSIFICACIÓ DEL LOOP AMB EL PROGRAMA ARCHTYPE
Es
va fer servir aquest programa per classificar el loop, però, com el loop 90-130
té 40 residus i el màxim de residus que pot analitzar el programa és sis,
finalment no es va obtenir cap resultat.
MODELATGE DEL LOOP
Degut
als resultats obtinguts en els anàlisis anteriors s’optà per modelar el loop
amb l’estructura del millor template en aquesta regió.
Es va obtenir un arbre filogenètic a partir
d’un alineament CLUSTALW de totes les
seqüències de la regió del loop, per visualitzar quin era l’homòleg més proper
en aquesta zona. En aquest apareixien
dos clusters: un de les bactèries i
l’altre dels mamífers. La proteïna ALCEU sortia més propera al cluster de les
bactèries com era d’esperar. (loopnj)
Per determinar quin era el millor template es
van realitzar alineaments de la regió del loop amb CLUSTALW
de la proteïna problema contra cadascun dels templates (clustalw en parelles)
utilitzant dos programes clustalw diferents (www.edi.ac.uk/clustalw i http://clustalw.genomic.ad.jp)
Es
van comptar i comparar el número de residus idèntics (*), molt semblants (:) i semblants
(.). Els resultats van ser que les bactèries kevC i pedA tenien el màxim score
i la següent era ht0B.
Per
escollir entre les dues bactèries es va fer:
1.- un STAMP
dels seus PDBs i es va comprovar que tenien un alt grau d’homologia, ja què són
dues ADH del mateix organisme.
2.- amb l’SCOP es van determinar les seves característiques:
kev estava acomplexada amb NADP i ZN, i ped només amb ZN.
Després
d’aquest anàlisi, s’escollí KevC com a millor homòleg, ja que tenia la millor
puntuació i estava cristal·litzada amb els mateixos cofactors que ALCEU
utilitza en la seva activitat catalítica.
Degut
a que el KevC i el pedA són iguals excepte en els cofactors amb els que estan
cristal·litzats, es va decidir eliminar el pedA del nou modelatge a fer. Tot i
això, no s’observaren diferències estructurals al superposar-les amb l’STAMP, per tant, es va concloure que el NAD és
necessari per fer la funció però no influencia molt l’estructura de la
proteïna. Per aquesta raó, no hi havia problemes en barrejar templates
acomplexats amb NAD o no al fer el modelatge.
Un cop s’havia fet el perfil filogenètic i
l’alineament per homologia, es va decidir modelar la regió del loop amb kevC i
ht0B. L’estratègia a seguir va ser:
-
Fer un CLUSTALW
dels templates amb la seqüència sencera.
-
Posar gaps a la regió 90-130 en tots ells excepte
al pdb escollit com a model: per un model serà kevC (kevcaln)
i per l’altre ht0B (ht0baln).
-
Aleshores es van modificar tots els pdbs abans de
córrer el programa MODELLER.
-
Es va analitzar l’energia dels models obtinguts
segons l’alineament basat en kevC i en ht0B amb el programa PROSA.
-
Finalment es van visualitzar les estructures
secundàries dels models a la regió 90-130 amb el programa RASMOL.
Els
millors models resultants, tant usant ht0B com kevC, tenien energia positiva i
estructures secundàries en la regió del loop. En el millor model usant ht0B
l’energia era de 0.25 i es trobaren 2 b,
i en el model usant kevC, l’energia era de 0.4 i hi havia 2 a i 3 b.
Com
no s’aconseguí l’objectiu de disminuir l’energia del model en la regió del loop
(sessionalhk.cmd) es van provar altres
estratègies per a obtenir valors negatius en la regió conflictiva.
MODEL NOMÉS AMB BACTÈRIES
L’energia
dels templates de bactèries era menor que la dels mamífers en la regió del
loop, per això es va provar una altra estratègia que consistia en fer un model de
ALCEU utilitzant com a templates només els pbds de les bactèries (kevC, pedA i
ykfD):
-
Fer un STAMP dels
templates de bactèria.
-
Fer un perfil HMMER
de les ADH bacterianes i llençar-lo contra la seqüència ALCEU (bact.aln).
-
Córrer el programa MODELLER
per obtindre els models estructurals.
-
Analitzar l’energia dels models obtinguts amb el
programa PROSA (sessionalb.cmd).
Com
tots els models tenien energia positiva es va desestimar la opció de modelar
ALCEU només amb bactèries.
MODEL NOMÉS AMB HUMÀ
També
es va intentar modelar la proteïna ALCEU només a partir del pdb humà (ht0B),
perquè era la següent seqüència més homòloga a ALCEU després de les bactèries
kevC i pedA:
-
Fer un CLUSTALW
del template humà amb la seqüència ALCEU.
-
No es podia fer servir HMMER perquè amb una sola
seqüència no es pot fer un perfil de les ADHs.
-
Córrer el programa MODELLER.
-
Analitzar l’energia dels models obtinguts segons
l’alineament basat en kevC i en ht0B amb el programa PROSA (sessionalht0.cmd).
-
Finalment es van visualitzar les estructures
secundàries dels models a la regió 90-130 amb el programa RASMOL.
Amb
aquesta estratègia tots els models seguien tenint energia positiva, per tant
tampoc s’havia aconseguit l’objectiu marcat.
CONCLUSIÓ
Com
cap de les estratègies anteriors van funcionar per a disminuir l’energia del
loop a valors negatiu, es decidí tornar a fer els models amb tots els templates
excepte la bactèria pedA, per tal de no desviar el modelatge cap a l’estructura
comú entre les bactèries pedA i kevC, ja que aquestes són del mateix organisme
i altament homòlogues.
L’única
solució que quedava per tal de disminuir aquest pic d’energia era
l’optimització del model amb el programa GRUMOS (
veure l’apartat OPTIMITZACIO).