ANÀLISI DEL LOOP 90-130

 

 

 

REGIÓ DEL LOOP EN ELS TEMPLATES

 

 

TEMPLATE

RESIDUS

HELIX a

CADENES b

Ht0 B

97-143

1

1

Axe A

97 -143

-

1

Ykf D

88 -113

2

4 (3 d'un aa)

Ped A

88 - 113

2

4 (d'un aa)

Kev C

88 - 113

2

1 (d'un aa)

 

 

 

 

ANÀLISI DE L’ESTRUCTURA SECUNDÀRIA DEL LOOP

 

 

Un dels punts dubtosos del loop en els diferents models era que apareixien diferents estructures secundàries de pocs residus insertades, diferents per cada model. De manera que es van utilitzar programes de predicció d’estructura secundària per veure si aquesta regió corresponia a un loop o a alguna estructura secundària concreta.

 

 * PSI-PRED: indica que la regió del residu 88 al 139 ha de ser un loop (psipred)

 * PREDICT PROTEIN: prediu que la regió del residu 89 al 126 ha de ser un loop (predprotloop)

 

Per comprovar si els resultats eren fiables, es van utilitzar els mateixos programes per predir l’estructura secundària dels templates en la regió del loop:

 

TEMPLATE

PDB

PRED PROT

PSI-PRED

Ht0 B

 a1  ;  b1

  a0  ;  b4

  a0  ;  b2

Axe A

  a0  ;  b1

  a0  ;  b2

  a0  ;  b2

Ykf D

  a2  ;  b4

  a0  ;  b3

  a0  ;  b3

Ped A

  a2  ;  b4

  a0  ;  b3

  a1  ;  b4

Kev C

  a2  ;  b1

  a0  ;  b3

  a1  ;  b4

 

 

Com no van donar els mateixos resultats que la cristal·lografia, es va concloure que  la predicció d’un loop en aquesta regió per la proteïna problema no era fiable (fiabilitat del 70%). Degut a això es van seguir altres estratègies per veure quina estructura tenia el loop.

 

 

 

ANÀLISI DE LA FUNCIÓ DEL LOOP

 

 

Per tal de veure si el loop pertanyia a un domini funcional determinat amb estructura coneguda, com per exemple domini d’unió a zinc o a cofactor. Es va analitzar aquesta seqüència en diferents bases de dades de dominis funcionals de proteïnes:

 

 * PROSITE

 * PFAM

 * PRODOM

 * INTERPRO

 * GO

 
En cap de les bases de dades consultades es relacionà el loop amb un domini funcional, és a dir, aquesta regió no corresponia a cap dels dominis coneguts de les ADHs. Per tant, per aquest mètode tampoc es podia suggerir cap estructura secundària per al loop 90-130.

 

 

 

CLASSIFICACIÓ DEL LOOP AMB EL PROGRAMA ARCHTYPE

 

 

Es va fer servir aquest programa per classificar el loop, però, com el loop 90-130 té 40 residus i el màxim de residus que pot analitzar el programa és sis, finalment no es va obtenir cap resultat.

 

 

 

MODELATGE DEL LOOP

 

 

Degut als resultats obtinguts en els anàlisis anteriors s’optà per modelar el loop amb l’estructura del millor template en aquesta regió.

  

  * Es va obtenir un arbre filogenètic a partir d’un alineament CLUSTALW de totes les seqüències de la regió del loop, per visualitzar quin era l’homòleg més proper en aquesta zona.  En aquest apareixien dos clusters: un de les bactèries  i l’altre dels mamífers. La proteïna ALCEU sortia més propera al cluster de les bactèries com era d’esperar. (loopnj)

      

  * Per determinar quin era el millor template es van realitzar alineaments de la regió del loop amb CLUSTALW de la proteïna problema contra cadascun dels templates (clustalw en parelles) utilitzant dos programes clustalw diferents (www.edi.ac.uk/clustalw i   http://clustalw.genomic.ad.jp)

Es van comptar i comparar el número de residus idèntics (*), molt semblants (:) i semblants (.). Els resultats van ser que les bactèries kevC i pedA tenien el màxim score i la següent era ht0B.

     

Per escollir entre les dues bactèries es va fer:

            1.- un STAMP dels seus PDBs i es va comprovar que tenien un alt grau d’homologia, ja què són dues ADH del mateix organisme.

            2.- amb l’SCOP es van determinar les seves característiques: kev estava acomplexada amb NADP i ZN, i ped només amb ZN.

      

Després d’aquest anàlisi, s’escollí KevC com a millor homòleg, ja que tenia la millor puntuació i estava cristal·litzada amb els mateixos cofactors que ALCEU utilitza en la seva activitat catalítica.

Degut a que el KevC i el pedA són iguals excepte en els cofactors amb els que estan cristal·litzats, es va decidir eliminar el pedA del nou modelatge a fer. Tot i això, no s’observaren diferències estructurals al superposar-les amb l’STAMP, per tant, es va concloure que el NAD és necessari per fer la funció però no influencia molt l’estructura de la proteïna. Per aquesta raó, no hi havia problemes en barrejar templates acomplexats amb NAD o no al fer el modelatge.

 

  * Un cop s’havia fet el perfil filogenètic i l’alineament per homologia, es va decidir modelar la regió del loop amb kevC i ht0B. L’estratègia a seguir va ser:

  

-          Fer un CLUSTALW dels templates amb la seqüència sencera.  

-          Posar gaps a la regió 90-130 en tots ells excepte al pdb escollit com a model: per un model serà kevC (kevcaln) i per l’altre ht0B (ht0baln).

-          Aleshores es van modificar tots els pdbs abans de córrer el programa MODELLER.

-          Es va analitzar l’energia dels models obtinguts segons l’alineament basat en kevC i en ht0B amb el programa PROSA.

-          Finalment es van visualitzar les estructures secundàries dels models a la regió 90-130 amb el programa RASMOL.

 

Els millors models resultants, tant usant ht0B com kevC, tenien energia positiva i estructures secundàries en la regió del loop. En el millor model usant ht0B l’energia era de 0.25 i es trobaren 2 b, i en el model usant kevC, l’energia era de 0.4 i hi havia 2 a i 3 b.

 

Com no s’aconseguí l’objectiu de disminuir l’energia del model en la regió del loop (sessionalhk.cmd) es van provar altres estratègies per a obtenir valors negatius en la regió conflictiva.

 

 

MODEL NOMÉS AMB BACTÈRIES

 

L’energia dels templates de bactèries era menor que la dels mamífers en la regió del loop, per això es va provar una altra estratègia que consistia en fer un model de ALCEU utilitzant com a templates només els pbds de les bactèries (kevC, pedA i ykfD):

 

-          Fer un STAMP dels templates de bactèria.

-          Fer un perfil HMMER de les ADH bacterianes i llençar-lo contra la seqüència ALCEU (bact.aln).  

-          Córrer el programa MODELLER per obtindre els models estructurals.

-          Analitzar l’energia dels models obtinguts amb el programa PROSA (sessionalb.cmd).

 

Com tots els models tenien energia positiva es va desestimar la opció de modelar ALCEU només amb bactèries.

 

 

MODEL NOMÉS AMB HUMÀ

 

 

També es va intentar modelar la proteïna ALCEU només a partir del pdb humà (ht0B), perquè era la següent seqüència més homòloga a ALCEU després de les bactèries kevC i pedA:

 

-          Fer un CLUSTALW del template humà amb la seqüència ALCEU.

-          No es podia fer servir HMMER perquè amb una sola seqüència no es pot fer un perfil de les ADHs.

-          Córrer el programa MODELLER.

-          Analitzar l’energia dels models obtinguts segons l’alineament basat en kevC i en ht0B amb el programa PROSA (sessionalht0.cmd).

-          Finalment es van visualitzar les estructures secundàries dels models a la regió 90-130 amb el programa RASMOL.

 

Amb aquesta estratègia tots els models seguien tenint energia positiva, per tant tampoc s’havia aconseguit l’objectiu marcat.

 

 

 

CONCLUSIÓ

 

 

Com cap de les estratègies anteriors van funcionar per a disminuir l’energia del loop a valors negatiu, es decidí tornar a fer els models amb tots els templates excepte la bactèria pedA, per tal de no desviar el modelatge cap a l’estructura comú entre les bactèries pedA i kevC, ja que aquestes són del mateix organisme i altament homòlogues.

L’única solució que quedava per tal de disminuir aquest pic d’energia era l’optimització del model amb el programa GRUMOS ( veure l’apartat OPTIMITZACIO).