Metodología del modelado

                      Estrategia 2

Se realizó una segunda búsqueda de posibles templates En este caso, también se hizo una búsqueda de homólogos en la base de datos del PDB, pero esta vez partiendo de una matriz construida con todas las proteínas que la base de datos PFAM utiliza para caracterizar la familia (Tabla 2).

 
Scores for complete sequences (score includes all domains):
Sequence        Description                                           Score    E-value  N 

pdb|1BJ5|1BJ5   human serum albuminbiological_unit  842.6   5.1e-250   3
pdb|1BKE|1BKE   serum albuminbiological_unit         842.6   5.1e-250   3
pdb|1E7C|1E7C-A serum albumin                              842.6   5.1e-250   3
pdb|1E7E|1E7E-A serum albumin                               842.6   5.1e-250   3
pdb|1E7F|1E7F-A serum albumin                               842.6   5.1e-250   3
pdb|1E7G|1E7G-A serum albumin                              842.6   5.1e-250   3
pdb|1E7H|1E7H-A serum albumin                              842.6   5.1e-250   3
pdb|1E7I|1E7I-A serum albumin                                 842.6   5.1e-250   3
pdb|1GNI|1GNI-A serum albumin                              842.6   5.1e-250   3
pdb|1GNJ|1GNJ-A serum albumin                              842.6   5.1e-250   3
pdb|1H9Z|1H9Z-A serum albumin(hsa)                       842.6   5.1e-250   3
pdb|1HA2|1HA2-A serum albumin(hsa)                      842.6   5.1e-250   3
pdb|1UOR|1UOR   serum albumin                              842.6   5.1e-250   3
pdb|1AO6|1AO6-A serum albumin                             835.9   5.6e-248   3
pdb|1BM0|1BM0-A serum albumin                            835.9   5.6e-248   3
pdb|1E78|1E78-A serum albumin                                835.9   5.6e-248   3
pdb|1E7A|1E7A-A serum albumin                              835.9   5.6e-248   3
pdb|1E7B|1E7B-A serum albumin                               835.9   5.6e-248   3
pdb|1E7B|1E7B-B serum albumin                               835.9   5.6e-248   3
pdb|1J78|1J78-B vitamin d binding protein                  375.4   2.3e-109   2
pdb|1J7E|1J7E-B vitamin d binding protein                  375.4   2.3e-109   2
pdb|1J78|1J78-A vitamin d binding protein                  339.2    1.9e-98   2
pdb|1J7E|1J7E-A vitamin d binding protein                  334.8    3.9e-97   2
 

                                                          Tabla 2. Resultados búsqueda PDB

En este caso apareció la  proteína de unión a la vitamina D (1J78, 1J7E). La secuencia original que se intentaba modelar era la del precursor de la DBP, por lo que se pensó que estas secuencias serían buenos templates.

El alineamiento de esta secuencia con las obtenidas por la búsqueda fue realizado mediante el programa CLUSTALW. Se observó que la única zona no homóloga eran los primeros 17 aminoácidos, que no aparecen en la forma madura de DBP al tratarse de una secuencia señal. Por este motivo, esta región fue cortada, por lo que la secuencia problema y los templates quedaron con una homología del 100%, a excepción de un gap de 7 aminoácidos (96-102) que se corresponde con una región no resuelta de la estructura cristalográfica.

La DBP está formada por 2 cadenas, DBPA y DBPB, que no son totalmente idénticas entre si (rmsd entre A y B:1.73). Se descartó el uso de la cadena A porque en el alineamiento secuencial se observaba un gap más.

En el caso de las cadenas A, se observó que una de ellas había sido cristalizada acomplejada con vitamina D y la otra no. Se realizó, entonces, un alineamiento mediante el programa XAM  y posterior visualización con RASMOL, para comprobar si la unión de la vitamina D provocaba un cambio de conformación en la molécula de DBP, en especial en el dominio I por ser la zona de unión a la vitamina D, pero no se observa ningún cambio apreciable de conformación (Fig 6); se demostró numéricamente calculando el la desviación rms de las dos cadenas obteniéndose un valor de 0.52 Å,muy parecido al existente entre las cadenas B (rmsd:0.59 Å), ambas unidas a vitamina D.
 


Fig 6. Superposición subdominio Ia de cadenas A


El paso siguiente fue  modelar la proteína problema, utilizándose como templates las cadenas B de 1J78 y 1J7E de estructura cristalográfica conocida, aún cuando la secuencia problema y la secuencia de los templates son idénticas. El modelado se realizó mediante el programa MODELLER, basado en restricciones de distancias extraídas del alineamiento múltiple de las secuencias. El modelo resultante fue analizado energéticamente con los programas PROSAII y PROCHECK. Los resultados, como era de esperar, eran muy favorables. Así, un 94.7% de los aminoácidos están situados en el core y no hay ningún mal contacto entre cadenas laterales.
 

En la estructura cristalográfica de los templates, hay una zona, desde el aminoácido 96 al 102, que no se ha resuelto su estructura, por lo que en el modelo aparece como un loop. Se intentó modelar esta zona con el programa ARCH TYPE que utiliza una base de datos de loops de  estructura determinada. Pero no fue posible, ya que no coincidía con ninguno de los determinados en la base de datos.



Se decidió optimizar el modelo mediante el programa GROMOS . El modelo optimizado obtenido se analizó también energéticamente mediante PROSAII y PROCHECK (resultados) Aunque el porcentaje de los aminoáciods en el core es algo menor (89.1%), la energía global del sistema ha disminuído ligeramente, partiendose de un valor inicial de -0.27E+5, se alcanzó el valor de -0.29E+5.

El análisis comparativo del perfil de pseudo-energías del template, modelo sin optimizar y optimizado muestra que es idéntico (Fig 7). No se observan zonas de mala energía, aunque la zona N-terminal, que se corresponde con el dominio de unión a la vitamina D, tiene energía algo superior al resto.
 
 

Fig 7. Resultados PROSA. En rojo,template (1J78) en amarillo, modelo optimizado y en cian, modelo no optimizado.

El cálculo de la desviación rms entre el template y el modelo obtenido es de  0.69 Å, lo que evidencia que no existe diferencia estructural  entre ambas. No hay que obviar que ambas son la misma proteína.


Dinámica Molecular:
 

En la estructura de los templates había un gap (aminoácidos 96-102), que en el modelo aparece como un loop. Se realizó la dinámica molecular del sistema mediante el programa GROMOS, para ver la movilidad de la molécula y, en especial, de la región correspondiente al gap.

El loop está entre las hélices 5 y 6 del dominio I, concretamente entre las cisteínas 93 y  104, que forman un puente disulfuro entre sí; este hecho provoca que los extremos del loop tengan muy poca movilidad, pudiéndose mover libremente el centro. Analizando la secuencia de esta zona se observa que está formada fundamentalmente por aminoácidos cargados; concretamente hay una lisina (carga +) y un ácido glutámico (carga -) seguidas y separadas por una glicina y una leucina de otro ácido glutámico, una lisina y un arginina (Fig 8).

Fig 8. Loop correspondiente a la región 96-102 (en verde aa con carga positiva, en azul los negativos)

 
Por tanto, se forman claramente dos dipolos con sus cargas negativas orientadas hacia el centro del loop, por lo que estarán en continuo movimiento; este hecho se agudiza por la presencia del solvente.El valor del B-factor no  es muy elevado; este hecho puede ser debido a que la dinámica se ha realizado en un medio sin agua, que es donde los dipolos tendrían más fuerza y, por tanto, más movimiento (Fig 9).
Fig 9. Dinámica molecular de la región 96-102 (en azul aa con carga negativa)

 
 
 
 
 

   Home | Abstract | Características estructurales | Metodología 1 | Conclusiones | Bibliografía