Pràctica 6

OBJECTIUS
Validació i identificació de regions mal modelades del model de subtilisina de la pràctica 5. Arreglar l’aliniament amb la predicció d’estructura secundària i mirar de millorar els models.


Pràctica 6.1

PROCHECK
Analitzarem el model mitjançant PROCHECK. L'objetiu de Procheck és valorar la 'calitat estereoquímica' de l'estructura de la proteïna donada, comparant amb estructures ben refinades a la mateixa resolució, i dona una indicació de la fiabilitat de cada residu. Per a fer aquesta valoració, el programa utilitza diferents paràmetres. Sobretot, el paràmetre que nosaltres mirarem serà el plot de Ramachandran mirant els angles phi-psi.

Hem de mirar la resolució mes alta (per tant, pitjor resolució) dels pdb's utilitzats al fer el model.

utilitzarem la resolució de 2.0

execució:
   $ procheck_single model1.hmm 2.0
Obtenim els arxius .ps
Podrem visualitzar aquests arxius mitjançant el programa Ghostview. Podrem visualitzar els mapes de Ramachandran de tots quatre models, visualitzant els arxius: model1.hmm_01.ps, model1.clu_01.ps, model2.clu_01.ps, model2.hmm_01.ps.
No puc extreure conclusions clares dels resultats observats al mapa de Ramachandran, ja que els mapes dels quatre models son molt similars, amb petites variacions, i en tots els casos el percentatge de residus dins de les regions favorables (Residues in most favoured regions) i dins de les regions permeses (Residues in additional allowed regions) ,supera el 90%. Només podem veure, que els segons models (tant de HMM com de Clustalw) tenen un resultat més favorable.
Haurem d'esperar a fer l'anàlisis amb Prosa, per concluir quin es el millor model.

DSSP
El programa DSSP defineix l'estructura secondària, les característiques geomètriques i l'exposició de les proteïnes al solvent, donant les coordenades atomiques en format PDB. El programa no fa una predicció de l'estructura secondària.
El fitxer d'Input haurà de ser el pdb amb les coordenades atòmiques. Obtenim el fitxer model2.hmm.cut.dssp.
   $ dssp P11018.B99990001 model.hmm.cut.dssp

ALISS
L'estructura obtingua de DSSP, la podem transformar. ALISS (Alingment Independent Similarity Searcher) detecta eficaçment similituts locals entre dos proteïnes. El fitxer obtingut tindrà un format més similar a Clustalw

Pràctica 6.2

ProsaII
Prosa ens ajudara a analitzar si el nostre model és correcte. Prosa calcula un score (Z-score) del nostre model. El score indicarà la calitat de l'estructura. Els scores dels plegaments de les estructures natives tenen uns rangs característics. Si l'score obtingut està fora del rang, llavors l'estructura pot tenir problemes.
Amb Prosa podem obtenir gràfiques d'energia del model, que ens ajudarà en l'anàlisis de les diferents regions. Aquests gràfics mostren la arquitectura energètica del plegament de la proteïna en funció de la posició dels aminoàcids en la seqüència. Utilitza la inversa de la llei de Boltzmann per obtenir energies. Si observem altes energies a la gràfica, podem deduir que es troba d'una secció massa 'forçada' que pot indicar una part problemàtica en el plegament. D'aquesta forma podem millorar el model.
Prosa analitza el model mitjançant els potencial estadístics. A partir de les distancies entre cada aminoàcid, conta la probabilitat de que dos aminoàcids es trobin a una distancia concreta en l'espai.
execució:
Per tal d'executar el prosa, i veure un gràfic amb els 4 models, he realitzat un script de l'execució:prosa.ss
   $ prosa -s prosa.ss
Obtenim aquest gràfic:prosa

Analitzant la gràfica, podem observar que el model obtingut no sería massa correcte. Apareixen dos pics de energia positiva, que podríen correspondre a les zones de gaps observats al alineament inicial de Clustalw.
A més, la línia que correspondria al model2.hmm (línia vermella), és la que en una de les zones sobrepassa més ampliament el 0. En teoria, aquest model hauria de ser el més correcte, però no és així. Una posible explicació podria ser que al haber tanta homoloiía entre les seqüències, l'alineament entre seqüències sería més correcte que l'alineament estructural. Però en el meu cas, no hauria de ser així, per que tal i com he explicat a la practica 5, les proteïnes que he escollit per a realitzar els models no són de les que major homologia presentaven.
Finalment, he decidit tornar a fer el model. Mirant l'alineament de Clustalw, observem dos zones de (
gaps) que podríen ser eliminades si treíessim la seqüència 1svn. Tornare a realitzar la Practica 5 , però sense utilitzar aquesta proteïna com a template.

Anàlisis del nou model:

Procheck:
model1.hmm_01.ps
model1.clu_01.ps
model2.clu_01.ps
model2.hmm_01.ps
Els resultats del plot de Ramachandran es similar al del anterior model. En alguns casos podríem dir que el nou model seria pitjor. Però encara no podem arribar a cap conclusió, sense realitzar el Prosa.

Prosa:
Grafic de Prosa del nou model.

Al analitzar Prosa, sembla ser que inclús després de tallar, el millor model es el blau (model2.hmm.cut). Però encara te una zona en N-term en la que s'observa un petit pic en el que la E es positiva. Al observar l'alineament sembla ser que pot coincidir amb una zona en la que en l'alineament (hmm.ali) hi ha gaps. Fem un Stamp de una de les estructures templates amb el model model2.hmm.cut.
Podem veure la imatge de la superposició : prueba1pdb. En aquest imatge estan assenyalats els àtoms dels que hem fet referència.
Amb aquesta superposició podrem observar les diferències entre la template i el model. Observem dos zones de loops, que són més llargues en el model. Això produeix que els loops estiguin més a prop en el model. Si mirem els atoms dels loops del model, que estan més a prop veiem que son: GLU 122 - ASP 72, els dos tenen càrrega negativa. Si tenen igual càrrega i estan tant a prop, la energia que observem a Prosa, serà positiva. La distància a la que es troben és: 14'470 A.
Possiblement el pic d'energia positiva que s'observa, vingui donada per aquest fet.


Pràctica 6.3

GROMOS
GROMOS és un programa que serveix per a realitzar el que anomenem optimització geomètrica. Per a optimitzar un model cal buscar els mínims energètics (valls). Hi ha varis factors a tenir en compte: la distància d'interacció, l'angle d'enllaç, el diedre,(components enllaçants), i les forces de Van der Waals i interaccions electroestàtiques, (components no enllaçants). Si tenim en compte tot això, obtenim l'equació del camp de forces, que ho ajunta tot i permet que si l'optimitzem millori l'energia del model.
Correccions: Al generar el model creem torsions, tensions i altres desajusts per tal de que la seqüència problema s'ajusti als templates. Aquests forçaments són el que prosa, procheck, etc... ens mostra i és precisament això el que cal corregir.
Per a familiaritzar-nos amb GRUMOS, hem fet l'exemple: pci.pdb.

Avaluació del model
En el model ja havíem afegit la terminació TER i OXT, necessaris per a l'execució de GRUMOS. Fem els passos previs per a l'execució de GRUMOS:
Canviem el nom del model model2.hmm.cut a model2.hmm.pdb
   $ cp model2.hmm.cut model2.hmm.pdb
Executem arrangeG
   $arrangeG.pl modelo.pdb modeloG.pdb
   $arrangeG.pl model2.hmm.pdb model2G.hmm.pdb
Afegim el TER ( ja que l'arrangeG, ens el treu)
Mirem amb Rasmol si existeixen ponts disulfurs:
    select cys
    color CPK
    pick distance
Les dos cïsteines trobades es troben a més de 4A, i per tant no podran formar ponts disulfur
    Atom #1: CYS35.CA (256)
    Atom #2: CYS157.CA (1137)
    Distance CYS35.CA-CYS157.CA: 17.505

Executem Grumos

Mirem:
energia inicial: 0.12119E+10
energia final: -0.15359E+05 : model2G.hmmxemnum010.gsf

XAMinicial i final(factor multiplicació 10):
Utilitzem el xam per fer la superposició d'estructura del model que teníem abans d'executar Grumos(model2G.hmm.pdb) i el que ens ha sortit de la optimització (model2G.hmmxemnum010.gsf ) D'aquesta forma aconseguim veure la superposició ( i per tant, veure les diferencies) i convertir model2G.hmmxemnum010.gsf a pdb
El pdb q obtenim de la superposició [modelfin.pdb ], hem d'esborrar la primera part (que correspondrà al pdb q teniem abans de grumos- model2G.hmm.pdb). Podem veure una imatge de la superposició: superposició . El nou pdb el guardo com a model.final.pdb.
Podem veure una imatge del model final: model.final
rms superposició (rms del arxiu modelfina). El valor del Procheck, no sembla massa correcte, i ens porta a dubtar de la correcció de la superposició.

PROCHECK
Realitzem un procheck del nou model, per comparar amb el model sense optimitzar:
model.final_01.ps
model2.hmm_01.ps
Podem veure, com clarament, els valors que s’ obtenen després de l’ optimizació, son pitjors que els del model previ. Això pot ser degut a que en la optimizació s’han produït canvis en aminoàcids que produeixen aquests resultats.


Index