Pràctica 4.2- Superposició d'estructures II (STAMP)
Pràctiques de Biologia Estructural- Carlos Masdeu Ávila- Nia=16965
<<                                                    >>

1-Introducció

        A l'altre apartat d'aquesta pràctica hem utilitzat XAM, al qual nosaltres li dèiem el rang de la seqüència en el que voliem aliniar i ell calculava un valor de RMS, generant una superposició 'manual'.

        Ara utitilitzarem STAMP, al qual, generes una llista de .pdb's i a partir d'aquí, ell sol genera una superposició automàticament, donant un valor de RMS així com un fitxer .pdb que conté l'alineament estructural.

       STAMP es basa en l'aliniament de Needleman-Wunch per a calcular les distàncies euclídees (es a dir, utilitza una mesura derivada de la separació geomètrico espacial) i a partir d'aquí crea un terme phi, dependent de les distàncies entre residus (generalment, c-alpha). Així, mitjançant la programació dinàmica, trobem el recorregut d'alineament estructural que inclou menys distància intermolecular.

Utilitzarem un altre shell per cridarlo, tcsh, amb el source contingut a disc9/cshrc. (Nota, això és vàlid per a totes les pràctiques d'aquí endavant)

Superposició de les estructures de globines

       Utilitzarem el fitxer de globines /disc9/practica_4/STAMP/EXAMPLES/globin.tar , dintre del qual hi ha 6 pdb's de globines, les quals superposarem a aquesta pràctica.

       Perquè STAMP generi l'aliniament, li hem de donar com a input un arxiu que contingui la ruta que ha de seguir per trobar cada estructura, seguida del nom del domini que volem que hi posi, i les cadenes que volem que alinïi. Per exemple,

./1ecd.pdb 1ecd {ALL}
./2hhba.pdb 2hhba { CHAIN A }
./2lhb.pdb 2lhb {ALL}
./1lh1.pdb 1lh1 {ALL}
./2hhbb.pdb 2hhbb { CHAIN B }
./4mbn.pdb 4mbn {ALL}

La comanda per cridar-lo és:

stamp -l <nom del fitxer on tinguem les dades anteriors> -rough -n 2 -prefix <nom que vulguem que tinguin els outputs>

stamp -l globin.domains -rough -n 2 -prefix globin

 

    Un cop el executem, crea un output per pantalla, així com un arxiu a cada pas de la superposició. Al final del procés ens genera, en aquest cas, globin.5, que té aquesta estructura, on apareix el aliniament vertical, seguit d'una sèrie de nombres:

LLLLLL ?????? 1 0.47136 1.87884 6.86900
TSSSST ?????? 1 0.51131 1.98002 7.43400
EAAEPP ?????? 1 0.57134 1.87560 8.28300
SADGAE ?????? 1 0.62733 1.77793 9.07500
QEQEDE ?????? 1 0.72031 1.61036 10.39000
AKIWKK ?????? 1 0.77030 1.49654 11.09700
ATSQTS ?????? 1 0.77334 1.48061 11.14000
LKTLNA ?????? 1 0.82835 1.32055 11.91800
VIVVVV ?????? 1 0.87134 1.18370 12.52600
KRQLKT ?????? 1 0.84836 1.24879 12.20100
SSAHAA ?????? 1 0.82135 1.29528 11.81900
SASVAL ?????? 1 0.85635 1.16239 12.31400
WWFWWW ?????? 1 0.85232 1.16346 12.25700

       No obstant, vist així no és gaire informatiu; Hi ha un script que permet passar tota aquesta informació a un format més comprensible per a humans. Es tracta d' aconvertMod2.pl:

aconvertMod2.pl -in b -out c < globin.5 (En aquest cas, el output serà en format clustal)

TRANSFORM

        És un programa que ve junt amb STAMP i que permet, entrant un output d'STAMP (p.ex: globin.5), treure un output en .pdb per a posterior anàlisis gràfic de l'aliniament.

transform -f globin.5 -g -o globin5.pdb

Aquest fitxer podem veure'el en RasMol, i exportar-lo com a arxiu gràfic :

           Cadascuna de les estructures superposades ha estat marcada amb un color diferent. Es pot apreciar com l'estructura és molt més ben conservada a les regions que contenen hèlix que als coils, fet que demostra la hipòtesi de que aquelles regions amb una funció determinada tendeixen a conservar-se molt més en l'evolució degut al fenomen de la selecció negativa dels mutants.

 

Comparació d'alineaments estructura-seqüència

       Finalment, compararem l'aliniament estructural que acabem de realitzar amb un aliniament múltiple de seqüències de les mateixes estructures. Per fer-ho, abans hem de realitzar aquest aliniament:

-En primer lloc, utilitzem PDBtoSplitChain sobre les 6 globines per obtenir les seves seqüències en format FASTA.
-Concatenem aquestes seqüències en un sol fitxer
-cridem clustalw, i utilitzem aquest fitxer com a input. Ens generarà globins.aln

      Ja tenim tots dos alineaments en format clustal, globins.aln (aliniat per seqüència) i globins.stamp (aliniat per estructura). Si ens fixem, tot i que l'aliniament global s'assembla bastant, la diferència principal entre tots dos és que en l'aliniament per estructura, totes les seqüències conserven un patró de gaps molt més semblant que en el aliniament per seqüència, tot i que en aquest últim trobem que hi ha molts més casos en els que trobem el mateix aminoàcid en la mateixa posició (tret d'alguna histidina determinada que es manté molt conservada en la posició en l'aliniament estructural, cosa que ja ens fa pensar en la seva importància funcional).

       La explicació a aquests fets és que les molècules evolucionen sobretot per la seva funció, i qualsevol sèrie de canvis que pugui produir-se en un determinat aminoàcid, sempre tendirà a conservar abans la funció que la seqüència. D'aquesta manera, trobem que quan alguna de les seqüències ha tingut una inserció, això es reflexa en l'aliniament estructural en la forma en que tota la resta de les seqüències tenen un gap (en bloc). Si a aquestes mateixes seqüències les aliniessim, els algoritmes d'aliniament mai podrien arribar a filar-ho tant prim, ja que les matrius de puntuacions no són capaces de reflexar els canvis que es produeixen a totes les proteïnes. Només ens donen el millor acostament estadístic al seu abast.


<<                                                    >>