Pràctica 5.3- Modelat de seqüències III: Construcció del model
Pràctiques de Biologia Estructural- Carlos Masdeu Ávila- Nia=16965
<<                                                    >>

1-Introducció

        A 5.1 i 5.2 hem obtingut un alineament en el qual feiem correspondència dels aa i veiem si estaven conservats, etc... també vèiem si havien insercions i delecions.   Ara construirem un model utilitzant aquests alineaments.
      

Ara que ja tenim dos alineaments de les seqüències, construirem un model per a cadascun:
listapD.aln (Clustalw)
listapFhmm.alh (STAMP i hmm)

Primer, passem tots dos alineaments a format p (amb aconvertMod2.pl): Ara tenim alinclu.alp i alinhmm.alp.
De cara a poder donar-li un input a modeller, necessitem crear un arxiu .top on contingui una estructura similar a la següent:

# PRIMER: STEP 5
#
# This script should produce two models, 1fdx.B999901 and 1fdx.B999902.
#
# Before you run this script, do this: ln alignment.seg.ali fer2.ali
#

INCLUDE # Include the predefined TOP routines


SET ALNFILE = 'alinclu.alp' # alignment filename
(indica quin aliniament seguirà el programa per fer el model)
SET KNOWNS = '1ak9' '1scjA' '1ubnA' '1sca' # codes of the templates
(indica els noms de les proteïnes de les quals coneixem la estructura i la seqüència i formen part de l'alíniament)
SET SEQUENCE = 'P11018' # code of the target
(indica el nom de la seqüència problema a modelar)
SET ATOM_FILES_DIRECTORY = './' # directories for input atom files
SET STARTING_MODEL= 1 # index of the first model
SET ENDING_MODEL = 2 # index of the last model
# (determines how many models to calculate)
SET DEVIATION = 2.0 # have to be >0 if more than 1 model
SET RAND_SEED = -12312 # to have different models from another TOP file

CALL ROUTINE = 'model' # do homology modelling

Així, creem dos fitxers.top, un per a cada alineament: clu.top i hmm.top (al tenir la mateixa seqüència problema i les mateixes estructures conecgudes, només variaran en el ALNFILE)

       Si tot ha anat bé (si no hem cuidat que no hi haguessin caràcters estranys als llistats de les seqüències FASTA, o bé els aminoàcids de la seqüència i de l'estructura no coincideixen, modeller no funcionarà), ens generarà dos models per a cada execució.

       El nom de cada model té una estructura del tipus "P11018.B99990002". Seria interessant canviar-li el nom per un més còmode (així, a més, no ens ho sobreescriu al còrrer modeller vàries vegades).
    D'aquesta manera, a l'acabar de funcionar modeller amb tots dos alineaments, ens haurà creat 4 models (dos per cadascun).

Els models creats en el nostre cas són:

clustal1.mod
clustal2.mod
hmm1.mod
hmm2.mod

 


<<                                                    >>