Pràctica 3- Cerca d'homòlegs remots
Pràctiques de Biologia Estructural- Carlos Masdeu Ávila- Nia=16965
<<                                                    >>

1-Introducció

        Trobar els homòlegs d'una proteïna és una tasca que pot tenir molta utilitat biològica -fisiològica, evolutiva, estructural...-, però que sovint no resulta trivial per les característiques de la mateixa evolució. Així, un assaig en busca d'homòlegs no pot basar-se només en la cerca d'una determinada tirallonga d'aminoàcids, ja que es molt freqüent que es produeixin mutacions equivalents que, tot i que preservarien funció i estructura, variarien l'estructura, i per tant no apareixerien en una cerca basada només en la seqüència tal qual apareix a la proteína problema.

         Així, el que es farà a aquesta pràctica és intentar trobar els remots homòlegs d'una determinada seqüència problema, mitjançant cerques de simil·laritat iteratives, en les quals, al principi, la matriu de substitució que puntuarà els alineaments és una de les clàssiques (PAM, BLOSSUM), però que en les següents iteracions, aquesta matriu de substitució es basarà en les ocurrències que hagin aparegut durant la cerca. D'aquesta manera, es crearia una nova matriu a cada 'round', que al final acabaria representant un 'patró' de substitució específic per a la proteïna que estem utilitzant.

         Realitzarem dos exercicis. Al primer, farem un mètode 'manual' per construir el perfil, mitjançant els resultats obtinguts a BLAST. Al segon, utilitzarem només el software PSIBLAST, que fa tots els pasos automàticament.

-Manual

-Automàtic

2-Mètode manual
           La seqüència problema és serc_myctu.fa. Primer realitzarem un BLAST contra la base de dades de SWISSPROT, agafarem algunes de les seqüències més llunyanes, i després realitzarem un psi-BLAST donant-li aquest a lineament com a font per a puntuar les següents troballes de la cerca.

- Per fer el BLAST, cridem la comanda

/disc9/BLAST/EXE/blastall -p blastp -i hbb_tarsy.sw -d /disc9/DB/blast/swissprot -o blast_sw.out

on:

-p blastp indica que volem usar el programa blastp

-i hbb_tarsy.sw indica que hbb_tarsy.sw és la seqüència que usarem com a input

-d /disc9/DB/blast/swissprot indica quin es el fitxer que usarem com a base de dades

-o blast_sw.out indica quin es el arxiu on es enmagatzermarà l'output

-Com busquem seqüències remotes, utilitzarem els resultats més llunyans per a construir el perfil. En aquest cas, agafarem les tres seqüències més llunyanes, P80945, P02008, i P02020.

-Descarreguem les seqüències (per exemple, de www.expasy.ch) i les concatenem en un arxiu, en format FASTA (listaseqs.txt).

-Realitzem l'alíniament mitjançant clustalw, entrant listaseqs.txt com a input, i demanant-li que faci l'alíniament múltiple. Ens generarà l'output listaseqs.aln   amb l'aliniament. Si ens fixem a l'output, veurem que al final de l'alíniament de cada sector de les seqüències, apareix una línia amb caràcters '*' i '.' que hem de treure amb qualsevol editor de txt, de cara a evitar possibles futures incompatibilitats o errors.

-Ara, amb aquest alíniament, ja tenim un patró que ens permetrà cerques d'homòlegs remots. Per fer-ho, utilitzarem el programa PSI-BLAST, que utilitzarà el procediment iteratiu descrit a la introducció, en el què la matriu de puntuació dels aliniaments anirà evolucionant des del patró que hem subministrat en funció dels resultats obtinguts a cada round de la iteracció.

Per fer el psi-BLAST, cridem la comanda:

/disc9/BLAST/EXE/blastpgp -i hbb_tarsy.sw -B listaseqs.aln -j 2 -o psimanual.out -d /disc9/DB/blast/swissprot

on:

-i hbb_tarsy.sw indica que hbb_tarsy.sw és la seqüència que usarem com a input

-B listaseqs.aln indica quin és l'alineament que utilitzarem com a patró inicial

-j 2 indica que volem fer dos iteracions

-o psimanual.out indica quin es el arxiu on es enmagatzermarà l'output

-d /disc9/DB/blast/swissprot indica quin es el fitxer que usarem com a base de dades

I tindrem els resultats de la cerca d'homòlegs remots a psimanual.out.

2-Mètode automàtic
           Com hem dit prèviament, Psi-BLAST pot fer tot el procés directament. Si donem la ordre:

/disc9/BLAST/EXE/blastpgp -i hbb_tarsy.sw -d /disc9/DB/blast/pdb -C hbb_tarsy.bls1 -o hbb_tarsy.out1 -j 2

on:

-i hbb_tarsy.sw indica que hbb_tarsy.sw és la seqüència que usarem com a input

-d /disc9/DB/blast/pdb indica quin es el fitxer que usarem com a base de dades

-C hbb_tarsy.bls1 dona l'ordre de que, a l'acabar el procés, la darrera matriu de substitució usada s'enmagatzemi en aquest fitxer

-o hbb_tarsy.out1 indica quin es el arxiu on es enmagatzermarà l'output

-j 2 indica que es realitzaran dos iteracions

ens generarà dos outputs:

- hbb_tarsy.out1- El listat de troballes aliniades.

- hbb_tarsy.bls1- La matriu de puntuació al final de la iteració j=2.

-Ara, per exemple, amb aquesta matriu de puntuació, podem tornar a cridar Psi-BLAST, però dient-li que l'agafi com a punt de partida. A més, podem variar la base de dades en la que realitzem la búsqueda. Vegem-ho en la comanda:

/disc9/BLAST/EXE/blastpgp -i hbb_tarsy.sw -d /disc9/DB/blast/swissprot -R hbb_tarsy.bls1 -o hbb_tarsy.out2 -j 2

on:

-i hbb_tarsy.sw indica que hbb_tarsy.sw és la seqüència que usarem com a input

-d /disc9/DB/blast/swissprot indica quin es el fitxer que usarem com a base de dades

-R hbb_tarsy.bls1 indica que aquest fitxer serà la matriu de substitució a l'inici del procés

-o hbb_tarsy.out2 indica quin es el arxiu on es enmagatzermarà l'output

-j 2 indica que es realitzaran dos iteracions

I s'ens generarà hbb_tarsy.out2, que contindrà el output d'aquesta nova creca a pdb.

(S'adjunten alguns aliniaments realitzats amb clustalw entre seqüències seleccionades entre els resultats a fi de mostrar les homologies: pdbseqs.aln.txt, que conté aliniaments entre seqüències escollides entre els resultats del pdb i dbseqs.aln.txt que conté aliniaments entre seqüències escollides entre els resultats del pdb i de swissprot)


 

<<                                                    >>