En aquesta pràctica realitzaré cerques mitjançant models ocults de Markov (HMM).
Cerca a partir d'un perfil HMM Creació d'alineaments
Cerca a partir d'un perfil HMM
Aquest mètode consisteix en cercar homòlegs remots a una família a partir d'un alineament dels membres d'aquesta família.
Primerament usaré hmmbuild per crear un perfil de HMM (veure perfil) a partir de l'arxiu que conté l'alineament (veure alineament):
hmmbuild globin.hmm globins50.msf A continuació, s'hauria d'executar hmmcalibrate, que elimina el biaix del sistema ja que elimina les seqüències repetides o molt semblants. Aquest pas no s'ha realitzat a la pràctica, ja que consumeix molt temps.
El següent pas és executar hmmsearch, que a partir del perfil creat amb hmmbuild executa la cerca sobre una base de dades. Per fer la pràctica cercaré en una base de dades que s'adjunta amb el tutorial del programa anomenada Artemia.fa.
hmmsearch globin.hmm Artemia.fa Com a resultat (veure resultat) ha trobat una seqüència homòloga (veure Scores for complete sequences, a resultats), una globina, amb un e-value (calculat a partir de la probabilitat de cada residu comparar contra la matriu) de 2.4e-105.
Finalment, repetiré la cerca sobre Swissprot:
hmmsearch globin.hmm /disc9/DB/blast/swissprot Al fer la cerca sobre Swissprot troba un gran nombre de seqüències homòlogues amb e-values compresos entre 9.1e-98 i 1.2 (veure resultat).
En aquest cas, s'usa HMM per buscar dominis coneguts en una seqüència problema, buscant una seqüència contra una llibreria de HMMs (la diferència amb el cas anterior és que abans es cercava contra una base de dades, i ara contra una llibreria de HMMs).
Primerament crearé la llibreria contra la que es farà la cerca, a partir de diversos fitxers HMM, usant hmmbuild:
hmmbuild -A myhmms rrm.slxhmmbuild -A myhmms fn3.slx
hmmbuild -A myhmms pkinase.slx
Com abans, ara s'ha d'aplicar hmmcalibrate, però aquest pas no es farà.
Finalment, usarem aquesta llibreria per analitzar la seqüència 7LES_DROME, usant hmmpfam:
hmmpfam myhmms 7LES_DROME Si es miren els resultats (veure resultat) es pot veure que ha trobat dominis homòlegs amb les tres seqüències de la llibreria, amb e-values molt negatiu (1.1e-91 i 3.5e-53 respectivament) per pkinase i fn3, i un e-value bastant dolent per rrm (0.72).
Finalment, repetiré la cerac sobre la base de dades PFAM:
hmmpfam myhmms /disc9/DB/pfam/Pfam hmmpfam ha trobat 43 proteïnes amb dominis homòlegs a 7LES_DROME. Dues d'aquestes tenen e-values molt negatiu, de 2.8e-88 i 1.9e-50, mentre que les altres tenen e-values dolents, compresos entre 0.11 i 9.8(veure resultat).
Finalment usaré HMM per fer un alineameent de seqüència. Per fer-ho, HMM crea un alineament inicial a partir d'un petit nombre de seqüències representatives i l'usa per alinear altres seqüències.
Per fer-ho, usaré el programa hmmalign per alinear les seqüències contingudes a globins630.fa a partir del perfil globin.hmm creat anteriorment:
hmmalign -o globins630.ali globin.hmm globins630.fa Amb això es crea un alineament de seqüència (veure alineament). En aquest, les zones alineades apareixen en majúscula mentre que les zones que queden fora de l'alineament tenen els residus escrits en minúscula.