Pràctica
3.2- Hidden Markov Models (HMMER)
Pràctiques de Biologia Estructural-
Carlos Masdeu Ávila- Nia=16965
<< >>
1-Introducció
El software HMMER permet realitzar múltiples operacions que tenen com a centre els models de markov ocults (hidden markov models, hmm), perfils formats a partir d'alineaments, que ens poden dir la probabilitat de que en una determinada posició de la seqüència hi hagi un determinat element (això vé pel fet que no totes les posicions tenen les mateixes probabilitats de patir canvis).
2-Construcció del .hmm a partir d'un aliniament (hmmbuild)
Nosaltres partirem d'un aliniament múltiple de seqüències: globins50.msf. Per construir un model a partir d'un alineament, la comanda és
hmmbuild <output> <input>
En aquest
cas concret,
hmmbuild globin.hmm globins50.msf
Ens generarà globin.hmm, que conté el perfil de les probabilitats de les posibles sustitucions a cada posició.
En principi, caldria calibrar-lo, mitjançant la comanda hmmcalibrate ( que aquí no es farà per raons de temps i disponibilitat dels ordinadors a la facultat).
Podem crear també una base de dades de perfils de .hmm's. Per fer-ho, pot bastar simplement concatenant-los (p.ex, amb la comanda cat de linux), o bé podem fer-ho mitjançant la comanda
hmmbuild -A <output al que vols afegir> <input que vols afegir>
Un exemple de base de dades de .hmm's creada d'aquesta manera és hmmdb.hmm. (L'output generat es aquest)
3-Buscar en una base de dades de seqüències un determinat perfil .hmm(hmmsearch)
Un cop tenim el nostre patró, podem realitzar una cerca sobre una base de dades de seqüències en format FASTA per veure quines d'aquestes s'adaptarien més al nostre patró .hmm. La comanda per fer-ho seria:
hmmsearch globin.hmm /disc9/DB/blast/pdb -o hmmsearch.output
(I ens emetria un output semblant a aquest, on descomposa cada seqüència analitzada en dominis a fi d'aplicar-los-hi el patró, i ens indica els scores i e-values per a cada aliniament, seguit dels alineaments)
4-Buscar una seqüència contra una base de dades de hmm's
Amb
pfam nosaltres podem buscar una determinada seqüència dins d'una base de dades
de HMM (com hmmdb.hmm
creada anteriorment).
Per exemple, tenim la seqüència
7LES_DROME i volem buscar ocurrències dins de hmmdb.hmm. La comanda seria:
hmmpfam hmmdb.hmm 7LES_DROME
(I ens emetria un output semblant a aquest, on ens indica, entre altres dades, l'score i e-value resultants de comparar aquesta seqüència amb cada .hmm de la base de dades)