Анализ эффективности использования семейства алгоритмов GeneMark при аннотации геномов

Автор: Траньков Сергей Вячеславович, Яворский Владислав Антонович, Бородовский Марк

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Молекулярная и биологическая физика

Статья в выпуске: 2 (14) т.4, 2012 года.

Бесплатный доступ

В статье проводится анализ семейства алгоритмов GeneMark, которые используют- ся для автоматизированной аннотации генов в новых прокариотических (в том числе всех бактериальных) геномах без использования сравнения (выравнивания) с извест- ными генами и белками. Показано, что в своем классе алгоритм GeneMark является лучшим; дальнейшее улучшение этого алгоритма возможно более полным учетом ре- гуляторных участков, располагающихся вблизи стартов трансляции, а также учетом локальных вариаций GC композиции генома, часто связанных с горизонтальным пере- носом генов из других микробов.

Аннотация генома, бактериальный геном, семейство алгоритмов, скрытые марковские модели, алгоритм витерби

Короткий адрес: https://sciup.org/142185826

IDR: 142185826

Список литературы Анализ эффективности использования семейства алгоритмов GeneMark при аннотации геномов

  • Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: I. Oligonucleotide Frequencies Analysis//Molecular Biology. -1986. -V. 20. -P. 826-833.
  • Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: II. Non-homogeneous Markov Models//Molecular Biology. -1986. -V. 20. -P. 833-840.
  • Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: III. Computer Recognition of Coding Regions//Molecular Biology. -V. 20. -P. 1145-1150.
  • Borodovsky M., McIninch J. GeneMark: parallel gene recognition for both DNA strands//Computers & Chemistry. -1993. -V. 17, N. 19. -P. 123-133.
  • Borodovsky M., McIninch J. Recognition of genes in DNA sequence with ambiguities//Biosystems. -1993. -V. 30, N 1-3. -P. 161-171.
  • Delcher A.L., Harmon D., Kasif S., White O., Salzberg S.L. Improved microbial gene identification with GLIMMER//Nucleic Acids Res. -1999. -V. 27. -P. 4636-4641.
  • Frishman D., Mironov A., Mewes H.-W., Gelfand M. Combining diverse evidence for gene recognition in completely sequenced bacterial genomes//Nucleic Acids Res. -1998. -V. 26. -P. 2941-2947.
  • Rabiner L.R., Juang B.H. An introduction to hidden Markov models//IEEE ASSP Magazine. -1986. -V. 3, N 1. -P. 4-16.
  • Krogh A., Mian I.S., Haussler D. A hidden Markov model that fins genes in E.coli DNA//Nucleic Acids Res. -1994. -V. 22. -P. 4768-4778.
  • Lukashin A., Borodovsky M. GeneMark.hmm: new solutions for gene finding//Nucleic Acids Research. -1998. -V. 26, N 4. -P. 1107-1115.
  • Besemer J., Lomsadze A., Borodovsky M. GeneMarkS -a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions//Nucleic Acids Research. -2001. -V. 9, N 12. -P. 2607-2618.
  • Besemer J., Borodovsky M. Heuristic approach to deriving models for gene finding//Nucleic Acids Research. -1999. -V. 27, N 19. -P. 3911-3920.
  • Lomsadze A., Ter-Hovhannisyan V., Chernoff Y., Borodovsky M. Gene identification in novel eukaryotic genomes by self-training algorithm//Nucleic Acids Research. -2005. -V. 33, N 20. -P. 6494-6506.
  • Zhu W., Lomsadze A., Borodovsky M. Ab initio gene identification in metagenomic sequences//Nucleic Acids Research. -2010. -V. 38, N 12.
  • Durbin R., Eddy S., Krogh A., Mitchison G. Biological sequence analysis: Probabilistic models of proteins and nucleic acids. -Cambridge University Press, 1998. -P. 54.
  • Viterbi A. Error bounds for convolutional codes and an asymptotically optimum decoding algorithm//Information Theory. -1967. -V. 13, N 2. -P. 260-269.
  • Baum L.E. An equality and associated maximization technique in statistical estimation for probabilistic functions of Markov processes//Inequalities. -1972. -V. 3, N 1. -P. 1-8.
  • Medigue C., Rouxel T., Vigier P., Henaut A., Danchin A. Evidence for horizontal gene transfer in Escherichia coli speciation//J. Mol. Biol. -1991. -V. 222. -P. 851-856.
  • Lawrence J.G. Selfish operons and speciation by gene transfer//Trends Microbiol. -1997. -V. 5. -P. 355-359.
  • Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool//J. Mol. Biol. -1990. -V. 215, N 3. -P. 403-410.
Еще
Статья научная