Анализ эффективности использования семейства алгоритмов GeneMark при аннотации геномов
Автор: Траньков Сергей Вячеславович, Яворский Владислав Антонович, Бородовский Марк
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Молекулярная и биологическая физика
Статья в выпуске: 2 (14) т.4, 2012 года.
Бесплатный доступ
В статье проводится анализ семейства алгоритмов GeneMark, которые используют- ся для автоматизированной аннотации генов в новых прокариотических (в том числе всех бактериальных) геномах без использования сравнения (выравнивания) с извест- ными генами и белками. Показано, что в своем классе алгоритм GeneMark является лучшим; дальнейшее улучшение этого алгоритма возможно более полным учетом ре- гуляторных участков, располагающихся вблизи стартов трансляции, а также учетом локальных вариаций GC композиции генома, часто связанных с горизонтальным пере- носом генов из других микробов.
Аннотация генома, бактериальный геном, семейство алгоритмов, скрытые марковские модели, алгоритм витерби
Короткий адрес: https://sciup.org/142185826
IDR: 142185826
Список литературы Анализ эффективности использования семейства алгоритмов GeneMark при аннотации геномов
- Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: I. Oligonucleotide Frequencies Analysis//Molecular Biology. -1986. -V. 20. -P. 826-833.
- Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: II. Non-homogeneous Markov Models//Molecular Biology. -1986. -V. 20. -P. 833-840.
- Borodovsky M., Sprizhitsky Yu., Golovanov E., Alexandrov A. Statistical Patterns in Primary Structures of Functional Regions in the E. Coli Genome: III. Computer Recognition of Coding Regions//Molecular Biology. -V. 20. -P. 1145-1150.
- Borodovsky M., McIninch J. GeneMark: parallel gene recognition for both DNA strands//Computers & Chemistry. -1993. -V. 17, N. 19. -P. 123-133.
- Borodovsky M., McIninch J. Recognition of genes in DNA sequence with ambiguities//Biosystems. -1993. -V. 30, N 1-3. -P. 161-171.
- Delcher A.L., Harmon D., Kasif S., White O., Salzberg S.L. Improved microbial gene identification with GLIMMER//Nucleic Acids Res. -1999. -V. 27. -P. 4636-4641.
- Frishman D., Mironov A., Mewes H.-W., Gelfand M. Combining diverse evidence for gene recognition in completely sequenced bacterial genomes//Nucleic Acids Res. -1998. -V. 26. -P. 2941-2947.
- Rabiner L.R., Juang B.H. An introduction to hidden Markov models//IEEE ASSP Magazine. -1986. -V. 3, N 1. -P. 4-16.
- Krogh A., Mian I.S., Haussler D. A hidden Markov model that fins genes in E.coli DNA//Nucleic Acids Res. -1994. -V. 22. -P. 4768-4778.
- Lukashin A., Borodovsky M. GeneMark.hmm: new solutions for gene finding//Nucleic Acids Research. -1998. -V. 26, N 4. -P. 1107-1115.
- Besemer J., Lomsadze A., Borodovsky M. GeneMarkS -a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions//Nucleic Acids Research. -2001. -V. 9, N 12. -P. 2607-2618.
- Besemer J., Borodovsky M. Heuristic approach to deriving models for gene finding//Nucleic Acids Research. -1999. -V. 27, N 19. -P. 3911-3920.
- Lomsadze A., Ter-Hovhannisyan V., Chernoff Y., Borodovsky M. Gene identification in novel eukaryotic genomes by self-training algorithm//Nucleic Acids Research. -2005. -V. 33, N 20. -P. 6494-6506.
- Zhu W., Lomsadze A., Borodovsky M. Ab initio gene identification in metagenomic sequences//Nucleic Acids Research. -2010. -V. 38, N 12.
- Durbin R., Eddy S., Krogh A., Mitchison G. Biological sequence analysis: Probabilistic models of proteins and nucleic acids. -Cambridge University Press, 1998. -P. 54.
- Viterbi A. Error bounds for convolutional codes and an asymptotically optimum decoding algorithm//Information Theory. -1967. -V. 13, N 2. -P. 260-269.
- Baum L.E. An equality and associated maximization technique in statistical estimation for probabilistic functions of Markov processes//Inequalities. -1972. -V. 3, N 1. -P. 1-8.
- Medigue C., Rouxel T., Vigier P., Henaut A., Danchin A. Evidence for horizontal gene transfer in Escherichia coli speciation//J. Mol. Biol. -1991. -V. 222. -P. 851-856.
- Lawrence J.G. Selfish operons and speciation by gene transfer//Trends Microbiol. -1997. -V. 5. -P. 355-359.
- Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool//J. Mol. Biol. -1990. -V. 215, N 3. -P. 403-410.