Параллельный метод объединения результатов работы программ по сборке генома
Автор: Романенков Кирилл Владимирович, Сальников Алексей Николаевич, Алексеевский Андрей Владимирович
Рубрика: Вычислительная математика
Статья в выпуске: 1 т.5, 2016 года.
Бесплатный доступ
В данной работе проводится исследование в области применения многопроцессорных систем для задачи коррекции сборки генома. Существует большое количество алгоритмических подходов к проблеме сборки генома из набора коротких фрагментов, при этом результаты их работы на одних и тех же экспериментальных данных зачастую существенно разнятся. Вследствие большого объема данных необходима организация вычислений в модели распределенной памяти на вычислительном кластере. Авторами предложен алгоритм объединения результатов работ геномных сборщиков, основанный на построении распределенного взвешенного графа контигов. Предлагаемый подход использует комбинацию выводов программ сборки гeномов, что позволяет уменьшить фрагментированность контигов в результирующем наборе. Последовательная версия алгоритма реализована на C/C++ и доступна по адресу: https://bitbucket.org/kromanenkov/gar.
Бионформатика, многопроцессорные системы, параллельные алгоритмы
Короткий адрес: https://sciup.org/147160582
IDR: 147160582 | DOI: 10.14529/cmse160103
Список литературы Параллельный метод объединения результатов работы программ по сборке генома
- Miller J.R., Koren S., Sutton G. Assembly algorithms for next-generation sequencing data//Genomics. 2010. Vol. 95, No. 6. P. 315-327. DOI: DOI: 10.1016/j.ygeno.2010.03.001
- NCBI, БД Assembly, геном человека. URL: http://www.ncbi.nlm.nih.gov/assembly/883148 (дата обращения: 1.08.2015).
- Метаинформация о геномах эукариотов на сайте NCBI. URL: ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/eukaryotes.txt (дата обращения: 1.08.2015).
- Vicedomini R., Vezzi F., Scalabrin S., Arvestad L., Policriti A. GAM-NGS: genomic assemblies merger for next generation sequencing//BMC Bioinformatics. 2013. Vol. 14(Suppl.7), No. 1. P. 1-18. DOI: DOI: 10.1186/1471-2105-14-S7-S6
- Yao G., Ye L., Gao H., Min P., Warren W.C., Weinstock G.M. Graph accordance of next-generation sequence assemblies//Bioinformatics. 2012. Vol. 28, No. 1. P. 13-16. DOI: DOI: 10.1093/bioinformatics/btr588
- Zimin A.V., Smith D.R., Sutton G., Yorke J.A. Assembly reconciliation//Bioinformatics. 2008. Vol. 24, No. 1. P. 42-45. DOI: DOI: 10.1093/bioinformatics/btm542
- Zorro -The masked assembler. URL: http://lge.ibi.unicamp.br/zorro/(дата обращения: 22.07.2015).
- European Nucleotide Archive. URL: http://www.ebi.ac.uk/ena/data/view/SRR122309 (дата обращения: 1.08.2015).
- Encephalitozoon cuniculi GB-M1. URL: http://www.ncbi.nlm.nih.gov/genome/39?genome_assembly_id=22671 (дата обращения: 1.08.2015).
- Gurevich A., Saveliev V., Vyahhi N., Tesler G. QUAST: quality assessment tool for genome assemblies//Bioinformatics. 2013. Vol. 29, No. 8. P. 1072-1075. DOI: DOI: 10.1093/bioinformatics/btt086
- Koren S., Treangen T.J., Hill C.M., Pop M., Phillippy A.M. Automated ensemble assembly and validation of microbial genomes//BMC Bioinformatics. 2014. Vol. 15, No. 5. P. 126-134 DOI: 10.1186/1471-2105-15-126
- Simpson J.T., Durbin R. Efficient construction of an assembly string graph using the FM-index//Bioinformatics. 2010. Vol. 26, No. 12. P. 367-373 DOI: 10.1093/bioinformatics/btq217