Параллельный метод объединения результатов работы программ по сборке генома

Автор: Романенков Кирилл Владимирович, Сальников Алексей Николаевич, Алексеевский Андрей Владимирович

Журнал: Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi

Рубрика: Вычислительная математика

Статья в выпуске: 1 т.5, 2016 года.

Бесплатный доступ

В данной работе проводится исследование в области применения многопроцессорных систем для задачи коррекции сборки генома. Существует большое количество алгоритмических подходов к проблеме сборки генома из набора коротких фрагментов, при этом результаты их работы на одних и тех же экспериментальных данных зачастую существенно разнятся. Вследствие большого объема данных необходима организация вычислений в модели распределенной памяти на вычислительном кластере. Авторами предложен алгоритм объединения результатов работ геномных сборщиков, основанный на построении распределенного взвешенного графа контигов. Предлагаемый подход использует комбинацию выводов программ сборки гeномов, что позволяет уменьшить фрагментированность контигов в результирующем наборе. Последовательная версия алгоритма реализована на C/C++ и доступна по адресу: https://bitbucket.org/kromanenkov/gar.

Еще

Бионформатика, многопроцессорные системы, параллельные алгоритмы

Короткий адрес: https://sciup.org/147160582

IDR: 147160582   |   DOI: 10.14529/cmse160103

Список литературы Параллельный метод объединения результатов работы программ по сборке генома

  • Miller J.R., Koren S., Sutton G. Assembly algorithms for next-generation sequencing data//Genomics. 2010. Vol. 95, No. 6. P. 315-327. DOI: DOI: 10.1016/j.ygeno.2010.03.001
  • NCBI, БД Assembly, геном человека. URL: http://www.ncbi.nlm.nih.gov/assembly/883148 (дата обращения: 1.08.2015).
  • Метаинформация о геномах эукариотов на сайте NCBI. URL: ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/eukaryotes.txt (дата обращения: 1.08.2015).
  • Vicedomini R., Vezzi F., Scalabrin S., Arvestad L., Policriti A. GAM-NGS: genomic assemblies merger for next generation sequencing//BMC Bioinformatics. 2013. Vol. 14(Suppl.7), No. 1. P. 1-18. DOI: DOI: 10.1186/1471-2105-14-S7-S6
  • Yao G., Ye L., Gao H., Min P., Warren W.C., Weinstock G.M. Graph accordance of next-generation sequence assemblies//Bioinformatics. 2012. Vol. 28, No. 1. P. 13-16. DOI: DOI: 10.1093/bioinformatics/btr588
  • Zimin A.V., Smith D.R., Sutton G., Yorke J.A. Assembly reconciliation//Bioinformatics. 2008. Vol. 24, No. 1. P. 42-45. DOI: DOI: 10.1093/bioinformatics/btm542
  • Zorro -The masked assembler. URL: http://lge.ibi.unicamp.br/zorro/(дата обращения: 22.07.2015).
  • European Nucleotide Archive. URL: http://www.ebi.ac.uk/ena/data/view/SRR122309 (дата обращения: 1.08.2015).
  • Encephalitozoon cuniculi GB-M1. URL: http://www.ncbi.nlm.nih.gov/genome/39?genome_assembly_id=22671 (дата обращения: 1.08.2015).
  • Gurevich A., Saveliev V., Vyahhi N., Tesler G. QUAST: quality assessment tool for genome assemblies//Bioinformatics. 2013. Vol. 29, No. 8. P. 1072-1075. DOI: DOI: 10.1093/bioinformatics/btt086
  • Koren S., Treangen T.J., Hill C.M., Pop M., Phillippy A.M. Automated ensemble assembly and validation of microbial genomes//BMC Bioinformatics. 2014. Vol. 15, No. 5. P. 126-134 DOI: 10.1186/1471-2105-15-126
  • Simpson J.T., Durbin R. Efficient construction of an assembly string graph using the FM-index//Bioinformatics. 2010. Vol. 26, No. 12. P. 367-373 DOI: 10.1093/bioinformatics/btq217
Еще
Статья научная