Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Колганов А.С.; Kolganov A.S.

doi:10.14529/cmse160301

Научные статьи \ Общие вопросы науки и культуры \ Информационные технологии. Вычислительная техника. Обработка данных \ Специальные определители для вычислительной техники

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Автор: Колганов А.С.

Журнал: Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi

Рубрика: Вычислительная математика

Статья в выпуске: 3 т.5, 2016 года.

Бесплатный доступ

Решение задачи поиска минимальных остовных деревьев является распространенной в различных областях исследований: распознавание различных объектов, компьютерное зрение, анализ и построение сетей (например, телефонных, электрических, компьютерных, дорожных и т.д.), химия и биология и многие другие. Обработка больших графов - достаточно трудоемкая задача для центрального процессора (CPU) и является востребованной в данное время. Все более широкое распространение для решения задач общего назначения получают графические ускорители (GPU), имеющие большую вычислительную мощность, чем CPU. В данной статье рассмотрены методы сжатия и преобразования исходных графов для повышения эффективности их обработки. На примере алгоритма поиска минимальных остовных деревьев исследованы предложенные подходы. Исследована возможность гибридной реализация данного алгоритма. Получены самые высокие результаты по производительности на графах R-MAT и SSCA2.

Поиск остовных деревье, параллельная обработка графов, алгоритм борувки, большие графы

Короткий адрес: https://sciup.org/147160599

IDR: 147160599 | УДК: 004.021 | DOI: 10.14529/cmse160301

Parallel implementation of minimum spanning tree algorithm on CPU and GPU

Solution of the finding a minimum spanning tree problem is common in various areas of research: recognition of different objects, computer vision, analysis and construction of networks (eg, telephone, electrical, computer, travel, etc.), chemistry and biology, and many others. Processing large graphs is a quite time-consuming task for the central processor (CPU), and in high demand at the present moment. The usage of Graphics processing units (GPUs) as a mean to solve general-purpose problems grows every day, because GPUs have more computing power than CPUs. This article describes the methods of compression and conversion of graphs in standard formats to increase the efficiency of their processing. The search algorithm of minimum spanning trees has been used for researching the proposed approaches. The possibility of a hybrid implementation of this algorithm has been investigated. The highest results were obtained on the large R-MAT and SSCA2 graphs.

Список литературы Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Chazelle B.A. Minimum spanning tree algorithm with inverse-ackermann type complexity//Journal of the ACM. 2000. Vol. 47, No. 6. P. 1028-1047.
Pettie S. An inverse-Ackermann style lower bound for the online minimum spanning tree verification problem//Foundations of Computer Science. 2002. P. 155-163.
Wei W., Shaozhong G., Fan Y., Jianxun C. GPU-Based Fast Minimum Spanning Tree Using Data Parallel Primitives//Information Engineering and Computer Science (ICIECS), 2nd International Conference (TBD Wuhan, China). 2010. P. 1-4.
Arefin A.S., Riveros C., Berretta R., Moscato P. kNN-MST-Agglomerative: A fast and scalable graph-based data clustering approach on GPU//Computer Science & Education (ICCSE), 7th International Conference (The University of Melbourne, Australia). 2012. P. 585-590.
Vineet V., Harish P., Patidar S., Narayanan P.J. Fast Minimum Spanning Tree for Large Graphs on the GPU//HPG ’09 Proceedings of the Conference on High Performance Graphics (New Orleans, LA, USA). 2009. P. 167-171.
Gibbs N.E., Poole W.G., Stockmeyer P.K. A comparison of several bandwidth and profile reduction algorithms//ACM Transactions on Mathematical Software. 1976. Vol. 2, No. 4. P. 322-330.
Gilbert J.R., Moler C., Schreiber R. Sparse matrices in MATLAB: Design and Implementation//SIAM Journal on Matrix Analysis and Applications. 1992. Vol. 13, No. 1. P. 333-356.
Chakrabarti D., Zhan Y., Faloutsos C. R-MAT: A Recursive Model for Graph Mining//In Proceedings of 4th International Conference on Data Mining (Brighton, UK). 2004. P. 442-446.
Bader D.A., Madduri K. Design and implementation of the HPCS graph analysis benchmark on symmetric multiprocessors. Technical report. 2005.
Bor˚uvka O. O Jist´em Probl´emu Minim´aln´ım. Pr´ace Moravsk´e Pˇr´ırodovˇedeck´e SpoleˇcnostiIII. 1926. No. 3. P. 37-58
Описание алгоритмов для структуры Union-Find. URL: https://www.topcoder.com/community/data-_science/data-_science-_tutorials/disjoint-_set-_data-_structures/(дата обращения: 30.11.2015).
Описание стандарта OpenMP. URL: http://www.openmp.org/mp-_documents/openmp-_4.5.pdf (дата обращения: 30.11.2015).
Compute Unified Device Architecture. URL: http://www.nvidia.ru/object/cuda-_parallel-_computing-_ru.html (дата обращения: 30.11.2015).
Unified Memory in CUDA 6. URL: http://devblogs.nvidia.com/parallelforall/unified-_memory-_in-_cuda-_6/(дата обращения: 30.11.2015).
Nobari S., Cao T., Karras P., Bressan S. Scalable Parallel Minimum Spanning Forest Computation//PPoPP’12 Proceedings of the 17th ACM SIGPLAN symposium on Principles and Practice of Parallel Programming (New York, NY, USA). 2012. P. 205-214.
Wei W., Shaozhong G., Fan Y., Jianxun C. Design and Implementation of GPU-Based Prim’s Algorithm//Information Engineering and Computer Science (ICIECS) 2nd International Conference (TBD Wuhan, China). 2010. P. 1-4.

Еще