Расширение двухуровневого распараллеливания MPI+OpenMP посредством OpenCL для газодинамических расчетов на гетерогенных системах

Горобец Андрей Владимирович; Суков Сергей Александрович; Железняков Андрей Олегович; Богданов Павел Борисович; Четверушкин Борис Николаевич; Gorobets A.V.; Soukov S.A.; Bogdanov P.B.; Zheleznyakov A.O.; Chetverushkin B.N.

Научные статьи \ Математика. Естественные науки \ Математика \ Вычислительная математика. Численный анализ

Расширение двухуровневого распараллеливания MPI+OpenMP посредством OpenCL для газодинамических расчетов на гетерогенных системах

Автор: Горобец Андрей Владимирович, Суков Сергей Александрович, Железняков Андрей Олегович, Богданов Павел Борисович, Четверушкин Борис Николаевич

Журнал: Вестник Южно-Уральского государственного университета. Серия: Математическое моделирование и программирование @vestnik-susu-mmp

Рубрика: Программирование

Статья в выпуске: 25 (242), 2011 года.

Бесплатный доступ

В работе рассматривается применение расширенного распараллеливания для расчетов задач газовой динамики и аэроакустики на гетерогенных кластерах с узлами, сочетающими вычислительные элементы принципиально разной архитектуры, CPU и GPGPU. Двухуровневая модель распараллеливания MPI+OpenMP дополняется применением OpenCL для загрузки GPGPU, таким образом, реализуется третий уровень параллелизма. Представлена параллельная модель алгоритма для неструктурированных сеток.

Газовая динамика, аэроакустика, параллельные вычисления

Короткий адрес: https://sciup.org/147159103

IDR: 147159103 | УДК: 519.688

Extension with OpenCL of the two-level MPI+OpenMP parallelization for CFD simulations on heterogeneous systems

The paper is devoted to the extended parallelization for numerical experiments in fluid dynamics and aeroacoustics on heterogeneous systems that combines computing units of different architectures, namely CPU and GPU. A hybrid two-level MPI+OpenMP parallel model is extended with OpenCL in order to engage GPUs. In doing so the third level of parallelism appears. A model of an algorithm for unstructured meshes is presented.

Список литературы Расширение двухуровневого распараллеливания MPI+OpenMP посредством OpenCL для газодинамических расчетов на гетерогенных системах

Some useful strategies for unstructured edge-based solvers on shared memory machines/R. Aubry, G. Houzeaux, M. Vazquez, J.M. Cela//International J. for Numerical Methods in Engineering. -2010. -V. 85. -P. 537 -561.
Scalability of hybrid programming for a CFD code on the Earth Simulator/K. Itakura, A. Uno, M. Yokokawa, T. Ishihara, Y. Kaneda//Parallel Computing. -2004. -V. 30, № 12. P. 1329 -1343.
Nakajima, K. Three-level hybrid vs. flat MPI on the Earth Simulator: Parallel iterative solvers for finite-element method/K. Nakajima//Applied Numerical Mathematics. -2005. V. 54, № 2. -P. 237 -255.
Heuveline, V. Towards a hybrid parallelization of lattice Boltzmann methods/V. Heuveline, M.J. Krause, J. Latt//Computers and Mathematics with Applications. -2009. -V. 58, № 5. -P. 1071 -1080.
Chorley, M.J. Performance analysis of a hybrid MPI/OpenMP application on multi-core clusters/M.J. Chorley, D.W. Walker//J. of Computational Science. -2010. -V. 1, № 3. P. 168 -174.
Monakov, A. Automatically Tuning Sparse Matrix-Vector Multiplication for GPU Architectures/A. Monakov, A. Lokhmotov, A. Avetisyan//High Performance Embedded Architectures and Compilers. Series: Lecture Notes in Computer Science. -2010. -V. 5952. P. 111 -125.
Buatois, L. Concurrent number cruncher: a GPU implementation of a general sparse linear solver/L. Buatois, G. Caumon, B. Levy//Int. J. Parallel Emerg. Distrib. Syst. -2009. -V. 24, № 3. -P. 205 -223.
Abalakin, I. Computational Study of Mathematical Models for Noise DNS/I. Abalakin, A. Dervieux, T. Kozubskaya//AIAA. -2002. -P. 2585.
Accuracy Improvement for Finite-Volume Vertex-Centered Schemes Solving Aeroacoustics Problems on Unstructured Meshes/I. Abalakin et all//AIAA. -2010. -P. 3933.
Khronos OpenCL Working Group, The OpenCL Specification, Version: 1.1, 2010. http://www.khronos.org/registry/cl/specs/opencl-L1.pdf> (дата обращения: 11.06.2011)
Advanced Micro Devices, Inc, AMD Accelerated Parallel Processing OpenCL Programming Guide, 2011. AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf' TARGET='_new'>http://developer.amd.com/sdks/AMDAPPSDK/assets/>AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf (дата обращения: 11.06.2011)
NVIDIA, OpenCL Programming Guide for the CUDA Architecture Version 2.3. NVIDIA_OpenCL_ProgrammingGuide.pdf' TARGET='_new'>http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/>NVIDIA_OpenCL_ProgrammingGuide.pdf (дата обращения: 11.06.2011)
INRIA RUNTIME team, A Unified Runtime System for Heterogeneous Multicore Architectures, 2010. http://runtime.bordeaux.inria.fr/StarPU/> (дата обращения: 11.06.2011)
Faster, Cheaper, Better -a Hybridization Methodology to Develop Linear Algebra Software for GPUs/E. Agullo et all//GPU Computing Gems Morgan Kaufmann. -2010. -V. 2. INRIA-00547847:1.

Еще