Программный инструментарий для трафаретных вычислений на гибридных суперкомпьютерах
Автор: Климов Юрий Андреевич, Орлов Антон Юрьевич, Шворин Артем Борисович
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
Статья в выпуске: 2 (11) т.3, 2012 года.
Бесплатный доступ
Рассматривается проблема переноса программ на гибридные суперкомпьютеры. В общем случае эта проблема сложна и требует вложения значительного количества высококвалифицированного труда, однако для ограниченных классов программ перенос всё же поддается автоматизации. Одним из таких классов являются трафаретные программы, имеющие широкое применение в научных вычислениях. Излагаются идеи и описывается реализация программного инструментария, разработанного авторами в рамках проекта Кентавр, направленного на автоматическое распараллеливание трафаретных программ для исполнения на гибридных суперкомпьютерах. Основная задача, решаемая инструментарием Кентавр,~— автоматизация обменов между вычислительными узлами суперкомпьютера, а также между ускорителем и центральным процессором в рамках узла.
Проект кентавр, проблемно-ориентированные языки программирования, гибридные суперкомпьютеры, трафаретные вычисления
Короткий адрес: https://sciup.org/14335936
IDR: 14335936 | УДК: 004.424+004.434
Software toolkit for implementing stencil codes on hybrid supercomputers
The problem of porting programs to hybrid (heterogeneous) supercomputers is considered. The process of porting is known to be difficult and error prone and generally requires a lot of efforts. Nevertheless, for some restricted classes of programs it can be automated. One of such classes is stencil codes, which are used widely in scientific computations. The ideas and implementation of a Centaur toolkit aimed at automatic parallelization of stencil programs for running on hybrid supercomputers are described. The main task performed by Centaur is to organize automatic data interchange between supercomputer nodes as well as interchange between accelerator and CPU inside each hybrid node. (In Russian).
Список литературы Программный инструментарий для трафаретных вычислений на гибридных суперкомпьютерах
- Nvidia CUDA, http://www.nvidia.com/object/cuda˙home˙new.html.
- OpenCL, http://www.khronos.org/opencl/.
- Проект Кентавр, http://centaur.botik.ru/.
- Datta K., Murphy M., Volkov V., Williams S., Carter J., Oliker L., Patterson D., Shalf J., Yelick K. Stencil computation optimization and auto-tuning on state-of-the-art multicore architectures // Proceedings of the 2008 ACM/IEEE Conference on Supercomputing // SC ’08. –– Piscataway, NJ, USA : IEEE Press, 2008, p. 4:1–4:12
- Климов Ю. А., Орлов А. Ю., Шворин А. Б. Перспективные подходы к созданию масштабируемых приложений для суперкомпьютеров гибридной архитектуры//Программные системы: теория и приложения: электронный научный журнал, 2011, № 4 (8), c. 45-59, http://psta.psiras.ru/read/psta2011_4_45-59.pdf
- OpenMP, http://openmp.org/.
- Intel Cluster OpenMP User’s Guide, http://software.intel.com/file/6330.
- Message Passing Interface, http://www.mpi-forum.org/.
- Unified Parallel C, http://upc.gwu.edu/.
- Проект Кентавр: методические материалы, http://centaur.botik.ru/metodicheskie-materialy.
- Dean J., Ghemawat S. MapReduce: simplified data processing on large clusters // Proceedings of the 6th Conference on Symposium on Opearting Systems Design & Implementation // OSDI’04. ––Berkeley, CA, USA : USENIX Association, 2004. Vol. 6, p. 137–150
- Sch¨afer A., Fey D. LibGeoDecomp: A Grid-Enabled Library for Geometric Decomposition Codes//Proceedings of the 15th European PVM/MPI Users’ Group Meeting on Recent Advances in Parallel Virtual Machine and Message Passing Interface. -Berlin, Heidelberg: Springer-Verlag, 2008, p. 285-294
- Maruyama N., Nomura T., Sato K., Matsuoka S. Physis: an implicitly parallel programming model for stencil computations on large-scale GPU-accelerated supercomputers // Proceedings of 2011 International Conference for High Performance Computing, Networking, Storage and Analysis // SC ’11. –– New York, NY, USA : ACM, 2011, p. 11:1–11:12
- Balay S., Brown J., Buschelman K., Gropp W. D., Kaushik D., Knepley M. G., McInnes L.C., Smith B. F., Zhang H. PETSc Web page, 2012, http://www.mcs.anl.gov/petsc.
- Singh S. Computing without processors//Communications of the ACM, 2011. Vol. 54, no. 8, p. 46-54
- OpenACC, http://www.openacc-standard.org/.
- Augonnet C., Thibault S., Namyst R., Wacrenier P.-A. StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures//Proceedings of the 15th International Euro-Par Conference. Lecture Notes in Computer Science -Delft, The Netherlands: Springer, 2009. Vol. 5704, p. 863-874
- Charm++, http://charm.cs.uiuc.edu/research/charm/.
- Андрианов А. Н., Ефимкин К. Н. Подход к параллельной реализации численных методов на неструктурированных сетках//Вычислительные методы и программирование: новые вычислительные технологии, 2007. Т. 8, № 2, c. 6-17