Особенности параллельной реализации численных моделей N-тел на GPU
Автор: Храпов Сергей Сергеевич, Хоперсков Сергей Александрович, Хоперсков Александр Валентинович
Рубрика: Программирование
Статья в выпуске: 1 т.11, 2018 года.
Бесплатный доступ
Рассмотрены особенности параллельной реализации прямого гравитационного моделирования N-тел на нескольких GPU с использованием технологии GPU-Direct. Подробно описан параллельный алгоритм решения задачи N-тел, основанный на гибридной технологии распараллеливания OpenMP-CUDA с количеством частиц N:105-107. Исследована эффективность распараллеливания нашего алгоритма для различных GPU линейки Nvidia Tesla (K20, K40, K80) при моделировании динамики гравитационно-неустойчивого звездного галактического диска. Изучена производительность и точность моделирования при использовании чисел одинарной и двойной точности. Так, например, для процессора Nvidia Tesla K80 время вычислений с двойной точностью оказалась всего лишь в 1,85 раз больше чем для одинарной точности. Показано, что использовать числа с одинарной точностью при моделировании на GPU сильно несимметричных систем взаимодействующих N-тел схемами второго порядка точности по времени некорректно, так как это приводит к значительным количественным и качественным искажениям результата. Так, например, для чисел одинарной точности после 104 шагов по времени полные энергия, импульс и момент импульса системы N-тел (N=220) сохранились с точностью менее 2x10-3, 4x10-2 и 7x10-3, соответственно. Для чисел двойной точности эти законы сохранения выполнялись с точностью более 5x10-5, 10-15 и 10-13, соответственно. Наши оценки показывают, что по шкале производительность-точность использование схем второго порядка точности по времени наряду с числами двойной точности оказывается на 20-30% более эффективно, чем схем четвертого порядка с числами одинарной точности.
Задача n-тел, одинарная и двойная точность численных решений, звездный галактический диск, гравитационная неустойчивость
Короткий адрес: https://sciup.org/147159464
IDR: 147159464 | DOI: 10.14529/mmp180111