Эффективный расчет двумерного БПФ на однородном или гетерогенном вычислительном кластере
Автор: Князьков Дмитрий Юрьевич
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
Статья в выпуске: 1 (32) т.8, 2017 года.
Бесплатный доступ
Рассмотрена задача осуществления двумерного БПФ матрицы на суперкомпьютере. Исследована зависимость времени выполнения БПФ от размера матрицы для суперкомпьютеров МВС-100К, МВС-10П и HybriLIT. Описан метод балансировки вычислительной нагрузки между вычислениями на процессоре и видеокарте при использовании гетерогенного кластера. На примере видеокарты TESLA K40 показано, что время, необходимое для перемещения данных, близко времени, требуемому для осуществления двумерного БПФ на графическом вычислителе, а само время расчета в 48 раз меньше времени счета на двухпроцессорном узле
ID: 14336114 Короткий адрес: https://sciup.org/14336114
Список литературы Эффективный расчет двумерного БПФ на однородном или гетерогенном вычислительном кластере
- I. Muhammad, O. Khan. "Performance analysis of Fast Fourier Transform on Field Programmable Gate Arrays and graphic cards", Proc. of the 2016 International Conference on Computing, Electronic and Electrical Engineering, ICE Cube (Quetta, Pakistan, 11-12 April, 2016), IEEE, 2016. P. 158-162.
- Г. Нуссбаумер. Быстрое преобразование Фурье и алгоритмы вычисления сверток, Радио и связь, М., 1985, 248 с.
- Д. Даджион, Г. Мерсеро. Цифровая обработка многомерных сигналов, Мир, М., 1988, 488 с.
- Д.Ю. Князьков. Эффективные методы расчета электромагнитных полей//Вычислительные методы и программирование, Т. 13, № 1. 2012. С. 181-188.
- A. Shamaev, D. Knyazkov. "An Effective Method of Electromagnetic Field Calculation", Numerical Analysis and Its Applications. V. II, 5th International Conference NAA 2012 (Lozenetz, Bulgaria, June 15-20, 2012), Lecture Notes in Computer Science, vol. 8236, Springer, Berlin-Heidelberg, 2013. P. 487-494.
- П. А. Михеев. Применение быстрого преобразования фурье при расчете сегментированной свёртки//Доклады Академии наук, Т. 464, № 2. 2015. С. 152-155.
- М. В. Борисов, В. А. Боровиков, А. А. Гавриков, Д. Князьков, В. И. Раховский, Д. А. Челюбеев, А. С. Шамаев. Методы создания и коррекции качества голографических изображений геометрических объектов с элементами субволновых размеров//Доклады Академии Наук, Т. 434, № 3. 2010. С. 332-336.
- О. Ю. Сударева. Эффективная реализация алгоритмов быстрого преобразования Фурье и свертки на микропроцессоре КОМДИВ128-РИО, ред. В. Б. Бетелин, НИИСИ РАН, М., 2014, 266 с.
- А. А. Бурцев. Применение векторного сопроцессора для ускорения операции быстрого преобразования Фурье//Национальный Суперкомпьютерный Форум 2015 (Переславль-Залесский, Россия, 24-27 ноября 2015), URL: http://2015.nscf.ru/TesisAll/5_Prikladnoe_PO/05_459_BurtsevAA.pdf
- И. А. Каляев, И. И. Левин, Е. А. Семерников, В. И. Шмойлов. Реконфигурируемые мультиконвейерные вычислительные структуры, ЮНЦ РАН, Ростов-на-Дону, 2008, 320 с.
- M. Frigo, S. G. Johnson. "The design and implementation of FFTW3", Proceedings of the IEEE, V. 93. No. 2. 2005. P. 216-231.