Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем. Рубрика в журнале - Программные системы: теория и приложения

Публикации в рубрике (82): Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
все рубрики
Элементы стратегии опережения и архитектурные предпосылки к созданию однокристального ускорителя массовых вычислений общего назначения на базе архитектуры отечественного многопроцессорного компьютера ПС-2000

Элементы стратегии опережения и архитектурные предпосылки к созданию однокристального ускорителя массовых вычислений общего назначения на базе архитектуры отечественного многопроцессорного компьютера ПС-2000

Затуливетер Юрий Семенович, Фищенко Елена Алексеевна, Артамонов Сергей Евгеньевич, Козлов Владимир Алексеевич

Статья научная

Анализируются причины, проявления и индустриальные проблемы кризиса структурного насыщения микропроцессорных архитектур. Рассматривается состояние рынка однокристальных компьютеровускорителей общего назначения для задач с массовым параллелизмом. Предлагается концепция развития отечественной линии высокопараллельных компьютеров ПС-2000, которые можно рассматривать как первых представителей общедоступных многопроцессорных систем класса GP (General Purpose). В развитие архитектуры ПС-2000 приводится описание свойств однокристальной масштабируемой и комплексируемой многопроцессорной системы ПС2000М, обладающей архитектурным потенциалом опережения. Приводится сопоставление архитектуры ПС-2000М с современными архитектурами однокристальных компьютеров с массовым параллелизмом.

Бесплатно

Эффективный расчет двумерного БПФ на однородном или гетерогенном вычислительном кластере

Эффективный расчет двумерного БПФ на однородном или гетерогенном вычислительном кластере

Князьков Дмитрий Юрьевич

Ред. заметка

Рассмотрена задача осуществления двумерного БПФ матрицы на суперкомпьютере. Исследована зависимость времени выполнения БПФ от размера матрицы для суперкомпьютеров МВС-100К, МВС-10П и HybriLIT. Описан метод балансировки вычислительной нагрузки между вычислениями на процессоре и видеокарте при использовании гетерогенного кластера. На примере видеокарты TESLA K40 показано, что время, необходимое для перемещения данных, близко времени, требуемому для осуществления двумерного БПФ на графическом вычислителе, а само время расчета в 48 раз меньше времени счета на двухпроцессорном узле

Бесплатно

Журнал