Параллельное системное программирование и вычислительные технологии. Рубрика в журнале - Проблемы информатики

Публикации в рубрике (26): Параллельное системное программирование и вычислительные технологии
все рубрики
Реализация и оценка производительности разреженного матрично-векторного умножения многократной точности на CUDA с использованием системы остаточных классов

Реализация и оценка производительности разреженного матрично-векторного умножения многократной точности на CUDA с использованием системы остаточных классов

Исупов Константин Сергеевич, Князьков Владимир Сергеевич, Бабешко Иван Павлович, Крутиков Александр Константинович

Статья научная

Умножение разреженной матрицы на плотный вектор (SpMV) является основным и наиболее затратным элементом в итерационных методах решения разреженных линейных систем и задач на собственные значения. Эффективная реализация SpMV имеет решающее значение для многих научных и инженерных вычислений, причем важно обеспечить не только высокое быстродействие, но и достаточную точность SpMV, поскольку итерационные методы известны своей чувствительностью к ошибкам округления. В статье мы рассматриваем параллельные реализации SpMV для CUDA-совместимых графических процессоров видеокарт (GPU) с использованием арифметики многократной точности на основе системы остаточных классов (СОК). Основным преимуществом СОК перед позиционными системами счисления является отсутствие переносов между цифрами числа, что позволяет заменить многоразрядные операции группами покомпонентных операций с цифрами небольшой разрядности, которые выполняются без накладных расходов, связанных с обработкой информации о переносах между цифрами. Мы рассматриваем реализации SpMV, основанные на двух широко распространенных форматах хранения разреженной матрицы - CSR и ELLPACK. Экспериментальная оценка с матрицами из реальных приложений показывает, что во многих случаях представленные реализации выполняются быстрее, чем реализации на основе существующих библиотек многократной точности для GPU.

Бесплатно

Сибирский суперкомпьютерный центр коллективного пользования и его применение для создания вычислительных технологий

Сибирский суперкомпьютерный центр коллективного пользования и его применение для создания вычислительных технологий

Глинский Борис Михайлович, Черных Игорь Геннадьевич, Мартынов Валерий Николаевич, Сапетина Анна Федоровна, Винс Дмитрий Владимирович

Статья научная

В работе описано развитие двух направлений деятельности, инициированных академиком А. С. Алексеевым в ИВМиМГ СО РАН: суисркомиьютсрный центр коллективного пользования и активная сейсмология с использованием мощных виброссйсмичсских источников. Представлены основные этапы развития центра коллективного пользования „Сибирский суперкомпьютерный центр“ ИВМиМГ СО РАН (ЦКП СССКЦ), его роль в решении больших задач математического моделирования в Сибирском отделении РАН. Другое направление связано с развитием идей виброеейемичеекого мониторинга ссйсмоопас- ных объектов. Математическое моделирование задачи мониторинга живущих магматических вулканов показало принципиальную возможность ирод сказания катастрофических извержений методом виброеейемичеекого мониторинга. Численное моделирование выполнено с использованием многоуровневой суисркомиьютсрной технологии, развиваемой авторами, включающей со-дизайн, исследование масштабируемости алгоритмов на основе имитационного моделирования и оценку энергоэффективноети алгоритмов.

Бесплатно

Система LuNA автоматического конструирования параллельных программ численного моделирования на мультикомпьютерах

Система LuNA автоматического конструирования параллельных программ численного моделирования на мультикомпьютерах

Перепелкин Владислав Александрович

Статья научная

Разработка параллельных программ численного моделирования на мультикомньютсрах является сложной задачей ввиду необходимости обеспечивать нефункциональные свойства программ (производительность, расход памяти, нагрузка на есть и т. н.), а также динамическую балансировку нагрузки, отказоустойчивость и другие свойства. В работе рассматриваются технология фрагментированного программирования и поддерживающая со система LuNA автоматического конструирования параллельных программ с заданными нефункциональными свойствами. Прикладной алгоритм представляется в виде множества информационно-зависимых задач, что позволяет параллельно исполнять их, динамически перераспределять их но узлам мультикомньютера, обеспечивая динамическую балансировку нагрузки на узлы, а также реализовывать другие нефункциональные свойства программы автоматически. Рассматривается возможность автоматической настройки исполнения программы на конфигурацию вычислителя на основе профилирования.

Бесплатно

Сравнение возможностей MPI и LUNA на примере реализации модели клеточно-автоматной интерференции волн

Сравнение возможностей MPI и LUNA на примере реализации модели клеточно-автоматной интерференции волн

Маркова Валентина Петровна, Остапкевич Михаил Борисович

Статья научная

В статье рассматривается параллельная реализация алгоритма клеточно-автоматной интерференции двух волн е использованием технологии фрагментированного программирования и основанной на ней системы LuNA. Технология основана на стратегии управления потоками данных. В отличие от других известных технологий и систем, LuNA предоставляет унифицированный способ написания параллельных программ для мультикомньютеров е неоднородными узлами. Программа на LuNA содержит описание фрагментов данных, вычислительных фрагментов и информационных зависимостей между ними. В данной работе LuNA программа исполняется на мультикомпьютере с однородными узлами. Результаты сравнения LuNA и MPI показали, что время выполнения LuNA программы больше, чем время выполнения MPI программы. Это обусловлено особенностями алгоритмов распределения, поиска и передачи данных и вычислительных фрагментов между узлами мультикомньютера. Написание программы для LuNA существенно проще, чем написание MPI программы.

Бесплатно

Эффективная реализация алгоритма быстрого преобразования Фурье на нерегулярных сетках

Эффективная реализация алгоритма быстрого преобразования Фурье на нерегулярных сетках

Матвеев Алексей Сергеевич, Никитин Виктор Валерьевич, Романенко Алексей Анатольевич, Дучков Антон Альбертович

Статья научная

Статья посвящена преобразованию Фурье на нерегулярных сетках (USFFT), популярному средству анализа во многих естественнонаучных задачах. Большинство практических задач, использующих USFFT, имеют большой объем данных, что приводит к значительным вычислительным затратам. В данной работе предложена реализация алгоритма USFFT, использующая такие особенности современных центральных процессоров как параллелизм и наличие большого кэша данных. Оптимизация последовательной программы позволила сократить время выполнения наиболее трудоемкого этапа преобразования в два раза, а последующее распараллеливание дало тринадцатикратное ускорение на вычислительном узле с 16 ядрами.

Бесплатно

Эффективная фрагментированная реализация краевой задачи фильтрации двухфазной жидкости

Эффективная фрагментированная реализация краевой задачи фильтрации двухфазной жидкости

Кудрявцев А.А., Малышкин В.Э., Нуштаев Ю.Ю., Перепелкин В.А., Спирин В.А.

Статья научная

Автоматизация конструирования параллельных программ численного моделирования является актуальной темой в области системного параллельного программирования. В общей постановке задача автоматического конструирования эффективной (по времени выполнения, расходу памяти, нагрузке на сеть и т.п.) параллельной программы по ее высокоуровневой спецификации является алгоритмически труднорешаемой. Развитие языков и систем автоматического конструирования параллельных программ осуществляется за счет накопления в системах частных решений и эвристик, обеспечивающих приемлемую эффективность конструируемых программ для классов приложений. Важную роль в этой связи имеет исследование эффективных параллельных реализаций конкретных задач численного моделирования на предмет возможности создания на основе этого опыта новых методов и алгоритмов конструирования эффективных параллельных программ для аналогичных случаев. Технология фрагментированного программирования является подходом, позволяющим автоматизировать конструирование эффективных параллельных программ численного моделирования. Система LuNA, разрабатываемая в ИВМиМГ СО РАН, инструментально поддерживает этот подход. В статье рассматривается эффективная фрагментированная реализация на мультикомпьютерах решателя краевой задачи фильтрации двухфазной жидкости в трехмерной области в присутствии скважин. Разработаны и оптимизированы две версии программы - одна на основе традиционных средств параллельного программирования (MPI+OpcnMP), вторая - полученная с помощью системы LuNA. Обе реализации основаны на анализе численного алгоритма с точки зрения возможностей его эффективной параллельной реализации. Экспериментальное исследование реализаций показало, что программа, разработанная вручную, обладает удовлетворительной эффективностью, а автоматически сконструированная программа с помощью системы LuNA уступает в производительности ручной реализации около трех раз, что является хорошим показателем для систем такого типа.

Бесплатно

Журнал