@programmnye-sistemy Программные системы: теория и приложения

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем. Рубрика в журнале - Программные системы: теория и приложения

Публикации в рубрике (94): Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Скрытые резервы системных сетей суперкомпьютеров Blue Waters (IBM) и Gemini (CRAY)

Каравай Михаил Федорович, Подлазов Виктор Сергеевич

Статья научная

Рассматриваются простые возможности повышения характеристик интерконнекта суперкомпьютеров Blue Waters (IBM) и Gemini (CRAY) за счет использования системных сетей с прямыми каналами.

Бесплатно

Современные серверные ARM-процессоры для суперЭВM: A64FX и другие. Начальные данные тестов производительности

Кузьминский Михаил Борисович

Статья обзорная

Дан сравнительный анализ производительности серверных ARM./процессоров, используемых на~суперЭВМ или ориентированных в частности на~высокопроизводительные вычисления (HPC). В~стартовый анализ производительности были отобраны Fujitsu A64FX, Marvell ThunderX2 и Huawei Kunpeng 920. Обзор производительности для HPC сосредоточен в~первую очередь на~тестах и приложениях для A64FX, поддерживающего более длинные, чем у~других ARM./процессоров, вектора и имеющего большую пиковую производительность. Производительность A64FX сопоставлена с~соответствующими данными для Intel Xeon Skylake и Cascade Lake, и AMD EPYC с~Zen 2 и 3 (Roma и Milan), а также с~GPU Nvidia V100 и A100. Сформулирован краткий набор потенциальных плюсов и минусов микроархитектуры A64FX. Сопоставлены данные о~производительности, получаемой с~применением различных компиляторов для A64FX. Сформированы признаки, когда A64FX дает обычно преимущества в~производительности относительно x86-64, а когда~.-- проигрывает x86-64. Подтверждается, что применение A64FX в~суперЭВМ может расти далее. Возможно, гегемония x86-64 в~HPC будет уменьшаться, в~том числе за счет расширения применения серверных ARM./процессоров. Однако проведенный анализ A64FX и ожидаемых в~ближайшее время новых процессоров архитектуры AArch64 показал, что ведущим в~этом процессе не обязательно окажется A64FX.

Бесплатно

Специализатор JaSpe: BT-объекты и межпроцедурный аспект алгоритма анализа времен связывания

Адамович Игорь Алексеевич

Статья научная

Статья посвящена частичным вычислениям, использующим offline-стратегию. Мощность этого метода решения задачи специализации программ во многом зависит от анализа времен связывания, который размечает программные конструкции как выполнимые либо невыполнимые на этапе специализации. Анализ времен связывания может использовать несколько вариантов разметки полей класса, зависящих от их использования в программе. Увеличивая число потенциальных оптимизаций, такая поливариантность по классам позволяет эффективно специализировать большее число программ. Наибольший эффект достигается на объектно./ориентированных языках, предполагающих создание большого количества различающихся по~ назначению экземпляров класса. Известные алгоритмы анализа времен связывания расширяются до поливариантности по классам и распрострают их на~объектно./ориентированный язык общего назначения. Новые методы реализованы в~виде набора плагинов для Eclipse IDE, составляющих специализатор JaSpe для программ на Java.

Бесплатно

Способы повышения производительности систем хранения данных

Сибиряков Максим Андреевич

Статья научная

В статье рассматриваются основные способы повышения производительности систем хранения данных (СХД). Определяется направление совершенствования высокопроизводительных СХД (ВСХД)

Бесплатно

Сравнительная оценка методов планирования приложений в распределенных вычислительных средах

Сухорослов Олег Викторович, Назаренко Алексей Михайлович

Ред. заметка

Работа посвящена анализу эффективности известных алгоритмов планирования пакетов задач и композитных приложений в распределенных вычислительных средах (РВС). Сравнение алгоритмов производится на основе результатов имитационных экспериментов для различных примеров приложений и конфигураций РВС. Имитационное моделирование позволяет избежать проведения длительных натурных экспериментов и обеспечить воспроизводимость результатов. Помимо полученных результатов описывается используемая имитационная модель (симулятор) РВС на базе платформы SimGrid

Бесплатно

Средства, методы и алгоритмы эффективного распараллеливания вычислительной нагрузки в гетерогенных средах

Фраленко Виталий Петрович, Агроник Алексей Юрьевич

Статья научная

Работа посвящена анализу современного состояния исследований в области алгоритмического, математического и программного обеспечения распределения задач по вычислительным узлам гетерогенной вычислительной среды. Предложена классификация стратегий распределения нагрузки: по принципу учета динамики, по принципу управления, по признаку универсальности, с прогнозированием/без прогнозирования состояния системы и пр. Рассмотрен ряд методов, систем и комплексов распределения нагрузки, в том числе следующие: метод с представлением задачи в виде направленного ациклического графа, модель планировщика задач на основе метаданных, системы «DIET», «ProActive», «Moab», «Maui», система поддержки «пластичных» заданий, комплекс потоковой обработки в терминах теории массового обслуживания, сервис-ориентированный подход. Использование указанного обеспечения позволяет минимизировать время простоя вычислительных устройств, сократить объемы и время передачи данных от одних исполнительных устройств другим, повысить общую масштабируемость, минимизировать время доступа к данным и пр. Выявлены достоинства и недостатки, даны предложения по применению.

Бесплатно

Суперкомпьютерный анализ геномных и транскриптомных данных, полученных с помощью технологий высокопроизводительного секвенирования ДНК

Спицина Анастасия Михайловна, Орлов Юрий Львович, Подколодная Наталья Николаевна, Свичкарев Анатолий Владленович, Дергилев Артур Игоревич, Чен Минг, Кучин Николай Владимирович, Черных Игорь Геннадьевич, Глинский Борис Михайлович

Ред. заметка

Развитие технологий высокопроизводительного секвенирования ДНК привело к появлению нового класса объемных геномных данных и алгоритмов их обработки и анализа. Суперкомпьютерные вычисления являются необходимым инструментом работы с генетическими данными. Представлены задачи геномики и транскриптомики, анализа экспрессии генов в контексте вычислительной сложности. Дан обзор компьютерных подходов и разработанных авторами программ для решения задач, возникающих при аннотации геномных данных и анализе экспрессии генов

Бесплатно

Суперкомпьютеры, иерархия памяти и потоковая модель вычислений

Климов Аркадий Валентинович, Левченко Николай Николаевич, Окунев Анатолий Семенович, Стемпковский Александр Леонидович

Статья научная

Современные суперкомпьютеры устроены иерархически, и глубина этой иерархии будет только расти. Структурная иерархия (ядро–чип– узел–шасси–стойка–система) создает заметные неоднородности в коммуникационной сети. Иерархия памяти тоже создает неоднородность доступа: больше объем — медленнее доступ. Поэтому среди факторов неэффективности на первый план выходят затраты на перемещения данных, и соответственно растет сложность построения хорошо оптимизированных по этому фактору программ. Возникающие трудности в значительной мере являются следствием традиционной парадигмы программирования, восходящей к фон Нейману. И хотя в защиту этой парадигмы имеются такие серьезные аргументы как сложившиеся навыки и накопленное программное обеспечение, все же полезно хотя бы в теории понимать альтернативы. Мы видим корень проблем фоннеймановского программирования в том, что в нем осуществляется парадигма сбора, и предлагаем перейти к использованию модели вычислений с управлением потоком данных, которой свойственна работа в парадигме раздачи, и в которой благодаря этой парадигме проблемы оптимизации перемещения данных решаются и проще, и эффективнее.

Бесплатно

Унифицированные электронные модули — универсальный инструмент интеграции высокоуровневых ресурсов для решения научных и инженерных задач

Чудинов Станислав Михайлович, Маликов Сергей Николаевич

Статья научная

Рассматривается структура, состав и применение Унифицированных электронных модулей (изделия УЭМ) для решения задач цифровой локации в реальном масштабе времени с применением модифицированных современных алгоритмов цифровой обработки сигналов (ЦОС), а также построение масштабируемых вычислительных систем сбора и цифровой обработки информации на базе УЭМ для решения задач цифровой локации в различных областях науки и техники.

Бесплатно

Цветные сети Петри и язык распределенного программирования UPL: их сравнение и перевод

Климов А.В.

Статья научная

Сети Петри широко используются как средство моделирования распределенных мультиагентых систем. Существуют инструменты работы с расширенными сетями Петри, в которых токены нагружены произвольными данными. В частности, CPN Tools позволяет описывать, проигрывать и исследовать цветные сети Петри (Coloured Petri Nets, CPN). Ставится вопрос о возможности использовать этот инструмент для разработки, прототипирования и исследования параллельных распределенных вычислительных алгоритмов, в идеале - превращения их в работающие эффективные параллельные программы. У нас есть опыт экспериментального программирования разных алгоритмов в нашем графическом языке UPL, который пока существует как бы «на бумаге». Его сравнение с CPN показывает, что в их семантиках много общего. В статье оба языка определяются, сравниваются на примерах и через правила перевода из одного в другой. Также описываются средства управления распределением вычислений для UPL. Интересен вопрос об их переносе в CPN, где им пока аналога нет.

Бесплатно

Шаблоны в модуле визуализации Web-интерфейса системы мониторинга BotikMon

Стоцкий Максим Викторович, Шевчук Юрий Владимирович

Ред. заметка

Статья посвящена системе мониторинга BotikMon, разработанной в ИПС им.~А.~К.~Айламазяна РАН. Система предназначена для архивации и визуализации информации, полученной от большого числа датчиков. В данной статье рассматривается вопрос разработки структур данных для страниц «избранное» в графическом интерфейсе пользователя системы BotikMon. Страницы «избранное» дают возможность сводить на одну страницу выбранные оператором данные и настраивать режимы отображения для них. Предлагается подход, основанный на использовании объектов\=/шаблонов, для которых поддерживается механизм наследования.

Бесплатно

Эксафлопсные суперЭВМ. 1 контуры архитектуры

Степаненко Сергей Александрович, Южаков Василий Васильевич

Статья научная

Исследованы архитектурные аспекты вычислительных систем эксафлопной производительности. Оценены параметры вычислительной и коммуникационной сред. Показано, что для достижения эксафлопной производительности необходимы гибридные системы. Процессорные элементы этих систем содержат ядра универсальных процессоров и арифметические ускорители. Они реализуют MIMD и SIMD дисциплины вычислений соответственно. Эффективное задействование эксафлопных гибридных систем требует принципиально нового программного обеспечения и средств архитектурного масштабирования эффективности. Применение перечисленных средств иллюстрируется на примерах тестовых программ молекулярной динамики и NPB LU. В результате достигается динамическая адаптируемость архитектуры к особенностям исполняемой программы, что в свою очередь обеспечивает эффективность применения эксафлопных суперЭВМ.

Бесплатно

Элементы стратегии опережения и архитектурные предпосылки к созданию однокристального ускорителя массовых вычислений общего назначения на базе архитектуры отечественного многопроцессорного компьютера ПС-2000

Затуливетер Юрий Семенович, Фищенко Елена Алексеевна, Артамонов Сергей Евгеньевич, Козлов Владимир Алексеевич

Статья научная

Анализируются причины, проявления и индустриальные проблемы кризиса структурного насыщения микропроцессорных архитектур. Рассматривается состояние рынка однокристальных компьютеровускорителей общего назначения для задач с массовым параллелизмом. Предлагается концепция развития отечественной линии высокопараллельных компьютеров ПС-2000, которые можно рассматривать как первых представителей общедоступных многопроцессорных систем класса GP (General Purpose). В развитие архитектуры ПС-2000 приводится описание свойств однокристальной масштабируемой и комплексируемой многопроцессорной системы ПС2000М, обладающей архитектурным потенциалом опережения. Приводится сопоставление архитектуры ПС-2000М с современными архитектурами однокристальных компьютеров с массовым параллелизмом.

Бесплатно

Эффективный расчет двумерного БПФ на однородном или гетерогенном вычислительном кластере

Князьков Дмитрий Юрьевич

Ред. заметка

Рассмотрена задача осуществления двумерного БПФ матрицы на суперкомпьютере. Исследована зависимость времени выполнения БПФ от размера матрицы для суперкомпьютеров МВС-100К, МВС-10П и HybriLIT. Описан метод балансировки вычислительной нагрузки между вычислениями на процессоре и видеокарте при использовании гетерогенного кластера. На примере видеокарты TESLA K40 показано, что время, необходимое для перемещения данных, близко времени, требуемому для осуществления двумерного БПФ на графическом вычислителе, а само время расчета в 48 раз меньше времени счета на двухпроцессорном узле

Бесплатно

← Предыдущая

Журнал