@programmnye-sistemy Программные системы: теория и приложения

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем. Рубрика в журнале - Программные системы: теория и приложения

Публикации в рубрике (94): Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Building robust malware detection through conditional generative adversarial network-based data augmentation

Baghirov E.

Статья научная

Malware detection is essential in cybersecurity, yet its accuracy is often compromised by class imbalance and limited labeled data. This study leverages conditional Generative Adversarial Networks (cGANs) to generate synthetic malware samples, addressing these challenges by augmenting the minority class. The cGAN model generates realistic malware samples conditioned on class labels, balancing the dataset without altering the benign class. Applied to the CICMalDroid2020 dataset, the augmented data is used to train a LightGBM model, leading to improved detection accuracy, particularly for underrepresented malware classes. The results demonstrate the efficacy of cGANs as a robust data augmentation tool, enhancing the performance and reliability of machine learning-based malware detection systems.

Бесплатно

Desktop Grid корпоративного уровня

Ивашко Евгений Евгеньевич

Статья научная

В работе рассказывается о системах Desktop Grid корпоративного уровня, их возможностях, отличительных особенностях и приложениях. Даны примеры реализации систем промежуточного программного обеспечения, предназначенных для организации корпоративных Desktop Grid.

Бесплатно

Etherbox: a protocol for modular sensor networks

Shevchuk Yury Vladimirovich, Shevchuk Elena Vasilievna, Ponomarev Alexander Yurievich, Vogt Igor Anatolievich, Elistratov Alexey Viktorovich, Vakhrin Andrey Yurievich, Yarovicyn Roman Evgenievich

Ред. заметка

Бесплатно

Etherbox: протокол для управления модульной сенсорной сетью

Шевчук Юрий Владимирович, Шевчук Елена Васильевна, Пономарв Александр Юрьевич, Фохт Игорь Анатольевич, Елистратов Алексей Викторович, Вахрин Андрей Юрьевич, Яровицын Роман Евгеньевич

Ред. заметка

Протокол прикладного уровня Etherbox предназначен для взаимодействия управляющего компьютера с узлами сенсорной сети в форме исполняемых программ виртуальной машины, что позволяет обеспечить гибкость в управлении, необходимую для сенсорных сетях с модульной конструкцией узлов. В статье описаны принципы функционирования сенсорной сети, использующей протокол Etherbox, в сравнении с сетями, использующими протоколы MQTT-SN и CoAP. Рассматривается архитектура программного обеспечения снесорных узлов и управляющего компьютера.

Бесплатно

Memory-efficient sensor data compression

Shevchuk Yury Vladimirovich

Статья научная

We treat scalar data compression in sensor network nodes in streaming mode (compressing data points as they arrive, no pre-compression buffering). Several experimental algorithms based on linear predictive coding (LPC) combined with run length encoding (RLE) are considered. In entropy coding stage we evaluated (a) variable-length coding with dynamic prefixes generated with MTF-transform, (b) adaptive width binary coding, and (c) adaptive Golomb-Rice coding. We provide a comparison of known and experimental compression algorithms on 75 sensor data sources. Compression ratios achieved in the tests are about 1.5/4/1000000 (min/med/max), with compression context size about 10 bytes.

Бесплатно

Methods for anchoring boundary nodes when smoothing a triangular surface mesh

Sergei S. Shumilin

Статья научная

In numerical modeling tasks that use surface meshes, remeshing is often required. However, while remeshing, distortion can occur. The accumulation of distortions can lead to the collapse of the solution. Smoothing algorithms are used to maintain the quality of the mesh during the calculation. When performing smoothing using methods that shift the mesh nodes, the border nodes are usually fixed to avoid distortion. However, simply fixing the nodes can lead to more severe distortion. This paper presents methods for working with boundary nodes to control such nodes during the smoothing process. Algorithms for working with pseudo-3D surface meshes, which are of particular interest, are also considered

Бесплатно

Modern server ARM processors for supercomputers: A64FX and others. Initial data of benchmarks

Kuzminsky Mikhail Borisovich

Статья обзорная

A comparative analysis of~the performance of~ARM server processors used on~supercomputers or also aimed at~high-performance computing (HPC) is given. Fujitsu A64FX, Marvell ThunderX2 and Huawei Kunpeng 920 were selected for the initial performance analysis. The HPC performance review focuses primarily on~benchmarks and applications for the A64FX, which supports longer vectors than other ARM processors and has higher peak performance. The performance of~the A64FX is compared against corresponding data for Intel Xeon Skylake and Cascade Lake, and AMD EPYC with Zen 2 and 3 (Roma and Milan), as well as Nvidia V100 and A100 GPUs. A~short set of~potential pros and cons of~the A64FX microarchitecture has been formulated. Comparison of~performance data obtained using different compilers for A64FX. Features have been formed when A64FX usually gives advantages in~performance over x86-64, and when it concedes to x86-64. It is clear that the use of~A64FX in~supercomputers can grow further. There is an assumption that x86-64 hegemony in~HPC will decrease, in~particular, due to the increased use of~server ARM processors. But the analysis of~A64FX and new AArch64 processors expected in~the near future showed that A64FX will not necessarily lead in~this process.

Бесплатно

Riak KV performance in sensor data storage application

Zhivchikova Nadezhda Sergeevna, Shevchuk Yury Vladimirovich

Ред. заметка

Бесплатно

The platform approach to research and development using high-performance computing

Biryaltsev Eugeniy Vasiljevich, Galimov Marat Razifovich, Demidov Denis Evgenievich, Elizarov Aleksandr Mikhailovich

Статья научная

In this paper, we analyze the prerequisites and substantiate the relevance for creating an open Internet platform that employs big data technologies, highperformance computing, and multilateral markets in a unified way. Conceived as an ecosystem for the development and use of applied software (including in the field of design and scientific research), the platform should reduce time/costs and improve the quality of software development for solving analytical problems arising in industrial enterprises, scientific research organizations, state bodies and private individuals. The article presents a working prototype of the platform using supercomputer technologies and desktop virtualization systems.

Бесплатно

Vectorization of the Riemann solver using the AVX-512 instruction set

Rybakov Alexey Anatoljevich, Shumilin Sergey Sergeevich

Статья научная

Numerical methods based on solving the Riemann problem of the decay of an arbitrary discontinuity are extremely demanding of computational resources. Applying the data of numerical methods to modern computational grids requires the use of a supercomputer. Among the various tools for improving the performance of supercomputer applications, we can emphasize the vectorization of program code. The AVX-512 instruction set has a number of unique features allowing to apply vectorization to the Riemann solver software context, which results in a significant acceleration of the solver. Using the exact Riemann solver as an example, the article discusses practical approach to vectorizing a various program contexts, including simple linear blocks, regions with complex control, and nested loops. The basis of the approach under consideration is the possibility of simultaneously executing several instances of some pure function on the same processor core. This feature is achieved by translating the program code into the predicate form and using AVX-512 vector instructions. In this case the number of simultaneously running instances is equal to the width of the vector. It is shown that using the features of the AVX-512 instruction set allows to successfully vectorize the considered program context. The proposed approach can be applied to vectorize a wide range of applications.

Бесплатно

Алгоритм динамического распараллеливания решения задачи адаптивного разбиения расчетной сетки для численного решения дифференциальных уравнений

Кузнецов Антон Александрович, Роганов Владимир Александрович, Матвеев Герман Анатольевич, Осипов Валерий Иванович

Статья научная

При численном решении дифференциальных уравнений непрерывная область решений ДУ заменяется дискретной решеткой, в узлах которой приближенно вычисляется значение искомой функции. В зоне ударных волн, межфазных границ и пограничных слоев при использовании регулярных сеток может быть резкий рост нормы производных и как следствие нормы ошибок аппроксимации, что ведет к потере точности численного решения. Для подавления роста ошибок аппроксимации используются адаптивные алгоритмы сгущения сеток в проблемных областях. В работе кратко описан подход к распараллеливанию такого алгоритма на основе концепции динамического распараллеливания «Т-система».

Бесплатно

Быстродействие и отказоустойчивость идеальной системной сети через дополнительную параллельность

Подлазов В.С.

Статья научная

Рассмотрены методы повышения быстродействия системных сетей посредством двоякого повышения их параллельности – использования копий и параллельных каналов в их совокупности. Предложены методы построения неблокируемых системных сетей с прямыми каналами произвольной размерности. Рассмотрены методы построения неблокируемых сетей с заданным числом параллельных каналов как сетей со структурой квазиполных графов. Предложен метод построения системных сетей любого размера с заданным числом параллельных каналов посредством использования соответствующего числа их копий.

Бесплатно

Вариант организации облачного сервиса для высокопроизводительных вычислений

Баранов Антон Викторович, Зонов Антон Андреевич

Статья научная

Статья посвящена вопросу создания облачного сервиса вида SaaS для готовых суперкомпьютерных приложений. В статье рассмотрены технологии организации подобного облачного сервиса на основе программного комплекса «Пирамида» и Системы управления прохождением параллельных заданий (СУППЗ). Созданный облачный сервис призван выполнять роль дополнительного уровня абстракции, позволяющего объединить разные высокопроизводительные вычислительные установки и организовать для них единый интерфейс управления

Бесплатно

Векторизация римановского решателя с использованием набора инструкций AVX-512

Рыбаков Алексей Анатольевич, Шумилин Сергей Сергеевич

Статья научная

Численные методы, базирующиеся на решении задачи Римана о распаде произвольного разрыва, крайне требовательны к вычислительным ресурсам. Для применения данных численных методов на современных расчетных сетках требуется использование суперкомпьютера. Среди различных инструментов повышения производительности суперкомпьютерных приложений можно выделить векторизацию программного кода. Набор инструкций AVX-512 обладает рядом уникальных возможностей, позволяющих применить векторизацию к программному контексту римановского решателя, что ведет к значительному ускорению решателя. На примере точного римановского решателя рассматривается практический подход к векторизации разнообразного программного контекста, включая простые линейные участки, регионы со сложным управлением, а также вложенные циклы. В основе рассматриваемого подхода лежит возможность одновременного выполнения на одном процессорном ядре нескольких экземпляров некоторой чистой функции. Данная возможность достигается путем перевода программного кода в предикатную форму и использования векторных инструкций. При этом количество одновременно выполняющихся экземпляров равно ширине вектора. Показано, что использование возможностей набора команд AVX-512 позволяет успешно векторизовать рассматриваемый программный контекст. Предложенный подход может быть применен для векторизации широкого спектра приложений.

Бесплатно

Влияние пакетирования на эффективность планирования параллельных заданий

Баранов Антон Викторович, Ляховец Дмитрий Сергеевич

Ред. заметка

В статье рассматривается разработанная авторами система пакетирования параллельных заданий, позволяющая объединять однотипные задания с длительным временем инициализации в пакеты. Длительная инициализация влечёт за собой снижение эффективности использования вычислительных ресурсов и планирования параллельных заданий. В статье приводятся результаты экспериментов по исследованию влияния пакетирования на такие показатели эффективности планирования параллельных заданий, как полная и полезная загрузка вычислительных ресурсов

Бесплатно

Внутреннее представление и механизм межпроцессного обмена для блочно/структурированной сетки при выполнении расчетов на суперкомпьютере

Рыбаков Алексей Анатольевич

Ред. заметка

В статье рассматривается внутреннее представление блочноструктурированной сетки, описание основных ее объектов и взаимодействие их между собой. Также рассматривается механизм организации межпроцессного обмена данными, при выполнении расчетов на суперкомпьютере

Бесплатно

Вокруг условного 4-го поколения современных серверных процессоров AMD и Intel: их микроархитектура и производительность соответствующих вычислительных систем

Кузьминский М.Б.

Статья научная

Обзор посвящен особенностям микроархитектуры и производительности процессоров Intel Xeon — масштабируемых процессоров 4-го поколения (c микроархитектурой Sapphire Rapids-SP, далее Xeon SPR), 5-го поколения (Emerald Rapids-SP, далее Xeon EMR), и разных классов процессоров AMD EPYC архитектуры Zen 4, а также вычислительным системам на их основе. Анализируются данные о моделях Xeon SPR (и Xeon SPR с памятью HBM, то есть Xeon Max), Xeon EMR и процессорax AMD EPYC 9004 (хотя приведены и краткие данные о EPYC 8004 и 4004). Эти процессоры отнесены в обзоре к условному 4-му поколению Xeon и EPYC. Сопоставления проводятся и с масштабируемыми процессорами Xeon 3-го поколения — Ice Lake-SP (далее Xeon ICL), Cooper Lake-SP, с AMD EPYC с архитектурой Zen 3 (Milan), а также иногда с процессорами ARM-архитектуры и GPU. Кратко обсуждаются средства разработки программ (SDK) для процессоров 4-го поколения, имеющие важное значение для достигаемой производительности. В связи с применением чиплетов или использованием HBM-памяти в рассматриваемых процессорах AMD и Intel особое внимание обращается на поддерживаемые варианты NUMA. Анализируется также аппаратная поддержка средств обеспечения безопасности для задач виртуализации, которые теперь часто применяются и в области высокопроизводительных вычислений (HPC). Данные о производительности в обзоре охватывают широкий спектр областей применения, характерных для серверов с этими процессорами. Но основное внимание уделяется HPC и, в меньшей степени, задачам ИИ. Рассматриваемые процессоры анализируются с точки зрения построения с ними гомогенных или содержащих GPU гетерогенных серверов и вычислительных систем на их основе (кластеров и суперкомпьютеров). Анализируется также начальная информация о новейших процессорах Intel Xeon 6 Granite Rapids и AMD EPYC Zen 5 Turin, включая первые данные об их производительности. Сделаны выводы общего характера о состоянии и образовавшихся тенденциях развития таких процессоров x86.

Бесплатно

Выполнение задач сортировки на векторном процессоре с архитектурой управления потоком данных

Дикарев Николай Иванович, Шабанов Борис Михайлович, Шмелв Александр Сергеевич

Ред. заметка

Задача сортировки является широко распространённым вычислительным блоком, который используется во многих областях, и известно много алгоритмов, как последовательных, так и параллельных, решения этой задачи. Поэтому несколько известных алгоритмов решения задачи сортировки были выбраны для тестирования разрабатываемого в МСЦ РАН векторного процессора с архитектурой управления потоком данных и сравнения достигнутой при моделировании производительности с производительностью лучших современных процессоров.Анализируются преимущества и недостатки архитектуры разрабатываемого векторного процессора, их учет для построения графов программ последовательных и параллельных алгоритмов решения задачи сортировки на данном процессоре и достигнутые при этом результаты.

Бесплатно

Групповые вычисления в неблокируемых системных сетях

Подлазов В.С.

Статья научная

Рассмотрены неблокируемые оптоэлектронные сети, в которых выполняются групповые операции над множеством чисел за время передачи одного числа. Рассмотрено выполнение групповых операций исполнительными фотонными блоками, размещенными при каждом абоненте сети, и представлена схемотехника этих блоков. Исследована возможность выполнения групповых операции в циклических последовательностях узлов, задаваемых гамильтоновыми графами. Предложены процедуры построения этих циклических последовательностей и выполнения в них групповых операций. Рассмотрена возможность построения неблокируемой электронной системной сети на любое число абонентов. Предложен способ построения оптоэлектронной сети как тандемной сети, в которой оптоэлектронные переключатели управляются их аналогами из электронной сети.

Бесплатно

Задача оптимизации времени выполнения проекта в вычислительной сети из персональных компьютеров

Румянцев Александр Сергеевич

Статья научная

Рассмотрена модель процесса выполнения одного проекта в вычислительной сети из персональных компьютеров при условии равного времени выполнения подзаданий. Исследованы условия, при которых репликация подзаданий между узлами сети сокращает общее время выполнения проекта в двух частных случаях модели: при выполнении пачек подзаданий, а также при ненулевом штрафе за невыполнение подзадания.

Бесплатно

Следующая страница →

Журнал