Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi
Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика
Все статьи: 333

Статически-детерминированный метод прогнозирования динамических характеристик параллельных программ
Статья научная
В статье рассматривается задача прогнозирования характеристик параллельных приложений. Изучаются динамические характеристики, описывающие выполнение параллельных приложений - время выполнения, количество операций с плавающей точкой, потребляемая электроэнергия, количество обращений в память и другие. Прогнозирование динамических характеристик позволяет решать многие проблемы, связанные с проектированием новых архитектур, выбором наиболее подходящих конфигураций многопроцессорных систем для решения конкретных задач, портированием приложений на новые системы, планированием потоков задач и многие другие. Задача прогнозирования характеристик активно исследуется. Возрастающая сложность архитектур современных высокопроизводительных систем требует разработки новых методов решения задачи прогнозирования. В статье дается обзор существующих подходов и программных средств для прогнозирования динамических характеристик и предлагается подход, основанный на статическом анализе исходного кода параллельного приложения. На основе текста параллельной программы, формального описания целевой вычислительной платформы и параметров запуска реализован метод, позволяющий прогнозировать время работы, количество выполненных операций вещественной арифметики, обращения к памяти и другие характеристики параллельного приложения. Применимость предложенного подхода продемонстрирована на примере решения тестовой трехмерной задачи численного моделирования на многопроцессорном кластере на базе процессоров IBM Power8.
Бесплатно

Статья научная
При параллельной реализации итерационных численных методов на регулярных сетках возникает необходимость в статической или динамической балансировке вычислительной нагрузки. Для исследования того или иного алгоритма балансировки нагрузки важно проводить его разносторонее тестирование на множестве различных задач рассматриваемого класса с различными конфигурациями вычислителя и различными наборами входных данных задач. В статье представлен тестовый стенд, предназначенный для автоматизации проведения такого тестирования. Он позволяет описать прикладную задачу и подключить реализацию алгоритма статической или динамической балансировки вычислительной нагрузки для последующего тестирования на мультикомпьютере. На выходе стенд предоставляет информацию о том, как происходило исполнение итерационного сеточного метода с точки зрения баланса вычислительной нагрузки. Приведен пример использования стенда для исследования диффузионного алгоритма динамической балансировки нагрузки на процессоры мультикомпьютера.
Бесплатно

Структурно-иерархическая дидактическая модель электронного обучения
Статья научная
В данной статье описывается оригинальная структурно-иерархическая дидактическая (СИД) модель электронного обучения В основе модели лежит четырехуровневая методическая база знаний. Первый уровень включает в себя комплекс электронных учебных энциклопедий по различным областям знаний. Второй уровень включает в себя электронные учебные курсы. Модель поддерживает структурирование электронного учебного курса по дидактическим компонентам (вертикальное слоение) и уровням детализации (горизонтальное слоение). Третий уровень включает в себя комплекс рабочих учебных программ. Четвертый уровень включает в себя комплекс ФГОС ВО. Отличительной особенностью СИД модели является деление образовательных объектов на дидактические компоненты. Это позволит, во-первых, производить автоматическую верификацию дидактической полноты электронного учебного курса. Во-вторых, включать части одного курса в другой без потери дидактической структуры. В-третьих, выделять из электронного учебного курса отдельный дидактический слой и на его основе автоматически формировать специализированные учебно-методические материалы: конспекты лекций, сборники задач, экзаменационные тесты и др. Описаны основные операции СИД модели, на основе которых предложены алгоритмы по анализу образовательных программ и электронных учебных курсов. В заключении дается краткая сводка результатов и направления дальнейших исследований.
Бесплатно

Суперкомпьютерное моделирование сверхзвукового течения вокруг тел вращения различной формы
Статья научная
В работе представлены численный подход и его параллельная программная реализация для исследования процессов обтекания твердых тел сложной геометрии сверхзвуковыми потоками газа. Цель исследования состояла в анализе эффективности численных схем на неструктурированных гибридных сетках, аппроксимирующих квазигазодинамические (КГД) уравнения. В качестве примера была выбрана задача обтекания тел вращения различной формы. Газовая среда представлена сухим воздухом. Система КГД уравнений рассматривалась в однокомпонентной постановке. Она дополнялась уравнениями состояния идеального газа и зависимостями кинетических коэффициентов от температуры и давления. В работе исследовались зависимость результатов от параметров численного метода и особенности параллельной реализации. В первом случае было проанализировано влияние параметров регуляризации, используемых в КГД подходе. Во втором случае анализировались различные варианты распараллеливания. В итоге этих исследований были предложены оптимальные значения вышеуказанных параметров и выявлены зависимости эффективности от алгоритма распараллеливания. В численных экспериментах были рассмотрены осесимметричные течения газа вокруг цилиндра, эллипсоида и составного тела. Расчеты проводились для трех значений скорости входного потока. Полученные результаты подтвердили корректность разработанной вычислительной технологии.
Бесплатно

Сходимость метода конечных элементов для краевой задачи с вырождением на всей границе области
Статья научная
В статье рассматривается задача Дирихле с однородным граничным условием для эллиптического уравнения второго порядка с вырождением на всей дважды непрерывно дифференцируемой границе двумерной области Ω. Определяется обобщенное решение этой задачи, которое существует и единственно в весовом пространстве Ŵ12,α(Ω). Для решения сформулированной задачи разработан метод конечных элементов, схема которого построена на основе определения обобщенного решения исходной дифференциальной задачи в пространстве Ŵ12,α(Ω). С этой целью двумерная выпуклая область разбивается на треугольники со специальным сгущением к границе. Далее, введено пространство конечных элементов Vh ⊂ Ŵ12,α(Ω), которое содержит непрерывные функции, линейные на каждом треугольном элементе сеточной области Ωh и равные нулю на множестве Ω' \ Ωh, показана однозначная разрешимость схемы метода конечных элементов. Для обобщенного решения u из подпространства Ŵ22,α-1(Ω) пространства Ŵ12,α(Ω), используя значения в узлах триангулированной области Ωh, строится интерполянт uI∈ Vh, устанавливается факт его сходимости по норме W12,α(Ω). Главным результатом работы является доказательство сходимости приближенного решения предложенного метода к точному решению в весовом пространстве Соболева.
Бесплатно

Тенденции развития вычислительных узлов современных суперкомпьютеров
Статья научная
В данной работе выполнен анализ вычислительных узлов современных суперкомпьютеров с двух точек зрения - аппаратно-компонентной и инфраструктурной. На основании проведённого анализа названы основные конструктивные элементы, которыми должен быть оснащен современный вычислительный узел. В статье приведены классификации архитектур современных универсальных и специализированных ядер с примерами; проведен обзор современных тенденций организации подсистемы памяти и внутриузлового интерконнекта; упомянуты способы использования энергонезависимых устройств хранения на узлах при организации современных высокопроизводительных систем хранения. Также разобраны основные требования к организации инфраструктуры узла современного суперкомпьютера, в частности, дана краткая классификация современных подходов к организации жидкостного охлаждения и мониторинга вычислительных узлов. Выявленные тенденции приводят к основным вариантам дизайна вычислительных узлов, состоящих из энергоэффективного универсального процессора и совокупности энергоэффективных специализированных ускорителей. В статье сделан акцент на современных технологиях, которые достигли стадии выхода в производство или, как минимум, создания рабочих прототипов. Обсуждаются современные суперкомпьютерные задачи и их отображение на архитектуру вычислительных узлов. В заключении приведено кратное обсуждение актуальных технологических проблем и основных направлений для сохранения прогресса в компьютерной отрасли.
Бесплатно

Статья научная
В работе рассматриваются вычислительные технологии решения задач, связанных с моделированием распространения сейсмических волн в неоднородных средах, характерных для вулканических структур, с использованием суперкомпьютерного моделирования в целях создания систем вибросейсмического мониторинга сейсмоопасных объектов. Построена физико-математическая модель магматического вулкана и программная реализация на основе известного численного метода, эффективно использующая архитектуру современного суперкомпьютера, оснащенного GPU. Созданы параллельные 2D и 3D алгоритмы и программы для моделирования распространения упругих волн в сложно построенной среде (2D модель есть сечение исходной 3D модели различными плоскостями и под разными углами) на основе явной конечно-разностной схемы на сдвинутых сетках и метода поглощающих границ CFS-PML. Исследована масштабируемость алгоритмов. Применение разработанной технологии позволяет гораздо эффективней проводить изучение структуры волнового поля, обусловленного геометрией внутренних границ, уточнение его кинематических и динамических характеристик.
Бесплатно

Технология фрагментированного программирования
Статья научная
Кратко представлена технология фрагментированного программирования и реализующие ее язык и система фрагментированного программирования LuNA, разрабатываемые в ИВМиМГ СО РАН. Технология ориентирована на поддержку разработки параллельных программ, реализующих большие численные модели, и их исполнения на суперкомпьютерах. Система LuNA автоматически обеспечивает такие динамические свойства параллельных программ как динамическая настройка на все доступные ресурсы, динамическая балансировка нагрузки, учет динамики поведения моделируемого явления и т.п.
Бесплатно

Топологические резервы «Сплющенных» системных сетей
Статья научная
Рассматривается метод изменения топологии 2-шаговой системной сети «сплющенная бабочка» (Flattened Butterfly), обеспечивающий уменьшение размеров составляющих ее коммутаторов и, как следствие, уменьшение схемной сложности и энергопотребления при сохранении числа абонентов (процессоров), диаметра сети и коммутационных свойств. При сохранении размеров коммутаторов предлагаемый метод позволяет существенно увеличить число абонентов при сохранении диаметра сети.
Бесплатно

Статья научная
В работе рассмотрены схемы второго и четвертого порядков погрешности аппроксимации для решения задачи диффузии-конвекции. Для модельной начально-краевой задачи, в случае когда функции правой части и начального условия представимы конечными суммами рядов Фурье по тригонометрическому базису, исследована точность разностных схем. Установлено, что точность численного решения зависит от количества узлов приходящихся на половину длины волны, соответствующей наиболее высокочастотной гармонике в конечной сумме ряда Фурье, необходимой для описания поведения расчетных объектов. Получены зависимости погрешности аппроксимации диффузионных слагаемых разностными схемами второго и четвертого порядков точности от количества узлов. Выполнено сопоставление результатов расчета двумерной задачи диффузии-конвекции и задачи Пуассона на основе схем второго и четвертого порядков точности. В работе обоснована целесообразность перехода к схемам повышенного порядка точности при решении прикладных задач и из полученных оценок нетрудно получить численные значения выигрышей во времени счета при использовании схем повышенного порядка точности.
Бесплатно

Тэта-функции в математической модели шума квантования
Статья научная
В статье выведена новая формула для двухмерной плотности распределения вероятности шума квантования, которая позволила записать ее с помощью математического выражения, которое состоит только из тэта-функций Якоби. Приведен способ получения данной формулы. Вывод формулы основан на том, что при подходящей замене переменных часть членов двойного ряда уничтожается. Показан принцип получения всех формул данного семейства. Этот принцип основан на свойствах симметрии тэта-функций. Симметрия тэта-функций позволяет выражать одну тэта-функцию через другую тэта-функцию и получать формулы, состоящие только из тэта-функций Якоби. Это семейство формул позволяет получать выражения для организации модельных экспериментов, поддерживаемые основными математическими пакетами. Они позволяют получать и числовые характеристики случайных процессов, как функции параметров, порождающих их случайных процессов гауссовского типа в аналитическом виде. Их применение увеличивает скорость сходимости результатов моделирования. Полученные формулы позволят выполнять синтез нужных выражений в аналитическом виде при функциональных преобразованиях случайных векторов и процессов, при обработке сигналов.
Бесплатно

Удаленная визуализация больших объемов данных
Статья научная
Вычислительные мощности и аппаратные характеристики персональных вычислительных устройств не всегда позволяют обеспечить должный уровень производительности для обеспечения визуализации больших объемов данных, возникающих в результате решения различных задач с использованием суперкомпьютерных вычислительных систем. Для обеспечения прозрачного и удобного доступа к таким данным может применяться подход удаленной визуализации, при котором клиент используется исключительно для отображения видео-информации с одного или нескольких удаленных серверов визуализации. В данной работе рассматриваются виды удаленной визуализации, используемые технологии, для обеспечения взаимодействия между клиентскими приложениями и удаленными серверами, анализируются различные подходы к решению задачи удаленной визуализации.
Бесплатно

Статья научная
В работе предлагается новый подход для оценки стоимостной меры риска (VaR) многомерных портфелей, основанный на смеси вероятностных анализаторов главных компонент (mPPCA) и информационном критерии Акаике. Проверяется эффективность рассматриваемого подхода на основе исторических данных с учетом различного количества компонент смесей в методе mPPCA. Исследование проводится на 100 сильно и 100 слабо диверсифицированных портфелях акций индекса S&P 500 за период 2009–2023 гг., используя скользящие окна размером 350 торговых дней. Вероятностный метод главных компонент (PPCA) позволяет моделировать сложные зависимости между активами и учитывать «тяжелые» хвосты распределений. Благодаря этому метод mPPCA превосходит классический метод главных компонент (PCA) в точности оценки. Помимо этого, за счет понижения размерности модель оказывается вычислительно существенно легче и стабильнее, чем смесь гауссовских распределений (GMM). В работе показывается зависимость волатильности и «тяжести» хвостов распределений лог-приростов стоимости портфеля как от оптимального количества компонент в методе mPPCA, так и от минимального достаточного количества основных компонент в методах PCA и PPCA для объяснения 80 % дисперсии в данных. Новый подход с оптимизацией количества компонент методом mPPCA показывает более высокие результаты, чем подходы с методами GMM, PCA и PPCA, особенно на слабо диверсифицированных портфелях. В работе описаны подходы по оптимизации обучения метода mPPCA и проведена обширная оценка эффективности на основе исторических данных (бэктестинг). Использование JIT-компиляции, «теплого старта» обучения метода mPPCA на каждом новом положении окна и трехступенчатый алгоритм поиска меры VaR позволяют существенно ускорить эксперименты по сравнению с обычной реализацией.
Бесплатно

Статья научная
Данное исследование направлено на увеличение эффективности методик государственного регулирования рынка естественной монополии. В качестве методов регулирования рассматривается применение неценовых рычагов. Эффективность системы управления, скорость реакции на внешние изменения зависит от адаптивности. Решение проблемы адаптации государства к изменению ситуации на рынке происходит циклически. На каждом шаге решается две задачи: построение модели взаимодействия монополиста и покупателя при заданных корректирующих государственных регуляторах (рынок рассматривается как замкнутая система); построение модели взаимодействия государства с рынком и оценка характеристик адаптивности государства. Решение задачи основано на определении равновесия по Штакельбергу в бескоалиционных играх двух лиц в смешанных стратегиях. При этом скорость, эффективность, оптимальность выбора государством корректирующего варианта и непосредственно момента его выбора характеризует адаптивность государства.
Бесплатно

Условная минимизация слабоунимодальных функций методом бинарного сканирования (бискана)
Статья научная
Предложен метод бинарного сканирования (бискана) для условной минимизации слабоунимодальных функций. Областью приложения данного метода является оптимизация кусочных, ступенчатых, релейных и иных слабоунимодальных функций, экстремум которых может быть локализован, как в узких, так и протяженных областях, включая области постоянства минимизируемой функции. Алгоритм, реализующий метод, представлен двумя процедурами, блок-схемы которых приведены в статье. Для оценки работоспособности бискана был проведен сравнительный вычислительный эксперимент на примерах минимизации ряда слабоунимодальных функций. Установлено, что в сравнении с конкурирующими методами, в частности с методом золотого сечения и методом последовательного перебора, бискан дает лучшие показатели быстродействия. Наибольшее быстродействие метод обеспечивает при минимизации непостоянных монотонных функций. Для определения экстремума требуется лишь пять вычислений такой функции. В сравнении с методом золотого сечения бискан имеет в 1,5 раза большее быстродействие при решении задач данного типа. При минимизации строго слабоунимодальных функций, к которым не применимы известные методы минимизации унимодальных функций, в частности, метод золотого сечения, бискан работает на порядки быстрее конкурирующего метода последовательного перебора.
Бесплатно

Учебный курс «Программирование с использованием модели OneApi»
Статья научная
Современные высокопроизводительные вычислительные системы в массе своей являются гетерогенными. Разработка параллельных программ, способных использовать весь потенциал таких систем, сопряжена со значительными сложностями - требуется не только применять соответствующие языки и технологии программирования, но и учитывать особенности центральных и графических процессоров, влияющие в том числе на схемы организации параллелизма и работу с памятью. На упрощение процесса разработки таких программ направлена модель гетерогенного программирования oneAPI, представленная компанией Intel, и ее ключевой компонент - язык Data Parallel C++, позволяющий разрабатывать переносимые высокопроизводительные программы для CPU, GPU, FPGA и других устройств. В статье представлен учебный курс по oneAPI, разработанный в ННГУ им. Н. И. Лобачевского. Курс направлен на изучение широкого спектра вопросов, связанных с высокопроизводительными вычислениями с использованием моделей, методов и инструментов параллельного программирования на платформах Intel. В статье представлена концепция курса, описана его структура, категории слушателей, которым он может быть интересен, и варианты построения курса в зависимости от уровня подготовки аудитории.
Бесплатно

Формирование и планирование пакетов заданий в распределенных вычислительных средах
Статья научная
В работе рассматриваются подходы к формированию системы ранжированных заданий в модели циклического планирования в виртуальных организациях распределенных вычислительных сред. Предлагаются и сравниваются две различные методологии отбора заданий для планирования: первая из них базируется на решении задачи о заполнении ранца, для второй - вводится эвристический показатель «совместимости» заданий и доменов вычислительных узлов. Приводятся результаты экспериментального исследования, позволяющего оценить эффективность предложенных решений, проводится их сравнительный анализ со случайным отбором заданий в пакет.
Бесплатно

Функциональность и технологии алгебраических решателей в библиотеке Krylov
Статья научная
Описываются функциональные возможности и особенности программной реализации библиотеки параллельных алгоритмов Krylov, ориентированной на решение больших систем линейных алгебраических уравнений с разреженными симметричными и несимметричными матрицами (положительно определенными и знаконеопределенными), получаемых при сеточных аппроксимациях многомерных краевых задач для систем дифференциальных уравнений на неструктурированных сетках. Библиотека включает двухуровневые итерационные методы в подпространствах Крылова, предобуславливание которых осуществляется на основе сбалансированной декомпозиции расчетной области с различными размерами пересечений подобластей и краевых условий сопряжения на смежных границах. Программные реализации выполнены на типовых сжатых разреженных форматах матричных данных. Приводятся результаты численных экспериментов с демонстрацией эффективности распараллеливания для характерных плохо обусловленных задач.
Бесплатно

Цифровой проект и платформа для работы с ним
Статья научная
Обоснована актуальность представления сложных наукоемких цифровых проектов в виде направленного графа, объединяющего в единый цифровой объект входные, выходные и промежуточные данные с программными модулями преобразования информации. Предложен метод манипулирования с таким представлением в виде облачной интернет-платформы. Последняя включает в себя центральный сервер приложений и хранилище (репозиторий), обеспечивающие хранение алгоритмов и данных, регистрацию и сопровождение пользователей, коммуникации между ними, а также учет использования ими алгоритмов и данных при решении прикладных задач. Работа с алгоритмами и данными происходит в исполняемой среде, загружаемой при присоединении к платформе либо на машину пользователя, либо на виртуальную машину в облачном кластере. Эта среда обеспечивает создание, модификацию и использование алгоритмов (в том числе, из множества предлагаемых стандартных), которые решают конкретные прикладные задачи конкретного пользователя. Взаимодействие пользователя с сервером и репозиторием осуществляется через веб-интерфейс или толстый клиент на локальной или виртуальной машинах. Представлен работающий прототип названной платформы, функционирующий с использованием суперкомпьютерных технологий и системы виртуализации рабочих столов. Прототип включает в себя инструменты создания программных средств на основе графовомодульной архитектуры и коммуникационные сервисы для участников. Он позволяет выполнять вычислительные графы в высокопроизводительной среде, обеспечивать регистрацию интеллектуальной собственности в галерее и осуществлять биллинг ее использования. Приведены реализованные примеры возможного использования платформы в геофизических исследованиях и в области государственного управления.
Бесплатно

Численная реализация метода поверхностного движения для решения задач линейного программирования
Статья научная
Работа посвящена численной реализации нового метода линейного программирования, получившего название "метод поверхностного движения". В основе реализации лежит оригинальный алгоритм AlFaMove, который строит на поверхности допустимого многогранника оптимальный целевой путь от произвольной граничной точки до точки, являющейся решением задачи линейного программирования. Оптимальность пути заключается в том, что направление движения по грани многогранника соответствует максимальному увеличению значения целевой функции. Для вычисления оптимального направления движения используется метод, базирующийся на операции построения псевдопроекции на линейное многообразие. Операция псевдопроекции обобщает понятие ортогональной проекции и реализуется с помощью итерационного алгоритма проекционного типа. Доказано, что в случае линейного многообразия, образуемого путем пересечения гиперплоскостей, псевдопроекция совпадает с ортогональной проекцией. Также доказано, что в случае линейного многообразия метод на основе псевдопроектирования вычисляет вектор движения в направлении максимального увеличения целевой функции. Выполнена параллельная реализация алгоритма AlFaMove. Приведены результаты вычислительных экспериментов на кластерной вычислительной системе, демонстрирующие высокую масштабируемость предложенной численной реализации.
Бесплатно