Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика
Все статьи: 316
Моделирование влияния системы мониторинга производительности на выполнение коллективных MPI операций
Статья научная
Изучение параллельных программ с помощью средств мониторинга производительности - распространенная практика. Агент системы мониторинга для сбора данных о работе приложения периодически активируется во время счета этого приложения, внося помехи и занимая ресурсы. Однако вопрос об уровне влияния этих помех является слабо изученным, разработчики систем мониторинга зачастую не проводят исследования в этом направлении. В данной статье рассматриваются подходы к изучению влияния системы мониторинга производительности суперкомпьютера на пользовательские приложения. В качестве инструмента для измерения влияния агента системы мониторинга предлагается использовать коллективные MPI операции. Так, кроме обнаружения шума системы мониторинга, можно исследовать влияние системы мониторинга на сильно синхронизированные приложения. Время выполнения коллективных MPI операций изучается в присутствии программного средства, моделирующего работу агента системы мониторинга производительности. Оценивается уровень шума, который каждая из рассматриваемых коллективных операций в выбранной конфигурации запуска способна зафиксировать. В работе приводятся данные запусков инструмента с коллективными MPI операциями All-to-All, All-Reduce, Barrier. Найдено, что хорошей стабильностью и чувствительностью обладают операции All-to-All и Barrier.
Бесплатно
Моделирование заданного движения пятизвенного механизма
Краткое сообщение
Рассматривается задача о моделировании совместного со связями заданного пятизвенного механизма, у которого точки опоры шарнирно связаны с плоскостью. Управлениями являются моменты сил в шарнирных соединениях механизма. Для упрощенной модели на основе анализа уравнений движения излагается схема построения требуемых уравнений.
Бесплатно
Краткое сообщение
В статье описаны принципы моделирования предельных границ рудных месторождений на высокопроизводительных вычислительных системах с гибридной архитектурой с применением параллельного генетического алгоритма.
Бесплатно
Статья научная
Рассматриваются процессы переноса многокомпонентных веществ в водоеме. Примером таких веществ могут являться радионуклидные и нефтяные загрязнения природных водоемов. Полученные в результате математического моделирования численные задачи решаются на высокопроизводительных вычислительных системах (ВВС) с использованием существующих пакетов распараллеленных итерационных методов. В качестве исследуемого водоема рассматривается Азовское море.
Бесплатно
Статья научная
Рассматривается проблема выполнения длительных расчетов на высокопроизводительных вычислительных системах, компоненты которых подвержены отказам. Для программ, запускаемых на подобных системах, существенным является возможность обработки отказов путем автоматического продолжения расчета на оставшихся работоспособных узлах системы. Возможность обработки отказов предусматривается в разрабатываемом стандарте MPI 3.1. В работе кратко описывается библиотека моделирования отказов для тестирования отказоустойчивых алгоритмов, использующих функционал разрабатываемого стандарта MPI 3.1. Описана техника отказоустойчивости на примере тестовой задачи. Проведено сравение записи контрольных точек в оперативную память и в распределенную файловую систему.
Бесплатно
Моделирование процесса роста нанопленок методом химического осаждения из газовой фазы
Статья научная
Большинство задач, которые связаны со многими аспектами развития нанотехнологий, по своей природе существенно междисциплинарны. Одним из наиболее характерных примеров этого является проблематика применения газофазного синтеза в нанотехнологиях. По своему существу такие технологии являются реализацией процессов химического осаждения вещества из газообразного состояния, подаваемого в реакционную зону, в твердое состояние. Междисциплинарность рассматриваемых в газофазном синтезе процессов порождает серьезные трудности при их изучении. При этом в рамках традиционного физического эксперимента не удается получить хорошего результата, так как такой эксперимент: не является наглядным, не позволяет изучать зависимость конечного материала от различных физических параметров системы, занимает много времени, дорог. Поэтому естественно искать пути решения задач на базе математического моделирования, которое лежит в основе виртуального эксперимента. В основе работы — разработка и апробация технологий математического моделирования с использованием высокопроизводительных вычислений в области процессов газофазного синтеза наноразмерных структур и наноматериалов с целью изучения и обеспечения визуализации протекающих физико-химических процессов.
Бесплатно
Статья научная
В работе рассмотрена задача моделирования сейсмического поля (случай распространения продольной волны с учетом только сжатия и растяжения среды) в слоистой среде с включениями иерархической структуры. Построены алгоритмы моделирования в сейсмическом случае для 2-D упругой и пористой иерархической неоднородности. Исследован вопрос отражения физических свойств однофазности и двухфазности в системе уравнений решения прямой динамической сейсмики в частотном варианте.
Бесплатно
Моделирование экстремального наводнения в дельте дона на многопроцессорных вычислительных системах
Статья научная
По материалам ежедневных гидрометеорологических наблюдений на береговой базе Южного научного центра РАН в период с 20 марта по 26 марта 2013 года, проведено восстановление картины аномального затопления дельты Дона. Расчеты уровня воды и объема поступающей в дельту Дона воды проводились с помощью двухслойной математической модели. Расчеты проводились на многопроцессорных вычислительных системах, установленных в Южном федеральном университете.
Бесплатно
Моделирование электромагнитного и сейсмического поля в иерархически неоднородных средах
Статья научная
Построен алгоритм 3D моделирования электромагнитного поля для произвольного типа источника возбуждения N-слойной среды с иерархическим проводящим включением, расположенным в J-ом слое. Построены алгоритмы 2-D моделирования для дифракции звука и линейно поляризованной поперечной упругой волны на включении иерархической структуры, расположенной в J-ом слое N-слойной упругой среды.
Бесплатно
Модель параллельных вычислений для многопроцессорных систем с распределенной памятью
Статья научная
Появление мощных многопроцессорных вычислительных систем выдвигает на первый план вопросы, связанные с разработкой фреймворков (шаблонов), позволяющих создавать высокомасштабируемые параллельные программы, ориентированные на системы с распределенной памятью. При этом особенно важной является проблема разработки моделей параллельных вычислений, позволяющих на ранней стадии проектирования программы оценить ее масштабируемость. В статье приводятся общие требования к модели вычислений и строится новая высокоуровневая модель параллельных вычислений Bulk Synchronous Farm (BSF), являющаяся расширением модели BSP, и основанная на методе программирования SPMD и парадигме «мастер-рабочие». Модель BSF ориентирована на вычислительные системы с массовым параллелизмом на распределенной памяти, включающие в себя сотни тысяч процессорных узлов, и имеющие экзафлопный уровень производительности и на численные итерационные методы с высокой временной сложностью. Определяется архитектура BSF-компьютера и описывается структура BSF-программы. Описывается формальная стоимостная метрика, с помощью которой получаются верхние оценки масштабируемости параллельных BSF-программ применительно к вычислительным системам с распределенной памятью. Также выводятся формулы для оценки эффективности распараллеливания BSF-программ и даются аналитические оценки масштабируемости BSF-приложений.
Бесплатно
Модель прогнозирования живого веса с помощью глубокой регрессии RGB-D изображений
Статья научная
Прогнозирование живого веса помогает контролировать здоровье животных, эффективно проводить генетическую селекцию и определять оптимальное время убоя. На крупных фермах для измерения живого веса используются точные и дорогостоящие промышленные весы. Взвешивание животного из-за стресса ведет к потере его веса и продуктивности на 5-10%. Однако, перспективной альтернативой является оценка живого веса с помощью морфометрических измерений животного, а затем применение уравнений регрессии, связывающих такие измерения с живым весом. Ручные измерения животных с помощью рулетки отнимают много времени и вызывают стресс у животных. Поэтому в настоящее время для бесконтактных морфометрических измерений все чаще используются технологии компьютерного зрения. В статье предлагается новая модель для прогнозирования живого веса на основе регрессии изображений с использованием методов глубокого обучения. Для регрессии изображений использовались RGB изображения и карты глубины вид сбоку для прогнозирования живого веса крупного рогатого скота. Показано, что на реальных наборах данных предложенная модель достигает точности измерения веса с ошибкой MAE 35.5 и MAPE 8.4 на тестовом наборе данных.
Бесплатно
Статья научная
В статье рассматривается метод матричных пучков, являющийся параметрическим Прони -подобным методом обработки сигнала и позволяющим найти частоты, коэффициенты затухания, фазы и амплитуды суммы затухающих синусоид. Его преимуществом по сравнению с методом Прони является меньшее количество операций, что приводит к меньшей вычислительной ошибке. Предложена модификация данного метода способная решить задачу разделения истинных и ложных полюсов сигнала. Из отсчетов сигнала конструируются два пучка матриц, собственные значения которых в случае отсутствия шума совпадают с полюсами сигнала и обратными к ним. В случае зашумленного сигнала разделение истинных и ложных полюсов проводится за счет: 1) сингулярного разложения, 2) завышенного порядка предсказания, 3) анализа собственных значений двух пучков матриц. Приведен алгоритм модифицированного метода матричных пучков и сравнение этой модификации с классическим вариантом на модельном примере обнаружения сигнала в шуме. Показано, что классический метод не способен определить время начала полезного сигнала, поскольку подстраивает под шум сумму экспонент. Модифицированный метод матричных пучков решает задачу обнаружения сигнала в шуме и его параметров, т.к. помимо определения времени прихода сигнала, также способен оценить количество затухающих синусоид в нем и их параметры. Предложенный алгоритм обнаружения сигнала пригоден для работы с сигналами достаточно общего вида (суммой затухающих синусоид) и не требует знания законов распределения самого сигнала и его шумовой составляющей, как метод максимального правдоподобия.
Бесплатно
Модулярно-логарифмический сопроцессор для массовых арифметических вычислений
Статья научная
Предлагаемый сопроцессор представляет собой самостоятельный сложнофункциональный (intellectual property - IP) блок системы-на-кристалле, позволяющий проводить математические вычисления над вещественными числами в уникальной модулярно-логарифмической системе счисления. Обеспечены два уровня преобразования исходных чисел: в модулярную систему счисления вместо традиционной позиционной и в логарифмическую систему счисления вместо плавающей точки. Благодаря этому сопроцессор обладает более высоким быстродействием, точностью и надежностью вычислений по сравнению с известными аналогами. Он состоит из набора одинаковых вычислительных ядер, каждое из которых выполняет однотактовые скалярные или векторные операции. В результате проведенных исследований и разработок предложены новые научные и технические решения, реализующие предложенные способы вычислений и кодирования данных. При этом преобразование кодов в модулярно-логарифмическую систему счисления и обратно не вносит значительных временных задержек при большом потоке входных данных за счет предложенных аппаратных решений, конвейеризирующих процесс интерполяции функции логарифма и преобразования кодов системы остаточных классов. Реализован прототип устройства на базе программируемой логической интегральной схемы в виде IP-блока. Целевой рынок решения - компании разработчики универсальных процессоров.
Бесплатно
Статья научная
Рассматривается новый способ организации высокоточных вычислений с плавающей точкой, позволяющий распараллеливать арифметические операции вплоть до уровня отдельных цифр многоразрядных мантисс путем использования модулярно-позиционного формата представления данных. Основная концепция данного формата заключается в представлении мантисс чисел в многомодульной системе остаточных классов (СОК), а порядков - в позиционной системе счисления. Мантиссы сопровождаются позиционной характеристикой, которая способствует реализации эффективных алгоритмов выполнения немодульных операций в СОК, таких как деление (частный случай) и округление. На основе данного подхода разрабатывается программное решение High Precision Digit-Parallel Solver (HPDP-Solver). Комплекс HPDP-Solver может быть гибко настроен на конфигурацию конкретной машины, в результате чего обеспечивается наиболее эффективное использование ее ресурсов. В результате экспериментального исследования быстродействия пакета HPDP-Solver были получены результаты, доказывающие его преимущества при решении высокоточных численных задач перед имеющей мировую известность позиционной библиотекой GNU Multiple Precision Arithmetic Library. Пакет HPDP-Solver может быть применен при решении задач, которые предъявляют особо высокие требования к вычислительной точности.
Бесплатно
Статья научная
Проведен сравнительный анализ вычислительной эффективности и масштабируемости молекулярной динамики (МД), реализованной в пакете AMBER, на реальных биологических системах с применением классического силового поля FF14SB с 4-центровой моделью воды TIP4P-Ew, а также нового многообещающего поля FF15IPQ с 3-центровой моделью воды SPC/Eb. Были использованы классические процессоры Intel Xeon E5-2697 v3, а также GPU ускорители Tesla K40 (архитектура Kepler) и P100 (Pascal). Уменьшение количества атомов в ячейке на 25-31 % в результате использования 3-центровой модели растворителя ускоряет расчет МД до 63% и ухудшает масштабируемость до 11 %. При этом полученные результаты могут качественно отличаться, что говорит о необходимости совместного использования разных силовых полей при изучении биологических систем. Использование GPU-ускорителей как альтернативы классическим CPU позволяет существенно увеличить длину траектории в повседневной практике.
Бесплатно
Направленные сплайны и их использование для сглаживания выбросов и изломов интерполянта
Статья научная
Сформулирован и предложен метод построения направленного кубического сплайна для набора точек на плоскости. Проведено сравнение сплайна с B-сплайном Шёнберга, сплайнами Акимы и Катмулла-Рома. Показано, что для неравноотстоящих точек в сравнении с B-сплайном он дает значительно меньшие выбросы и практически лишен сильных изломов, которые свойственны сплайнам Акимы. Сплайн не дает петель и осцилляций, которые являются характерным недостатком параметрических сплайнов, в частности, эрмитовых, к числу которых относится сплайн Катмулла-Рома. Предложен быстрый метод оптимизации направляющего коэффициента сплайна, цель которой состоит в минимизации разрывов второй производной функции в ее промежуточных точках. Приведен пример оптимизации направленного сплайна третьего порядка. Также предложен направленный сплайн четвертого порядка, который лишен изломов. Сформулирован метод оптимизации направленного сплайна четвертого порядка, изложен алгоритм его оптимизации. Критериями оптимизации являются длина сплайна и наименьшее расстояние между его глобальными максимумом и минимумом. Показано, что в сравнении с сплайна Шёнберга направленный сплайн четвертого порядка имеет меньшие выбросы. Предложен метод автоматического притупления острых пиков кривых, который можно применять ко всем типам сплайнов.
Бесплатно
Нейросетевой метод решения задачи мэппинга параллельных приложений
Статья научная
Статья посвящена проблеме повышения эффективности параллельных приложений. В статье предлагается подход к решению проблемы, основанный на сокращении накладных расходов, связанных с передачей данных между процессами параллельной программы во время ее выполнения на высокопроизводительной вычислительной системе. С ростом числа процессорных узлов расходы на передачу сообщений между узлами оказывают все большее влияние на производительность параллельных приложений. В связи с этим становится особо актуальной задача размещения процессов параллельной программы по вычислительным узлам суперкомпьютера, известная, как задача мэппинга. В работе предлагается новый подход к решению задачи мэппинга. Ключевой особенностью подхода является выбор коммуникационного шаблона путем фазового анализа приложения и использование сверточной нейронной сети для быстрого выбора подходящего алгоритма мэппинга, исходя из построенного коммуникационного шаблона. Для построения коммуникационных шаблонов проводится анализ поведения приложения с точки зрения передачи сообщений точка-точка между процессами параллельной программы. Временная шкала событий передачи сообщений разбивается на равные промежутки, для каждого из которых строится коммуникационных шаблон. К построенным шаблонам применяется двумерное вейвлет-преобразование Хаара для выделения признаков. Затем проводится кластеризация признаков и построение фаз во временной шкале работы приложения. Для каждой фазы строится коммуникационный шаблон, соответствующий этой фазе. Выбор подходящего алгоритма мэппинга проводится с помощью сверточной нейронной сети. Использование нейронной сети предполагает знание о свойствах коммуникационного поведения различных типов приложений и подходящих для этих типов алгоритмов мэппинга. Эти знания должны быть представлены в виде набора классов коммуникационных шаблонов (матриц) с известным для каждого класса наилучшим алгоритмом мэппинга. Нейронная сеть обучается на данном наборе классов. Обученная сеть решает задачу классификации входного коммуникационного шаблона, выбирая наиболее подходящий алгоритм мэппинга для данного параллельного приложения. В статье представлена реализация отдельных этапов метода, и продемонстрирована их работа на тестовых примерах.
Бесплатно
О вопросах распараллеливания крыловских итерационных методов
Статья научная
В работе рассматриваются математические вопросы многообразных вычислительных технологий методов распараллеливания итерационных процессов крыловского типа для решения больших разреженных симметричных и несимметричных СЛАУ, возникающих при сеточных аппроксимациях многомерных краевых задач для систем дифференциальных уравнений. Характерным примером являются конечно-элементные приближения в газогидродинамических приложениях, где в каждом узле определены пять неизвестных функций, в силу чего СЛАУ имеет мелкоблочную структуру. Основой применяемых алгоритмов является гибкий метод обобщенных минимальных невязок FGMRES с динамическими предобуславливателями аддитивного типа, представляющий собой верхний уровень двухступенчатого итерационного алгоритма Шварца. Для повышения производительности алгебраических решателей автором предлагается применение различных подходов: декомпозиции расчетной области с различными топологиями, типами краевых условий на смежных границах и размерами пересечений подобластей, методов грубосеточной коррекции и агрегации, дефляции и неполной факторизации матриц. Описываются унифицированные формулировки используемых алгоритмов, а также вопросы их вычислительной эффективности и масштабируемого распараллеливания на суперкомпьютерах гетерогенной архитектуры. Приводятся примеры технологических требований к особенностям программных реализаций библиотек параллельных алгоритмов для решения систем линейных алгебраических уравнений.
Бесплатно
О генерации случайных задач линейного программирования на кластерных вычислительных системах
Статья научная
В статье рассматривается масштабируемый алгоритм FRaGenLP для генерации больших совместных случайных задач линейного программирования произвольной размерности n на кластерных вычислительных системах. Для обеспечения совместности и ограниченности допустимой области система ограничений включает в себя 2n+1 стандартных неравенств, называемых опорными. Случайные неравенства добавляются в систему последовательно так, чтобы сохранялась совместность ограничений. Кроме этого, вводятся две метрики «похожести», которые препятствуют добавлению нового случайного неравенства, «похожего» на какое-либо из уже включенных в систему, включая опорные. Также отклоняются случайные неравенства, которые при фиксированной целевой функции не влияют на решение опорной задачи линейного программирования. Параллельная реализация алгоритма FRaGenLP выполнена на языке C++ с использованием параллельного BSF-каркаса, инкапсулирующего в проблемно-независимой части своего кода все аспекты, связанные с распараллеливанием программы на базе библиотеки MPI. Приводятся результаты масштабных вычислительных экспериментов на кластерной вычислительной системе, подтверждающие эффективность использованного подхода.
Бесплатно
О декодере мягких решений двоичных кодов Рида-Маллера второго порядка
Статья научная
Построена общая модель помехоустойчивого двоичного канала передачи данных, предназначенная для использования с различными декодерами мягких решений. Линия связи, рассматриваемая в модели, является дискретной по входу и непрерывной по выходу. На ее вход поступают дискретные сигналы из мультипликативного двоичного алфавита, а в силу искажений, действующих в линии связи, на выходе после фильтрации формируются символы из мультипликативной группы поля вещественных чисел, которые затем подаются на вход декодера помехоустойчивого кода. Мягкие и вероятностные декодеры помехоустойчивых кодов позволяют исправлять большее количество ошибок в кодовых словах, чем гарантируется минимальным расстоянием используемого кода. В работе рассмотрен вероятностный декодер мягких решений Сидельникова-Першакова для кодов Рида-Маллера второго порядка в модификации, предложенной П. Лоидрю и Б. Саккуром. Ранее эффективность этих декодеров была подтверждена с помощью имитационных экспериментов, но теоретическое обоснование отсутствовало. В настоящей работе сформулировано требование к каналу связи, названное гладкостью канала, при выполнении которого теоретически доказана корректность этого декодера в случае, когда количество ошибок на каждое кодовое слово не превосходит половины кодового расстояния. В основе доказательства лежит использование теории квадратичных форм и методов дифференциального исчисления в кольце полиномов нескольких переменных над полями Галуа.
Бесплатно