Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Все статьи: 306

Моделирование отказов в высокопроизводительных вычислительных системах в рамках стандарта MPI и его расширения ULFM

Моделирование отказов в высокопроизводительных вычислительных системах в рамках стандарта MPI и его расширения ULFM

Бондаренко Алексей Алексеевич, Якобовский Михаил Владимирович

Статья научная

Рассматривается проблема выполнения длительных расчетов на высокопроизводительных вычислительных системах, компоненты которых подвержены отказам. Для программ, запускаемых на подобных системах, существенным является возможность обработки отказов путем автоматического продолжения расчета на оставшихся работоспособных узлах системы. Возможность обработки отказов предусматривается в разрабатываемом стандарте MPI 3.1. В работе кратко описывается библиотека моделирования отказов для тестирования отказоустойчивых алгоритмов, использующих функционал разрабатываемого стандарта MPI 3.1. Описана техника отказоустойчивости на примере тестовой задачи. Проведено сравение записи контрольных точек в оперативную память и в распределенную файловую систему.

Бесплатно

Моделирование процесса роста нанопленок методом химического осаждения из газовой фазы

Моделирование процесса роста нанопленок методом химического осаждения из газовой фазы

Болдырев Юрий Яковлевич, Замотин Кирилл Юрьевич, Петухов Евгений Павлович

Статья научная

Большинство задач, которые связаны со многими аспектами развития нанотехнологий, по своей природе существенно междисциплинарны. Одним из наиболее характерных примеров этого является проблематика применения газофазного синтеза в нанотехнологиях. По своему существу такие технологии являются реализацией процессов химического осаждения вещества из газообразного состояния, подаваемого в реакционную зону, в твердое состояние. Междисциплинарность рассматриваемых в газофазном синтезе процессов порождает серьезные трудности при их изучении. При этом в рамках традиционного физического эксперимента не удается получить хорошего результата, так как такой эксперимент: не является наглядным, не позволяет изучать зависимость конечного материала от различных физических параметров системы, занимает много времени, дорог. Поэтому естественно искать пути решения задач на базе математического моделирования, которое лежит в основе виртуального эксперимента. В основе работы — разработка и апробация технологий математического моделирования с использованием высокопроизводительных вычислений в области процессов газофазного синтеза наноразмерных структур и наноматериалов с целью изучения и обеспечения визуализации протекающих физико-химических процессов.

Бесплатно

Моделирование сейсмического поля в акустическом приближении двухфазных, иерархически неоднородных сред

Моделирование сейсмического поля в акустическом приближении двухфазных, иерархически неоднородных сред

Хачай Ольга Александровна, Хачай Андрей Юрьевич

Статья научная

В работе рассмотрена задача моделирования сейсмического поля (случай распространения продольной волны с учетом только сжатия и растяжения среды) в слоистой среде с включениями иерархической структуры. Построены алгоритмы моделирования в сейсмическом случае для 2-D упругой и пористой иерархической неоднородности. Исследован вопрос отражения физических свойств однофазности и двухфазности в системе уравнений решения прямой динамической сейсмики в частотном варианте.

Бесплатно

Моделирование экстремального наводнения в дельте дона на многопроцессорных вычислительных системах

Моделирование экстремального наводнения в дельте дона на многопроцессорных вычислительных системах

Дацюк Виктор Николаевич, Крукиер Лев Абрамович, Чикин Алексей Львович, Чикина Любовь Григорьевна

Статья научная

По материалам ежедневных гидрометеорологических наблюдений на береговой базе Южного научного центра РАН в период с 20 марта по 26 марта 2013 года, проведено восстановление картины аномального затопления дельты Дона. Расчеты уровня воды и объема поступающей в дельту Дона воды проводились с помощью двухслойной математической модели. Расчеты проводились на многопроцессорных вычислительных системах, установленных в Южном федеральном университете.

Бесплатно

Моделирование электромагнитного и сейсмического поля в иерархически неоднородных средах

Моделирование электромагнитного и сейсмического поля в иерархически неоднородных средах

Хачай Ольга Александровна, Хачай Андрей Юрьевич

Статья научная

Построен алгоритм 3D моделирования электромагнитного поля для произвольного типа источника возбуждения N-слойной среды с иерархическим проводящим включением, расположенным в J-ом слое. Построены алгоритмы 2-D моделирования для дифракции звука и линейно поляризованной поперечной упругой волны на включении иерархической структуры, расположенной в J-ом слое N-слойной упругой среды.

Бесплатно

Модель параллельных вычислений для многопроцессорных систем с распределенной памятью

Модель параллельных вычислений для многопроцессорных систем с распределенной памятью

Ежова Надежда Александровна, Соколинский Леонид Борисович

Статья научная

Появление мощных многопроцессорных вычислительных систем выдвигает на первый план вопросы, связанные с разработкой фреймворков (шаблонов), позволяющих создавать высокомасштабируемые параллельные программы, ориентированные на системы с распределенной памятью. При этом особенно важной является проблема разработки моделей параллельных вычислений, позволяющих на ранней стадии проектирования программы оценить ее масштабируемость. В статье приводятся общие требования к модели вычислений и строится новая высокоуровневая модель параллельных вычислений Bulk Synchronous Farm (BSF), являющаяся расширением модели BSP, и основанная на методе программирования SPMD и парадигме «мастер-рабочие». Модель BSF ориентирована на вычислительные системы с массовым параллелизмом на распределенной памяти, включающие в себя сотни тысяч процессорных узлов, и имеющие экзафлопный уровень производительности и на численные итерационные методы с высокой временной сложностью. Определяется архитектура BSF-компьютера и описывается структура BSF-программы. Описывается формальная стоимостная метрика, с помощью которой получаются верхние оценки масштабируемости параллельных BSF-программ применительно к вычислительным системам с распределенной памятью. Также выводятся формулы для оценки эффективности распараллеливания BSF-программ и даются аналитические оценки масштабируемости BSF-приложений.

Бесплатно

Модель прогнозирования живого веса с помощью глубокой регрессии RGB-D изображений

Модель прогнозирования живого веса с помощью глубокой регрессии RGB-D изображений

Ручай Алексей Николаевич

Статья научная

Прогнозирование живого веса помогает контролировать здоровье животных, эффективно проводить генетическую селекцию и определять оптимальное время убоя. На крупных фермах для измерения живого веса используются точные и дорогостоящие промышленные весы. Взвешивание животного из-за стресса ведет к потере его веса и продуктивности на 5-10%. Однако, перспективной альтернативой является оценка живого веса с помощью морфометрических измерений животного, а затем применение уравнений регрессии, связывающих такие измерения с живым весом. Ручные измерения животных с помощью рулетки отнимают много времени и вызывают стресс у животных. Поэтому в настоящее время для бесконтактных морфометрических измерений все чаще используются технологии компьютерного зрения. В статье предлагается новая модель для прогнозирования живого веса на основе регрессии изображений с использованием методов глубокого обучения. Для регрессии изображений использовались RGB изображения и карты глубины вид сбоку для прогнозирования живого веса крупного рогатого скота. Показано, что на реальных наборах данных предложенная модель достигает точности измерения веса с ошибкой MAE 35.5 и MAPE 8.4 на тестовом наборе данных.

Бесплатно

Модификация метода матричных пучков, использующая совместное оценивание полюсов сигнала и обратных к ним

Модификация метода матричных пучков, использующая совместное оценивание полюсов сигнала и обратных к ним

Ибряева Ольга Леонидовна, Салов Данил Дмитриевич

Статья научная

В статье рассматривается метод матричных пучков, являющийся параметрическим Прони -подобным методом обработки сигнала и позволяющим найти частоты, коэффициенты затухания, фазы и амплитуды суммы затухающих синусоид. Его преимуществом по сравнению с методом Прони является меньшее количество операций, что приводит к меньшей вычислительной ошибке. Предложена модификация данного метода способная решить задачу разделения истинных и ложных полюсов сигнала. Из отсчетов сигнала конструируются два пучка матриц, собственные значения которых в случае отсутствия шума совпадают с полюсами сигнала и обратными к ним. В случае зашумленного сигнала разделение истинных и ложных полюсов проводится за счет: 1) сингулярного разложения, 2) завышенного порядка предсказания, 3) анализа собственных значений двух пучков матриц. Приведен алгоритм модифицированного метода матричных пучков и сравнение этой модификации с классическим вариантом на модельном примере обнаружения сигнала в шуме. Показано, что классический метод не способен определить время начала полезного сигнала, поскольку подстраивает под шум сумму экспонент. Модифицированный метод матричных пучков решает задачу обнаружения сигнала в шуме и его параметров, т.к. помимо определения времени прихода сигнала, также способен оценить количество затухающих синусоид в нем и их параметры. Предложенный алгоритм обнаружения сигнала пригоден для работы с сигналами достаточно общего вида (суммой затухающих синусоид) и не требует знания законов распределения самого сигнала и его шумовой составляющей, как метод максимального правдоподобия.

Бесплатно

Модулярно-логарифмический сопроцессор для массовых арифметических вычислений

Модулярно-логарифмический сопроцессор для массовых арифметических вычислений

Осинин Илья Петрович

Статья научная

Предлагаемый сопроцессор представляет собой самостоятельный сложнофункциональный (intellectual property - IP) блок системы-на-кристалле, позволяющий проводить математические вычисления над вещественными числами в уникальной модулярно-логарифмической системе счисления. Обеспечены два уровня преобразования исходных чисел: в модулярную систему счисления вместо традиционной позиционной и в логарифмическую систему счисления вместо плавающей точки. Благодаря этому сопроцессор обладает более высоким быстродействием, точностью и надежностью вычислений по сравнению с известными аналогами. Он состоит из набора одинаковых вычислительных ядер, каждое из которых выполняет однотактовые скалярные или векторные операции. В результате проведенных исследований и разработок предложены новые научные и технические решения, реализующие предложенные способы вычислений и кодирования данных. При этом преобразование кодов в модулярно-логарифмическую систему счисления и обратно не вносит значительных временных задержек при большом потоке входных данных за счет предложенных аппаратных решений, конвейеризирующих процесс интерполяции функции логарифма и преобразования кодов системы остаточных классов. Реализован прототип устройства на базе программируемой логической интегральной схемы в виде IP-блока. Целевой рынок решения - компании разработчики универсальных процессоров.

Бесплатно

Модулярно-позиционный формат и программный пакет для разрядно-параллельных вычислений высокой точности в формате с плавающей точкой

Модулярно-позиционный формат и программный пакет для разрядно-параллельных вычислений высокой точности в формате с плавающей точкой

Исупов К.С.

Статья научная

Рассматривается новый способ организации высокоточных вычислений с плавающей точкой, позволяющий распараллеливать арифметические операции вплоть до уровня отдельных цифр многоразрядных мантисс путем использования модулярно-позиционного формата представления данных. Основная концепция данного формата заключается в представлении мантисс чисел в многомодульной системе остаточных классов (СОК), а порядков - в позиционной системе счисления. Мантиссы сопровождаются позиционной характеристикой, которая способствует реализации эффективных алгоритмов выполнения немодульных операций в СОК, таких как деление (частный случай) и округление. На основе данного подхода разрабатывается программное решение High Precision Digit-Parallel Solver (HPDP-Solver). Комплекс HPDP-Solver может быть гибко настроен на конфигурацию конкретной машины, в результате чего обеспечивается наиболее эффективное использование ее ресурсов. В результате экспериментального исследования быстродействия пакета HPDP-Solver были получены результаты, доказывающие его преимущества при решении высокоточных численных задач перед имеющей мировую известность позиционной библиотекой GNU Multiple Precision Arithmetic Library. Пакет HPDP-Solver может быть применен при решении задач, которые предъявляют особо высокие требования к вычислительной точности.

Бесплатно

Молекулярная динамика в силовом поле FF14SB в воде TIP4P-EW, и в силовом поле FF15IPQ в воде SPC/EB: сравнительный анализ на GPU и CPU

Молекулярная динамика в силовом поле FF14SB в воде TIP4P-EW, и в силовом поле FF15IPQ в воде SPC/EB: сравнительный анализ на GPU и CPU

Суплатов Дмитрий Андреевич, Шарапова Яна Александровна, Попова Нина Николаевна, Копылов Кирилл Евгеньевич, Воеводин Владимир Валентинович, Швядас Витас Каятоно

Статья научная

Проведен сравнительный анализ вычислительной эффективности и масштабируемости молекулярной динамики (МД), реализованной в пакете AMBER, на реальных биологических системах с применением классического силового поля FF14SB с 4-центровой моделью воды TIP4P-Ew, а также нового многообещающего поля FF15IPQ с 3-центровой моделью воды SPC/Eb. Были использованы классические процессоры Intel Xeon E5-2697 v3, а также GPU ускорители Tesla K40 (архитектура Kepler) и P100 (Pascal). Уменьшение количества атомов в ячейке на 25-31 % в результате использования 3-центровой модели растворителя ускоряет расчет МД до 63% и ухудшает масштабируемость до 11 %. При этом полученные результаты могут качественно отличаться, что говорит о необходимости совместного использования разных силовых полей при изучении биологических систем. Использование GPU-ускорителей как альтернативы классическим CPU позволяет существенно увеличить длину траектории в повседневной практике.

Бесплатно

Направленные сплайны и их использование для сглаживания выбросов и изломов интерполянта

Направленные сплайны и их использование для сглаживания выбросов и изломов интерполянта

Коднянко Владимир Александрович

Статья научная

Сформулирован и предложен метод построения направленного кубического сплайна для набора точек на плоскости. Проведено сравнение сплайна с B-сплайном Шёнберга, сплайнами Акимы и Катмулла-Рома. Показано, что для неравноотстоящих точек в сравнении с B-сплайном он дает значительно меньшие выбросы и практически лишен сильных изломов, которые свойственны сплайнам Акимы. Сплайн не дает петель и осцилляций, которые являются характерным недостатком параметрических сплайнов, в частности, эрмитовых, к числу которых относится сплайн Катмулла-Рома. Предложен быстрый метод оптимизации направляющего коэффициента сплайна, цель которой состоит в минимизации разрывов второй производной функции в ее промежуточных точках. Приведен пример оптимизации направленного сплайна третьего порядка. Также предложен направленный сплайн четвертого порядка, который лишен изломов. Сформулирован метод оптимизации направленного сплайна четвертого порядка, изложен алгоритм его оптимизации. Критериями оптимизации являются длина сплайна и наименьшее расстояние между его глобальными максимумом и минимумом. Показано, что в сравнении с сплайна Шёнберга направленный сплайн четвертого порядка имеет меньшие выбросы. Предложен метод автоматического притупления острых пиков кривых, который можно применять ко всем типам сплайнов.

Бесплатно

Нейросетевой метод решения задачи мэппинга параллельных приложений

Нейросетевой метод решения задачи мэппинга параллельных приложений

Попова Нина Николаевна, Козлов Михаил Владимирович, Шубин Михаил Витальевич

Статья научная

Статья посвящена проблеме повышения эффективности параллельных приложений. В статье предлагается подход к решению проблемы, основанный на сокращении накладных расходов, связанных с передачей данных между процессами параллельной программы во время ее выполнения на высокопроизводительной вычислительной системе. С ростом числа процессорных узлов расходы на передачу сообщений между узлами оказывают все большее влияние на производительность параллельных приложений. В связи с этим становится особо актуальной задача размещения процессов параллельной программы по вычислительным узлам суперкомпьютера, известная, как задача мэппинга. В работе предлагается новый подход к решению задачи мэппинга. Ключевой особенностью подхода является выбор коммуникационного шаблона путем фазового анализа приложения и использование сверточной нейронной сети для быстрого выбора подходящего алгоритма мэппинга, исходя из построенного коммуникационного шаблона. Для построения коммуникационных шаблонов проводится анализ поведения приложения с точки зрения передачи сообщений точка-точка между процессами параллельной программы. Временная шкала событий передачи сообщений разбивается на равные промежутки, для каждого из которых строится коммуникационных шаблон. К построенным шаблонам применяется двумерное вейвлет-преобразование Хаара для выделения признаков. Затем проводится кластеризация признаков и построение фаз во временной шкале работы приложения. Для каждой фазы строится коммуникационный шаблон, соответствующий этой фазе. Выбор подходящего алгоритма мэппинга проводится с помощью сверточной нейронной сети. Использование нейронной сети предполагает знание о свойствах коммуникационного поведения различных типов приложений и подходящих для этих типов алгоритмов мэппинга. Эти знания должны быть представлены в виде набора классов коммуникационных шаблонов (матриц) с известным для каждого класса наилучшим алгоритмом мэппинга. Нейронная сеть обучается на данном наборе классов. Обученная сеть решает задачу классификации входного коммуникационного шаблона, выбирая наиболее подходящий алгоритм мэппинга для данного параллельного приложения. В статье представлена реализация отдельных этапов метода, и продемонстрирована их работа на тестовых примерах.

Бесплатно

О вопросах распараллеливания крыловских итерационных методов

О вопросах распараллеливания крыловских итерационных методов

Ильин Валерий Павлович

Статья научная

В работе рассматриваются математические вопросы многообразных вычислительных технологий методов распараллеливания итерационных процессов крыловского типа для решения больших разреженных симметричных и несимметричных СЛАУ, возникающих при сеточных аппроксимациях многомерных краевых задач для систем дифференциальных уравнений. Характерным примером являются конечно-элементные приближения в газогидродинамических приложениях, где в каждом узле определены пять неизвестных функций, в силу чего СЛАУ имеет мелкоблочную структуру. Основой применяемых алгоритмов является гибкий метод обобщенных минимальных невязок FGMRES с динамическими предобуславливателями аддитивного типа, представляющий собой верхний уровень двухступенчатого итерационного алгоритма Шварца. Для повышения производительности алгебраических решателей автором предлагается применение различных подходов: декомпозиции расчетной области с различными топологиями, типами краевых условий на смежных границах и размерами пересечений подобластей, методов грубосеточной коррекции и агрегации, дефляции и неполной факторизации матриц. Описываются унифицированные формулировки используемых алгоритмов, а также вопросы их вычислительной эффективности и масштабируемого распараллеливания на суперкомпьютерах гетерогенной архитектуры. Приводятся примеры технологических требований к особенностям программных реализаций библиотек параллельных алгоритмов для решения систем линейных алгебраических уравнений.

Бесплатно

О генерации случайных задач линейного программирования на кластерных вычислительных системах

О генерации случайных задач линейного программирования на кластерных вычислительных системах

Соколинский Леонид Борисович, Соколинская Ирина Михайловна

Статья научная

В статье рассматривается масштабируемый алгоритм FRaGenLP для генерации больших совместных случайных задач линейного программирования произвольной размерности n на кластерных вычислительных системах. Для обеспечения совместности и ограниченности допустимой области система ограничений включает в себя 2n+1 стандартных неравенств, называемых опорными. Случайные неравенства добавляются в систему последовательно так, чтобы сохранялась совместность ограничений. Кроме этого, вводятся две метрики «похожести», которые препятствуют добавлению нового случайного неравенства, «похожего» на какое-либо из уже включенных в систему, включая опорные. Также отклоняются случайные неравенства, которые при фиксированной целевой функции не влияют на решение опорной задачи линейного программирования. Параллельная реализация алгоритма FRaGenLP выполнена на языке C++ с использованием параллельного BSF-каркаса, инкапсулирующего в проблемно-независимой части своего кода все аспекты, связанные с распараллеливанием программы на базе библиотеки MPI. Приводятся результаты масштабных вычислительных экспериментов на кластерной вычислительной системе, подтверждающие эффективность использованного подхода.

Бесплатно

О декодере мягких решений двоичных кодов Рида-Маллера второго порядка

О декодере мягких решений двоичных кодов Рида-Маллера второго порядка

Деундяк Владимир Михайлович, Могилевская Надежда Сергеевна

Статья научная

Построена общая модель помехоустойчивого двоичного канала передачи данных, предназначенная для использования с различными декодерами мягких решений. Линия связи, рассматриваемая в модели, является дискретной по входу и непрерывной по выходу. На ее вход поступают дискретные сигналы из мультипликативного двоичного алфавита, а в силу искажений, действующих в линии связи, на выходе после фильтрации формируются символы из мультипликативной группы поля вещественных чисел, которые затем подаются на вход декодера помехоустойчивого кода. Мягкие и вероятностные декодеры помехоустойчивых кодов позволяют исправлять большее количество ошибок в кодовых словах, чем гарантируется минимальным расстоянием используемого кода. В работе рассмотрен вероятностный декодер мягких решений Сидельникова-Першакова для кодов Рида-Маллера второго порядка в модификации, предложенной П. Лоидрю и Б. Саккуром. Ранее эффективность этих декодеров была подтверждена с помощью имитационных экспериментов, но теоретическое обоснование отсутствовало. В настоящей работе сформулировано требование к каналу связи, названное гладкостью канала, при выполнении которого теоретически доказана корректность этого декодера в случае, когда количество ошибок на каждое кодовое слово не превосходит половины кодового расстояния. В основе доказательства лежит использование теории квадратичных форм и методов дифференциального исчисления в кольце полиномов нескольких переменных над полями Галуа.

Бесплатно

О единственности решения обратной задачи нестационарной фильтрации

О единственности решения обратной задачи нестационарной фильтрации

Боков Александр Викторович

Статья научная

При определении коэффициента гидропроводности нефтяного пласта методом гидродинамического прослушивания скважин возникает необходимость решения обратной задачи фильтрации. При этом важно поставить задачу таким образом, чтобы обеспечить единственность решения. В статье определяются условия, достаточные для единственности решения обратной задачи.

Бесплатно

О задаче по восстановлению коэффициентов-функций времени источников специального вида в параболическом уравнении

О задаче по восстановлению коэффициентов-функций времени источников специального вида в параболическом уравнении

Рагимов Анар Бейбала

Статья научная

Исследуется обратная задача по идентификации коэффициентов, зависящих только от времени, при источнике специального вида в линейных параболических уравнениях с точечными условиями переопределения. К исследуемым обратным задачам, в частности, приводятся краевые задачи с нелокальными (интегральными) краевыми условиями. Специфика рассматриваемой в данной работе обратной задачи заключается в том, что восстанавливаемые коэффициенты находятся при свободном члене и они зависят только от временной переменной. Предлагается методика численного решения задачи с применением метода прямых, основанная на использовании специального вида представления решения. Методом прямых задача приводится к параметрически обратной задаче относительно обыкновенной системы дифференциальных уравнений. Для ее решения предложено представление этого решения в специальном виде. Построены вспомогательные краевые задачи, которые определяют решение исходной задачи. Наиболее существенным в данной работе является то, что предлагаемый подход к численному решению исследуемой обратной задачи по идентификации коэффициентов не требует (в отличие от ранее известных методов) построения каких-либо итерационных процедур. Приводятся результаты численных экспериментов виде таблиц и графиков, полученных при решении тестовой задачи, и их анализ.

Бесплатно

О количественной модели рисков и преимуществ облачных вычислений

О количественной модели рисков и преимуществ облачных вычислений

Зеленков Юрий Александрович

Статья научная

Перенос вычислительной инфраструктуры в облака стал сегодня одним из ключевых направлений оптимизации корпоративных ИТ. Обширный ряд исследований доказывает, что облачные вычисления обеспечивают экономическую выгоду, поскольку они повышают гибкость инфраструктуры и снижаю затраты на ее поддержание. Другие исследовательские работы посвящены обсуждению рисков, связанных с облаками, и их влиянию на бизнес. Однако, в большинстве случаев преимущества и риски облачных вычислений обсуждаются раздельно. В работе предложена модель, которая позволяет оценить одновременное влияние всех факторов. Идентифицированы материальные и нематериальные преимущества и риски адаптации к облаку, предложены простые правила, позволяющие оценить их количественно и построить непротиворечивую матрицу попарного сравнения. Использование предложенного метода иллюстрируется на простом примере.

Бесплатно

О некоторых вариантах метода декомпозиции областей

О некоторых вариантах метода декомпозиции областей

Ильин Валерий Павлович, Перевозкин Данил Валерьевич

Статья научная

Рассматриваются алгоритмы масштабируемого распараллеливания решения сверхбольших разреженных сеточных СЛАУ, представленных в универсальных сжатых форматах, в том смысле, что их реализация осуществляется без программных ограничений на порядки алгебраических систем и на количество используемых вычислительных узлов, процессоров и/или ядер. Данная задача сводится к распределенному варианту алгебраической 3D-декомпозиции областей, в котором отсутствует чрезмерная расчетно-информационная нагрузка корневого процессора, т.е. все организуемые MPI-процессы, каждый из которых соответствует своей подобласти, являются практически равноправными. Вычислительный процесс состоит из двух основных этапов, первый из которых заключается в непосредственной автоматической декомпозиции, на основе анализа матричного портрета и формировании крупноблочного представления СЛАУ. Второй этап - это реализация крыловского итерационного алгоритма FGMRES (гибкого обобщенного метода минимальных невязок), использующего точное или приближенное обращение диагональных матричных блоков (многопоточное решение подсистем в подобластях с использованием средств OpenMP) с помощью прямого или итерационного метода соответственно. Описываемые методы реализованы в составе библиотеки алгебраических решателей Krylov. В работе приводятся некоторые оценки используемых ресурсов и особенности параллельных вычислительных технологий. Эффективность разработанных алгоритмов иллюстрируется результатами численных экспериментов по решению характерных алгебраических задач на различных конфигурациях многопроцессорной вычислительной системы.

Бесплатно

Журнал