Вычислительная математика. Рубрика в журнале - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Публикации в рубрике (35): Вычислительная математика
все рубрики
Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Харченко Сергей Александрович, Ющенко Алексей Александрович

Статья научная

В работе рассматривается параллельная MPI+threads+SIMD реализация алгоритма вычисления разреженного QR разложения специальным образом упорядоченной прямоугольной матрицы на основе разреженных блочных преобразований Хаусхолдера. В алгоритме производится предварительное независимое параллельное вычисление QR разложений для наборов строк матрицы. Затем в соответствии с деревом вычислений производится вычисление QR разложения матриц, составленных из R факторов строчных разложений. Приводятся результаты экспериментов, подтверждающие эффективность предложенной параллельной реализации для тестовых задач. Алгоритм также может быть эффективно реализован на гетерогенных кластерных архитектурах с ускорителями типа GPGPU.

Бесплатно

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Соколинская Ирина Михайловна, Соколинский Леонид Борисович

Статья научная

В статье описывается параллельный алгоритм решения нестационарных задач линейного программирования большой размерности, ориентированный на кластерные вычислительные системы. В основе алгоритма, получившего название «следящий», лежат фейеровские отображения. Алгоритм отслеживает изменения исходных данных и вносит корректировки в вычислительный процесс. При этом задача разбивается на большое количество подзадач, которые могут решаться независимо без обменов данными. Приводятся диаграммы деятельности UML, описывающие реализацию следящего алгоритма.

Бесплатно

Параллельный алгоритм вычисления матрицы евклидовых расстояний для многоядерного процессора Intel Xeon Phi поколения Knights Landing

Параллельный алгоритм вычисления матрицы евклидовых расстояний для многоядерного процессора Intel Xeon Phi поколения Knights Landing

Речкалов Тимофей Валерьевич, Цымблер Михаил Леонидович

Статья научная

Вычисление матрицы Евклидовых расстояний требуется в широком спектре задач, связанных с интеллектуальным анализом данных. В настоящее время большое количество параллельных алгоритмов решения этой задачи реализовано для графических процессоров. Однако данные разработки не могут быть просто перенесены на многоядерные системы архитектуры Intel Many Integrated Core. В статье предлагается параллельный алгоритм вычисления матрицы Евклидовых расстояний на многоядерном процессоре Intel Xeon Phi поколения Knights Landing для случая, когда входные данные могут быть размещены в оперативной памяти. Данный алгоритм использует блочно-ориентированную схему организации вычислений, которая позволяет эффективно использовать возможности векторизации вычислений Intel Xeon Phi. В алгоритме применена нетривиальная компоновка данных в оперативной памяти для уменьшения количества кэш-промахов процессора во время вычислений. Эксперименты на реальных и синтетических наборах данных показали, что предложенный алгоритм хорошо масштабируется и опережает аналоги в случае прямоугольных матриц с данными малой размерности.

Бесплатно

Параллельный метод объединения результатов работы программ по сборке генома

Параллельный метод объединения результатов работы программ по сборке генома

Романенков Кирилл Владимирович, Сальников Алексей Николаевич, Алексеевский Андрей Владимирович

Статья научная

В данной работе проводится исследование в области применения многопроцессорных систем для задачи коррекции сборки генома. Существует большое количество алгоритмических подходов к проблеме сборки генома из набора коротких фрагментов, при этом результаты их работы на одних и тех же экспериментальных данных зачастую существенно разнятся. Вследствие большого объема данных необходима организация вычислений в модели распределенной памяти на вычислительном кластере. Авторами предложен алгоритм объединения результатов работ геномных сборщиков, основанный на построении распределенного взвешенного графа контигов. Предлагаемый подход использует комбинацию выводов программ сборки гeномов, что позволяет уменьшить фрагментированность контигов в результирующем наборе. Последовательная версия алгоритма реализована на C/C++ и доступна по адресу: https://bitbucket.org/kromanenkov/gar.

Бесплатно

Разработка системы реконструкции неоднородных тел элементарными объемами на примере керамики с дефектами микроструктуры

Разработка системы реконструкции неоднородных тел элементарными объемами на примере керамики с дефектами микроструктуры

Кибель Мария Олеговна, Долганина Наталья Юрьевна

Статья научная

Работа посвящена разработке системы реконструкции неоднородных тел элементарными объемами на примере керамики с дефектами микроструктуры. Система была спроектирована и реализована. Проведено тестирование системы. Данная система позволяет создавать модели керамических структур с учетом распределения дефектов, которые предназначены для суперкомпьютерного моделирования ударного нагружения керамик в пакете программ LS-DYNA.

Бесплатно

Реализация итерационных методов решения систем линейных уравнений в задачах математической физики на реконфигурируемых вычислительных системах

Реализация итерационных методов решения систем линейных уравнений в задачах математической физики на реконфигурируемых вычислительных системах

Левин И.И., Дордопуло А.И., Пелипец А.В.

Статья научная

В статье рассматриваются характерные особенности реализации итерационных методов решения систем линейных уравнений в задачах математической физики на параллельных вычислительных системах, которыми являются геометрическая декомпозиция расчетной области и распараллеливание данных внутри последовательно выполняемых процессором итераций с интенсивным информационным обменом между процессорами и памятью. Стандартные методы реализации итерационных методов решения систем линейных уравнений при множественных транзакциях с памятью и межпроцессорных обменах, существенно снижающих реальную производительность, дополнительно требуют от вычислительной системы наличия большого числа физических линий связи для реализации сложных топологий и иерархических схем хранения данных. Выходом является использование многопроцессорных систем с реконфигурируемой архитектурой, позволяющее адаптировать свою архитектуру под структуру итерационных алгоритмов математической физики путем распараллеливания по итерациям. В статье рассмотрена реализация метода Якоби для решения краевой задачи Дирихле для уравнения Лапласа на реконфигурируемой вычислительной системе, на примере которой показано сокращение количества внешних каналов обмена как одного из наиболее критических ресурсов реконфигурируемой вычислительной системы.

Бесплатно

Самая быстрая и энергоэффективная реализация алгоритма поиска в ширину на одноузловых различных параллельных архитектурах согласно рейтингу Graph500

Самая быстрая и энергоэффективная реализация алгоритма поиска в ширину на одноузловых различных параллельных архитектурах согласно рейтингу Graph500

Колганов Александр Сергеевич

Статья научная

Поиск в ширину является одним из основных алгоритмов обхода графа и базовым для многих алгоритмов анализа графов более высокого уровня. Поиск в ширину на графах является задачей с нерегулярным доступом к памяти и с нерегулярной зависимостью по данным, что сильно усложняет его распараллеливание на все существующие архитектуры. В статье будет рассмотрена реализация алгоритма поиска в ширину (основного теста рейтинга Graph500) для обработки больших графов на различных архитектурах: Intel х86, IBM Power8+, Intel KNL и NVidia GPU. Будет рассмотрены алгоритмы реализации поиска в ширину, такие как top-down обход, bottom-up обход и гибридный обход, содержащий в себе как top-down, так и bottom-up обходы. Будут описаны особенности реализации алгоритма на общей памяти, а также преобразования графа: локальная сортировка вершин графа, глобальная сортировка вершин графа, перенумерация всех вершин графа, сжатое представление вершин графа. Данные преобразования и гибридный алгоритм обхода позволяют достичь рекордных показателей производительности и энергоэффективности на данном алгоритме среди всех одноузловых систем рейтинга Graph500 и GreenGraph500.

Бесплатно

Сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов на задачах обращения криптографических функций

Сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов на задачах обращения криптографических функций

Булавинцев Вадим Германович

Статья научная

Проводится сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов, используемых в криптоанализе. В частности, анализируются причины, по которым не удается эффективно реализовать на GPU алгоритмы, осуществляющие «интеллектуальный перебор». Показывается, что применение специальных техник трансформации потока управления позволяет существенно компенсировать потери производительности, возникающие из-за неэффективного исполнения условных переходов на SIMD-устройстве. Однако ограничения, которые накладывают механизмы работы с памятью, применяемые в современных GPU, для рассматриваемых алгоритмов оказываются непреодолимыми. В качестве тестовых задач рассматриваются задачи обращения криптографических функций DES и A5/1.

Бесплатно

Технология суперкомпьютерного 3D моделирования сейсмических волновых полей в сложно построенных средах

Технология суперкомпьютерного 3D моделирования сейсмических волновых полей в сложно построенных средах

Глинский Борис Михайлович, Мартынов Валерий Николаевич, Сапетина Анна Федоровна

Статья научная

В работе рассматриваются вычислительные технологии решения задач, связанных с моделированием распространения сейсмических волн в неоднородных средах, характерных для вулканических структур, с использованием суперкомпьютерного моделирования в целях создания систем вибросейсмического мониторинга сейсмоопасных объектов. Построена физико-математическая модель магматического вулкана и программная реализация на основе известного численного метода, эффективно использующая архитектуру современного суперкомпьютера, оснащенного GPU. Созданы параллельные 2D и 3D алгоритмы и программы для моделирования распространения упругих волн в сложно построенной среде (2D модель есть сечение исходной 3D модели различными плоскостями и под разными углами) на основе явной конечно-разностной схемы на сдвинутых сетках и метода поглощающих границ CFS-PML. Исследована масштабируемость алгоритмов. Применение разработанной технологии позволяет гораздо эффективней проводить изучение структуры волнового поля, обусловленного геометрией внутренних границ, уточнение его кинематических и динамических характеристик.

Бесплатно

Точность численного решения уравнения диффузии-конвекции на основе разностных схем второго и четвертого порядков погрешности аппроксимации

Точность численного решения уравнения диффузии-конвекции на основе разностных схем второго и четвертого порядков погрешности аппроксимации

Сухинов Александр Иванович, Чистяков Александр Евгеньевич, Якобовский Михаил Владимирович

Статья научная

В работе рассмотрены схемы второго и четвертого порядков погрешности аппроксимации для решения задачи диффузии-конвекции. Для модельной начально-краевой задачи, в случае когда функции правой части и начального условия представимы конечными суммами рядов Фурье по тригонометрическому базису, исследована точность разностных схем. Установлено, что точность численного решения зависит от количества узлов приходящихся на половину длины волны, соответствующей наиболее высокочастотной гармонике в конечной сумме ряда Фурье, необходимой для описания поведения расчетных объектов. Получены зависимости погрешности аппроксимации диффузионных слагаемых разностными схемами второго и четвертого порядков точности от количества узлов. Выполнено сопоставление результатов расчета двумерной задачи диффузии-конвекции и задачи Пуассона на основе схем второго и четвертого порядков точности. В работе обоснована целесообразность перехода к схемам повышенного порядка точности при решении прикладных задач и из полученных оценок нетрудно получить численные значения выигрышей во времени счета при использовании схем повышенного порядка точности.

Бесплатно

Тэта-функции в математической модели шума квантования

Тэта-функции в математической модели шума квантования

Васильев Юрий Сергеевич, Заволокин Владимир Валентинович

Статья научная

В статье выведена новая формула для двухмерной плотности распределения вероятности шума квантования, которая позволила записать ее с помощью математического выражения, которое состоит только из тэта-функций Якоби. Приведен способ получения данной формулы. Вывод формулы основан на том, что при подходящей замене переменных часть членов двойного ряда уничтожается. Показан принцип получения всех формул данного семейства. Этот принцип основан на свойствах симметрии тэта-функций. Симметрия тэта-функций позволяет выражать одну тэта-функцию через другую тэта-функцию и получать формулы, состоящие только из тэта-функций Якоби. Это семейство формул позволяет получать выражения для организации модельных экспериментов, поддерживаемые основными математическими пакетами. Они позволяют получать и числовые характеристики случайных процессов, как функции параметров, порождающих их случайных процессов гауссовского типа в аналитическом виде. Их применение увеличивает скорость сходимости результатов моделирования. Полученные формулы позволят выполнять синтез нужных выражений в аналитическом виде при функциональных преобразованиях случайных векторов и процессов, при обработке сигналов.

Бесплатно

Условная минимизация слабоунимодальных функций методом бинарного сканирования (бискана)

Условная минимизация слабоунимодальных функций методом бинарного сканирования (бискана)

Коднянко Владимир Александрович

Статья научная

Предложен метод бинарного сканирования (бискана) для условной минимизации слабоунимодальных функций. Областью приложения данного метода является оптимизация кусочных, ступенчатых, релейных и иных слабоунимодальных функций, экстремум которых может быть локализован, как в узких, так и протяженных областях, включая области постоянства минимизируемой функции. Алгоритм, реализующий метод, представлен двумя процедурами, блок-схемы которых приведены в статье. Для оценки работоспособности бискана был проведен сравнительный вычислительный эксперимент на примерах минимизации ряда слабоунимодальных функций. Установлено, что в сравнении с конкурирующими методами, в частности с методом золотого сечения и методом последовательного перебора, бискан дает лучшие показатели быстродействия. Наибольшее быстродействие метод обеспечивает при минимизации непостоянных монотонных функций. Для определения экстремума требуется лишь пять вычислений такой функции. В сравнении с методом золотого сечения бискан имеет в 1,5 раза большее быстродействие при решении задач данного типа. При минимизации строго слабоунимодальных функций, к которым не применимы известные методы минимизации унимодальных функций, в частности, метод золотого сечения, бискан работает на порядки быстрее конкурирующего метода последовательного перебора.

Бесплатно

Численное моделирование колебаний элементов трубы с потоком несжимаемой жидкости

Численное моделирование колебаний элементов трубы с потоком несжимаемой жидкости

Прокудина Людмила Александровна, Япарова Наталия Михайловна, Вихирев Михаил Павлович

Статья научная

Контроль расхода жидкости в трубопроводах является актуальной и практически значимой задачей. Основой контроля служат характеристики поперечных колебаний прямой трубы с потоком жидкости. В данной работе рассмотрена математическая модель и численный метод определения колебаний прямого участка трубы с потоком несжимаемой жидкости. Труба подвергается точечному внешнему импульсному воздействию. Для решения поставленной задачи в статье предложен численный метод, основанный на использовании конечно-разностных уравнений и применении QR-разложения матричной формы получаемой системы. С целью проверки принципиальной возможности построения численного решения задачи определения влияния импульсного воздействия на характеристики поперечных колебаний элементов прямой трубы был проведен вычислительный эксперимент. В эксперименте исследовалось влияние скорости и массы потока жидкости, импульсного воздействия, осевого давления, а также параметров трубы на характеристики процесса колебаний. Влияние перечисленных факторов было учтено в коэффициентах уравнения. В ходе эксперимента осуществлен сравнительный анализ получаемых численных решений в трех контрольных точках. Результаты вычислительного эксперимента представлены в работе и свидетельствуют о том, что предложенный метод позволяет выявить влияние импульсного воздействия на характеристики поперечных колебаний.

Бесплатно

Численный метод решения обратной задачи с неизвестными начальными условиями для нелинейного параболического уравнения

Численный метод решения обратной задачи с неизвестными начальными условиями для нелинейного параболического уравнения

Япарова Наталья Михайловна

Статья научная

В статье рассмотрена обратная задача для нелинейного параболического уравнения с неизвестными начальными условиями. Для решения обратной задачи предложен метод дискретной регуляризации, основанный на использовании конечно-разностных уравнений и применении регуляризирующих функционалов. Построенная вычислительная схема позволяет одновременно найти численное решение внутри рассматриваемой области и неизвестную граничную функцию. В статье проведено исследование устойчивости вычислительной схемы. Выявлено влияние величин шагов дискретизации и погрешности исходных данных на устойчивость численных решений. Предложенная схема послужила основой для разработки численного метода и проведения вычислительного эксперимента. Результаты эксперимента для серии тестовых функций также представлены в данной работе и свидетельствуют о достаточной эффективности предложенного метода дискретной регуляризации.

Бесплатно

Экспериментальное сравнение алгоритмов в параллельном методе вложенных сечений

Экспериментальное сравнение алгоритмов в параллельном методе вложенных сечений

Пирова Анна Юрьевна, Кудрявцев Никита Юрьевич, Мееров Иосиф Борисович

Статья научная

В прямых методах решения больших разреженных систем линейных алгебраических уравнений применяется процедура переупорядочения строк и столбцов исходной матрицы. Целью данной процедуры является сокращение числа ненулевых элементов в процессе последующей численной факторизации. Нахождение перестановки, минимизирующей число ненулевых элементов в факторе, является NP-полной задачей. Для решения этой задачи применяются эвристические методы. Результаты применения данных методов могут быть оценены как с точки зрения качества получаемых перестановок (заполнение фактора матрицы после переупорядочения), так и с точки зрения временных затрат на построение перестановок. Многоуровневый метод вложенных сечений, показывающий достаточно хорошие результаты по обоим критериям, является одним из наиболее распространенных методов переупорядочения. Метод имеет определенные ресурсы внутреннего параллелизма, активно используемые в ряде реализаций (ParMETIS, mtMETIS, PT-SCOTCH, PMORSy). Вместе с тем, низкая арифметическая интенсивность, нерегулярный доступ к памяти, дисбаланс вычислительной нагрузки и необходимость поиска компромисса между временем работы и качеством перестановок мотивируют дальнейшие исследования метода. В данной работе выполняется сравнение ряда алгоритмов, применяемых на разных этапах метода вложенных сечений, с точки зрения их влияния на заполнение фактора и время работы в параллельном случае. Реализация алгоритмов и эксперименты выполнены в рамках ранее разработанной параллельной библиотеки переупорядочения матриц PMORSy, опережающей аналоги на ряде матриц коллекции университета Флориды. В результате выполненной работы удалось выделить наиболее перспективную комбинацию алгоритмов и улучшить качество перестановок и время работы PMORSy.

Бесплатно

Журнал