Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi
Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика
Все статьи: 329

Статья научная
В статье рассмотрена модель территориально распределенной вычислительной системы (ТРС), состоящей из объединенных каналами связи высокопроизводительных вычислительных установок. Вычислительные установки из состава ТРС представляют собой высокопроизводительные кластеры, различающиеся по архитектуре и производительности. Объединяющие их каналы связи имеют разные надежность и пропускную способность. Особенностью рассматриваемой модели является децентрализованная схема управления заданиями. Подобная схема подразумевает, что любая вычислительная установка в любой момент времени может выйти из состава ТРС по причине своей неисправности или неисправности канала связи. Устранение неисправности означает динамическое подключение вычислительной установки к ТРС. В этих условиях в ТРС организуется глобальная очередь заданий с абсолютными приоритетами, из которой задания распределяются по свободным ресурсам вычислительных установок. Абсолютные приоритеты предполагают вытеснение с выполнения низкоприоритетного задания поступившим в очередь высокоприоритетным заданием. Для формирования и хранения глобальной очереди заданий в условиях динамически изменяющегося состава ТРС необходима надежная распределенная информационная система (РИС). В качестве основы для ее построения авторами рассмотрен ряд известных распределенных СУБД. В статье сформулированы требования к РИС, проведен сравнительный анализ и сделан выбор решения, удовлетворяющего требованиям, рассмотрен разработанный авторами макет ТРС с децентрализованной схемой диспетчеризации заданий.
Бесплатно

Методы и эвристики планирования в распределенных вычислениях с неотчуждаемыми ресурсами
Статья научная
Статья посвящена вопросам эффективной организации вычислений в виртуальных организациях распределенных сред с неотчуждаемыми ресурсами, включая коммерчески используемый грид. Предлагается и обосновывается комплексное сочетание методов и эвристик планирования и распределения ресурсов на уровне потоков заданий и приложений, реализующих принятую в виртуальной организации политику предоставления и потребления ресурсов с использованием экономических принципов.
Бесплатно

Методы оптимизации обобщенных тензорных сверток
Статья научная
Свертка тензоров является одной из основных операций "Тензорного исчисления" - отдельного раздела математики, ставшего основным языком для описания фундаментальных законов таких областей науки, как теория относительности, механика, электродинамика и физика твердого тела. Эффективность выполнения свертки тензоров и её обобщений имеет существенную практическую значимость для таких областей как решение задач математической физики, машинного обучения, в спектральных методах, в квантовой химии, при интеллектуальном анализе данных, в высокопроизводительных вычислениях на многопроцессорных системах, и др. В последние двадцать лет количество методов оптимизации тензорных сверток значительно увеличилось и продолжает возрастать. В статье представлен обзор активно используемых подходов к оптимизации свертки тензоров, применяемых при решении прикладных задач на однопроцессорных и многопроцессорных вычислительных системах с распределенной памятью. В работе представлены методы оптимизации важных частных случаев свертки тензоров - матричного и матрично-векторного произведения, использующихся для большинства оптимизаций сверток тензоров. Описанные оптимазации могут применяться в процессе компиляции программ, выполняемой промышленными компиляторами. Представленная информация может помочь при систематизации уже имеющихся знаний.
Бесплатно

Методы параллельного решения СЛАУ на системах с распределенной памятью в библиотеке Krylov
Статья научная
Рассматривается подход к созданию итерационного black-box («черного ящика») параллельного решателя, использованный в библиотеке Krylov для систем линейных алгебраических уравнений (СЛАУ) с разреженными матрицами высокого порядка, возникающими при сеточных аппроксимациях многомерных краевых задач и представленными в сжатом строчном формате CSR. Предлагается вариант алгебраической одномерной декомпозиции СЛАУ. Алгоритм основан на обходе в ширину графа матрицы системы и позволяет привести ее к блочно-трехдиагональному виду. За основу алгебраического решателя системы взят ад дитивный метод Шварца, который естественным образом ложится на архитектуру вычислительных систем с распределенной памятью. Полученные алгебраические системы в подпространстве следов, образованных переменными на внутренних границах подобластей, решаются с помощью обобщенного метода минимальных невязок. Вспомогательные системы в подобластях решаются с помощью прямого алгоритма PARDISO из библиотеки Intel MKL, использующего распараллеливание над общей памятью средствами OpenMP. Реализованные алгоритмы апробированы на численном решении ряда задач вычислительной математики, таких как задачи гидродинамики, диффузионно-конвективные уравнения, задачи электромагнетизма и др. Приведенные результаты численных экспериментов демонстрируют эффективность предлагаемых решений для многопроцессорных вычислительных систем с распределенной памятью.
Бесплатно

Статья научная
В параллельных планировщиках задач, работающих по стратегии work-stealing, каждый процессор имеет свой дек задач. Один конец дека используется для добавления и извлечения задач только владельцем, а другой - для перехвата задач другими процессорами. В статье предлагается обзор методов управления work-stealing деками, которые используются при реализации work-stealing планировщиков параллельных задач, а также представлено описание поставленных и решенных нашим коллективом задач оптимального управления деками для стратегии work-stealing. Принцип алгоритмов оптимального управления деками в двухуровневой памяти заключается в том, что при переполнении выделенного участка быстрой памяти происходит перераспределение элементов (задач) дека между уровнями памяти. В быстрой памяти остаются элементы из концов дека, так как с ними будет происходить работа в ближайшее время, а элементы средней части дека хранятся в медленной памяти. В таком случае необходимо определить оптимальное количество элементов, которое нужно оставить в быстрой памяти, в зависимости от критерия оптимальности и параметров системы.
Бесплатно

Статья научная
В последнее время наблюдается взрывной рост в развитии концепции цифровой индустрии. Одним из важнейших элементов этой концепции является применение методов математического моделирования и интеллектуального анализа данных для создания моделей производственных процессов и конечной продукции, базирующихся на обработке сигналов, поступающих с интеллектуальных сенсоров. Совокупность таких моделей, представляющих собой виртуальное представление промышленных процессов, систем и оборудования называют цифровыми двойниками. Цифровые двойники используют данные, получаемые от сенсоров, установленных на производственных линиях или на базе конечной продукции, для прогнозирования сбоев в работе оборудования, оптимизации качества продукции и сокращения негативного воздействия производственных процессов на окружающую среду. Комплексы моделей, лежащие в основе цифровых двойников, могут быть описаны в виде вычислительных потоков работ (Workflow), состоящих из набора вычислительных сервисов, каждый из которых представляет собой модель одного из этапов технологического процесса. Для организации гибкой поддержки облачных вычислений для выполнения цифровых двойников, мы предлагаем концепцию микро-потоков работ (Micro-Workflows), которая сочетает в себе мощность концепции научных потоков работ (Scientific Workflows), гибкость контейнерных технологий и устойчивость подхода потоковой обработки данных (Stream Processing) в распределенных вычислительных системах.
Бесплатно

Модели и стандарты электронного обучения
Статья научная
Статья представляет собой обзор моделей и стандартов, используемых в современных системах электронного обучения. Описывается общая концептуальная модель среды электронного обучения. Рассматриваются: модель данных для взаимодействия с электронными образовательными объектами; модель накопления контента, определяющая структуру образовательных объектов, способы их поиска и передачи между различными обучающими системами, а также способы упаковки контента; модель среды выполнения, определяющей структуру прикладного программного интерфейса для управления образовательными объектами; модель упорядочивания иерархического образовательного контента; модель компетенций, используемая для спецификации знаний, умений и навыков в системах электронного обучения. Также дается обзор стандарта SCORM, объединяющего в себе комплекс моделей электронного обучения.
Бесплатно

Моделирование влияния системы мониторинга производительности на выполнение коллективных MPI операций
Статья научная
Изучение параллельных программ с помощью средств мониторинга производительности - распространенная практика. Агент системы мониторинга для сбора данных о работе приложения периодически активируется во время счета этого приложения, внося помехи и занимая ресурсы. Однако вопрос об уровне влияния этих помех является слабо изученным, разработчики систем мониторинга зачастую не проводят исследования в этом направлении. В данной статье рассматриваются подходы к изучению влияния системы мониторинга производительности суперкомпьютера на пользовательские приложения. В качестве инструмента для измерения влияния агента системы мониторинга предлагается использовать коллективные MPI операции. Так, кроме обнаружения шума системы мониторинга, можно исследовать влияние системы мониторинга на сильно синхронизированные приложения. Время выполнения коллективных MPI операций изучается в присутствии программного средства, моделирующего работу агента системы мониторинга производительности. Оценивается уровень шума, который каждая из рассматриваемых коллективных операций в выбранной конфигурации запуска способна зафиксировать. В работе приводятся данные запусков инструмента с коллективными MPI операциями All-to-All, All-Reduce, Barrier. Найдено, что хорошей стабильностью и чувствительностью обладают операции All-to-All и Barrier.
Бесплатно

Моделирование заданного движения пятизвенного механизма
Краткое сообщение
Рассматривается задача о моделировании совместного со связями заданного пятизвенного механизма, у которого точки опоры шарнирно связаны с плоскостью. Управлениями являются моменты сил в шарнирных соединениях механизма. Для упрощенной модели на основе анализа уравнений движения излагается схема построения требуемых уравнений.
Бесплатно

Краткое сообщение
В статье описаны принципы моделирования предельных границ рудных месторождений на высокопроизводительных вычислительных системах с гибридной архитектурой с применением параллельного генетического алгоритма.
Бесплатно

Статья научная
Рассматриваются процессы переноса многокомпонентных веществ в водоеме. Примером таких веществ могут являться радионуклидные и нефтяные загрязнения природных водоемов. Полученные в результате математического моделирования численные задачи решаются на высокопроизводительных вычислительных системах (ВВС) с использованием существующих пакетов распараллеленных итерационных методов. В качестве исследуемого водоема рассматривается Азовское море.
Бесплатно

Статья научная
Рассматривается проблема выполнения длительных расчетов на высокопроизводительных вычислительных системах, компоненты которых подвержены отказам. Для программ, запускаемых на подобных системах, существенным является возможность обработки отказов путем автоматического продолжения расчета на оставшихся работоспособных узлах системы. Возможность обработки отказов предусматривается в разрабатываемом стандарте MPI 3.1. В работе кратко описывается библиотека моделирования отказов для тестирования отказоустойчивых алгоритмов, использующих функционал разрабатываемого стандарта MPI 3.1. Описана техника отказоустойчивости на примере тестовой задачи. Проведено сравение записи контрольных точек в оперативную память и в распределенную файловую систему.
Бесплатно

Моделирование процесса роста нанопленок методом химического осаждения из газовой фазы
Статья научная
Большинство задач, которые связаны со многими аспектами развития нанотехнологий, по своей природе существенно междисциплинарны. Одним из наиболее характерных примеров этого является проблематика применения газофазного синтеза в нанотехнологиях. По своему существу такие технологии являются реализацией процессов химического осаждения вещества из газообразного состояния, подаваемого в реакционную зону, в твердое состояние. Междисциплинарность рассматриваемых в газофазном синтезе процессов порождает серьезные трудности при их изучении. При этом в рамках традиционного физического эксперимента не удается получить хорошего результата, так как такой эксперимент: не является наглядным, не позволяет изучать зависимость конечного материала от различных физических параметров системы, занимает много времени, дорог. Поэтому естественно искать пути решения задач на базе математического моделирования, которое лежит в основе виртуального эксперимента. В основе работы — разработка и апробация технологий математического моделирования с использованием высокопроизводительных вычислений в области процессов газофазного синтеза наноразмерных структур и наноматериалов с целью изучения и обеспечения визуализации протекающих физико-химических процессов.
Бесплатно

Статья научная
В работе рассмотрена задача моделирования сейсмического поля (случай распространения продольной волны с учетом только сжатия и растяжения среды) в слоистой среде с включениями иерархической структуры. Построены алгоритмы моделирования в сейсмическом случае для 2-D упругой и пористой иерархической неоднородности. Исследован вопрос отражения физических свойств однофазности и двухфазности в системе уравнений решения прямой динамической сейсмики в частотном варианте.
Бесплатно

Моделирование экстремального наводнения в дельте дона на многопроцессорных вычислительных системах
Статья научная
По материалам ежедневных гидрометеорологических наблюдений на береговой базе Южного научного центра РАН в период с 20 марта по 26 марта 2013 года, проведено восстановление картины аномального затопления дельты Дона. Расчеты уровня воды и объема поступающей в дельту Дона воды проводились с помощью двухслойной математической модели. Расчеты проводились на многопроцессорных вычислительных системах, установленных в Южном федеральном университете.
Бесплатно

Моделирование электромагнитного и сейсмического поля в иерархически неоднородных средах
Статья научная
Построен алгоритм 3D моделирования электромагнитного поля для произвольного типа источника возбуждения N-слойной среды с иерархическим проводящим включением, расположенным в J-ом слое. Построены алгоритмы 2-D моделирования для дифракции звука и линейно поляризованной поперечной упругой волны на включении иерархической структуры, расположенной в J-ом слое N-слойной упругой среды.
Бесплатно

Модель параллельных вычислений для многопроцессорных систем с распределенной памятью
Статья научная
Появление мощных многопроцессорных вычислительных систем выдвигает на первый план вопросы, связанные с разработкой фреймворков (шаблонов), позволяющих создавать высокомасштабируемые параллельные программы, ориентированные на системы с распределенной памятью. При этом особенно важной является проблема разработки моделей параллельных вычислений, позволяющих на ранней стадии проектирования программы оценить ее масштабируемость. В статье приводятся общие требования к модели вычислений и строится новая высокоуровневая модель параллельных вычислений Bulk Synchronous Farm (BSF), являющаяся расширением модели BSP, и основанная на методе программирования SPMD и парадигме «мастер-рабочие». Модель BSF ориентирована на вычислительные системы с массовым параллелизмом на распределенной памяти, включающие в себя сотни тысяч процессорных узлов, и имеющие экзафлопный уровень производительности и на численные итерационные методы с высокой временной сложностью. Определяется архитектура BSF-компьютера и описывается структура BSF-программы. Описывается формальная стоимостная метрика, с помощью которой получаются верхние оценки масштабируемости параллельных BSF-программ применительно к вычислительным системам с распределенной памятью. Также выводятся формулы для оценки эффективности распараллеливания BSF-программ и даются аналитические оценки масштабируемости BSF-приложений.
Бесплатно

Модель прогнозирования живого веса с помощью глубокой регрессии RGB-D изображений
Статья научная
Прогнозирование живого веса помогает контролировать здоровье животных, эффективно проводить генетическую селекцию и определять оптимальное время убоя. На крупных фермах для измерения живого веса используются точные и дорогостоящие промышленные весы. Взвешивание животного из-за стресса ведет к потере его веса и продуктивности на 5-10%. Однако, перспективной альтернативой является оценка живого веса с помощью морфометрических измерений животного, а затем применение уравнений регрессии, связывающих такие измерения с живым весом. Ручные измерения животных с помощью рулетки отнимают много времени и вызывают стресс у животных. Поэтому в настоящее время для бесконтактных морфометрических измерений все чаще используются технологии компьютерного зрения. В статье предлагается новая модель для прогнозирования живого веса на основе регрессии изображений с использованием методов глубокого обучения. Для регрессии изображений использовались RGB изображения и карты глубины вид сбоку для прогнозирования живого веса крупного рогатого скота. Показано, что на реальных наборах данных предложенная модель достигает точности измерения веса с ошибкой MAE 35.5 и MAPE 8.4 на тестовом наборе данных.
Бесплатно

Статья научная
В статье рассматривается метод матричных пучков, являющийся параметрическим Прони -подобным методом обработки сигнала и позволяющим найти частоты, коэффициенты затухания, фазы и амплитуды суммы затухающих синусоид. Его преимуществом по сравнению с методом Прони является меньшее количество операций, что приводит к меньшей вычислительной ошибке. Предложена модификация данного метода способная решить задачу разделения истинных и ложных полюсов сигнала. Из отсчетов сигнала конструируются два пучка матриц, собственные значения которых в случае отсутствия шума совпадают с полюсами сигнала и обратными к ним. В случае зашумленного сигнала разделение истинных и ложных полюсов проводится за счет: 1) сингулярного разложения, 2) завышенного порядка предсказания, 3) анализа собственных значений двух пучков матриц. Приведен алгоритм модифицированного метода матричных пучков и сравнение этой модификации с классическим вариантом на модельном примере обнаружения сигнала в шуме. Показано, что классический метод не способен определить время начала полезного сигнала, поскольку подстраивает под шум сумму экспонент. Модифицированный метод матричных пучков решает задачу обнаружения сигнала в шуме и его параметров, т.к. помимо определения времени прихода сигнала, также способен оценить количество затухающих синусоид в нем и их параметры. Предложенный алгоритм обнаружения сигнала пригоден для работы с сигналами достаточно общего вида (суммой затухающих синусоид) и не требует знания законов распределения самого сигнала и его шумовой составляющей, как метод максимального правдоподобия.
Бесплатно

Модулярно-логарифмический сопроцессор для массовых арифметических вычислений
Статья научная
Предлагаемый сопроцессор представляет собой самостоятельный сложнофункциональный (intellectual property - IP) блок системы-на-кристалле, позволяющий проводить математические вычисления над вещественными числами в уникальной модулярно-логарифмической системе счисления. Обеспечены два уровня преобразования исходных чисел: в модулярную систему счисления вместо традиционной позиционной и в логарифмическую систему счисления вместо плавающей точки. Благодаря этому сопроцессор обладает более высоким быстродействием, точностью и надежностью вычислений по сравнению с известными аналогами. Он состоит из набора одинаковых вычислительных ядер, каждое из которых выполняет однотактовые скалярные или векторные операции. В результате проведенных исследований и разработок предложены новые научные и технические решения, реализующие предложенные способы вычислений и кодирования данных. При этом преобразование кодов в модулярно-логарифмическую систему счисления и обратно не вносит значительных временных задержек при большом потоке входных данных за счет предложенных аппаратных решений, конвейеризирующих процесс интерполяции функции логарифма и преобразования кодов системы остаточных классов. Реализован прототип устройства на базе программируемой логической интегральной схемы в виде IP-блока. Целевой рынок решения - компании разработчики универсальных процессоров.
Бесплатно