Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Все статьи: 306

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Гетманский Виктор Викторович, Чалышев Владимир Сергеевич, Крыжановский Дмитрий Иванович, Лексиков Евгений Иванович

Статья научная

Разработан метод отображения на кластерную архитектуру неоднородно взаимодействующих параллельных процессов в вычислительном приложении, использующем MPI. Метод предназначен для сокращения задержек при синхронизации за счет назначения наиболее интенсивно взаимодействующих процессов, на вычислительные ядра с наиболее быстрым интерконнектом. Метод использует представление вычислительной задачи и архитектуры кластера в виде взвешенного графа. Разработан эвристический алгоритм, дающий за приемлемое время результат отображения номеров процессов на номера вычислительных ядер кластера. На примере хорошо масштабируемого вычислительного пакета получено ускорение вычислений на 17-20 % в результате оптимизации отображения для тестов от 300 до 4800 процессов.

Бесплатно

Оптимизация утилизации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Оптимизация утилизации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович, Семенов Александр Сергеевич, Симонов Алексей Сергеевич

Статья научная

В данной работе рассматривается высокоскоростная вычислительная сеть Ангара с топологией «многомер-ный тор». Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. Данная работа является продолжение работы по оптимизации фрагментации ресурсов исследуемой вычислительной системы. В данной работе к учету фрагментации при выборе узлов добавлен метод запуска пользовательских заданий, основанный на политике выбора первого подходящего задания (First-Fit) в некотором рассматриваемом окне заданий. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной и основаны на данных, полученных с вычислительного кластера Desmos на базе сети Ангара. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследованы различные размеры окон заданий. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 7 % и на 36, 6 % сокращает значение времени ожидания задания в очереди по сравнению с базовым методом.

Бесплатно

Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович, Семенов Александр Сергеевич

Статья научная

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11% по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45,3 %

Бесплатно

Организация доступа к высокопроизводительным вычислительным ресурсам в HPC Community Cloud

Организация доступа к высокопроизводительным вычислительным ресурсам в HPC Community Cloud

Городничев Максим Александрович, Вайцель Сергей Александрович

Статья научная

Резюме: HPC Community Cloud представляет собой программный комплекс для объединения вычислительных ресурсов в единый сервис и предоставления доступа к этому сервису пользователям через веб-приложение и внешним программным системам через программный интерфейс. HPC Community Cloud скрывает нюансы работы с различными вычислительными системами за единой точкой доступа пользователей к сервису. В работе представлена архитектура и реализация программного комплекса HPC Community Cloud.

Бесплатно

Организация обмена данными в рамках платформы мобильной медицины

Организация обмена данными в рамках платформы мобильной медицины

Волков Иван Алексеевич, Радченко Глеб Игоревич, Черных Андрей Николаевич

Статья научная

Мобильная медицина является важной составляющей для реализации постоянного мониторинга здоровья, который открывает для врачей, пациентов и исследователей новые возможности. Экспоненциальныйрост сферы привел к увеличению скорости появления новых решений на рынке здравоохранения и, соответственно, к увеличению количества информации о здоровье населения. Однако сегодня практически всясобираемая сервисами мобильной медицины информация изолирована друг от друга, так как распределенапо разным сайтам и мобильным приложениям. Отсутствие у пользователя возможности удобно управлятьсвоими медицинскими данными и делиться ими является существенной проблемой на текущий момент.Создание платформы мобильной медицины позволит решить данную проблему, предлагая механизмы наоснове которых сторонние разработчики могут размещать свои сервисы и организовывать межсервисныйобмен данными пользователей. В рамках нашей работы мы провели анализ существующих решений нарынке мобильной медицины, описали варианты использования сервисов в сфере мобильной медицины. Нами предложена концепция платформы мобильной медицины и проведено сравнение способов организацииобмена медицинскими данными. На основе проведенного анализа нами был выбран и реализован прототипсистемы обмена медицинскими данными между мобильными клиентами на основе однорангового (peer-to-peer) соединения.

Бесплатно

Особенности реализации алгоритма Treecode для решения задачи n-тел с использованием графических ускорителей

Особенности реализации алгоритма Treecode для решения задачи n-тел с использованием графических ускорителей

Титов Александр Викторович, Хоперсков Александр Валентинович

Статья научная

Иерархические методы вычисления гравитационных сил для систем N-тел позволяют существенно увеличить качество численного моделирования при решении различных астрофизических задач за счет увеличения числа элементов N, поскольку вместо вычислительной сложности ~O(N2) для прямого метода, мы имеем N log(N) при использовании приближенного метода TreeCode, что позволяет существенно увеличить число частиц в численных моделях. Разработано новое программное обеспечение для решения динамической задачи с большим числом частиц для моделирования галактических бесстолкновительных компонент, в частности, звездной подсистемы и темной массы. В работе представлены результаты тестирования алгоритма TreeCode для параллельной реализациии на графических ускорителях NVidia Tesla. Для построения иерархической системы сеток нами реализован быстрый алгоритм построения октодеревьев, основанный на пространственной кривой Мортона. Для оценок качества построенной численной модели используем для сравнения результаты моделирования на основе прямого вычисления сил взаимодействия между всеми N частицами системы. Проведен анализ быстродействия различных реализаций алгоритмов решения задачи N-тел и выполнения интегральных законов сохранения физических характеристик для гравитирующих систем. В частности, проанализированы законы сохранения энергии и момента импульса для вращающегося самогравитирующего диска. Рассмотрены модели с различными критериями оценки удаленности частицы и значениями угла раскрытия θ.

Бесплатно

Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным

Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным

Бахтин Владимир Александрович, Колганов Александр Сергеевич, Крюков Виктор Алексеевич, Поддерюгина Наталия Викторовна, Притула Михаил Николаевич

Статья научная

В 2011 г. для новых гетерогенных и гибридных суперкомпьютерных систем в Институте прикладной математики им. М.В. Келдыша РАН была предложена модель DVMH (DVM for Heterogeneous systems), разработаны языки программирования высокого уровня, представляющие собой стандартные языки Фортран и Си, расширенные директивами отображения программы на параллельную машину, оформленными в виде специальных комментариев (или прагм). В статье описываются проблемы и методы отображения циклов с зависимостями на графические процессоры, демонстрируется эффективность разработанных на языке Fortran DVMH параллельных программ с регулярными зависимостями по данным.

Бесплатно

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Лиходед Н.А., Полещук М.А.

Статья научная

Исследуется задача получения блоков операций и потоков операций параллельного алгоритма, приводящих к меньшему числу обращений к глобальной памяти и к эффективному использованию параллельными потоками вычислений кэшей и разделяемой памяти графического процессора. Сформулированы и доказаны утверждения, позволяющие оценить объем коммуникационных операций, порождаемых альтернативными вариантами задания размеров блоков вычислений, а также минимизировать число промахов кэша за счет использования временной и пространственной локальности данных с учетом размера и длины строк кэша. Исследования конструктивны и допускают программную реализацию для практического использования.

Бесплатно

Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Миниахметов Руслан Марсович, Цацина Елизавета Олеговна

Статья научная

В данной работе рассмотрена смешанная языковая модель, применяемая для поиска экспертов в таких областях как анализ социальных сетей и информационный поиск, предложена адаптация этой модели для социальной сети Twitter. Рассмотрены метрики популярности в социальной сети Twitter. Предложена формула оценки популярности пользователей социальой сети Twitter с учетом оценки релевантности их сообщений заданной теме, а также описан прототип системы для сбора данных и оценки популярности по предложенной формуле.

Бесплатно

Очистка сенсорных данных в интеллектуальных системах управления отоплением зданий

Очистка сенсорных данных в интеллектуальных системах управления отоплением зданий

М.Л. Цымблер, Я.А. Краева, Е.А. Латыпова, Е.В. Иванова, Д.А. Шнайдер, А.А. Басалаев

Статья научная

В современных интеллектуальных системах управления отоплением зданий зачастую возникают пропуски значений или выбросы в показаниях температурных и других датчиков ввиду сбоев программного или аппаратного обеспечения либо человеческого фактора. Для обеспечения эффективного анализа данных и принятия решений некорректные данные датчиков следует очищать путем восстановления пропущенных значений и сглаживания выбросов. В данной статье представлен пример SCADA-системы ПолиТЭР для управления отоплением, установленной в Южно-Уральском государственном университете, и описана структура и принципы реализации Модуля очистки данных, внедренного в указанную систему. Модуль очистки данных реализован с помощью технологий интеллектуального анализа данных и нейронных сетей в виде набора следующих подсистем. Препроцессор извлекает необработанные данные из хранилища данных системы и подготавливает обучающий набор данных для дальнейшей обработки. Предиктор представляет собой рекуррентную нейронную сеть для прогнозирования следующего значения датчика на основе его исторических данных. Реконструктор определяет, является ли текущее значение датчика выбросом, и в таком случае заменяет его на синтетическое значение, полученное Предиктором. Наконец, Детектор аномалий в режиме реального времени обнаруживает аномальные промежутки в данных датчика. В вычислительных экспериментах на реальных данных разработанный модуль показал относительно высокую и стабильную точность, а также адекватное обнаружение аномалий.

Бесплатно

Пакет параллельных прикладных программ Helmholtz3D

Пакет параллельных прикладных программ Helmholtz3D

Бутюгин Дмитрий Сергеевич

Статья научная

В работе представлен пакет параллельных прикладных программ Helmholtz3D, который позволяет проводить расчеты трехмерных электромагнитных полей с гармонической зависимостью от времени, распространяющиеся в трехмерных областях со сложной геометрией. Для решения возникающих в результате аппроксимаций систем линейных алгебраических уравнений (СЛАУ) с комплексными плохообусловленными неэрмитовыми матрицами используются современные итерационные методы решения СЛАУ в подпространствах Крылова совместно с оригинальными параллельными предобуславливателями. Апробация пакета проведена на серии методических и практических задач расчета электромагнитных полей для волновых устройств и задач электромагнитного каротажа.

Бесплатно

Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Гавриш Евгений Владимирович, Колтаков Алексей Владимирович, Медведев Александр Андреевич, Соколинский Леонид Борисович

Статья научная

Статья посвящена вопросам разработки параллельной СУБД с открытым исходным кодом для кластерных вычислительных систем. Дан обзор известных решений в этой области. Рассмотрена новая параллельная СУБД «Омега» с открытым исходным кодом, ориентированная на кластерные вычислительные системы. Приведена общая архитектура системы «Омега». Представлены диаграмма размещения и диаграмма классов. Описаны основные подсистемы СУБД «Омега» и принципы их взаимодействия при выполнении запросов.

Бесплатно

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Иванова Елена Владимировна, Соколинский Леонид Борисович

Статья научная

Данная статья является продолжением и развитием более ранней работы авторов, в которой была рассмотрена декомпозиция операций пересечения и соединения колоночных индексов на основе доменно-интервальной фрагментации. Такая декомпозиция позволяет организовать параллельное выполнение реляционных операций над распределенными колоночными индексами без массовых обменов данными между процессорными узлами. В настоящей статье рассматривается декомпозиция операций проекции, выбора, удаления дубликатов и объединения. Кроме этого, вводится новый вид колоночных индексов, названных колоночными хеш-индексами. Колоночный хеш-индекс способен индексировать сразу несколько атрибутов отношения. Для распределенных колоночных хеш-индексов рассматривается декомпозиция операций пересечения, объединения и естественного соединения.

Бесплатно

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Колганов А.С.

Статья научная

Решение задачи поиска минимальных остовных деревьев является распространенной в различных областях исследований: распознавание различных объектов, компьютерное зрение, анализ и построение сетей (например, телефонных, электрических, компьютерных, дорожных и т.д.), химия и биология и многие другие. Обработка больших графов - достаточно трудоемкая задача для центрального процессора (CPU) и является востребованной в данное время. Все более широкое распространение для решения задач общего назначения получают графические ускорители (GPU), имеющие большую вычислительную мощность, чем CPU. В данной статье рассмотрены методы сжатия и преобразования исходных графов для повышения эффективности их обработки. На примере алгоритма поиска минимальных остовных деревьев исследованы предложенные подходы. Исследована возможность гибридной реализация данного алгоритма. Получены самые высокие результаты по производительности на графах R-MAT и SSCA2.

Бесплатно

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Харченко Сергей Александрович, Ющенко Алексей Александрович

Статья научная

В работе рассматривается параллельная MPI+threads+SIMD реализация алгоритма вычисления разреженного QR разложения специальным образом упорядоченной прямоугольной матрицы на основе разреженных блочных преобразований Хаусхолдера. В алгоритме производится предварительное независимое параллельное вычисление QR разложений для наборов строк матрицы. Затем в соответствии с деревом вычислений производится вычисление QR разложения матриц, составленных из R факторов строчных разложений. Приводятся результаты экспериментов, подтверждающие эффективность предложенной параллельной реализации для тестовых задач. Алгоритм также может быть эффективно реализован на гетерогенных кластерных архитектурах с ускорителями типа GPGPU.

Бесплатно

Параллельная реализация каталитической реакции (CO + O 2 -> CO 2) с помощью асинхронного клеточного автомата

Параллельная реализация каталитической реакции (CO + O 2 -> CO 2) с помощью асинхронного клеточного автомата

Шарифулина Анастасия Евгеньевна

Статья научная

Представлена параллельная реализация асинхронного клеточного автомата, моделирующего классическую реакцию гетерогенного катализа - окисление монооксида углерода на поверхности платины. В каталитических реакциях в неравновесных условиях могут возникать различные критические явления (автоколебания, хаос, гистерезис). Помимо фундаментального интереса изучение механизма протекания каталитических процессов на металлах платиновой группы имеет важное практическое применение, связанное с использованием в каталитических преобразователях для очистки выхлопных газов. Сложное поведение нелинейных каталитических систем наиболее эффективно может быть описано с помощью асинхронного клеточного автомата, который еще называют кинетическим методом Монте-Карло. КА-моделирование реакций гетерогенного катализа требует решения задач больших размеров, поэтому необходимо использовать эффективные алгоритмы распараллеливания. Распараллеливание асинхронных КА сопряжено с определёнными трудностями, которых можно избежать, преобразовав асинхронный КА в блочно-синхронный. Блочно-синхронный режим работы уменьшает стохастичность моделируемого процесса, поэтому необходимо проверить эквивалентность эволюций асинхронного и блочно-синхронного КА. Для этого проводится статистический анализ основных характеристик моделирования реакции окисления: бифуркационных диаграмм, функций распределения концентраций реагентов, математических ожиданий и дисперсий концентраций, полученных с помощью асинхронного и блочно-синхронного КА. Вычисленные характеристики свидетельствуют о совпадении эволюций асинхронного и блочно-синхронного КА. Кроме того, выполнено сравнение эволюций асинхронного и блочно-синхронного КА для моделей «ZGB» и «наивная диффузия». На основе полученных результатов делается вывод о приемлемой точности аппроксимации асинхронного режима блочно-синхронным для класса задач «реакция - диффузия». В статье представлены результаты распараллеливания блочно-синхронного КА и приведены оценки эффективности параллельной реализации.

Бесплатно

Параллельная реализация мелкозернистых алгоритмов в системе WinALT

Параллельная реализация мелкозернистых алгоритмов в системе WinALT

Остапкевич Михаил Борисович

Статья научная

Дано краткое описание системы имитационного моделирования алгоритмов и структур с мелкозернистым параллелизмом WinALT. Отличительные черты системы - визуальное построение и отладка моделей, а также ориентация не только на клеточный автомат и некоторые его расширения, но и на широкий спектр других мелкозернистых алгоритмов. Рассмотрена существующая подсистема параллельного исполнения, которая позволяет выполнять моделирование с использованием кластеров Windows машин. Сформулированы требования к новой проектируемой подсистеме параллельного исполнения, которая пригодна для исполнения моделей на широком спектре современных параллельных ЭВМ. Предложена ее архитектура, рассмотрены режимы параллельного исполнения моделей и сформулированы планы развития системы.

Бесплатно

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Соколинская Ирина Михайловна, Соколинский Леонид Борисович

Статья научная

В статье описывается параллельный алгоритм решения нестационарных задач линейного программирования большой размерности, ориентированный на кластерные вычислительные системы. В основе алгоритма, получившего название «следящий», лежат фейеровские отображения. Алгоритм отслеживает изменения исходных данных и вносит корректировки в вычислительный процесс. При этом задача разбивается на большое количество подзадач, которые могут решаться независимо без обменов данными. Приводятся диаграммы деятельности UML, описывающие реализацию следящего алгоритма.

Бесплатно

Параллельная реализация стохастической клеточно-автоматной модели рекомбинации электронов и дырок в 2D и 3D неоднородных полупроводниках

Параллельная реализация стохастической клеточно-автоматной модели рекомбинации электронов и дырок в 2D и 3D неоднородных полупроводниках

Сабельфельд Карл Карлович, Киреева Анастасия Евгеньевна

Статья научная

В работе представлены стохастические клеточно-автоматные модели рекомбинации электронов и дырок в неоднородном полупроводнике для двумерного и трехмерного случаев. С помощью разработанных клеточно-автоматных моделей рекомбинации исследовано пространственно-временное распределение частиц, обнаружено и исследовано формирование макрокластеров электронов и дырок. В связи стем, что интегральные характеристики процесса рекомбинации вычисляются с помощью осреднения по большому ансамблю начальных данных, для сокращения времени вычислений разработаны параллельные программы, реализующие клеточно-автоматные модели рекомбинации в двумерном и трехмерном случаях. Параллельная реализация программ позволила вычислить за приемлемое время интегральные характеристики процесса: плотности частиц и интенсивность фотолюминесценции, для большого числа различных начальных условий, а также изучить кинетику процесса рекомбинации при наличии центров рекомбинации и диффузии частиц в двумерном и трехмерном случаях.

Бесплатно

Параллельное вычисление оценки приближенно оптимальных управлении

Параллельное вычисление оценки приближенно оптимальных управлении

Фесько Олесь Владимирович

Статья научная

Предложен метод расчета априорной оценки на основе достаточных условий оптимальности Кротова, позволяющей судить о качестве приближенного решения, полученного в ходе работы программы улучшения управления для задач оптимизации динамических систем. Метод реализован в виде параллельного алгоритма, являющегося частью программного комплекса оптимизации динамических систем на множествах кусочно-постоянных и кусочно-линейных управлений. Представленная процедура, кроме того, используется на этапе поиска начального управления при решении задач оптимального управления. Применение алгоритма и анализ эффективности его распараллеливания в рамках системы параллельного программирования с открытой архитектурой OpenTS демонстрируется в вычислительных экспериментах на примерах решения задач об оптимизации бифункциональной каталитической смеси и оптимального производства белка в биореакторе.

Бесплатно

Журнал