Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Все статьи: 345

Обработка запросов на кластерных вычислительных системах с многоядерными ускорителями

Костенецкий Павел Сергеевич

Статья научная

Работа посвящена вопросам моделирования процесса обработки запросов в мультипроцессорах параллельных систем баз данных. Предлагаются подходы для обработки запросов при помощи графических ускорителей, многоядерных сопроцессоров и центральных процессоров. На базе предложенных подходов реализован эмулятор параллельной СУБД. Приведены результаты вычислительных экспериментов и выполнен анализ эффективности предложенных подходов.

Бесплатно

Оптимальное управление процессом применения антивирусных препаратов при лечении ВИЧ-инфекции

Болодурина Ирина Павловна, Иванова Юлия Петровна

Краткое сообщение

Рассмотрена методологическая проблема применения современных математических и информационных методов для управления восстановлением иммунной системы человека в целях увеличения продолжительности его жизни. Разработана и численно решена задача оптимального управления динамикой ВИЧ-инфекции на основе применения принципа максимума Л.С. Понтрягина для нелинейных систем с постоянным запаздыванием и негладкой правой частью. На основе программной реализации численного алгоритма приведены результаты моделирования динамики иммунной системы при использовании различных стратегий применения лекарственных средств. Путем преобразования базовой системы дифференциальных уравнений, проведено исследование влияния вторичных инфекционных заболеваний на динамику ВИЧ-инфекции.

Бесплатно

Оптимальное управление тремя work-stealing деками в двухуровневой памяти

Акснова Е.А., Барковский Е.А., Соколов А.В.

Статья научная

При выполнении параллельных вычислений возникает проблема равномерного разделения задач между потоками. Одним из способов решения этой проблемы является применение распределенной динамической балансировки нагрузки. При таком способе балансировки каждый рабочий поток имеет свою очередь задач и потоки сами занимаются дальнейшем распределением задач. Широкое распространение получил метод балансировки «work-stealing», в котором один поток, у которого закончились задачи, может перехватывать задачи других потоков. Для реализации такого метода у каждого потока должен быть свой специализированный дек, в котором хранятся указатели на задачи. В этой статье предлагается и исследуется новый метод представления трех work-stealing деков в двухуровневой памяти. Рассматривается случай работы с тремя деками, когда в одном разделе быстрой памяти расположены две LIFO-части деков - два стека, которые растут навстречу друг другу, в другом разделе быстрой памяти расположены три FIFO-части, которые объединены в одну FIFO-очередь, из которой элементы только исключаются (кражи), и третья LIFO-часть. Средние части деков находятся в медленной памяти, обращение к ним происходит при переполнении или опустошении LIFO-частей или опустошении FIFO-частей деков, расположенных в быстрой памяти. Рассматривается задача оптимального разделения быстрой памяти для трех деков с заранее заданными вероятностями выполнения операций. Этот выбор зависит от характеристик уровней памяти, вероятностей операций и критерия оптимальности. В качестве критерия оптимальности рассматривается максимальное среднее время работы системы (среднее количество операций) до перераспределения памяти.

Бесплатно

Оптимизация моделирования белковых взаимодействий на многопроцессорных системах с предоставлением доступа к алгоритму через веб-интерфейс

Романенков Кирилл Владимирович, Сальников Алексей Николаевич

Статья научная

В работе представлены параллельные версии последовательной программы создания молекулярных интерфейсов с применением технологии OpenMP и MPI. Обе версии показали достаточную масштабируемость и лучшие временные показатели по сравнению с последовательной версией при запуске на одном процессоре. Моделирование белкового интерфейса для некоторых соединений занимает более двадцати часов счета на нескольких сотнях процессоров, поэтому для задач моделирования белковых соединений с большим количеством позиций важно наличие недетерминированных алгоритмов, позволяющих за приемлемое время получать биологически корректный результат. Выбор стохастических алгоритмов оправдал себя:и метод Монте-Карло, и алгоритм пчелиного поиска нашли пространственное расположение молекулы, соответствующее минимальному энергетическому состоянию. Предоставление доступа к реализации алгоритма по веб-интерфейсу отвечает современным тенденциям к перемещению вычислений на сторону сервера и позволяет широкому кругу специалистов использовать вычислительные мощности, предоставляемые Московским государственным университетом, а с учетом расширения сферы применимости задач молекулярного моделирования наличие открытого веб-интерфейса, предоставляющего удаленный доступ к вычислительным кластерам, является достаточно важной задачей.

Бесплатно

Оптимизация обнаружения конфликтов в параллельных программах с транзакционной памятью

Кулагин И.И., Курносов М.Г.

Статья научная

В настоящее время активно развивается альтернативный подход к созданию масштабируемых и потокобезопасных параллельных программ для многопроцессорных систем с общей памятью - технология транзакционной памяти (transactional memory). Ожидается, что она войдет в стандарт языка С++17. В данной работе предложен метод оптимизации обнаружения конфликтов (конкурентного доступа потоков к общим областям памяти), возникающих при выполнении параллельных программ на базе транзакционной памяти. Реализован модуль компилятора GCC для профилирования параллельных программ и адаптивной настройки параметров реализации транзакционной памяти под программу. Эффективность метода исследована на тестовых программах из пакета STAMP.

Бесплатно

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Гетманский Виктор Викторович, Чалышев Владимир Сергеевич, Крыжановский Дмитрий Иванович, Лексиков Евгений Иванович

Статья научная

Разработан метод отображения на кластерную архитектуру неоднородно взаимодействующих параллельных процессов в вычислительном приложении, использующем MPI. Метод предназначен для сокращения задержек при синхронизации за счет назначения наиболее интенсивно взаимодействующих процессов, на вычислительные ядра с наиболее быстрым интерконнектом. Метод использует представление вычислительной задачи и архитектуры кластера в виде взвешенного графа. Разработан эвристический алгоритм, дающий за приемлемое время результат отображения номеров процессов на номера вычислительных ядер кластера. На примере хорошо масштабируемого вычислительного пакета получено ускорение вычислений на 17-20 % в результате оптимизации отображения для тестов от 300 до 4800 процессов.

Бесплатно

Оптимизация утилизации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович, Семенов Александр Сергеевич, Симонов Алексей Сергеевич

Статья научная

В данной работе рассматривается высокоскоростная вычислительная сеть Ангара с топологией «многомер-ный тор». Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. Данная работа является продолжение работы по оптимизации фрагментации ресурсов исследуемой вычислительной системы. В данной работе к учету фрагментации при выборе узлов добавлен метод запуска пользовательских заданий, основанный на политике выбора первого подходящего задания (First-Fit) в некотором рассматриваемом окне заданий. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной и основаны на данных, полученных с вычислительного кластера Desmos на базе сети Ангара. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследованы различные размеры окон заданий. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 7 % и на 36, 6 % сокращает значение времени ожидания задания в очереди по сравнению с базовым методом.

Бесплатно

Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович, Семенов Александр Сергеевич

Статья научная

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11% по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45,3 %

Бесплатно

Организация доступа к высокопроизводительным вычислительным ресурсам в HPC Community Cloud

Городничев Максим Александрович, Вайцель Сергей Александрович

Статья научная

Резюме: HPC Community Cloud представляет собой программный комплекс для объединения вычислительных ресурсов в единый сервис и предоставления доступа к этому сервису пользователям через веб-приложение и внешним программным системам через программный интерфейс. HPC Community Cloud скрывает нюансы работы с различными вычислительными системами за единой точкой доступа пользователей к сервису. В работе представлена архитектура и реализация программного комплекса HPC Community Cloud.

Бесплатно

Организация обмена данными в рамках платформы мобильной медицины

Волков Иван Алексеевич, Радченко Глеб Игоревич, Черных Андрей Николаевич

Статья научная

Мобильная медицина является важной составляющей для реализации постоянного мониторинга здоровья, который открывает для врачей, пациентов и исследователей новые возможности. Экспоненциальныйрост сферы привел к увеличению скорости появления новых решений на рынке здравоохранения и, соответственно, к увеличению количества информации о здоровье населения. Однако сегодня практически всясобираемая сервисами мобильной медицины информация изолирована друг от друга, так как распределенапо разным сайтам и мобильным приложениям. Отсутствие у пользователя возможности удобно управлятьсвоими медицинскими данными и делиться ими является существенной проблемой на текущий момент.Создание платформы мобильной медицины позволит решить данную проблему, предлагая механизмы наоснове которых сторонние разработчики могут размещать свои сервисы и организовывать межсервисныйобмен данными пользователей. В рамках нашей работы мы провели анализ существующих решений нарынке мобильной медицины, описали варианты использования сервисов в сфере мобильной медицины. Нами предложена концепция платформы мобильной медицины и проведено сравнение способов организацииобмена медицинскими данными. На основе проведенного анализа нами был выбран и реализован прототипсистемы обмена медицинскими данными между мобильными клиентами на основе однорангового (peer-to-peer) соединения.

Бесплатно

Особенности реализации алгоритма Treecode для решения задачи n-тел с использованием графических ускорителей

Титов Александр Викторович, Хоперсков Александр Валентинович

Статья научная

Иерархические методы вычисления гравитационных сил для систем N-тел позволяют существенно увеличить качество численного моделирования при решении различных астрофизических задач за счет увеличения числа элементов N, поскольку вместо вычислительной сложности ~O(N2) для прямого метода, мы имеем N log(N) при использовании приближенного метода TreeCode, что позволяет существенно увеличить число частиц в численных моделях. Разработано новое программное обеспечение для решения динамической задачи с большим числом частиц для моделирования галактических бесстолкновительных компонент, в частности, звездной подсистемы и темной массы. В работе представлены результаты тестирования алгоритма TreeCode для параллельной реализациии на графических ускорителях NVidia Tesla. Для построения иерархической системы сеток нами реализован быстрый алгоритм построения октодеревьев, основанный на пространственной кривой Мортона. Для оценок качества построенной численной модели используем для сравнения результаты моделирования на основе прямого вычисления сил взаимодействия между всеми N частицами системы. Проведен анализ быстродействия различных реализаций алгоритмов решения задачи N-тел и выполнения интегральных законов сохранения физических характеристик для гравитирующих систем. В частности, проанализированы законы сохранения энергии и момента импульса для вращающегося самогравитирующего диска. Рассмотрены модели с различными критериями оценки удаленности частицы и значениями угла раскрытия θ.

Бесплатно

Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным

Бахтин Владимир Александрович, Колганов Александр Сергеевич, Крюков Виктор Алексеевич, Поддерюгина Наталия Викторовна, Притула Михаил Николаевич

Статья научная

В 2011 г. для новых гетерогенных и гибридных суперкомпьютерных систем в Институте прикладной математики им. М.В. Келдыша РАН была предложена модель DVMH (DVM for Heterogeneous systems), разработаны языки программирования высокого уровня, представляющие собой стандартные языки Фортран и Си, расширенные директивами отображения программы на параллельную машину, оформленными в виде специальных комментариев (или прагм). В статье описываются проблемы и методы отображения циклов с зависимостями на графические процессоры, демонстрируется эффективность разработанных на языке Fortran DVMH параллельных программ с регулярными зависимостями по данным.

Бесплатно

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Лиходед Н.А., Полещук М.А.

Статья научная

Исследуется задача получения блоков операций и потоков операций параллельного алгоритма, приводящих к меньшему числу обращений к глобальной памяти и к эффективному использованию параллельными потоками вычислений кэшей и разделяемой памяти графического процессора. Сформулированы и доказаны утверждения, позволяющие оценить объем коммуникационных операций, порождаемых альтернативными вариантами задания размеров блоков вычислений, а также минимизировать число промахов кэша за счет использования временной и пространственной локальности данных с учетом размера и длины строк кэша. Исследования конструктивны и допускают программную реализацию для практического использования.

Бесплатно

Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Миниахметов Руслан Марсович, Цацина Елизавета Олеговна

Статья научная

В данной работе рассмотрена смешанная языковая модель, применяемая для поиска экспертов в таких областях как анализ социальных сетей и информационный поиск, предложена адаптация этой модели для социальной сети Twitter. Рассмотрены метрики популярности в социальной сети Twitter. Предложена формула оценки популярности пользователей социальой сети Twitter с учетом оценки релевантности их сообщений заданной теме, а также описан прототип системы для сбора данных и оценки популярности по предложенной формуле.

Бесплатно

Очистка сенсорных данных в интеллектуальных системах управления отоплением зданий

М.Л. Цымблер, Я.А. Краева, Е.А. Латыпова, Е.В. Иванова, Д.А. Шнайдер, А.А. Басалаев

Статья научная

В современных интеллектуальных системах управления отоплением зданий зачастую возникают пропуски значений или выбросы в показаниях температурных и других датчиков ввиду сбоев программного или аппаратного обеспечения либо человеческого фактора. Для обеспечения эффективного анализа данных и принятия решений некорректные данные датчиков следует очищать путем восстановления пропущенных значений и сглаживания выбросов. В данной статье представлен пример SCADA-системы ПолиТЭР для управления отоплением, установленной в Южно-Уральском государственном университете, и описана структура и принципы реализации Модуля очистки данных, внедренного в указанную систему. Модуль очистки данных реализован с помощью технологий интеллектуального анализа данных и нейронных сетей в виде набора следующих подсистем. Препроцессор извлекает необработанные данные из хранилища данных системы и подготавливает обучающий набор данных для дальнейшей обработки. Предиктор представляет собой рекуррентную нейронную сеть для прогнозирования следующего значения датчика на основе его исторических данных. Реконструктор определяет, является ли текущее значение датчика выбросом, и в таком случае заменяет его на синтетическое значение, полученное Предиктором. Наконец, Детектор аномалий в режиме реального времени обнаруживает аномальные промежутки в данных датчика. В вычислительных экспериментах на реальных данных разработанный модуль показал относительно высокую и стабильную точность, а также адекватное обнаружение аномалий.

Бесплатно

Пакет параллельных прикладных программ Helmholtz3D

Бутюгин Дмитрий Сергеевич

Статья научная

В работе представлен пакет параллельных прикладных программ Helmholtz3D, который позволяет проводить расчеты трехмерных электромагнитных полей с гармонической зависимостью от времени, распространяющиеся в трехмерных областях со сложной геометрией. Для решения возникающих в результате аппроксимаций систем линейных алгебраических уравнений (СЛАУ) с комплексными плохообусловленными неэрмитовыми матрицами используются современные итерационные методы решения СЛАУ в подпространствах Крылова совместно с оригинальными параллельными предобуславливателями. Апробация пакета проведена на серии методических и практических задач расчета электромагнитных полей для волновых устройств и задач электромагнитного каротажа.

Бесплатно

Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Гавриш Евгений Владимирович, Колтаков Алексей Владимирович, Медведев Александр Андреевич, Соколинский Леонид Борисович

Статья научная

Статья посвящена вопросам разработки параллельной СУБД с открытым исходным кодом для кластерных вычислительных систем. Дан обзор известных решений в этой области. Рассмотрена новая параллельная СУБД «Омега» с открытым исходным кодом, ориентированная на кластерные вычислительные системы. Приведена общая архитектура системы «Омега». Представлены диаграмма размещения и диаграмма классов. Описаны основные подсистемы СУБД «Омега» и принципы их взаимодействия при выполнении запросов.

Бесплатно

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Иванова Елена Владимировна, Соколинский Леонид Борисович

Статья научная

Данная статья является продолжением и развитием более ранней работы авторов, в которой была рассмотрена декомпозиция операций пересечения и соединения колоночных индексов на основе доменно-интервальной фрагментации. Такая декомпозиция позволяет организовать параллельное выполнение реляционных операций над распределенными колоночными индексами без массовых обменов данными между процессорными узлами. В настоящей статье рассматривается декомпозиция операций проекции, выбора, удаления дубликатов и объединения. Кроме этого, вводится новый вид колоночных индексов, названных колоночными хеш-индексами. Колоночный хеш-индекс способен индексировать сразу несколько атрибутов отношения. Для распределенных колоночных хеш-индексов рассматривается декомпозиция операций пересечения, объединения и естественного соединения.

Бесплатно

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Колганов А.С.

Статья научная

Решение задачи поиска минимальных остовных деревьев является распространенной в различных областях исследований: распознавание различных объектов, компьютерное зрение, анализ и построение сетей (например, телефонных, электрических, компьютерных, дорожных и т.д.), химия и биология и многие другие. Обработка больших графов - достаточно трудоемкая задача для центрального процессора (CPU) и является востребованной в данное время. Все более широкое распространение для решения задач общего назначения получают графические ускорители (GPU), имеющие большую вычислительную мощность, чем CPU. В данной статье рассмотрены методы сжатия и преобразования исходных графов для повышения эффективности их обработки. На примере алгоритма поиска минимальных остовных деревьев исследованы предложенные подходы. Исследована возможность гибридной реализация данного алгоритма. Получены самые высокие результаты по производительности на графах R-MAT и SSCA2.

Бесплатно

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Харченко Сергей Александрович, Ющенко Алексей Александрович

Статья научная

В работе рассматривается параллельная MPI+threads+SIMD реализация алгоритма вычисления разреженного QR разложения специальным образом упорядоченной прямоугольной матрицы на основе разреженных блочных преобразований Хаусхолдера. В алгоритме производится предварительное независимое параллельное вычисление QR разложений для наборов строк матрицы. Затем в соответствии с деревом вычислений производится вычисление QR разложения матриц, составленных из R факторов строчных разложений. Приводятся результаты экспериментов, подтверждающие эффективность предложенной параллельной реализации для тестовых задач. Алгоритм также может быть эффективно реализован на гетерогенных кластерных архитектурах с ускорителями типа GPGPU.

Бесплатно

1
...
8
9
10
11
12
13
14
...
В конец

Журнал