Информатика, вычислительная техника и управление. Рубрика в журнале - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Публикации в рубрике (60): Информатика, вычислительная техника и управление
все рубрики
Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Гетманский Виктор Викторович, Чалышев Владимир Сергеевич, Крыжановский Дмитрий Иванович, Лексиков Евгений Иванович

Статья научная

Разработан метод отображения на кластерную архитектуру неоднородно взаимодействующих параллельных процессов в вычислительном приложении, использующем MPI. Метод предназначен для сокращения задержек при синхронизации за счет назначения наиболее интенсивно взаимодействующих процессов, на вычислительные ядра с наиболее быстрым интерконнектом. Метод использует представление вычислительной задачи и архитектуры кластера в виде взвешенного графа. Разработан эвристический алгоритм, дающий за приемлемое время результат отображения номеров процессов на номера вычислительных ядер кластера. На примере хорошо масштабируемого вычислительного пакета получено ускорение вычислений на 17-20 % в результате оптимизации отображения для тестов от 300 до 4800 процессов.

Бесплатно

Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович, Семенов Александр Сергеевич

Статья научная

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11% по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45,3 %

Бесплатно

Организация доступа к высокопроизводительным вычислительным ресурсам в HPC Community Cloud

Организация доступа к высокопроизводительным вычислительным ресурсам в HPC Community Cloud

Городничев Максим Александрович, Вайцель Сергей Александрович

Статья научная

Резюме: HPC Community Cloud представляет собой программный комплекс для объединения вычислительных ресурсов в единый сервис и предоставления доступа к этому сервису пользователям через веб-приложение и внешним программным системам через программный интерфейс. HPC Community Cloud скрывает нюансы работы с различными вычислительными системами за единой точкой доступа пользователей к сервису. В работе представлена архитектура и реализация программного комплекса HPC Community Cloud.

Бесплатно

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Лиходед Н.А., Полещук М.А.

Статья научная

Исследуется задача получения блоков операций и потоков операций параллельного алгоритма, приводящих к меньшему числу обращений к глобальной памяти и к эффективному использованию параллельными потоками вычислений кэшей и разделяемой памяти графического процессора. Сформулированы и доказаны утверждения, позволяющие оценить объем коммуникационных операций, порождаемых альтернативными вариантами задания размеров блоков вычислений, а также минимизировать число промахов кэша за счет использования временной и пространственной локальности данных с учетом размера и длины строк кэша. Исследования конструктивны и допускают программную реализацию для практического использования.

Бесплатно

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Иванова Елена Владимировна, Соколинский Леонид Борисович

Статья научная

Данная статья является продолжением и развитием более ранней работы авторов, в которой была рассмотрена декомпозиция операций пересечения и соединения колоночных индексов на основе доменно-интервальной фрагментации. Такая декомпозиция позволяет организовать параллельное выполнение реляционных операций над распределенными колоночными индексами без массовых обменов данными между процессорными узлами. В настоящей статье рассматривается декомпозиция операций проекции, выбора, удаления дубликатов и объединения. Кроме этого, вводится новый вид колоночных индексов, названных колоночными хеш-индексами. Колоночный хеш-индекс способен индексировать сразу несколько атрибутов отношения. Для распределенных колоночных хеш-индексов рассматривается декомпозиция операций пересечения, объединения и естественного соединения.

Бесплатно

Применение графических ускорителей для обработки запросов над сжатыми данными в параллельных системах баз данных

Применение графических ускорителей для обработки запросов над сжатыми данными в параллельных системах баз данных

Приказчиков Степан Олегович, Костенецкий Павел Сергеевич

Статья научная

Работа посвящена вопросам применения графических процессоров для обработки запросов в параллельных системах баз данных. Целью данной работы является оценка эффективности выполнения запросов к сжатой базе данных без предварительной распаковки с использованием графических ускорителей, поддерживающих технологию CUDA. Объем внутренней памяти ГПУ на порядки меньше, чем объем оперативной памяти современных вычислительных систем. Это ограничивает размер базы данных, которую можно загрузить в память ГПУ и как следствие не позволяет раскрыть весь вычислительный потенциал графического процессора. Предлагается подход для обработки запросов над сжатыми данными на ГПУ. На основе предложенного подхода реализован эмулятор параллельной СУБД. Аналогичный эмулятор разработан для ЦПУ. Приведены результаты вычислительных экспериментов и произведена оценка эффективности данного подхода.

Бесплатно

Применение трехкомпонентных ключей для полнотекстового поиска с учетом расстояния с гарантированным временем отклика

Применение трехкомпонентных ключей для полнотекстового поиска с учетом расстояния с гарантированным временем отклика

Веретенников Александр Борисович

Статья научная

Рассматриваются задачи поиска фраз и наборов слов в большом объеме текстов. В результате поиска получаем список документов, содержащих заданные слова, при этом документы, где слова располагаются ближе друг к другу, считаются более релевантными. Поскольку эта задача требует сохранения в индексе информации о каждом вхождении каждого слова в текстах, запросы, включающие часто встречающиеся слова, требуют для своего выполнения длительного времени. В некоторых поисковых системах предлагается ввести список стоп слов, которые не учитываются при поиске, но этот подход снижает качество поиска. В данной работе при поиске обрабатываются все слова и применяются дополнительные индексы. С помощью дополнительных индексов время выполнения поискового запроса, включающего часто встречающиеся слова, может быть снижено в десятки раз. Разработан новый вид индекса с трехкомпонентными ключами. Приведены алгоритмы поиска и результаты экспериментов поиска в сравнении с обычными индексами. Эксперименты показывают, что при применении разработанных индексов для определенного класса запросов, состоящих из самых часто встречающихся слов, скорость поиска возрастает более чем в 90 раз.

Бесплатно

Разномасштабные задачи тепломассообмена в атомной энергетике

Разномасштабные задачи тепломассообмена в атомной энергетике

Волков Василий Юрьевич, Голибродо Лука Антонович, Крутиков Алексей Александрович, Кудрявцев Олег Вячеславович, Надинский Юрий Николаевич, Нечаев Артем Тимурович, Скибин Александр Петрович

Статья научная

Данная статья посвящена обзору результатов, полученных в АО ОКБ «ГИДРОПРЕСС» с учетом наработанного опыта в области численного моделирования тепломассообмена в различных объектах атомной энергетики. Польза от применения CFD-технологий при проектировании реакторных установок заключается в возможности на базе ограниченного количества экспериментальных данных детально исследовать процессы тепломассообмена в установке с целью подтверждения или модернизации конструкторских решений на передовом научно-техническом уровне. Представлен ряд задач, для решения которых были использованы современные численные методы вычислительной гидродинамики с применением высокопроизводительной вычислительной техники. Показаны новые возможности расчетного моделирования при использовании современных суперкомпьютерных вычислительных технологий, а также сопутствующие вычислительные сложности и проблемы анализа результатов. Приведены примеры использования рассматриваемой технологии для моделирования экспериментальных стендов и натурных объектов при различных режимах работы. Показана автоматическая обработка результатов, позволяющая проводить анализ больших задач размерностью до 1 млрд. контрольных объемов по интегральным параметрам, характеризующим работу реакторной установки, таким как распределение расходов на входе и на выходе из активной зоны, распределение подогревов в тепловыделяющих сборках активной зоны, и т.д.

Бесплатно

Разработка алгоритмического обеспечения для синтеза топологических структур инфокоммуникационных систем

Разработка алгоритмического обеспечения для синтеза топологических структур инфокоммуникационных систем

Сорокин Александр Александрович, Резников Петр Сергеевич

Статья научная

В работе показано, что одна из проблем систем телекоммуникаций - это неопределенность отношения элемента к определенной подсистеме сети передачи информации, элемент может использоваться как абонентское оборудование и как подсистема управления. В результате затрудняется внедрение ad hoc сетей в структуру систем мобильной связи. Для устранения проблемы разработан метод описания структуры системы инфокоммуникаций. Метод основан на представлении системы как единой логической структуры. Основа структуры - это виртуальные узлы. Совокупность виртуальных узлов образует виртуальную сеть. Пропускная способность виртуальной сети изменяется по вероятностным законам. Вероятностные законы определяются на основе статистики посещения виртуального узла физическими узлами. Область использования для систем связи заключается в повышении эффективности управления за счет прогнозирования альтернативных маршрутов передачи информации и синтеза систем связи различных стандартов. Результаты можно использовать для исследования взаимодействий социальных и экономических систем региона. Для демонстрации результатов проведен эксперимент по прогнозированию количества физических узлов в заданном виртуальном узле. По полученным данным рассчитана вероятность появления в виртуальном узле физических объектов. Результаты расчета позволяют построить карту посещаемости территории физическими узлами и рассчитать маршруты передачи трафика между виртуальными узлами.

Бесплатно

Разработка компьютерных моделей баллистических тканей с поверхностной обработкой

Разработка компьютерных моделей баллистических тканей с поверхностной обработкой

Долганина Наталья Юрьевна, Игнатова Анастасия Валерьевна

Статья научная

Баллистические ткани на сегодняшний день широко применяются в качестве элементов защитных структур. Актуальными задачами при разработке бронеструктур являются минимизация их массы, уменьшение кинетической энергии пули, передаваемой объекту, расположенному за бронепанелью (снижение величины прогиба тыльной стороны панели). Значительная часть энергии пули рассеивается за счет работы сил трения при вытягивании нитей из ткани. Умение предсказывать работу баллистической ткани при вытягивании нитей позволит проектировать высокоэффективные бронеструктуры. Поэтому были разработаны малопараметрические численные модели вытягивания нити из арамидной ткани Р110 полотняного переплетения, а также для этой ткани с разными типами поверхностной обработки (канифоль, силиконовая смазка) в пакете программ LS-DYNA. Поверхностная обработка ткани позволяет изменять коэффициент трения между нитями с минимальным увеличением веса, и в модели она учитывалась за счет изменения одного параметра - коэффициента сухого трения. Рассмотрено несколько способов распараллеливания задачи вытягивания нити из ткани, получены графики ускорения. Были получены расчетные зависимости нагрузки от перемещения при вытягивании нити из ткани с поверхностной обработкой и без нее. Расчетные результаты лежат в диапазоне разброса экспериментальных данных.

Бесплатно

Распараллеливание тестов NAS NPB для сопроцессора Intel Xeon Phi на языке Fortran-DVMH

Распараллеливание тестов NAS NPB для сопроцессора Intel Xeon Phi на языке Fortran-DVMH

Алексахин Валерий Федорович, Бахтин Владимир Александрович, Жукова Ольга Федоровна, Колганов Александр Сергеевич, Крюков Виктор Алексеевич, Островская Ирина Петровна, Поддерюгина Наталия Викторовна, Притула Михаил Николаевич, Савицкая Ольга Антониевна

Статья научная

В статье анализируется эффективность выполнения тестов NAS из пакета NPB 3.3.1 (EP, MG, BT, SP, LU) на узлах кластеров различной архитектуры, использующих многоядерные универсальные процессоры, графические ускорители фирмы NVidia и сопроцессоры фирмы Intel. Сравниваются характеристики тестов, разработанных на высокоуровневом языке Fortran-DVMH (далее FDVMH), и их реализации на других языках. Исследуется влияние различных оптимизаций для FDVMH-версий тестов NAS, необходимых для их эффективной работы на сопроцессоре Intel Xeon Phi. Представлены результаты запусков тестов при одновременном использовании всех ядер центрального процессора, графического процессора и сопроцессора Intel Xeon Phi.

Бесплатно

Распределенный алгоритм отображения распределенных многомерных данных на многомерный мультикомпьютер в системе фрагментированного программирования Luna

Распределенный алгоритм отображения распределенных многомерных данных на многомерный мультикомпьютер в системе фрагментированного программирования Luna

Щукин Георгий Анатольевич

Статья научная

В статье рассматривается распределенный алгоритм с локальными взаимодействиями Patch, предназначенный для управления распределением данных и динамической балансировки нагрузки в системе фрагментированного программирования LuNA. Система LuNA используется для упрощения создания параллельных реализаций крупномасштабных численных моделей для распределенных вычислительных систем. Фрагментированная программа в системе LuNA выполняется под управлением исполнительной системы, которая использует различные алгоритмы распределения данных и вычислений для обеспечения эффективного (в плане времени исполнения и потребления ресурсов) исполнения программы. Разработанный для использования в системе LuNA распределенный алгоритм Patch предназначен для случая распределения многомерных сеток данных на многомерной решетке вычислительных узлов. Алгоритм использует отображение данных на многомерную решетку ячеек (координат), которые затем распределяются между вычислительными узлами мультикомпьютера. Такое отображение позволяет алгоритму учитывать зависимости между данными и сохранять локальность данных при динамической балансировке нагрузки. Тестирование алгоритма Patch на фрагментированной реализации реальной вычислительной задачи показало его преимущество над использовавшимся ранее в системе LuNA алгоритме Rope, в виде уменьшения суммарного объема и дальности коммуникаций между вычислительными узлами в ходе исполнения программы.

Бесплатно

Современные и перспективные высокопроизводительные вычислительные системы с реконфигурируемой архитектурой

Современные и перспективные высокопроизводительные вычислительные системы с реконфигурируемой архитектурой

Левин Илья Израилевич, Дордопуло Алексей Игоревич, Каляев И.А., Доронченко Ю.И., Раскладкин М.К.

Статья научная

В статье рассматриваются архитектура и сравнительные технические характеристики реконфигурируемых вычислительных систем (РВС) на основе программируемых логических интегральных схем (ПЛИС) семейства Xilinx Virtex-7: вычислительных модулей 24V7-750 и «Тайгета», устанавливаемых в вычислительный шкаф, и реконфигурируемого вычислительного блока «Калеано» для настольного использования. Рассматриваются также архитектура и компоновка РВС нового поколения на основе жидкостного охлаждения, приводятся результаты расчетов и макетирования основных технических решений. Рассматриваются технологии решения прикладных задач с помощью комплекса средств разработки прикладного программного обеспечения. РВС нового поколения на основе жидкостного охлаждения позволяют достичь производительности 1 Пфлопс в стандартном вычислительном шкафу высотой 47U при потребляемой мощности 150 кВт, обеспечивая, тем самым, существенное преимущество по таким технико-экономическим параметрам, как реальная и удельная производительность, энергоэффективность, массогабаритные характеристики и другим по сравнению с аналогичными системами.

Бесплатно

Сравнение областей истинности запросов к реляционной базе данных

Сравнение областей истинности запросов к реляционной базе данных

Мосин Сергей Владимирович

Статья научная

В данной статье предлагается описание подходов аналитического сравнения пользовательских запросов к реляционной базе данных. Такое сравнение имеет целью установление возможности частичного или полного использования закэшированных на компьютере пользователя запросов к СУБД и основано на применении аппарата логики предикатов, где в качестве формул выступают логические ограничения SQL, а предикатами служат элементарные операции SQL. В случае, если результат выполнения пользовательского запроса полностью содержится в кэше, то данные можно взять оттуда, минуя запрос к удаленному серверу. Описанные подходы выражены в алгоритме использования кэшированных данных. Предложенный алгоритм также может быть использован для определения недостающих в кэше данных и последующего запроса только на эти данные. Для этого также используются аналитические вычисления, что экономит сетевой трафик и время на выполнение запросов и является принципиальным отличием данной технологии от существующих аналогов.

Бесплатно

Средства программирования реконфигурируемых вычислительных систем на основе ПЛИС Virtex-7 с использованием софт-архитектур

Средства программирования реконфигурируемых вычислительных систем на основе ПЛИС Virtex-7 с использованием софт-архитектур

Левин Илья Израилевич, Дордопуло Алексей Игоревич, Коваленко Василий Борисович, Гудков Вячеслав Александрович, Гуленок Андрей Александрович

Статья научная

В статье рассматриваются существующие средства проектирования цифровых устройств в программируемых логических интегральных схемах (ПЛИС), языки программирования реконфигурируемых вычислительных систем и возможность их использования при программировании многокристальных реконфигурируемых вычислительных систем. Также рассмотрены разработанные в НИИ МВС ЮФУ язык программирования высокого уровня COLAMO и комплекс средств разработки многокристальных решений на реконфигурируемых вычислительных системах. Особое внимание уделено новому подходу в программировании, заключающемуся в разработке и использовании настраиваемых проблемно-ориентированных софт-архитектур, которые позволяют сократить количество трансляций конфигурационных файлов ПЛИС при отладке параллельных программ на реконфигурируемых вычислительных системах. Проблемно-ориентированные софт-архитектуры дают возможность без перезагрузки файлов конфигурации ПЛИС вычислительного поля с помощью программной настройки изменять коммутацию между устройствами и создавать необходимые вычислительные структуры для решения прикладных задач пользователя, что существенно сокращает время отладки параллельных прикладных программ.

Бесплатно

Стенд для отладки и тестирования качества работы локальных системных распределенных алгоритмов динамической балансировки нагрузки

Стенд для отладки и тестирования качества работы локальных системных распределенных алгоритмов динамической балансировки нагрузки

Перепелкин Владислав Александрович, Сумбатянц Илья Ильич

Статья научная

При параллельной реализации итерационных численных методов на регулярных сетках возникает необходимость в статической или динамической балансировке вычислительной нагрузки. Для исследования того или иного алгоритма балансировки нагрузки важно проводить его разносторонее тестирование на множестве различных задач рассматриваемого класса с различными конфигурациями вычислителя и различными наборами входных данных задач. В статье представлен тестовый стенд, предназначенный для автоматизации проведения такого тестирования. Он позволяет описать прикладную задачу и подключить реализацию алгоритма статической или динамической балансировки вычислительной нагрузки для последующего тестирования на мультикомпьютере. На выходе стенд предоставляет информацию о том, как происходило исполнение итерационного сеточного метода с точки зрения баланса вычислительной нагрузки. Приведен пример использования стенда для исследования диффузионного алгоритма динамической балансировки нагрузки на процессоры мультикомпьютера.

Бесплатно

Топологические резервы «Сплющенных» системных сетей

Топологические резервы «Сплющенных» системных сетей

Каравай Михаил Фдорович, Подлазов Виктор Сергеевич

Статья научная

Рассматривается метод изменения топологии 2-шаговой системной сети «сплющенная бабочка» (Flattened Butterfly), обеспечивающий уменьшение размеров составляющих ее коммутаторов и, как следствие, уменьшение схемной сложности и энергопотребления при сохранении числа абонентов (процессоров), диаметра сети и коммутационных свойств. При сохранении размеров коммутаторов предлагаемый метод позволяет существенно увеличить число абонентов при сохранении диаметра сети.

Бесплатно

Удаленная визуализация больших объемов данных

Удаленная визуализация больших объемов данных

Ненаженко Дмитрий Владимирович, Радченко Глеб Игоревич

Статья научная

Вычислительные мощности и аппаратные характеристики персональных вычислительных устройств не всегда позволяют обеспечить должный уровень производительности для обеспечения визуализации больших объемов данных, возникающих в результате решения различных задач с использованием суперкомпьютерных вычислительных систем. Для обеспечения прозрачного и удобного доступа к таким данным может применяться подход удаленной визуализации, при котором клиент используется исключительно для отображения видео-информации с одного или нескольких удаленных серверов визуализации. В данной работе рассматриваются виды удаленной визуализации, используемые технологии, для обеспечения взаимодействия между клиентскими приложениями и удаленными серверами, анализируются различные подходы к решению задачи удаленной визуализации.

Бесплатно

Формирование и планирование пакетов заданий в распределенных вычислительных средах

Формирование и планирование пакетов заданий в распределенных вычислительных средах

Топорков Виктор Васильевич, Емельянов Дмитрий Михайлович, Потехин Петр Анатольевич

Статья научная

В работе рассматриваются подходы к формированию системы ранжированных заданий в модели циклического планирования в виртуальных организациях распределенных вычислительных сред. Предлагаются и сравниваются две различные методологии отбора заданий для планирования: первая из них базируется на решении задачи о заполнении ранца, для второй - вводится эвристический показатель «совместимости» заданий и доменов вычислительных узлов. Приводятся результаты экспериментального исследования, позволяющего оценить эффективность предложенных решений, проводится их сравнительный анализ со случайным отбором заданий в пакет.

Бесплатно

Эмулятор PCI Express для HDL-моделирования

Эмулятор PCI Express для HDL-моделирования

Шворин Артем Борисович

Статья научная

В данной работе описывается эмулятор PCI Express - инструмент, позволяющий упростить разработку и отладку некоторого класса аппаратных устройств, работающих по протоколу передачи данных PCI Express. Эмулятор позволяет промоделировать поведение разрабатываемого устройства на обычном компьютере, что значительно сокращает цикл отладки.

Бесплатно

Журнал