Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Бесплатный доступ

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11% по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45,3 %

Еще

Коммуникационная сеть ангара, многомерный тор, правило порядка направлений, фрагментация вычислительной системы, выбор узлов

Короткий адрес: https://sciup.org/147160644

IDR: 147160644   |   УДК: 519.687.1   |   DOI: 10.14529/cmse180204

Allocation optimization for reducing resource fragmentation in Angara high-speed interconnect

This paper considers a high-speed interconnect with a multidimensional topology. The paper is devoted to the optimization of fragmentation resulting from sequential allocation of compute nodes in a supercomputer provided that network traffic from different user’s tasks should not overlap. This paper proposes a method for searching nodes with an evaluation of the fragmentation of the system based on ideas from multidimensional container loading problem. For such an evaluation, the concept of rectangles is introduced, which can be inscribed into the system after placing the next user task. Each set of nodes that is suitable for placing the task is evaluated by the proposed function taking into account the size and the number of found rectangles of maximum size. The proposed method was evaluated using computer system model. A set of different computer systems with three-dimensional and four-dimensional topologies was considered. The minimum system size is 32 compute nodes and the maximum is 144. A synthetic queue of tasks is set for each system. The parameters of the synthetic queues are close to a real ones. The average utilization of the resources of the computer system and the average waiting time for the tasks in the queue is chosen as a method quality criterion. The study showed that the increase of the resources utilization for the proposed method averaged 11 % compared to the base method, and the average time spent in queue is reduced by 45, 3 %.

Еще

Список литературы Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

  • Lan Z., Tang W., Wang J., Yang X., Zhou Z., Zheng X. Balancing Job Performance with System Performance via Locality-aware Scheduling on Torus-connected Systems//2014 IEEE International Conference on Cluster Computing (CLUSTER) (Madrid, Spain, September 22-26, 2014), 2014. P. 140-148 DOI: 10.1109/CLUSTER.2014.6968751
  • IBM Redbooks Publication: IBM System Blue Gene Solution: Blue Gene/Q System Administration. 2013. 282 p.
  • Tang W., Lan Z., Desai N., Buettner D., Yu Y. Reducing Fragmentation on Torus-Connected Supercomputers//Proceedings of the 2011 IEEE International Parallel Distributed Processing Symposium (IPDPS’11) (Anchorage, Alaska, USA, May 16-20, 2011), 2011. P. 828-839 DOI: 10.1109/IPDPS.2011.82
  • Cray Document: Managing System Software for Cray XE and Cray XT Systems. 2010.
  • Агарков А.А., Исмагилов Т.Ф., Макагон Д.В., Семенов А.С., Симонов А.С. Результаты оценочного тестирования отечественной высокоскоростной коммуникационной сети Ангара//Суперкомпьютерные дни в России: Труды международной конференции (26-27 сентября 2016 г., г. Москва). М.: Изд-во МГУ, 2016. С. 626-639.
  • Симонов А.С., Макагон Д.В., Жабин И.А., Щербак А.Н., Сыромятников Е.Л., Поляков Д.А. Первое поколение высокоскоростной коммуникационной сети «Ангара»//Наукоемкие технологии. 2014. Т. 15, № 1. С. 21-28.
  • Puente V., Beivide R., Gregorio J.A., Prellezo J.M., Duato J., Izu C. Adaptive Bubble Router: a Design to Improve Performance in Torus Networks//Proceedings of the International Conference Parallel Processing (Wakamatsu, Japan, September 21-24, 1999), 1999. P. 58-67 DOI: 10.1109/ICPP.1999.797388
  • Adiga N.R., Blumrich M., Chen D. Blue Gene/L Torus Interconnection Network//IBM Journal of Research and Development. 2005. Vol. 49, No. 2. P. 265-276 DOI: 10.1147/rd.492.0265
  • Scott S.L. The Cray T3E Network: Adaptive Routing in a High Performance 3D Torus. 1996.
  • Пожилов И.А., Семенов А.С., Макагон Д.В. Алгоритм определения связности сети с топологией «многомерный тор» с отказами для детерминированной маршрутизации//Программная инженерия. 2015. № 3. С. 13-19.
  • Кагиров Р.Р. Многомерная задача о рюкзаке: новые методы решения//Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2007. № 3. С. 16-20.
  • Gon¸calves J.F., Resende M.G.C. A Parallel Multi-population Biased Random-key Genetic Algorithm for a Container Loading Problem//Computers & Operations Research. February 2012. Vol. 39, No. 2. P. 179-190 DOI: 10.1016/j.cor.2011.03.009
  • Мукосей А.В., Семенов А.С. Приближенный алгоритм выбора оптимального подмножества узлов в коммуникационной сети Ангара с отказами//Вычислительные методы и программирование. 2017. Т. 18, № 1. C. 53-64.
  • Баранов А.В., Киселёв Е.А., Ляховец Д.С. Квазипланировщик для использования простаивающих вычислительных модулей многопроцессорной вычислительной системы под управлением СУППЗ//Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2014. Т. 3, № 4. С. 75-84 DOI: 10.14529/cmse140405
  • Полежаев П.Н. Симулятор вычислительного кластера и его управляющей системы, используемый для исследования алгоритмов планирования задач//Вестник ЮУрГУ. Серия: Математическое моделирование и программирование. 2010. Т. 6, № 35(211). С. 79-90.
Еще