Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Бесплатный доступ

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы - 32 вычислительных узла, максимальной - 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11% по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45,3 %

Еще

Коммуникационная сеть ангара, многомерный тор, правило порядка направлений, фрагментация вычислительной системы, выбор узлов

Короткий адрес: https://sciup.org/147160644

IDR: 147160644   |   DOI: 10.14529/cmse180204

Список литературы Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

  • Lan Z., Tang W., Wang J., Yang X., Zhou Z., Zheng X. Balancing Job Performance with System Performance via Locality-aware Scheduling on Torus-connected Systems//2014 IEEE International Conference on Cluster Computing (CLUSTER) (Madrid, Spain, September 22-26, 2014), 2014. P. 140-148 DOI: 10.1109/CLUSTER.2014.6968751
  • IBM Redbooks Publication: IBM System Blue Gene Solution: Blue Gene/Q System Administration. 2013. 282 p.
  • Tang W., Lan Z., Desai N., Buettner D., Yu Y. Reducing Fragmentation on Torus-Connected Supercomputers//Proceedings of the 2011 IEEE International Parallel Distributed Processing Symposium (IPDPS’11) (Anchorage, Alaska, USA, May 16-20, 2011), 2011. P. 828-839 DOI: 10.1109/IPDPS.2011.82
  • Cray Document: Managing System Software for Cray XE and Cray XT Systems. 2010.
  • Агарков А.А., Исмагилов Т.Ф., Макагон Д.В., Семенов А.С., Симонов А.С. Результаты оценочного тестирования отечественной высокоскоростной коммуникационной сети Ангара//Суперкомпьютерные дни в России: Труды международной конференции (26-27 сентября 2016 г., г. Москва). М.: Изд-во МГУ, 2016. С. 626-639.
  • Симонов А.С., Макагон Д.В., Жабин И.А., Щербак А.Н., Сыромятников Е.Л., Поляков Д.А. Первое поколение высокоскоростной коммуникационной сети «Ангара»//Наукоемкие технологии. 2014. Т. 15, № 1. С. 21-28.
  • Puente V., Beivide R., Gregorio J.A., Prellezo J.M., Duato J., Izu C. Adaptive Bubble Router: a Design to Improve Performance in Torus Networks//Proceedings of the International Conference Parallel Processing (Wakamatsu, Japan, September 21-24, 1999), 1999. P. 58-67 DOI: 10.1109/ICPP.1999.797388
  • Adiga N.R., Blumrich M., Chen D. Blue Gene/L Torus Interconnection Network//IBM Journal of Research and Development. 2005. Vol. 49, No. 2. P. 265-276 DOI: 10.1147/rd.492.0265
  • Scott S.L. The Cray T3E Network: Adaptive Routing in a High Performance 3D Torus. 1996.
  • Пожилов И.А., Семенов А.С., Макагон Д.В. Алгоритм определения связности сети с топологией «многомерный тор» с отказами для детерминированной маршрутизации//Программная инженерия. 2015. № 3. С. 13-19.
  • Кагиров Р.Р. Многомерная задача о рюкзаке: новые методы решения//Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2007. № 3. С. 16-20.
  • Gon¸calves J.F., Resende M.G.C. A Parallel Multi-population Biased Random-key Genetic Algorithm for a Container Loading Problem//Computers & Operations Research. February 2012. Vol. 39, No. 2. P. 179-190 DOI: 10.1016/j.cor.2011.03.009
  • Мукосей А.В., Семенов А.С. Приближенный алгоритм выбора оптимального подмножества узлов в коммуникационной сети Ангара с отказами//Вычислительные методы и программирование. 2017. Т. 18, № 1. C. 53-64.
  • Баранов А.В., Киселёв Е.А., Ляховец Д.С. Квазипланировщик для использования простаивающих вычислительных модулей многопроцессорной вычислительной системы под управлением СУППЗ//Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2014. Т. 3, № 4. С. 75-84 DOI: 10.14529/cmse140405
  • Полежаев П.Н. Симулятор вычислительного кластера и его управляющей системы, используемый для исследования алгоритмов планирования задач//Вестник ЮУрГУ. Серия: Математическое моделирование и программирование. 2010. Т. 6, № 35(211). С. 79-90.
Еще
Статья научная