Octoshell: система для администрирования больших суперкомпьютерных комплексов

Бесплатный доступ

Управление современными суперкомпьютерными центрами и входящими в их состав вычислительными системами представляет собой сложный и комплексный процесс. Традиционное использование многочисленных инструментов для решения отдельных задач по управлению и администрированию суперкомпьютеров становится ограничивающим фактором эффективного использования вычислительных ресурсов при растущих масштабах систем. Разработанная система поддержки работы суперкомпьютерных центров «Octoshell» призвана решить указанную проблему, реализуя в едином интерфейсе основные инструменты администрирования, и позволяет в значительной мере автоматизировать выполнение типовых задач обеспечения эффективного функционирования больших суперкомпьютерных комплексов.

Еще

Суперкомпьютер, мониторинг, управление суперкомпьютерным центром, администрирование суперкомпьютеров, система поддержки пользователей

Короткий адрес: https://sciup.org/147160602

IDR: 147160602   |   УДК: 004.457,   |   DOI: 10.14529/cmse160306

Octoshell: large supercomputer complex administration system

Managing and administering of modern supercomputer centers and HPC systems as a part is a complicated and complex task. The usage of numerous traditional stand-alone tools for administering and management of supercomputers becomes a bottleneck for efficient resource utilization in conditions of growing systems scale. The developed “Octoshell” system for support of running supercomputer centers is aimed at solving this problem. It implements essential tools for administering in a single interface and allows significant automatization of typical management tasks ensuring higher efficiency of large supercomputer complex output as a whole.

Еще

Список литературы Octoshell: система для администрирования больших суперкомпьютерных комплексов

  • Топ50 Суперкомпьютеры. URL: http://top50.supercomputers.ru (дата обращения: 02.08.2015).
  • Top500 Supercomputer sites. URL: http://top500.org (дата обращения: 02.08.2015).
  • Воеводин Вл.В., Жуматий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В. Практика суперкомпьютера «Ломоносов»//Открытые системы. 2012. № 7. С. 36-39.
  • Жуматий С.А., Никитенко Д.А. Подход к гибкому управлению суперкомпьютерами//Научный сервис в сети Интернет: все грани параллелизма: Труды Международной суперкомпьютерной конференции (Новороссийск, 23-28 сентября 2013 г.). М.: Изд-во МГУ, 2013. С. 296-300.
  • Жуматий С.А., Дацюк О.В. Администрирование суперкомпьютеров и кластерных систем. М.: Изд-во МГУ, 2014. 400 с.
  • Torgue batch system. URL: http://www.adaptivecomputing.com/products/open-source/torque/(дата обращения: 02.08.2015).
  • SLURM workload manager. URL: http://slurm.schedmd.com/(дата обращения: 02.08.2015).
  • OpenPBS. URL: http://www.mcs.anl.gov/research/projects/openpbs/(дата обращения: 02.08.2015).
  • Ganglia Monitoring System. URL: http://ganglia.sourceforge.net/(дата обращения: 02.08.2015).
  • Zabbix monitoring. URL: http://www.zabbix.com/ru/(дата обращения: 02.08.2015).
  • Nagios monitoring. URL: https://www.nagios.org/(дата обращения: 02.08.2015).
  • Open-source Ticket Request System. URL: http://www.otrs.org/(дата обращения: 02.08.2015).
  • Леоненков С.Н. Расширение функциональности менеджера ресурсов суперкомпьютера SLURM//Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции (Новороссийск, 22-27 сентября 2014 г.). М.: Изд-во МГУ, 2014. С. 472-476.
  • Никитенко Д.А. Комплексный анализ производительности суперкомпьютерных систем, основанный на данных системного мониторинга//Вычислительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). 2014. Т. 15. C. 85-97.
  • Антонов А.С., Жуматий С.А., Никитенко Д.А., Стефанов К.С., Теплов А.М., Швец П.А. Исследование динамических характеристик потока задач суперкомпьютерной системы//Вычислительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). 2013. Т. 14, № 2. С. 104-108.
  • Стефанов К.С. Система мониторинга производительности суперкомпьютеров//Вестник Пермского Национального исследовательского политехнического университета. Аэрокосмическая техника. 2014. № 39. С. 17-34.
  • Воеводин Вл.В. Ситуационный экран суперкомпьютера//Открытые системы. 2014. № 3. С. 36-39.
  • Антонов А.С., Воеводин Вад В., Даугель-Дауге А.А., Жуматий С.А., Никитенко Д.А., Соболев С.И., Стефанов К.С., Швец П.А. Обеспечение оперативного контроля и эффективной автономной работы Суперкомпьютерного комплекса МГУ//Вестник Южно-Уральского государственного университета. Серия Вычислительная математика и информатика. 2015. Т. 4, № 2. С. 33-43.
Еще