Обеспечение оперативного контроля и эффективной автономной работы суперкомпьютерного комплекса МГУ

Автор: Антонов Александр Сергеевич, Воеводин Вадим Владимирович, Даугель-Дауге Артем Александрович, Жуматий Сергей Анатольевич, Никитенко Дмитрий Александрович, Соболев Сергей Игоревич, Стефанов Константин Сергеевич, Швец Павел Артемович

Журнал: Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi

Рубрика: Информатика, вычислительная техника и управление

Статья в выпуске: 2 т.4, 2015 года.

Бесплатный доступ

В НИВЦ МГУ разрабатывается система для обеспечения оперативного контроля и поддержки эффективного автономного функционирования суперкомпьютерных комплексов. Данная система внедряется в Суперкомпьютерном центре МГУ. В работе описывается опыт установки, настройки и эксплуатации системы для контроля работы суперкомпьютера «Чебышёв».

Суперкомпьютер, граф, графовая модель, мониторинг, оперативный контроль, автономная работа

Короткий адрес: https://sciup.org/147160561

IDR: 147160561   |   DOI: 10.14529/cmse150203

Список литературы Обеспечение оперативного контроля и эффективной автономной работы суперкомпьютерного комплекса МГУ

  • Антонов, А.С. Разработка принципов построения и реализация прототипа системы обеспечения оперативного контроля и эффективной автономной работы суперкомпьютерных комплексов/А.С. Антонов, Вад.В. Воеводин, Вл.В. Воеводин, С.А. Жуматий, Д.А. Никитенко, С.И. Соболев, К.С. Стефанов, П.А. Швец//Вестник УГАТУ. -2014. -Т. 18, № 2. -С. 227-236.
  • Соболев, С.И. Суперкомпьютер в штатном режиме/С.И. Соболев//Открытые системы. -2014. -№ 8.
  • Швец, П.А. Об одном подходе к моделированию суперкомпьютерных комплексов/П.А. Швец, Вад.В. Воеводин, С.И. Соболев//Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции (22-27 сентября 2014 г., г. Новороссийск). -Изд-во МГУ Москва, 2014. -С. 197-204.
  • HP OpenView. URL: http://www.openview.hp.com/solutions/ams/ams_bb.pdf (дата обращения: 06.04.2015).
  • xCAT, An extreme cluster/cloud administration toolkit. URL: http://sourceforge.net/p/xcat/wiki/Main_Page/(дата обращения: 06.04.2015).
  • Lu K. et al. Iaso: an autonomous fault-tolerant management system for supercomputers//Frontiers of Computer Science. -2014. -Т. 8. -№. 3. -С. 378-390. DOI: DOI: 10.1007/s11704-014-3503-1
  • Программное обеспечение компании Т-Платформы. URL: http://www.tplatforms.ru/products/software.html (дата обращения: 06.04.2015).
  • Воеводин, Вад В. Автоматическое определение и описание сетевой инфраструктуры суперкомпьютеров/Вад.В. Воеводин, К.С. Стефанов//Вычислительные методы и программирование: Новые вычислительные технологии -2014. -Т. 15, № 3. -С. 560-568.
  • Полный исходный код Octotron. URL: https://github.com/srcc-msu/octotron_core (дата обращения: 06.04.2015).
  • Рабочее окружение Octotron для создания модели на языке Python. URL: https://github.com/srcc-msu/octotron (дата обращения: 06.04.2015).
Еще
Статья научная