Выполнение распределенных вычислительных экспериментов на MLOps платформе НИУ ВШЭ

Автор: Антон Сергеевич Хританков, Валентин Александрович Полежаев, Георгий Александрович Жуликов, Максим Сергеевич Галынчик, Никита Андреевич Климин, Кирилл Евгеньевич Сахаров, Виктор Олегович Минченков, Иван Вячеславович Спирин, Иван Игоревич Крупнов, Софья Федоровна Якушева, Александра Сергеевна Маратканова, Вячеслав Иванович Козырев, Павел Сергеевич Костенецкий, Хади Мухаммед Салех

Журнал: Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi

Статья в выпуске: 2 т.14, 2025 года.

Бесплатный доступ

Несмотря на распространение и успешные применения средств интеллектуального анализа и обработки данных для решения отдельных прикладных задач, все еще не решена проблема разработки технологии создания таких программных средств. В работе в контексте единого процесса MLOps создания технологий машинного обучения рассматриваются возникающие задачи автоматизации и выполнения распределенных вычислительных экспериментов на базе единой вычислительной платформы. Разрабатываемая в НИУ ВШЭ платформа MLOps предназначена для развертывания интеллектуальных веб-сервисов и программных средств анализа данных. Платформа должна управлять доступными локально и в облачной среде разнородными ресурсами и объединять их с ресурсами вычислительного кластера cHARISMa НИУ ВШЭ под управлением Slurm. Таким образом актуальна задача интеграции указанных ресурсов для проведения вычислительных экспериментов, реализации конвейеров настройки моделей машинного обучения, решения задач обработки и анализа данных. Особенностями решаемой задачи являются рассмотрение процесса вычислений, как составной части технологии создания интеллектуальных веб-сервисов, обусловленная этой технологией необходимость использования разнородных ресурсов и использование единой гибридной платформы для выполнения вычислений. В работе предложено решение указанной задачи интеграции вычислений и приведены результаты апробации решения для интеллектуальных веб-сервисов. Показана принципиальная возможность такой интеграции разнородных ресурсов в одном вычислительном эксперименте на базе расширяемой пользователем объектной модели эксперимента и предметно-ориентированного языка его спецификации, решены вопросы динамического управления развертыванием интеллектуальных приложений, интеграции конвейеров обработки данных, веб-сервисов и наборов данных для выполнения распределенных вычислительных экспериментов.

Еще

Распределенные вычислительные эксперименты, машинное обучение, облачные технологии, MLOps

Короткий адрес: https://sciup.org/147250999

IDR: 147250999   |   DOI: 10.14529/cmse250203

Статья научная