Динамическое управление точностью и сложностью в реальном времени на основе доступной мощности в микро-LLM

Автор: Худайберидева Г.Б., Кожухов Д.А., Пименкова А.А.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Основной раздел

Статья в выпуске: 8 (122), 2025 года.

Бесплатный доступ

Рассматривается проблема энергопотребления больших языковых моделей (LLM) при развертывании на устройствах с батарейным питанием и строгими энергетическими ограничениями. Предлагается концепция микро-LLM, оснащенных механизмами динамической адаптации своей вычислительной сложности и числовой точности в реальном времени, основанной на текущем уровне доступной мощности или заданном пользователем энергетическом бюджете. Ключевыми аспектами инновации являются методы селективной активации компонентов модели (слоев, голов внимания), адаптации битовой ширины вычислений и специализированного рантаим-менеджмента для управления энергопотреблением. Анализируются требования к архитектуре модели, рантайм-системе и потенциальные выгоды в контексте энергоэффективности. Указываются основные технические вызовы, требующие решения для практической реализации.

Еще

Большие языковые модели, микро-llm, энергоэффективность, динамическая адаптация, управление мощностью, квантование, аппаратно-программная кооперация, ресурсоограниченные устройства, рантайм-менеджмент, батарейное питание

Короткий адрес: https://sciup.org/140312539

IDR: 140312539   |   УДК: 004.89