Стандартизация и безопасное кодирование: объединение квантования, прунинга и дистилляции в единый адаптивный конвейер для микроконтроллеров класса Cortex-M

Автор: Худайберидева Г.Б., Кожухов Д.А., Пименкова А.А.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Основной раздел

Статья в выпуске: 8 (122), 2025 года.

Бесплатный доступ

Развертывание нейронных сетей на микроконтроллерах класса Cortex-M сопряжено с ограничениями по вычислительным ресурсам, объему памяти и энергопотреблению. Индивидуальное применение методов сжатия моделей, таких как квантование, прунинг и дистилляция знаний, демонстрирует ограниченную эффективность в условиях данных ограничений. Данная работа предлагает исследование синергетических эффектов при последовательном комбинировании указанных методов в едином адаптивном конвейере. Основное внимание уделяется анализу взаимозависимостей, например, влияния структурированного прунинга на последующее квантование. Предложена методология создания адаптивного инструмента, автоматически определяющего и настраивающего оптимальную последовательность и параметры методов сжатия для заданной целевой модели, целевого микроконтроллера Cortex-M и требуемых показателей точности. Экспериментальные результаты подтверждают, что предложенный адаптивный конвейер превосходит по эффективности изолированное применение методов сжатия, обеспечивая более высокую степень сжатия и ускорения при соблюдении целевых метрик точности на ресурсоограниченных устройствах.

Еще

Сжатие нейронных сетей, квантование, прунинг, дистилляция знаний, адаптивный конвейер, микроконтроллеры cortex-m, встраиваемые системы, ресурсоограниченные устройства, автоматизация оптимизации

Короткий адрес: https://sciup.org/140312532

IDR: 140312532   |   УДК: 004.89