Оптимизация времени обучения нейронных сетей с адаптивными параметрами скорости обучения

Бесплатный доступ

В работе выполнен анализ классического метода градиентного спуска и предложен способ динамического изменения шага обучения на основе вычисляемых параметров τ и p. Основной акцент сделан на алгоритме, который позволяет вычислять оптимальные значения параметров τ и p для минимизации времени обучения. Эксперименты демонстрируют, как изменения этих параметров влияют на скорость обучения для различных топологий нейронных сетей и функций активации. Результаты моделирования показывают, что правильный выбор τ и p может значительно сократить временные затраты при обучении нейронных сетей с фиксированной структурой. Использование этих параметров позволяет улучшить процесс обучения, предотвращая застревание в локальных минимумах и обеспечивая баланс между скоростью обучения и точностью результата. Исследования продемонстрировали эффективность адаптивного подхода при различных топологиях нейронных сетей и функциях активации. Представленные графики и численные расчёты показывают зависимость средней скорости обучения от выбранных параметров.

Еще

Нейронная сеть, градиентный спуск, оптимизация, скорость обучения, адаптивные параметры, корректировка

Короткий адрес: https://sciup.org/148331171

IDR: 148331171   |   DOI: 10.18137/RNU.V9187.25.02.P.43

Статья научная