Алгоритмы автоматического дифференцирования для матричных операций
Автор: Ахмедов Э.Ф.О.
Журнал: Международный журнал гуманитарных и естественных наук @intjournal
Рубрика: Физико-математические науки
Статья в выпуске: 2-3 (101), 2025 года.
Бесплатный доступ
В статье проводится анализ алгоритмов автоматического дифференцирования (АД), для вычисления производных функций, заданных в виде компьютерных программ, что особенно актуально в задачах, где аналитическое дифференцирование сопряжено со значительными трудностями или вовсе невозможно, обеспечивая при этом высокую точность, сопоставимую с аналитическим подходом, и исключая ошибки, характерные для численного дифференцирования. Особое внимание уделено предложенному А.В. Климовым алгоритму, который детально описывает как прямой, так и обратный проходы в персептроне, предоставляя схему вычисления градиентов для обучения нейронных сетей, акцентируя внимание на четкой индексации, детальном описании операций в каждом узле, формализации вычисления градиентов посредством введения сопряженных узлов и учете доменов узлов для корректной генерации кода дифференцирования. В работе также рассмотрены особенности применения АД к матричным операциям, а именно, прямой и обратный режимы, с анализом их влияния на вычислительную эффективность, а также обоснование использования правила цепочки и преобразований функций для достижения композиционности дифференцирования. Проведен сравнительный анализ прямого и обратного режимов АД с точки зрения вычислительной сложности и затрат памяти, а также рассмотрены методы оптимизации, такие как накопление касательных в памяти и использование обратных распространителей.
Автоматическое дифференцирование, матричные операции, прямой метод, обратный метод, градиент, оптимизация, вычислительная сложность
Короткий адрес: https://sciup.org/170209955
IDR: 170209955 | DOI: 10.24412/2500-1000-2025-2-3-100-104