О нейронных обыкновенных дифференциальных уравнениях и их вероятностном расширении

Автор: Маргасов А.О.

Журнал: Известия Коми научного центра УрО РАН @izvestia-komisc

Статья в выпуске: 6 (52), 2021 года.

Бесплатный доступ

В данной статье описывается переход от нейросетевой архитектуры к обыкновенным дифференциальным уравнениям и задаче Коши. Рассматривается сравнение двух нейросетевых архитектур:классическая RNN и ODE-RNN, в которой используются нейронные обыкновенные дифференциальные уравнения. В работе предлагается новая архитектура p-ODE-RNN, позволяющая добиться качества, сопоставимого с ODE-RNN, но при этом обучается значительно быстрее. Кроме того, рассматривается вывод предложенной архитектуры с точки зрения теории случайных процессов.

Обыкновенные дифференциальные уравнения, нейронные сети, случайные процессы, вероятностные распределения

Короткий адрес: https://sciup.org/149139082

IDR: 149139082   |   DOI: 10.19110/1994-5655-2021-6-14-19

Список литературы О нейронных обыкновенных дифференциальных уравнениях и их вероятностном расширении

  • Hornik K. Approximation Capabilities of Multilayer Feedforward Networks // Neural Net-works. 1991. Vol. 4. P. 251-257.
  • Deep Residual Learning for Image Recognition/K. He, X. Zhang, S. Ren, J. Sun // The IEEEConference on Computer Vision and PatternRecognition (CVPR). 2016. P. 770-778.
  • Neural Ordinary Differential Equations /R.T.Q. Chen, Yu.Rubanova, J. Bettencourt,D. Duvenaud // Advances in Neural InformationProcessing Systems. 2018. Vol. 31. P. 6571-6583.
  • Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский,Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.: Наука,1983. 392 c.Matematicheskaja teorija optimal'nyh processov [Mathematical theory of optimalprocesses] / L.S. Pontryagin, V.G. Boltyansky,R.V. Gamkrelidze, E.F. Mishchenko. Moscow:Nauka, 1983. 392 p.
  • Rubanova Yu., Chen R.T.Q., Duvenaud D. Latent ODEs for Irregularly-Sampled Time Series// Advances in Neural Information ProcessingSystems. 2019. Vol. 32. P. 5320-5330.
  • Круглов В.М. Случайные процессы. М.:Юрайт, 2016. 280 c.Kruglov V.M. Sluchajnye processy [Randomprocesses]. Moscow: Yurait, 2016. 280 p.
Статья научная