Устойчивость двухслойных рекурсивных нейронных сетей

Бесплатный доступ

Получены численные критерии устойчивости двухслойных дискретных нейронных сетей. Построены области устойчивости в пространстве параметров для таких сетей. Задача сводится к проблеме устойчивости матричных разностных уравнений высоких порядков с запаздыванием. Основным средством решения проблемы являются конусы устойчивости.

Нейронные сети, разностные матричные уравнения, устойчивость разностных уравнений, двухслойные сети

Короткий адрес: https://sciup.org/147158773

IDR: 147158773

Текст краткого сообщения Устойчивость двухслойных рекурсивных нейронных сетей

В статье рассмотрены двухслойные нейронные сети с одинаковыми запаздываниями во взаимодействии между нейронами в сети. Такие модели имеют широкое применение в различных областях знаний.

Связи двухслойной сети с тремя нейронами в каждом слое изображены на рис. 1.

В результате линеаризации вокруг стационарного решения уравнений двухслойной нейронной сети получается линейное матричное разностное уравнение

Рис. 1: ^вухслойна^ нейронна^ сеть

x s = Y Ix s - 1 + Bx s - k , s = I2 - ,                    (1)

где xs – вектор сигналов нейронов в момент s . Вектор xs размерности 2 n характеризует отклонения сигналов нейронов от стационарных, I единичная 2 n х 2 n матрица, у (0 у <  1) коэффициент затухания колебаний нейронов, B - матрица размера 2 n х 2 n , характеризующая взаимодействия между нейронами в сети, k – запаздывание во взаимодействии между нейронами, n – число нейронов в каждом слое.

Уравнение (1) принадлежит классу матричных разностных уравнений вида:

X s = AX s - I + BX s - k , s = 1,2 -                     (2)

которые обладают важным для нас свойством: матрицы A , B могут быть приведены к треугольному виду одним преобразованием. Поэтому мы имеем возможность применить метод конуса устойчивости [4] для устойчивости этих уравнений. На основе этого метода были изучены другие нейронные сети стандартных конфигураций [1, 2, 5]. Непрерывные модели исследованы в [3].

Матрица B, например, двухслойной сети, состоящей из шести нейронов, имеет следующий вид:

^ 0  0  0  a  aa

0  0  0  a  aa

0  0  0  a  aa

b  b  b  0  00

b  b  b  0  00

v b  b  b  0  00 где a – сила воздействия нейронов первого слоя на второй, b - сила обратного воздействия.

Мы ставим задачу изучить область устойчивости системы (1) в пространстве параметров a , b при разных значениях у , n и k .

В работах [4, 6] введены конусы устойчивости для диагностирования устойчивости систем вида (2) с матрицами A , B , одновременно приводимыми к треугольному виду. Аналогичные конусы устойчивости для дифференциальных уравнений введены в [7]. Для решения задачи устойчивости двухслойных нейронных сетей нам понадобится техника конусов устойчивости, которую мы здесь изложим.

Определение 1. Конусом устойчивости для уравнения вида (2) для данного к мы называем множество точек M = (u1, u2, u3) е R3, такое, что ux + iu2 = exp(ik®') - h exp(i(к -1)®), u3 = h, где параметры h, to связаны соотношениями

0 h <

sin к®    n, n

---------,-- < ® < —. sin( к - 1) ® к к

Теорема 1 [4]. Пусть A,B,Sе R2nх2n и S 1 AS = AT,S 1BS = BT, где AT,BT - треугольные матрицы с диагональными элементами Xj, Pj соответственно (1 < j < 2n). Построим точки Mj = (ui j, u2 j, u3 j) е R3 (1 < j < 2n), так что u j + iu2j = pj exp(-ik argXj), u3j = | Xj |. (6)

Тогда уравнение (2) асимптотически устойчиво, если и только если все точки M j лежат внутри конуса устойчивости (4), (6) для данного к . Если некоторая точка M j лежит вне конуса устойчивости, то уравнение (2) неустойчиво.

Теорема 1 сводит задачу диагностирования устойчивости системы (2) порядка (2 n х 2 n ) к геометрической задаче в R 3 : асимптотическая устойчивость системы равносильна условию, что все точки M j (1 j 2 n ) лежат внутри конуса устойчивости (4), (6) для данного к .

Для применения теории конусов устойчивости необходимо знать собственные числа матрицы B . Для матрицы B порядка 2 n собственные числа равны р 1 = р 2 = ... = 0; р 2n - 1 =- n4ab , P 2 n = n^ab .

Определение 2. Овалом устойчивости для уравнений вида (2) для запаздывания к > 1 и параметра у мы называем кривую M (®) = (u1(®), u2(®)), такую, что u1 (®) + iu2 (®) = exp(ik®') -|у exp(i(к -1)®), где ®е (-®,®), где ® есть наименьший положительный корень уравнения । । _ sin к®

Y = sin( к - 1) ®"

Овал устойчивости для данного запаздывания к и данного у - это сечение конуса устойчивости (см. Определение 1) плоскостью u 3 = У . На основании Теоремы 1 и свойств матрицы B для диагностирования устойчивости уравнения (1) достаточно проверить две точки M ( u 1 j , u 2 j ) = u 1 j + iu 2 j = ± n4ab (1 j 2). Поэтому имеют место следующие теоремы.

Теорема 2 . Пусть даны произвольные n , к е Z + , к 1. Пусть 0 у 1. Построим в R 2 овал устойчивости (см. Определение 2) для данных к , у . Построим точки M j = ( u 1 j , u 2 j ) е R 2 (1 j 2) так, что

  • u 1 j + iu 2 j = ± njab .

Если обе точки M j (1 j 2) лежат внутри овала устойчивости, то система (1) асимптотически устойчива. В противном случае система (1) неустойчива.

Иванов С.А.

Устойчивость двухслойных рекурсивных нейронных сетей

Теорема 3 .

  • 1.    Если у >  1, то система (1) неустойчива.

  • 2.    Если y < 1 и 0 ab <  I----I , то система (1) асимптотически устойчива при любом запаз- V n J

< 1 - Y У

,                  (1 - y У дывании k . Если y < 1 и ab > I----I , то система (1) неустойчива при любом запаздывании k .

  • V n J

  • 3. Если у 1 и ab 0 и | ab | <

I , то система (1) асимптотически устойчива при дан- ном значении k . Если у < 1 и ab < 0 и |ab| >

I , то система неустойчива при данном sin w(y) запаздывании k . Здесь F(у,k) =-------——, где ю(у) есть наименьший неотрицательный ко- cos( k - 1)to(y)

cos k to рень уравнения y =--------- cos( k - 1) to

.

Области устойчивости системы (1) отражены на рис. 2, 3.

Рис. 2. Область устойчивости системы (1) в плос-           Рис. 3. Область устойчивости системы (1) в плоскости (a,b) при фиксированных y=0,4,k = 3 и              кости (a,b) при фиксированных y = 0,4,n = 3 ипе- переменном числе нейронов n                           ременном запаз^ывании k

Вывод о динамике областей устойчивости в пространстве параметров таков. С ростом числа нейронов в сети область устойчивости стягивается в крест. Но при фиксированном количестве нейронов 2 n имеется область в пространстве параметров, в которой гарантируется устойчивость независимо от запаздывания (delay-independent stability).

  • 1.    Иванов, С.А. Область устойчивости в пространстве параметров рекурсивных нейронных сетей с топологией многомерного куба / С.А. Иванов // Вестник ЮУрГУ. Серия «Математика. Механика. Физика». – 2012. – Вып. 7. – №34(293). – С. 157–160.

  • 2.    Иванов, С.А. Устойчивость рекурсивных нейронных сетей со звездной топологией связей / С.А. Иванов // Естественные и технические науки. – 2012. – №6(62). – С. 21–25.

  • 3.    Khokhlova, T.N. Stability of a ring and linear neural networks with a large number of neurons / T.N. Khokhlova, M.M. Kipnis // Applied Mathematics and Computation. – 2012. – P. 1–14.

  • 4.    Ivanov, S.A. The stability cone for a difference matrix equation with two delays / S.A. Ivanov, M.M. Kipnis, V.V. Malygina // ISRN J. Applied Mathematics. – 2011. – P. 1–19. ID 910936.

  • 5.    Ivanov, S.A. Stability analysis of discrete-time neural networks with delayed interactions: torus, ring, grid, line / S.A. Ivanov, M.M. Kipnis // International Journal of Pure and Applied Math. – 2012. – Vol. 78, № 5. - P. 691-709.

  • 6.    Kipnis, M.M. The stability cone for a matrix delay difference equation / M.M. Kipnis, V.V. Malygina // International Journal of Mathematics and Mathematical Sciences. – 2011. – P. 1–15. ID 860326.

  • 7.    Khokhlova, T.N The stability cone for a delay differential matrix equation / T.N. Khokhlova, M.M. Kipnis, V.V. Malygina // Applied Math. Lett. – 2011. – Vol. 24. – P. 742–745.

STABILITY OF TWO-LAYER RECURSIVE NEURAL NETWORKS

  • S.A. Ivanov 1

Список литературы Устойчивость двухслойных рекурсивных нейронных сетей

  • Иванов, С.А. Область устойчивости в пространстве параметров рекурсивных нейронных сетей с топологией многомерного куба/С.А. Иванов//Вестник ЮУрГУ. Серия «Математика. Механика. Физика». -2012. -Вып. 7. -№34(293). -С. 157-160.
  • Иванов, С.А. Устойчивость рекурсивных нейронных сетей со звездной топологией связей/С.А. Иванов//Естественные и технические науки. -2012. -№6(62). -С. 21-25.
  • Khokhlova, T.N. Stability of a ring and linear neural networks with a large number of neurons/T.N. Khokhlova, M.M. Kipnis//Applied Mathematics and Computation. -2012. -P. 1-14.
  • Ivanov, S.A. The stability cone for a difference matrix equation with two delays/S.A. Ivanov, M.M. Kipnis, V.V. Malygina//ISRN J. Applied Mathematics. -2011. -P. 1-19. ID 910936.
  • Ivanov, S.A. Stability analysis of discrete-time neural networks with delayed interactions: torus, ring, grid, line/S.A. Ivanov, M.M. Kipnis//International Journal of Pure and Applied Math. -2012. -Vol. 78, № 5. -P. 691-709.
  • Kipnis, M.M. The stability cone for a matrix delay difference equation/M.M. Kipnis, V.V. Malygina//International Journal of Mathematics and Mathematical Sciences. -2011. -P. 1-15. ID 860326.
  • Khokhlova, T.N The stability cone for a delay differential matrix equation/T.N. Khokhlova, M.M. Kipnis, V.V. Malygina//Applied Math. Lett. -2011. -Vol. 24. -P. 742-745.
Еще
Краткое сообщение