Устойчивость многослойных рекурсивных нейронных сетей

Автор: Иванов Сергей Александрович, Блеес Ирина Игоревна

Журнал: Вестник Южно-Уральского государственного университета. Серия: Математика. Механика. Физика @vestnik-susu-mmph

Рубрика: Математика

Статья в выпуске: 3 т.7, 2015 года.

Бесплатный доступ

Получены численные критерии устойчивости многослойных дискретных нейронных сетей. Построены области устойчивости в пространстве параметров для таких сетей. Задача сводится к проблеме устойчивости матричных разностных уравнений высоких порядков с запаздыванием. Основным средством решения проблемы являются конусы устойчивости.

Нейронные сети, разностные матричные уравнения, устойчивость разностных уравнений, многослойные сети

Короткий адрес: https://sciup.org/147158868

IDR: 147158868

Текст научной статьи Устойчивость многослойных рекурсивных нейронных сетей

В статье рассмотрены многослойные нейронные сети с одинаковыми запаздываниями во взаимодействии между нейронами в сети. Такие модели имеют широкое применение в различных областях знаний.

В работе [1] изучалась нелинейная дискретная модель многослойных сетей. В этой работе даны достаточные условия глобальной устойчивости таких моделей. Наша задача другая – изучение локальной устойчивости и полное описание областей устойчивости в пространстве параметров.

Рис. 1. Трехслойная нейронная сеть

Связи трехслойной сети с тремя нейронами в каждом слое изображены на рис. 1.

В результате линеаризации вокруг стационарного решения уравнений многослойной нейронной сети получается линейное матричное разностное уравнение xs = YIxs-1 + Bxs-k, s = 1,2- , где xs – вектор сигналов нейронов в момент s . Вектор xs – размерности np характеризует отклонения сигналов нейронов от стационарных, I - единичная np х np матрица, у - коэффициент затухания колебаний нейронов (0 < у < 1), B - матрица размера np х np , характеризующая взаимодействия между нейронами в сети, k – запаздывание во взаимодействии между нейронами, n – число нейронов в каждом слое, p – число слоев в сети.

Уравнение (1) принадлежит классу матричных разностных уравнений вида:

X s = AX s - 1 + BX s - k , s = 1,2 - , (2) которые обладают важным для нас свойством: матрицы A , B могут быть приведены к треугольному виду одним преобразованием. Поэтому мы имеем возможность применить метод конуса устойчивости [2] для анализа устойчивости этих уравнений.

Матрица B, например, трехслойной сети, состоящей из шести нейронов, имеет следующий вид:

f 0 0 a a 0 0 ) 0 0 a a 0 0 B = b b 0 0 a a b b 0 0 a a 0 0 b b 0 0 10 0 b b 0 0) где a – сила воздействия нейронов одного слоя на следующий слой, b – сила обратного воздействия.

Мы ставим задачу изучить область устойчивости системы (1) в пространстве параметров a , b при разных значениях γ , n , p и k .

Конус устойчивости для диагностирования устойчивости нейронных сетей

В работах [2, 3] введены конусы устойчивости для диагностирования устойчивости систем вида (2) с матрицами A , B , одновременно приводимыми к треугольному виду. Для решения поставленной задачи устойчивости многослойных нейронных сетей нам понадобится техника конусов устойчивости, которую мы здесь изложим.

Определение 1. Конусом устойчивости для уравнения вида (2) для данного k мы называем множество точек M = (u1,u2,u3)∈ R3 , такое, что u1 +iu2 = exp(ikω) - hexp(i(k -1)ω), u3 = h,(4)

где параметры h, ω связаны соотношениями sin kω   ππ

0≤h≤           ,- ≤ω≤ .(5)

sin(k - 1)ω kk

Теорема 1 [3]. Пусть A,B,S ∈ Rnp×np и S-1AS = AT,S-1BS = BT , где AT ,BT треугольные матрицы с диагональными элементами λj , µj соответственно (1 ≤ j ≤ np) . Построим точки Mj = (u1j,u2j,u3j)∈ R3 (1 ≤ j ≤ np) так, что u1j +iu2j =µj exp(-ik argλj), u3j = λj . (6)

Тогда уравнение (2) асимптотически устойчиво, если и только если все точки Mj лежат внутри конуса устойчивости (4), (6) для данного k . Если некоторая точка M j лежит вне конуса устойчивости, то уравнение (2) неустойчиво.

Теорема 1 сводит задачу диагностирования устойчивости системы (2) порядка (np×np) к геометрической задаче в R3 : асимптотическая устойчивость системы равносильна условию, что все точки Mj(1 ≤ j ≤ np) лежат внутри конуса устойчивости (4), (6) для данного k .

Для применения теории конусов устойчивости необходимо знать собственные числа матри-

цы B . Введем следующие обозначения: ' 0 a 0 - 0 ) fl 1 1 - 1) b 0 a - 0 111⋯1 L= 0 b 0 - 0 ; V = 111 - 1 : : : 4 a •          •          •         • :     :     : ч 1 ( 0 0 0 b 0; (1 1 1 1 1J где матрица L размера (p× p) , матрица V размера (n×n) .

Заметим, что матрица L представляет собой матрицу сил запаздывающих взаимодействий нейронной сети линейной конфигурации. Собственные числа таких матриц и области устойчивости линейных нейронных сетей изучены в [4, 5].

Матрицу можно представить в виде произведения Кронекера следующим образом:

B = L V .

Для произведения Кронекера справедлива следующая теорема.

Теорема 2 [6]. Пусть собственные значения квадратных матриц A и B равны α 1,..., α m и β 1,..., β m . Тогда собственные числа А В равны α i β j .

Собственные числа матрицы L порядка p равны λ j = 2 ab cos

f]

( p + 1 )

j = 1... p . Собст-

венные числа матрицы V порядка n равны µ1 =µ2 = ⋯ = 0 ; µn = n . Согласно теореме 2 для мат- рицы B порядка np собственные числа равны £11 = £12 =

= £ pn - 1 = 0 ; £ j n = 2 njab cos

j = 1... p .

Диагностирование устойчивости двухслойной сети

Определение 2. Овалом устойчивости для уравнений вида (2) для запаздывания к > 1 и параметра y мы называем кривую M(to) = (u1(to),u2(to)), такую что u1 (to) + iu2 (to) = exp(ikto) -1у exp(i(к -1)to), где toe (-tol,to1), где to, - есть наименьший положительный корень уравнения

sin k to sin( к - 1) to

Овал устойчивости для данного запаздывания k и данного γ это сечение конуса устойчивости (см. Определение 1) плоскостью и3 = у. На основании Теоремы 1 и свойств матрицы B для диагностирования устойчивости уравнения (1) достаточно проверить две точки

M ( u 1 j , и 2 j ) = u 1 j + iu 2 j = ± 2 n4ab

cos

(1 j 2). Поэтому имеют место следующие теоре-

мы.

Теорема 3 . Пусть даны произвольные n , к e Z + , к >  1. Пусть 0 у < 1. Построим в R 2 овал устойчивости (см. Определение 2) для данных к , у . Построим точки M j = ( u 1 j , и 2 j ) e R 2 (1 j 2)

так, что

u 1 j + iu 2 j = ± 2 n4ab cos

Если обе точки M j (1 j 2) лежат внутри овала устойчивости, то система (1) асимптотиче-

ски устойчива. В противном случае система (1) неустойчива. Введем обозначение

q = 2 n cos

Теорема 4. 1. Если у >  1, то система (1) неустойчива.

  • 2.    Если

у 1 и 0 ab <

(

V

, то система (1) асимптотически устойчива при любом запаз-

дывании к . Если у 1 и ab >

, то система (1) неустойчива при любом запаздывании k .

  • 3.    Если у 1 и ab <  0 и

| ab | <

f ^ (^2 ) 2

V q )

, то система (1) асимптотически устойчива при дан-

ном значении к . Если у 1 и ab <  0 и

ab

f F ( у , к ) У

------I , то система неустойчива при данном

запаздывании к . Здесь F ( у , к ) =

sin to ( у ) cos( к - 1) « ( у )

где < у ( у ) есть наименьший неотрицательный ко-

cos k to рень уравнения у =---------.

cos( к - 1) to

Области устойчивости системы (1) отражены на рис. 2, 3.

Полученные результаты не противоречат известным результатам. Можно сделать вывод о динамике областей устойчивости в пространстве параметров. Область устойчивости стягивается в крест только с ростом числа нейронов в каждом слое. Увеличение числа слоев в нейронной сети с сохранением числа нейронов в каждом слое не стягивает область устойчивости в крест. При фиксированном количестве нейронов n имеется область в пространстве параметров, в которой гарантируется устойчивость независимо от запаздывания (delay-independent stability). Для сохранения устойчивости выгоднее увеличивать число слоев в многослойных сетях, чем наращивать число нейронов в каждом из слоев.

Рис. 2. Область устойчивости системы (1) в плоскости ( a, b ) при фиксированных у = 0,4, к = 3, n = 4 и переменном числе слоев p

Рис. 3. Область устойчивости системы (1) в плоскости ( a, b ) при фиксированных у = 0,4, Р = 3, n = 5 и переменном запаздывании к

Список литературы Устойчивость многослойных рекурсивных нейронных сетей

  • Barabanov, N.E. Stability analysis of discrete-time recurrent neural networks//N.E. Barabanov, D.V. Prokhorov. -IEEE Transactions of Neural Networks. -2002. -V. 13(2). -P. 292-303.
  • Kipnis, M.M. The stability cone for a matrix delay difference equation. International//M.M. Kipnis, V.V. Malygina. -J. of Mathematics and Mathematical Sciences. -2011. P. 1-15. ID 860326.
  • Ivanov, S.A. The stabiliry cone for a difference matrix equation with two delays//S.A. Ivanov, M.M. Kipnis, V.V. Malygina. -ISRN J. Applied Mathematics. -2011. -P. 1-19. ID 910936.
  • Ivanov, S.A. Stability analysis of discrete-time neural networks with delayed interactions: torus, ring, grid, line/S.A. Ivanov, M.M. Kipnis. -International Journal of Pure and Applied Math. -2012. -Vol. 78(5). -P. 691-709
  • Khokhlova, T.N. Numerical and qualitative stability analysis of ring and linear neural networks with a large number of neurons/T.N. Khokhlova, M.M. Kipnis. -International Journal of Pure and Applied Math. -2012. -Vol. 76(3). -P. 403-419.
  • Прасолов, В.В. Задачи и теоремы линейной алгебры/В.В. Прасолов. -М., 2008 -536 с.
Статья научная