К сетевому представлению. Обучение
Автор: Соловьв А.С.
Журнал: Экономика и социум @ekonomika-socium
Рубрика: Основной раздел
Статья в выпуске: 2 (69), 2020 года.
Бесплатный доступ
В работе предлагается метод обучения нейронной сети с учётом её количественных и качественных особенностей.
Нейронная сеть, качество, количество, мера, сравнение, обучение, цель, кватернионы
Короткий адрес: https://sciup.org/140247791
IDR: 140247791
Текст научной статьи К сетевому представлению. Обучение
Пусть в некоторой нормальной системе выделен тернарный узел

Рис. 1. Узел нормальной сети прямого распространения со смежными узлами нижестоящего среза.
(1) Для нормальной системы имеем соотношение
(2) Wо = ш 1 ¥1 + ю 2 W2 + ш з Wз = nW, ieN = {1, 2,3}, при этом для коэффициентов выполняется условие
(3) Ю 1 + Ю 2 + ю 3 = ю\ = 1, а узлы системы определяются собственными функциями Wi с собственными значениями равными единице
(4) X i = xW i , x i = 1.
В общем случае для стоящего в иерархии узла на более высокой ступени в сети прямого распространения имеем зависимость от смежных узлов нижележащего среза
-
(5) x 0 = ω i xiΨ i = ω 1 x 1 Ψ 1 + ω 2 x 2 Ψ 2 + ω 3 x3Ψ 3 , i ϵ N.
Соотношение, аналогичное (1), справедливое для зависимости собственных функций, будет справедливо и для собственных значений
-
(6) x 0 = ω i xi, i ϵ N .
Элемент сети будем рассматривать как вектор
-
(7) x i = xiΨ i
и знаком (*) обозначать переход к сопряжённому вектору, опуская вниз у сопряжённого вектора индекс. Тогда, если ввести векторы
-
(8) x = ( xi | i ϵ N ), ω = ( ωi | i ϵ N ),
равенство (4) можно записать в виде внутреннего произведения векторов
-
(9) x 0 = ω * x .
Рассмотрим две различные сети с одинаковой архитектурой. Выделим в них узел с собственной функцией Ψ 0 и рассмотрим его действие со смежными узлами. Поскольку архитектура сетей одинакова, то если узел одной сети имеет представление, изображённое на рис. 1, то аналогичное представление имеет и выделенный фрагмент второй сети, но описание их действия будет различными уравнениями – уравнением (8) и равенством
-
(10) y 0 = φ * y .
С учётом нормальности систем будем иметь
-
(11) y = x .
Таким образом, данные фрагменты будут отличаться только пропускной способностью связей. Будем полагать, что (8) и (9) состояния узла Ψ 0 из пространства X возможны состояний системы. Более того, считать состояние (9) целевым (плановым), а состояние (8) – фактическим. И полагать, что требуется последовательно сближать фактическое состояние с эталоном, естественно, с учётом ограничений на показатели функционирования.
Сравним данные фрагменты системы опираясь на основное метрическое тождество и используя свойства скобки процедуры Кэли-Диксона в алгебре Клиффорда в пространстве X ⨂ X в качестве элементов тензорного произведения c = x 0 y 0 . Для этого, на их бинарном соответствии z = ( x 0 , y 0 ), введём функции для внутреннего a = x 0 * y 0 и внешнего b = x 0 ∧ y 0 = i n b произведений, где n единичный вектор в представлении x 0 × y 0 = b n и гомоморфизм в пространстве определим функционалом D = c 2 = D ( z ). Получаем, что на данном бинарном соответствии справедливо тождество Пифагора
-
(12) a 2 + b 2 = c 2,
а для его тензорной кватерниональной формы имеет место волновое представление
-
(13) c = cΨ , Ψ= exp (i n θ ),
Будем полагать, что фактическое состояние системы есть образ (модель) оригинала, т.е. его расчётного состояния - эталон, в практической деятельности естественно последовательное стремление фактического состояния к эталону, и считать, что, не нарушая общности, ограничения (накладываемые на производственные факторы) для подобного совершенствования отсутствуют. Как скульптор из глыбы мрамора высекает Аполлона, так и мы будем последовательно совершенствовать образ, последовательно отсекая мешающие обстоятельства в нашем совершенствовании. Для производственной системы это модернизация производства, стимулирование и обучение персонала и т. п.
Как правило, если рассматривать производственные сети, то это будут многоуровневые иерархические структуры и алгоритм их совершенствования, с учётом сети прямого распространения, можно строить поэлементно, либо послойно, например, снизу вверх, либо сверху вниз. Из статистического сходства соответствующих слоёв вытекает основа алгоритма - последовательное улучшение корреляционного сходства.
Коэффициент корреляции определяется формулой
-
(14) r = a/c .
Применяя неравенства Коши-Буняковского
-
(15) a <= c ,
в котором равенство достигается при полном соответствии сравниваемых слоёв, и полагая r> 0,находим
-
(16) a = rc <= c .
При монотонном росте коэффициента корреляции образ будет последовательно стремиться к эталону. Предположим, что при темпах прироста T ( x ) некоторого фактора сети темпы прироста коэффициента корреляции равны T ( r ). При условии, что эластичность (чувствительность) коэффициента корреляции относительно данного изменения равна s получаем
-
(17) r ( t + 1) = (1 + sT ( x )) r ( t ).
Заключаем, что корреляция будет возрастать, если показатели s и T ( x ) будут одного знака.
Пусть x и у произвольные фрагменты исходных систем, находящихся в структурном бинарном соответствии, а x и у - некоторые соответствующие их узлы. Для эластичности коэффициента корреляции данных фрагментов по показателю x получаем выражение
-
(18) s = xy / a ( x , y ) - x 2 / c 2( x , y ),
т.е. сумма S = ^s эластичностей коэффициентов корреляции (17) по всем узлам данных фрагментов равна нулю. Следовательно, среди показателей эластичности узлов есть как положительные, так и отрицательные. Сумму положительных слагаемых обозначим S+ , а сумму абсолютных величин отрицательных слагаемых обозначим S- . Приходим к выражению
-
(18) S = S + - S = 0.
Представление (18) такого расслоения показывает, что качественное сближение модели с эталоном можно проводить двумя методами улучшая качество модели за счёт совершенствования узлов:
-
a) обращая внимание только на показатели с положительными коэффициентами эластичности, т.е. случай 1);
-
b) обращая внимание только на элементы сети с отрицательными коэффициентами эластичности, случай 2);
-
c) применяя в сближении одновременно как случай 1), так и случай 2).
Это свидетельствует, что "скульптор" из одной и той же " мраморной глыбы" может получить множество количественно различных, но качественно подобных моделей, т.е. в представлении (12) у таких моделей могут быть близкими по значению аргументы θ , но сильно варьироваться количественные показатели – амплитуды σ , т.е. x = k y , σ ( x ) = kσ ( y ).
На примере ненормированного фрагмента сети рис.1 определим состояния x = (1; 2; 3) и y = (1; 1; 2). При одинаковом качестве состояний их компоненты пропорциональны. Предъявляя y как эталон, состояние x можно привести к качественно подобному y состоянию двумя методами: 1) уменьшением компонент x 2 и x 3, и 2)увеличением в два раза компоненты x 1 и увеличением в полтора раза компоненты x 3. Если в первом случае получаем x = y , то в случае 2) имеем x = 2 y . Это объясняют и значения коэффициентов эластичности: s 1 = 5/126, s 2 = - 8/126, s 3 = 3/126.
Отметим, что волновое представление (12) даёт возможность наблюдать процесс обучение в цветовой гамме.
"Экономика и социум" №2(69) 2020