К сетевому представлению. Обучение

Автор: Соловьв А.С.

Журнал: Экономика и социум @ekonomika-socium

Рубрика: Основной раздел

Статья в выпуске: 2 (69), 2020 года.

Бесплатный доступ

В работе предлагается метод обучения нейронной сети с учётом её количественных и качественных особенностей.

Нейронная сеть, качество, количество, мера, сравнение, обучение, цель, кватернионы

Короткий адрес: https://sciup.org/140247791

IDR: 140247791

Текст научной статьи К сетевому представлению. Обучение

Пусть в некоторой нормальной системе выделен тернарный узел

Рис. 1. Узел нормальной сети прямого распространения со смежными узлами нижестоящего среза.

(1) Для нормальной системы имеем соотношение

(2)              Wо = ш 1 ¥1 + ю 2 W2 + ш з Wз = nW, ieN = {1, 2,3}, при этом для коэффициентов выполняется условие

(3) Ю 1 + Ю 2 + ю 3 = ю\ = 1, а узлы системы определяются собственными функциями  Wi с собственными значениями равными единице

(4)    X i = xW i ,    x i = 1.

В общем случае для стоящего в иерархии узла на более высокой ступени в сети прямого распространения имеем зависимость от смежных узлов нижележащего среза

  • (5)    x 0 = ω i xiΨ i = ω 1 x 1 Ψ 1 + ω 2 x 2 Ψ 2 + ω 3 x3Ψ 3 ,   i ϵ N.

Соотношение, аналогичное (1), справедливое для зависимости собственных функций, будет справедливо и для собственных значений

  • (6)    x 0 = ω i xi,      i ϵ N .

Элемент сети будем рассматривать как вектор

  • (7)    x i = xiΨ i

и знаком (*) обозначать переход к сопряжённому вектору, опуская вниз у сопряжённого вектора индекс. Тогда, если ввести векторы

  • (8)    x = ( xi | i ϵ N ),      ω = ( ωi | i ϵ N ),

равенство (4) можно записать в виде внутреннего произведения векторов

  • (9)    x 0 = ω * x .

Рассмотрим две различные сети с одинаковой архитектурой. Выделим в них узел с собственной функцией Ψ 0 и рассмотрим его действие со смежными узлами. Поскольку архитектура сетей одинакова, то если узел одной сети имеет представление, изображённое на рис. 1, то аналогичное представление имеет и выделенный фрагмент второй сети, но описание их действия будет различными уравнениями – уравнением (8) и равенством

  • (10)    y 0 = φ * y .

С учётом нормальности систем будем иметь

  • (11)    y = x .

Таким образом, данные фрагменты будут отличаться только пропускной способностью связей. Будем полагать, что (8) и (9) состояния узла Ψ 0 из пространства X возможны состояний системы. Более того, считать состояние (9) целевым (плановым), а состояние (8) – фактическим. И полагать, что требуется последовательно сближать фактическое состояние с эталоном, естественно, с учётом ограничений на показатели функционирования.

Сравним данные фрагменты системы опираясь на основное метрическое тождество и используя свойства скобки процедуры Кэли-Диксона в алгебре Клиффорда в пространстве X X в качестве элементов тензорного произведения c = x 0 y 0 . Для этого, на их бинарном соответствии z = ( x 0 , y 0 ), введём функции для внутреннего a = x 0 * y 0 и внешнего b = x 0 y 0 = i n b произведений, где n единичный вектор в представлении x 0 × y 0 = b n и гомоморфизм в пространстве определим функционалом D = c 2 = D ( z ). Получаем, что на данном бинарном соответствии справедливо тождество Пифагора

  • (12)    a 2 + b 2 = c 2,

а для его тензорной кватерниональной формы имеет место волновое представление

  • (13)    c = ,     Ψ= exp (i n θ ),

Будем полагать, что фактическое состояние системы есть образ (модель) оригинала, т.е. его расчётного состояния - эталон, в практической деятельности естественно последовательное стремление фактического состояния к эталону, и считать, что, не нарушая общности, ограничения (накладываемые на производственные факторы)    для подобного совершенствования отсутствуют. Как скульптор из глыбы мрамора высекает Аполлона, так и мы будем последовательно совершенствовать образ, последовательно отсекая мешающие обстоятельства в нашем совершенствовании. Для производственной системы это модернизация производства, стимулирование и обучение персонала и т. п.

Как правило, если рассматривать производственные сети, то это будут многоуровневые иерархические структуры и алгоритм их совершенствования, с учётом сети прямого распространения, можно строить поэлементно, либо послойно, например, снизу вверх, либо сверху вниз. Из статистического сходства соответствующих слоёв вытекает основа алгоритма - последовательное улучшение корреляционного сходства.

Коэффициент корреляции определяется формулой

  • (14)    r = a/c .

Применяя неравенства Коши-Буняковского

  • (15)    a <= c ,

в котором равенство достигается при полном соответствии сравниваемых слоёв, и полагая r> 0,находим

  • (16)    a = rc <= c .

При монотонном росте коэффициента корреляции образ будет последовательно стремиться к эталону. Предположим, что при темпах прироста T ( x ) некоторого фактора сети темпы прироста коэффициента корреляции равны T ( r ). При условии, что эластичность (чувствительность) коэффициента корреляции относительно данного изменения равна s получаем

  • (17)    r ( t + 1) = (1 + sT ( x )) r ( t ).

Заключаем, что корреляция будет возрастать, если показатели s и T ( x ) будут одного знака.

Пусть x и у произвольные фрагменты исходных систем, находящихся в структурном бинарном соответствии, а x и у - некоторые соответствующие их узлы. Для эластичности коэффициента корреляции данных фрагментов по показателю x получаем выражение

  • (18)    s = xy / a ( x , y ) - x 2 / c 2( x , y ),

т.е. сумма S = ^s эластичностей коэффициентов корреляции (17) по всем узлам данных фрагментов равна нулю. Следовательно, среди показателей эластичности узлов есть как положительные, так и отрицательные. Сумму положительных слагаемых обозначим S+ , а сумму абсолютных величин отрицательных слагаемых обозначим S- . Приходим к выражению

  • (18)                S = S + - S = 0.

Представление (18) такого расслоения показывает, что качественное сближение модели с эталоном можно проводить двумя методами улучшая качество модели за счёт совершенствования узлов:

  • a)    обращая внимание только на показатели с положительными коэффициентами эластичности, т.е. случай 1);

  • b)    обращая внимание только на элементы сети с отрицательными коэффициентами эластичности, случай 2);

  • c)    применяя в сближении одновременно как случай 1), так и случай 2).

Это свидетельствует, что "скульптор" из одной и той же " мраморной глыбы" может получить множество количественно различных, но качественно подобных моделей, т.е. в представлении (12) у таких моделей могут быть близкими по значению аргументы θ , но сильно варьироваться количественные показатели – амплитуды σ , т.е. x = k y , σ ( x ) = ( y ).

На примере ненормированного фрагмента сети рис.1 определим состояния x = (1; 2; 3) и y = (1; 1; 2). При одинаковом качестве состояний их компоненты пропорциональны. Предъявляя y как эталон, состояние x можно привести к качественно подобному y состоянию двумя методами: 1) уменьшением компонент x 2 и x 3, и 2)увеличением в два раза компоненты x 1 и увеличением в полтора раза компоненты x 3. Если в первом случае получаем x = y , то в случае 2) имеем x = 2 y . Это объясняют и значения коэффициентов эластичности: s 1 = 5/126, s 2 = - 8/126, s 3 = 3/126.

Отметим, что волновое представление (12) даёт возможность наблюдать процесс обучение в цветовой гамме.

"Экономика и социум" №2(69) 2020

Статья научная