Непараметрическое моделирование интеллектуальных систем при неполной информации
Автор: Низамеев Анатолий Рафаилович
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 4 (11), 2006 года.
Бесплатный доступ
Приведена схема управления многосвязным технологическим процессом. Даны общая и математическая постановки задачи управления многосвязным процессом. Построены непараметрические модели идентификации входных и выходных значений управляемого процесса.
Короткий адрес: https://sciup.org/148175279
IDR: 148175279
Текст научной статьи Непараметрическое моделирование интеллектуальных систем при неполной информации
НЕПАРАМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ
Приведена схема управления многосвязным технологическим процессом. Даны общая и математическая постановки задачи управления многосвязным процессом. Построены непараметрические модели идентификации входных и выходных значений управляемого процесса.
При моделировании и управлении сложными технологическими процессами часто возникает ситуация, когда параметрическая зависимость по ряду каналов объекта неизвестна полностью или частично. В этой связи перспективным является использование теории непараметрических обучающихся систем [1]. Рассмотрим формулировку задачи идентификации и управления для одного объекта, который будем считать фрагментом технологического процесса.
Общая постановка задачи. Рассмотрим схему (рис. 1).
Рис. 1. Схема управления процессом: О-объект;
АС - адаптивная система; ut - управляющее воздействие;
- контролируемое неуправляемое воздействие;
^ t - случайное воздействие; х,, zt - выходные переменные; hu, h " , hx, hz - помехи в каналах измерения; uth, ц ? , xth, zj -измеренные значения соответствующих переменных;
xj и zj- заданные значения выходных переменных
Следует заметить, что блок АС представляет собой достаточно сложную структуру, детализацию которой приводить не будем, лишь укажем, что в ее состав входят как модель исследуемого процесса, так и соответствующая процессу иерархия блоков управления.
Целью системы управления является поддержание заданного значения х* и z*. Отметим в связи с этим суще ственные отличия выходных переменныхxt и z. Выходная переменная х контролируется через достаточно малые интервалы времени At, как и переменные u, ц, А выходная переменная z отслеживается через существенно большие интервалы времени AT (AT>> At). С технологической точки зрения для всего технологического процесса наиболее важным является контроль именно этой переменной. Например, если выходная переменная х контролируется с помощью различного рода индукционных, емкостных и других датчиков, то выходная переменная z - по результатам химического анализа, физико-математических испытаний и др. Этим и обусловлено существенное отличие дискретности контроля выходных переменных х, и z. Если дискретность измерения х u ц. - это секунды, минуты, то дискретность z, составляет смену, сутки, недели и более. Последнее обусловлено технологией проведения самого контроля, который обычно регламентируется государственным стандартом.
Математическая постановка задачи. Пусть Ц , = { ц1„...,ц k } е R k , u , = { u t ,..., u m } е R m , x , = { x 1 ,..., x , } e R " , z , = { z , 1 ,..., z , } s R l . Характеристики объектов О1, О2и О3 взаимооднозначны по вектору управляющих переменных, т. е. одному значению utсоответствует только одно значение y.t. Имеется обучающая выборка { ц t , u,, х, Zt _ ф, t = 1, 5 }, где т указывает на запаздывание (смена, сутки ит.д.).
Сформулируем критерий оптимальности:
R ( z ) = Mu , ц { M z ( z _ z )2 | u , ц} = m i n, (1)
где zt - оценка вектора выхода z.
Используя необходимое условие минимума, т. е. приравняв производную функции R по искомой величине z к нулю, получим:
zopt = M ( z\u , ц}. (2)
Непараметрическая оценка выходной переменной zt для системы (см. рис. 1) имеет вид
s
m
k z s + 1
Z z. П ф i = 1 j = 1
u s V
^^^^^^в
j
U , 1
n
П ф
Ц р + 1
^^^^^^в
Ц p
sm
ZПФ
fu j u s + 1
^^^^^^в
us
j
ui
n
П ф
I p
Ц s +1
^^^^^^в
Ц y i c2
7 , (3)
где s - размер обучающей выборки; z ” s +1'
k
^^^^^^в
7
оценка к-й
компоненты вектора выхода, к = 1, l ; и$+1- вектор входа из экзаменующей выборки; Ф - ядро функции, и выбираемое по следующим условиям: j Ф(b)db = 1;
ОО г ви
Ф( b1 ) <Ф ( b 2 ) для | b2 | < | b | ; j bp Ф ( b ) db <^ ,р = 2,3,...;
вИ
Ъ - аргумент функции Ф ; Сй - параметр размытости ядра Ф, удовлетворяющий условиям: C n ^»_0 ; «с „ ( n ) n - >_~ .
При выполнении этих условий оценка z является асимптотически несмещенной, состоятельной, асимптотически нормально распределенной.
Параметр размытости С выбирается по условию выполнения минимума критерия:
Пусть N, О ,A - размерности векторов zt1, zt2 и zt3; N, О , A - размерности векторов zt1, zt2 и zt3; H, F и T - размерности векторов xt1, xt2, xt3; У , Г и Q - размерности векторов и 1, и 2 и и 3; D - размерность вектора ц t .
Запишем модели прогноза выходных значенииzt1,zt2, zt3 и xt1,xt2, xt3, а также модели расчета управляющих воздействий ut1, иt2, иt3 для объектов О1, О2 и О3.
Непараметрические оценки выходных переменных zt1, zt2, zt3 будут выглядеть следующим образом:
1 18 __ z s +ф =
а 25
z s +ф =
s
у
Z z 1 П ф i = 1 j = 1
й;+1в u,
u 1 s
D
Ц k + 1
в
Цк
Ц s
s У
ZПФ
Us+1 в U,
D
П ф
Ц k + 1
в
Ц k
,
u 1 s
5 = 1, N ,
Ц s
(9),
s Г
Z z25 Пф i=1 j=1
u
в й 2 i
N
1k zs +ф в
z 1 ik
u 2 s
s
R = Z ( zi в zi( C )) 2 — min, i = 1 C
s Г
ZП Ф i =1 j =1
u s +1 в u i
N
с к zs
1k1k zs+ф в zi
Н
Пф i=1
1 p x +
^^^^^е
x 1 ip
u 2 s
с к
V zs
Н
Пф p=1
A___
1 p x s +1
C p 1 xs
^^^^^в
x 1 ip
,
X
C p 1 xs
где s - размер обучающей выборки.
Критерий оптимальности для оценки управляющего воздействия выглядит так:
отсюда R ( й) = M Ц z x { M u ( u - й ) 2 | ц, z , x } = min, (6),
Ц ’ ’ й
5 = 1, О ,
(Ю)
отсюда й °р t = M ( u | ц, z , x = z * }.
~35 _ z s + ф =
sQ
Z z3 Пф i=1 j=1
u
^^^^^в
u3ij
u 3 s
О
z
/2 к
Формула оценкиу-го компонента вектора и в момент времени s+1 записывается следующим образом:
sQ
ZП Ф i =1 j =1
u s + 1 в u i
О
_
”2 к
■ s +ф в z
Ck z2s
, 2 к ^
F
- П Ф
2p x +
^^^^^в
2 p x L
u 3 s
z-CCPV z s
, 2 к ^
.z
F
p =1
p =1
j u s +
где j = 1, m .
Непараметрические модели последовательного технологического процесса. Приведем сравнительно простую схему технологического процесса (рис. 2). На это схеме опущены помехи, действующие в каналах измерения, чтобы не загромождать рисунок, хотя предполагается, что они, конечно же, действуют.

35 _ x s +1 =
£ 25 _ x s +1 =
Рис. 2. Схема последовательного технологического процесса (обозначения см. в тексте)
Содержание переменных соответствует описанному ранее. Отметим лишь, что роль неуправляемых переменных в данной схеме играют как ц t , так и z1, z2, контроль которых, производится через различные, но значительные интервалы времени. Блоки Р1, Р2 и Р3 - это регуляторы соответствующих объектов Ор О2 и О3; I- вся имеющаяся информация о процессе.
5 = 1, А .
C P A__ x A, 2 p 2 p x s +1 x i
Cp 2 xs
Непараметрические оценки выходных переменных x1, xt2, xt3 записываются таким образом:
£15 x s + 1
s
Z x,2
i =1
s
у
Z x8 П ф i = 1 j = 1
й;+1в u,
u 1 s
Г
D
Ц k + 1
в
Ц k
Цs
s у
s Г
ZП Ф i =1 j =1
u
u
в й i
u 1 s
5 = 1, Н ,
в й ‘j
Н
u 2 s
й s +1 в й i
sQ
Z x - п ф i =1 j =1
u
Н
2 us
в
D
f x 1 к
.А___ x1sk
^^^^^в
k
C 1
в
C 1 V x s
5 = 1, F,
u 3 ij
F
x 2 sk
Ц k + 1
1 k x i
x1s x1ik
в
в
Ц k
Ц s
\N
Пф
Б=1
InПф p=1
x 2 ik
,
f Z1 p z
.A_____
1p z s+1
X
^^^^^в
(12) zL '
C p 1 zs
в
z 1 ip
C p 1 zs
,
sQ
ZП Ф i =1 j =1
u s +1 в u i
F
u 3 s
C 2 x s_ f Y2 к -Y2 к x-c^ V x 2 s
5 = 1, T .
Lo_
Пф
2p z s+1
в
(13) z 2iL
О
Пф
X
CP
Л_____ z z
2p2p z s+1 z i
C p 2 zs
,
Непараметрические оценки выходных переменных ut1, иt2, иt3 записываются следующим образом:
W15 u s + 1
s N
Z 4* Пф i=1 j=1
Z . - Z s + 1 i
D
^^^^^в
Ц
Пф
1 p *
x . . 1
^^^^^в
xl
z 1 s
Ц s
p = 1
s N i =1 j=1
jj z s+1 z i
D
в
Ц i
z 1 s
Ц s
Н
0 Ф
X f r1 p *
x s + 1
Cp x 1 s
в
x 1 ip
,
c p
V xs 7
5 = 1, Т , (15)
* 25 uS^ 1
s П
Е и2 Пф i=1 j =1
ЕПф i=1 j =1
2 j . _ . +1 z
z
Пф
z Vk * _v2 k x s +1 x i
C \ x s
s +1
^^^^^™
. 2 j
z s
П ф
z 2k k * _v2 k X s +1 x i
k
■ x2 s
\
z ^ ( и ) =
sk
Е z [ s ] П о i =1 j =1
( u j - u j [ i ] . C j [ s ]
n
П о
(^ C WT j
k

( U j - U j [ i ] v C j [ s ]
П о
(
j
3 5 u s +1
sA
Е u35 Пф i=1 j=1
sA
ЕПф i=1 j=1
5 = 1, Г , (16)

\t, о ф
( V3 k * _ V3 k x s +1 x i
\
k x3 s

^^^^^™
z s
в ф
( 3 k * 3 k x s+1 - x i
k x3 s
5 = 1, Q .
Непараметрические модели и алгоритмы управления с идентификатором. Рассмотрим задачу управления объектом с идентификатором в управляющем контуре (рис. 3). Как на предыдущей схеме (см. рис. 2), на этой схеме опущены помехи, действующие в каналах измерения.
На первом этапе, когда ключ К1 разомкнут решается задача идентификации, на втором этапе, когда ключи К1 и К2, К3, К4 замкнуты, решается задача выработки управляющего воздействия, которое и подается на объект.
Далее для простоты записи будем рассматривать непараметрические алгоритмы на примере одного объекта. Для последовательной цепочки объектов алгоритмы записываются аналогичным образом.

Рис. 3. Схема управления с идентификатором: модуль М - модель
Введем некоторую функцию качества о( t ) = о( z ( t ), z * ( t )). Поскольку для показателя качества о( t ) , который представляет собой меру уклонения z(t) от z*(t), естественно потребовать равенство нулю, то оптимальное управляющее воздействие, в смысле квадратичного критерия о( t ) может быть представлено в виде условного математического ожидания:
u ( t ) = M { u ( t )/p( t ) e Q(p),o( t ) = OV z ( t ) e Q(z) } , (18)
Для решения задачи идентификации в условиях непараметрической неопределенности будем использовать непараметрическую модель идентификации объектов без памяти, алгоритм который имеет вид
7 , (19)
% = 1, m , где s - объем выборки; k, n и m - количество входных
управляемых, неуправляемых и выходных переменных
соответственно.
Задача сводится к непараметрическому оцениванию
(18) на основании поступающей информации { zt , ц t , u t } , t = 1, s . Ясно, что в качестве непарамет
рической оценки (18) может быть принята статистика
U (.[ s ] = где
s - 1 k
Е u [ i ] П 0
i = 1 j = 1
s - 1 k
ЕПо i=1 j=1
( О j [ s ] C j [ s ]
( о j [ s ] C [ s ]
V j
n
) ПО
П о
I j^
C j [ s ]
z
^ i [ s ] v j
+ A u j [ s ], (20)
O[ s ] = ( O 1 [ s ],..., о m [ s ] ) ; o j [ s ] = o j ( z j *[ s ], z j [ s ] ) ;
A u j [ s ] = A u ( o j [ s ] ) , j- количество входных управляемых
переменных; A u j [ s ] - изучающая добавка, j = 1, k .
Для того чтобы использовать опыт технолога-эксперта для выбора некоторых управляющих воздействий при решении этой задачи, алгоритм (20) следует модифицировать в форме
u j [ s ] =
f u [ i ] f о (°™ 1 пт о ( ^ j l s Di^' - о ( u T v s ] u j [ i ] 1:1 j 1 = П I C j [ s ] 1 °! = П I C j [ s ] J J j = 1 I C j [ s ]
V k о ( о j [ i ] n о ( ^ j [ s ] ^ j [ i ] ” о ( uj [ s ] uj [ i ] Е J j = 1 I C j [ s ] JJ j = 1 I C j [ s ] IJ j = 1 I C j [ s ]
1, (21)
c < k , j = 1, { k - c } .
В заключение приведем некоторые типы A u [ s ] адап
тивных непараметрических систем играющих основную роль при активном обучении:
- алгоритм с обратной связью
A u [ s ] = е ( z * s , z s - 1 ) , (22)
где е - некоторая функция, представляющая собой меру уклонения одного из элементов z s - 1 от заданного значенияz*;
- градиентный алгоритм
A u [ s ] = 0 s V x Q ( z * , z s - 1 ) , (23)
где c s - некоторая случайная последовательность; Q - выпуклая функция. Для этого класса могут быть ис
пользованы различные статистические оценки градиента, в том числе и непараметрические;
- обучающийся алгоритм. Для алгоритмов такого типа A w[s] определяется так
3 k , z z, [ s ] - z ,[ i ] 1 .^T k T , z z, [ s ] - z ,[ i ] 1
A u [ s ] = E A u [ s ] П О j C s jJ / ЕП о C I s ] (24)
j I i 7 i j I j 7
Приведенные непараметрические алгоритмы предполагают последовательную схему обучения и могут носить как активный, так и комбинированный характер.