О непараметрических алгоритмах управления дискретно-непрерывными процессами
Автор: Низамеев А.Р.
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 3 (6), 2005 года.
Бесплатный доступ
Предложены схема и алгоритмы управления дискретно-непрерывными процессами. Рассмотрены модификации алгоритмов, учитывающие взаимодействие с лицом, принимающим решение, наличие вещественных, целочисленных и булевых переменных.
Короткий адрес: https://sciup.org/148175106
IDR: 148175106 | УДК: 62.501
About researchings of nonparametric algorithms of mutually connected processes
There the scheme and discrete-continuous processes control algorithms are offered. The modifications of algorithms, which are taking into account interaction with the decision maker, presence of material, integer and Boolean variables are considered there.
Текст научной статьи О непараметрических алгоритмах управления дискретно-непрерывными процессами
Предложены схема и алгоритмы управления дискретно-непрерывными процессами. Рассмотрены модификации алгоритмов, учитывающие взаимодействие с лицом, принимающим решение, наличие вещественных, целочисленных и булевых переменных.
Рассмотрим задачу управления дискретно-непрерывным процессом, входные и выходные характеристики которого имеют вид вещественных, целочисленных и булевых переменных (см. рисунок).
Схема управления процессом
Регрессия (условное математическое ожидание) является оптимальной, в смысле квадратичного критерия
R = M {( X - x )2 | u } = min , (1)
x моделью истинных зависимостей. Здесь x - оценка вектора выхода объектаА.
Используя необходимое условие минимума, т. е., приравняв производную функции R по искомой величине x к нулю, получим dR / dx = - 2 M {( X - x ) | u } = 0, отсюда
5с — М {^ и }. (2)
Непараметрическая оценка регрессии для векторно
го случая имеет вид
k xs +1
s
l
- Z x k п *
i = 1
J = 1
/
u s + 1 j
-
u i j
\
V
Cx k
sl
/ дп
i = 1 j = 1
' u s j u i1
Cx
V
)
где Ф
u s + 1 j - ui’
k
Cx
ядро функции, выбирается из следую-
На рисунке приняты следующие обозначения: х ( t ) = ( x 1 ( t ),..., x k ( t ) ) - вектор выходных переменных процесса; u ( t) = ( u 1 ( t ),..., u m ( t ) ) и ц ( t ) = ( ц 1 ( t ), ..., ц n ( t ) ) - соответственно управляемые и неуправляемые контролируемые переменные, состоящие из т и п компонентов; ^ ( t ) - случайные возмущения; h p , hu , h x - случайные ошибки измерения, такие что M { h } = 0, D { h } < ~ ; x ( t ) - желаемое значение выходной переменной, t- время.
На первом этапе (ключ К , разомкнут) решается задача идентификации; на втором этапе (ключ К 1 замкнут) решается задача управления объектом с участием лица, принимающего решение (ЛПР), после этого ключ К 2 замыкается.
При управлении дискретно-непрерывными процессами целесообразно использовать теорию адаптивных и обучающихся систем. Задачи идентификации, управления и принятия решения в стохастических системах рассматриваются в условиях непараметрической неопределенности (когда не известна параметрическая структура модели исследуемого процесса), поэтому предлагается использовать регрессионные модели.
Пусть х , и , p t , где t - дискретное время, являются наблюдаемыми переменными. Необходимо найти алгоритм работы управляющего устройства для выработки такого управляющего воздействия на систему, что выход процесса в каждый текущий момент времени ( t - 1,2, ...) как можно меньше отличался бы от желаемого x * ( t ) .
Для решения задачи управления используем элементы непараметрического подхода [1...3], который предполагает использование непараметрической оценки регрессии в качестве модели истинных зависимостей.
щих условий:
W
- | ф ( z ) dz = 1,
где г
u s + 1 j - u? Cxk
-<х>
-ядро функции колоколообразное, т. е. Ф(z 1) < Ф(z2), для | z21< Z11;
- j z p Ф ( z ) dz <~ , ^- 2,3, ....
Параметр размытости Cx ядра Ф удовлетворяет усло виям Cx ^ 0 и nCx (n) ^ “ . n ^~ n ^^
При выполнении двух условий оценка x является асимптотически несмещенной, состоятельной, асимптотически нормально распределенной.
Приведем примеры треугольного, параболического и кубического ядер:
Ф ( z ) =
[ 1 - I z I, if I z l < 1, [ 0,if| z | > 1;
Ф ( z ) = fO/^X! - z 2),if| z | < 1, [ 0, if I z | > 1;
Ф( z ) =[ (1 + 2 | z |)(1 - | z |) 2 , if | z | < 1, 0, if | z |> 5.
Параметр размытости C x выбирается по условию выполнения минимума квадратичного критерия:
s
R = £ ( Xi - X -( Cx ))2 ^ min, (7)
Cx i=1
где ^ - размер обучающей выборки, с помощью которой методом скользящего экзамена выбирается оптимальный на этой выборке C :
X
Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева
s
l
X ik = 2 x nk П
n = 1
m = 1
m u i
^^^^^^
m u n
V
k Cx j
sl
/ 2Пф n=1 m=1
m u i
^^^^^в
m u n
V
k Cx j
n Ф i ■ (8)
Рассмотрим последовательный непараметрический
Пусть { u ( t ), p ( t ), x ( t ), t = 1, s - 1} - обучающая выборка, состоящая из наблюдения входа и выхода объекта^ Непараметрический алгоритм управления в этом случае
алгоритм управления .
Пусть мы имеем ситуацию, когда отсутствует обучающая выборка, а текущая информация об объекте поступает в устройство управления последовательно (активное накопление информации) Тогда обучающийся непараметрический алгоритм управления на такте t = s имеет вид йs = иsj + Aus , (9)
где u -оценкавектора входа; A uJs -изучающая добавка [3],
имеет вид
j us =
s - 1 k
Z u / П ф i = 1 f= 1
s - 1 k
2П
I = 1 р = 1
~
u
j
s
* f
x s
- x f
С f
C x l____
Пф
P sf !' р
р = 1
Г f
1 С ц
* р
x s
Г f
C x
s -1
k
P sf !' f
p сц
Y i_
Пф
=
э f ир u s - u i
C x
,(13)
u 1 e ( u mjn , u max) ,
2 u i П ф
( * f
/
i =1
f =1
k
f =1
l
A
n xi xs
A,
. * f xs
C xf
C
- xi
A
p
C ц
P f
j = 1, m , s = 2, 3,... ■
P f
P f
p
C ц
P f
A
A
,
j = l m , s _ 2, з, ^ , у e( u min , u max ) , ' < m ■
Алгоритм (13) представляет собой оценку обратной регрессии по наблюдениям { u ( t ), ц ( t ), x ( t ), t = 1, s - 1} ■
В случае если компонентами вектора u i , кроме веще
ственных переменных, являются переменные типа целочисленных и булевых, обучающиеся непараметрические алгоритмы несколько модифицируются^
Рассмотрим модификацию непараметрического обучающегося алгоритма управления с обучающей выборкой в этом случае:
На начальном этапе управления, когда фактически идет процесс обучения, доминирующую роль играет изучающая добавка^ Это связано с малой обученностью системы и соответствует выработке пробных шагов, которые могут носить случайный характер, если отсутствует дополнительная априорная информация^ По мере изучения объекта при формировании u s все большая роль начинает принадлежать и j [ s ] ■
'
u
s =
s - 1 k
Z u j П ф i = 1 f = 1
s - 1 k
2П ф i = 1 f = 1
[ * f f A n f f i Г э h h A c r r ) v x s -^ П ф| u i?" П ф| C^- П*
C x j f = 1 i C -ц 7 h = 1 i C x jr= 1 i C ” j q= 1
' *f fA n ( f р^i I эh hA c ( r r\v , xs^xL I ф|еГгнТ ^luszuc I ф|“sZ^L 1 h(wq i -xf 1^11 -цf tIL1 i -h п i -” jq/s
q w i
j = 1, m , s- 2,3, ^ , ui j e ( u m in , u ,)ax ) , i < m ,
где с и г - соответственно размеры векторов ю ( t ) и w ( t );
fi ( w sq
- w q ) =
1,
0,
если w j = w f , иначе.
При управлении реальным процессом естественно использовать опыт обслуживающего персонала (оператора, технолога-эксперта) Для того чтобы использовать опыт эксперта при решении этой задачи, формулу (11) в алгоритме (9) следует модифицировать в виде
Таким образом, предложенные обучающиеся непараметрические алгоритмы управления могут быть модифицированы и использованы при разработке реаль
ных компьютерных систем управления дискретно-непре
рывными процессами
~
u
s - 1 k
Z u / П ф
' j = i = 1 f = 1
s
s - 1 k
2П i=1 f=1
( * f x s
^^^^^s
x f A
n
и f
^^^^^s
и f
с f C x
V7
„ * f fP x s - x i
f = 1
n
V иf
p
- ц
Пф
u "f - u f
^^^^^s
И f
j = 1
-/ x
V
f = 1
C f l - ц
Пф
V
Г э f и s
C x
3 - u f
,(12)
j = 1
C x V7
j = 1 m , s- 2,3, ..., у e( u min , u max ) , где u э определяется ЛПР на каждом такте принятия ре-шения^ Но ЛПР может определить не все значения ком-
понент вектора и , поэтому ' < m ■
Далее рассмотрим непараметрический алгоритм управления с обучающей выборкой