Построение оптимального управления одним классом нелинейных систем по квадратичному критерию
Автор: Лобанов Сергей Михайлович, Затылкин Виктор Владимирович, Одеви Шабрель Малонга
Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet
Рубрика: Информационные технологии, моделирование и управление
Статья в выпуске: 3 (53), 2012 года.
Бесплатный доступ
Приведена теорема существования решений общей задачи оптимального управления для одного класса нелинейных систем. Показано, что решение этой задачи дается законом управления с обратной связью. Определена оценка временной границы существования решения.
Нелинейная система, закон управления с обратной связью
Короткий адрес: https://sciup.org/14039896
IDR: 14039896
Текст научной статьи Построение оптимального управления одним классом нелинейных систем по квадратичному критерию
Рассмотрим управляемую нелинейную динамическую систему, характеризуемую дифференциальным уравнением
X = Ax+Bu+f(x,u), (1)
где x = ( x 1 , . , x n ) - n -мерный действительный вектор состояния; u = ( u 1,.,u m ) - m -мерный действительный вектор управления; A и B – действительные (n× n) - и (n× m) -матрицы;
f = (f 1., fn) - векторная функция, определенная и непрерывная вместе со своими частными производными:
nfi
----7, i, j = 1,. , П , nx j
и nfi nu j
i = 1, . , n, j = 1, . , m ,
nn + m в пространстве R n m .
Предположим, что начальное состояние x(t o ) = c (2)
задано, а задача управления системой (1) заключается в минимизации функционала T
J ( u ) = - J [( e ( t ), Q e ( t )} + 2 t 0
+ ( u ( t ), Ru ( t ))] dt + 1 ee ( T ), Pe ( T )), (3)
где T – фиксированное конечное время; Q и P – положительные полуопределенные (n × n) -матрицы; R – положительно-определенная (m× m) -матрица; e(t) – ошибка системы, т.е.
e(t)= x(t) - z(t )
для всех значений t0 < t ^T , где z = ( z 1, . , zn ) – n - мерный действительный вектор, характеризующий заданный режим функционирования системы (1).
Легко видеть, что непосредственное применение принципа максимума Л.С. Понтрягина к рассматриваемой задаче приводит к достаточно сложной краевой задаче, если только (1) – (3) не сводится к линейноквадратичной задаче слежения [1, С. 657]. Однако во многих практических ситуациях режим z(t) устроен достаточно плохо и указанное сведение становится невозможным. Если влиянием функции f на систему (1) по каким-либо причинам можно пренебречь, то задача (1) – (3) оказывается достаточно простой и ее, видимо, можно считать полностью решенной [1, 2]. Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. Поэтому в общем случае для получения оценок решения задачи (1) – (3) применяют различные методы, которые в той или иной форме используют линеаризацию и последовательные приближения, позволяющие свести задачу к некоторой последовательности линейноквадратичных задач слежения [3-6].
Заметим, что в работах [7-9] намечено дальнейшее развитие упомянутых выше результатов. Существенным недостатком основной теоремы статей [7-9] является то, что закон управления дается только на некотором достаточно малом промежутке времени. Основной целью настоящей работы является устранение этого недостатка.
Вспомогательные задачи . Прежде всего, опишем первую проц едуру построения оценок решения нелинейно-квадратичных задач оптимального управления, фактически лежащую в основе последующих построений.
Следуя [4], для всех значений N = 0,1,2,... рассмотрим вспомогательную задачу о минимизации функционала
T
J N+1 (u)= 1 ∫ [ e(t),Qe(t) + 2t0
+ u((t),Ru(t)} ] dt + 1{e(T),Pe(T)} (4)
с ограничением
-
Х N + 1 = Ax N + 1 + BU N + 1 + f ( X N , U N X (5)
X N + 1 ( t 0 ) = c .
Для заданных функций xN и uN оптимальное управление uN + 1 ( t ) в задаче (4), (5) дается законом управления с обратной связью
U n + 1( t ) = R -1 B T h N + 1( t )- K ( t ) X n + 1( t )], (6) где xN + 1( t ) - решение уравнения (5), соответствующее uN + 1( t ) и удовлетворяющее начальному условию xN + 1( 1 0) = c ; K(t) - решение матричного дифференциального уравнения Риккати
K I ( t ) = - K ( t ) A - A K ( t ) +
+ K ( t ) BR -1 B'K ( t )- Q с граничным условием
K(T) = P,(8)
а hN+1( t) - решение линейного дифференциального уравнения hN+1 (t) = -[A - BR-1B‘K(t)]‘hN+1 (t) -
-
- Qz ( t ) + K ( t ) f ( X n ( t ), U n ( t )) с граничным условием
hN+1(T) = Pz (T).(10)
Таким образом, если начальное приближение x0( t), u 0( t) задано, то соотношения (4)-(10) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях T позволяет установить существование решений задачи (1) - (3) и дает эффективную процедуру построения этих решений. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями x0( t) nc (11)
и u 0( t) nR-1B ‘[ Pz (T)- K (t) c ]. (12)
Построение закона оптимального управления. Пусть X(t) и H(t) - решения линейных матричных дифференциальных уравнений
X = [ A - BR -1 B'K ( t )] X , X ( 1 0) = E
и
H = n - [ A - BR -1 B'K ( t )] ' H , H ( T ) = E , где E - единичная (n*n) -матрица. Тогда при использовании (6) уравнение (5) эквивалентно уравнению
X n + , ( t ) = X ( t ) c + J X ( t - т ) x
1 0 (13)
x[BR-1B‘hN+1 (t) + f (Xn (t), un (t))] dT, а уравнение (9) с граничным условием (10) -уравнению hN+1( t) = H (t) Pz (T ) +
t
+ J H ( t - T )( K ( t ) f ( X n ( т X u N ( t ))- Qz ( t )) d T . (14) T
Принимая во внимание (14), перепишем уравнение (13) в следующем эквивалентном виде:
X N + 1 ( t ) = X ( t ) c +
+ J [ X ( t - т ) f ( xN ( t ), u n ( t )) + BR -1 B'H ( t ) Pz ( T ) + t 0
‘
+ J X ( t - т ) BR 1 B'H ( t - 5 )( K ( 5 ) f ( X n ( 5 ), u n ( 5 )) - T
-
- Qz ( 5 )) d5 ] d T .
Тогда с учетом (6) система (13), (14) может быть представлена в виде
Xn+1 (t) = X(t)c + J [f1 (t,t,Xn (t), hN (t)) + t0
T
+ J f , ( t , 5 , X n ( 5 ), h N ( 5 )) d5 ] d T , (15)
T hN+1( t) = H (t) hо +
T (16)
+ J f ; ( t , t , X n ( t ), h N ( t )) d T ,
t где hо = Pz (T), f,( t,T, xN (t ), hN (t )) =
= X ( t - t )[ f ( X n ( t ), R -1 B ‘ [ h N ( t )-
- K T ) x N ( t )]) +
+ AR1A /H (t)Pz(T)], fз( t,T, xN (t ), hN (t )) =
-
= H ( t - t )( K ( t ) f ( xN ( t ), R -1 B '[ hN ( t )-
-
- K ( t ) xN ( t ))]- Qz ( t )),
-
f , ( T , 5 , xN ( 5 ), hN ( 5 )) = - X ( t - T ) BR -1 B ‘x X f 3 ( t , T , x N ( 5 ), hN ( 5 )).
Пусть теперь a - некоторое положительное число. Обозначим через X -множество точек (t, x, h) е R1+2n, для которых выполнены неравенства tо < t < T, | x - c |< a, | h - ho |< a, (17)
где | x | - евклидова длина вектора x . Так как X - компактное множество, то найдется такое положительное число M , что для всех значений t,x и h , удовлетворяющих условиям (17), при t0 ^ т ^Т выполнено неравенство
| f ( t , t , x , h )| < M , I = 1,2,3. (18)
Обозначим через Q множество всех непрерывных пар (x,h) функций, определенных на отрезке [t0,T], принимающих значения в пространстве Rn и при t0 ^ t ^ Т, удовлетворяющих условиям lx(t)-cha, lh(t)-h0l^a, (19)
т.е. Q - множество непрерывных пар (x,h) функций, графики которых лежат в X . При этом будем рассматривать часть Q 1 множества Q , такую, что наряду с неравенствами (19) при (x,h) E Q T выполнялись бы также неравенства
| X ( t ) c - c < 2 | H ( t ) h o - h o < a (20)
и
| x ( t )- X ( t ) c < a , | h ( t )- H ( t ) h o < a (21)
Тогда в силу неравенств lx(t) - cl^ix(t) - X(t)cl + lX(t)c - Cl
и
| h ( t )- h 0 < | h ( t )- H ( t ) h o | + | H ( t ) h o - h o | из условий (2O) и (21) следуют неравенства (19) и, таким образом, принадлежность пары (x,h) к множеству Q .
Для всех значений t0 ≤ t ≤ T положим ^ (t) = (x(t),h(t))
и будем говорить, что ф EQ T , если (x,h) EQ T .
Обозначим через F оператор, задаваемый правыми частями системы (15), (16). Если число Т достаточно мало, то из принадлежности ф к Q t следует принадлежность к Q T и функции
Ф *=F ф , (22)
где ф =(x ,h ) .
В самом деле, для того чтобы функция ф , задаваемая соотношением (22), принадлежала к множеству Q t , достаточно, чтобы при выполнении условия (2O) для всех значений t0 ≤ t ≤ T были выполнены также и неравенства
* а *■ а
| x ( t )- X ( t ) c < - , | h ( t )- H ( t ) h o < -.
Но в силу (15), (16) и (18) имеем
| h ( t )- H ( t ) h oh
T J t
[ f з( t , t , x ( t ), h ( t )) ] d T <
< M (T - 1 o )
и
| x ( t )- X ( t ) c |= J [ f X t , t , x ( t ), h ( t )) + t o
T
+ J
t
f , ( t , t , 5 , x ( 5 ), h ( 5 )) ds ] d T < M (( T - 1 o) + 1)( T - 1 o).
Отсюда следует, что при
M (( Т - 1 o ) + 1)( T - 1 o ) < - (23)
условие, предъявляемое к оператору F в (22), выполнено.
Для всех значений t0 ^t ^Т и N = O,1,2,_ положим фN(t) = (XN(t),hN(t)) и построим последовательность функций
Ф о , Ф 1 ,, Ф N ,..., (24)
определенных и непрерывных на отрезке [to,T] , в силу системы (15), (16), приняв
V n + 1 = F V n , N = 0,1,2,... (25)
т.е. u (t) - оптимальное управление в задаче
и
Ф о (t ) - ( c , h o ). (26)
Поскольку функция (23) принадлежит к множеству Q T , то согласно равенству (22) все функции последовательности (24) также принадлежат к Q T .
Рассмотрим функциональное уравнение
Ф = Р ф . (27)
Поскольку оператор F отображает множество Q T в себя, одна из его итераций является сжатием [10]. Поэтому уравнение (27) имеет на множестве Q решение ф , которое может быть получено по формуле *
Ф ( t ) = lim V n ( t ), (28)
N→∞ где сходимость равномерна на отрезке [t0, T] [10, С. 12].
Но так как по построению h0=Pz(T), то согласно (26) последовательность (25) удовлетворяет начальным приближениям (11) и (12). Поэтому из равенств (6) и (28) следует существование функций u (t) и x (t), построенных по формулам *
lim U n ( t ) = u ( t ) (29)
N→∞ и *
lim xN ( t ) = x ( t ), (30)
N→∞ где сходимость равномерна на отрезке [t0, T].
Поэтому функция x (t) является соответствующим u (t) решением уравнения (1) с начальным условием x (t0 )=c.
Более того, по построению
* lim J N ( U n ) J ( u )
N →∞
и
JN(uN) ≤JN(u) T для всех u Е L2 , откуда и следует, что для каждой функции u ∈LT2
*
lim JN ( uN ) = J ( u ) < lim JN ( u ), N →∞ N →∞
(1)-(3).
Результирующая теорема. Согласно равенствам (29) и (30) уравнение (16)
переходит в уравнение
h *( t ) = -[ A - BR -1 B'K ( t )] ‘ h *( t ) - Qz ( t ) +
+ K ( t ) f ( x *( t ), u *( t ))
с граничным условием
h*(T) = Pz(T). (32)
Аналогичным образом закон управления (6) - в закон управления u (t) = R 1B‘[h (t)- K(t)x (t)]. (33)
Предположим, что на множестве,задаваемом неравенствами t0 < t IX (t) c - c\< a, \H (t) h0- h0^ a, функции f и f удовлетворяют неравенствам 1 3 lfi(t,T,x,h) l 10 < t \ x (t)-c\< a, \h (t)-h0< a функция f2 неравенству | f2 (t, s, x, h)\< I . Тогда имеет место следующая теорема. Предположим, что число Т удовлетворяет условию M ((T -10) +1)( T -10) < a. (34) Тогда задача (1) - (3) имеет решение x*(t),u*(t). При этом, оказывается, что при t0 ^t ^T справедлив закон управления (33). Таким образом, установленная выше теорема дает решение задачи (1)-(3) в виде закона управления с обратной связью (33). При этом неравенство (34) определяет оценку границы существования такого решения. ВестникВГУИТ, № 3, 2012