Построение оптимального управления одним классом нелинейных систем по квадратичному критерию

Автор: Лобанов Сергей Михайлович, Затылкин Виктор Владимирович, Одеви Шабрель Малонга

Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet

Рубрика: Информационные технологии, моделирование и управление

Статья в выпуске: 3 (53), 2012 года.

Бесплатный доступ

Приведена теорема существования решений общей задачи оптимального управления для одного класса нелинейных систем. Показано, что решение этой задачи дается законом управления с обратной связью. Определена оценка временной границы существования решения.

Нелинейная система, закон управления с обратной связью

Короткий адрес: https://sciup.org/14039896

IDR: 14039896

Текст научной статьи Построение оптимального управления одним классом нелинейных систем по квадратичному критерию

Рассмотрим управляемую нелинейную динамическую систему, характеризуемую дифференциальным уравнением

X = Ax+Bu+f(x,u), (1)

где x = ( x 1 , . , x n ) - n -мерный действительный вектор состояния; u = ( u 1,.,u m ) - m -мерный действительный вектор управления; A и B – действительные (n× n) - и (n× m) -матрицы;

f = (f 1., fn)    - векторная    функция, определенная и непрерывная вместе со своими частными производными:

nfi

----7, i, j = 1,. , П , nx j

и nfi nu j

i = 1, . , n,  j = 1, . , m ,

nn + m в пространстве R n m .

Предположим, что начальное состояние x(t o ) = c                      (2)

задано, а задача управления системой (1) заключается в минимизации функционала T

J ( u ) = - J [( e ( t ), Q e ( t )} + 2 t 0

+ ( u ( t ), Ru ( t ))] dt + 1 ee ( T ), Pe ( T )),        (3)

где T – фиксированное конечное время; Q и P – положительные полуопределенные (n × n) -матрицы; R – положительно-определенная (m× m) -матрица; e(t) – ошибка системы, т.е.

e(t)= x(t) - z(t )

для всех значений t0 < t ^T , где z = ( z 1, . , zn ) – n - мерный действительный вектор, характеризующий заданный режим функционирования системы (1).

Легко видеть, что непосредственное применение принципа максимума Л.С. Понтрягина к рассматриваемой задаче приводит к достаточно сложной краевой задаче, если только (1) – (3) не сводится к линейноквадратичной задаче слежения [1, С. 657]. Однако во многих практических ситуациях режим z(t) устроен достаточно плохо и указанное сведение становится невозможным. Если влиянием функции f на систему (1) по каким-либо причинам можно пренебречь, то задача (1) – (3) оказывается достаточно простой и ее, видимо, можно считать полностью решенной [1, 2]. Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. Поэтому в общем случае для получения оценок решения задачи (1) – (3) применяют различные методы, которые в той или иной форме используют линеаризацию и последовательные приближения, позволяющие свести задачу к некоторой последовательности линейноквадратичных задач слежения [3-6].

Заметим, что в работах [7-9] намечено дальнейшее развитие упомянутых выше результатов. Существенным недостатком основной теоремы статей [7-9] является то, что закон управления дается только на некотором достаточно малом промежутке времени. Основной целью настоящей работы является устранение этого недостатка.

Вспомогательные задачи . Прежде всего, опишем первую проц едуру построения оценок решения нелинейно-квадратичных задач оптимального управления, фактически лежащую в основе последующих построений.

Следуя [4], для всех значений N = 0,1,2,... рассмотрим вспомогательную задачу о минимизации функционала

T

J N+1 (u)= 1 [ e(t),Qe(t) + 2t0

+ u((t),Ru(t)} ] dt + 1{e(T),Pe(T)}     (4)

с ограничением

  • Х N + 1 = Ax N + 1 + BU N + 1 + f ( X N , U N X     (5)

X N + 1 ( t 0 ) = c .

Для заданных функций xN и uN оптимальное управление uN + 1 ( t ) в задаче (4), (5) дается законом управления с обратной связью

U n + 1( t ) = R -1 B T h N + 1( t )- K ( t ) X n + 1( t )], (6) где xN + 1( t ) - решение уравнения (5), соответствующее uN + 1( t ) и удовлетворяющее начальному условию xN + 1( 1 0) = c ; K(t) - решение матричного дифференциального уравнения Риккати

K I ( t ) = - K ( t ) A - A K ( t ) +

+ K ( t ) BR -1 B'K ( t )- Q с граничным условием

K(T) = P,(8)

а     hN+1( t)     - решение линейного дифференциального уравнения hN+1 (t) = -[A - BR-1B‘K(t)]‘hN+1 (t) -

  • - Qz ( t ) + K ( t ) f ( X n ( t ), U n ( t )) с граничным условием

hN+1(T) = Pz (T).(10)

Таким образом, если начальное приближение     x0( t), u 0( t)     задано,     то соотношения (4)-(10) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях T позволяет установить существование решений задачи (1) - (3) и дает эффективную процедуру построения этих решений. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями x0( t) nc                     (11)

и u 0( t) nR-1B ‘[ Pz (T)- K (t) c ].         (12)

Построение закона оптимального управления. Пусть X(t) и H(t) - решения линейных матричных дифференциальных уравнений

X = [ A - BR -1 B'K ( t )] X , X ( 1 0) = E

и

H = n - [ A - BR -1 B'K ( t )] ' H , H ( T ) = E , где E - единичная (n*n) -матрица. Тогда при использовании (6) уравнение (5) эквивалентно уравнению

X n + , ( t ) = X ( t ) c + J X ( t - т ) x

1 0                                   (13)

x[BR-1B‘hN+1 (t) + f (Xn (t), un (t))] dT, а уравнение (9) с граничным условием (10) -уравнению hN+1( t) = H (t) Pz (T ) +

t

+ J H ( t - T )( K ( t ) f ( X n ( т X u N ( t ))- Qz ( t )) d T . (14) T

Принимая во внимание (14), перепишем уравнение (13) в следующем эквивалентном виде:

X N + 1 ( t ) = X ( t ) c +

+ J [ X ( t - т ) f ( xN ( t ), u n ( t )) + BR -1 B'H ( t ) Pz ( T ) + t 0

+ J X ( t - т ) BR 1 B'H ( t - 5 )( K ( 5 ) f ( X n ( 5 ), u n ( 5 )) - T

  • -    Qz ( 5 )) d5 ] d T .

Тогда с учетом (6) система (13), (14) может быть представлена в виде

Xn+1 (t) = X(t)c + J [f1 (t,t,Xn (t), hN (t)) + t0

T

+ J f , ( t , 5 , X n ( 5 ), h N ( 5 )) d5 ] d T , (15)

T hN+1( t) = H (t) hо +

T                          (16)

+ J f ; ( t , t , X n ( t ), h N ( t )) d T ,

t где hо = Pz (T), f,( t,T, xN (t ), hN (t )) =

= X ( t - t )[ f ( X n ( t ), R -1 B [ h N ( t )-

- K T ) x N ( t )]) +

+ AR1A /H (t)Pz(T)], fз( t,T, xN (t ), hN (t )) =

  • =    H ( t - t )( K ( t ) f ( xN ( t ), R -1 B '[ hN ( t )-

  • -    K ( t ) xN ( t ))]- Qz ( t )),

  • f , ( T , 5 , xN ( 5 ), hN ( 5 )) = - X ( t - T ) BR -1 B ‘x X f 3 ( t , T , x N ( 5 ), hN ( 5 )).

Пусть теперь a - некоторое положительное число. Обозначим через X -множество точек (t, x, h) е R1+2n, для которых выполнены неравенства tо < t < T, | x - c |< a, | h - ho |< a,          (17)

где | x | - евклидова длина вектора x . Так как X - компактное множество, то найдется такое положительное число M , что для всех значений t,x и h , удовлетворяющих условиям (17), при t0 ^ т ^Т выполнено неравенство

| f ( t , t , x , h )| < M , I = 1,2,3.    (18)

Обозначим через Q множество всех непрерывных пар     (x,h)     функций, определенных на отрезке [t0,T], принимающих значения в пространстве Rn и при t0 ^ t ^ Т, удовлетворяющих условиям lx(t)-cha, lh(t)-h0l^a,       (19)

т.е. Q - множество непрерывных пар (x,h) функций, графики которых лежат в X . При этом будем рассматривать часть Q 1 множества Q , такую, что наряду с неравенствами (19) при (x,h) E Q T выполнялись бы также неравенства

| X ( t ) c - c < 2 | H ( t ) h o - h o < a         (20)

и

| x ( t )- X ( t ) c < a , | h ( t )- H ( t ) h o < a (21)

Тогда в силу неравенств lx(t) - cl^ix(t) - X(t)cl + lX(t)c - Cl

и

| h ( t )- h 0 < | h ( t )- H ( t ) h o | + | H ( t ) h o - h o | из условий (2O) и (21) следуют неравенства (19) и, таким образом, принадлежность пары (x,h) к множеству Q .

Для всех значений t0 t T положим ^ (t) = (x(t),h(t))

и будем говорить, что ф EQ T , если (x,h) EQ T .

Обозначим через F оператор, задаваемый правыми частями системы (15), (16). Если число Т достаточно мало, то из принадлежности ф к Q t следует принадлежность к Q T и функции

Ф *=F ф ,               (22)

где ф =(x ,h ) .

В самом деле, для того чтобы функция ф , задаваемая соотношением (22), принадлежала к множеству Q t , достаточно, чтобы при выполнении условия (2O) для всех значений t0 t T были выполнены также и неравенства

*                а *■                 а

| x ( t )- X ( t ) c < - , | h ( t )- H ( t ) h o < -.

Но в силу (15), (16) и (18) имеем

| h ( t )- H ( t ) h oh

T J t

[ f з( t , t , x ( t ), h ( t )) ] d T <

< M (T - 1 o )

и

| x ( t )- X ( t ) c |= J [ f X t , t , x ( t ), h ( t )) + t o

T

+ J

t

f , ( t , t , 5 , x ( 5 ), h ( 5 )) ds ] d T < M (( T - 1 o) + 1)( T - 1 o).

Отсюда следует, что при

M (( Т - 1 o ) + 1)( T - 1 o ) -             (23)

условие, предъявляемое к оператору F в (22), выполнено.

Для всех значений t0 ^t ^Т и N = O,1,2,_ положим фN(t) = (XN(t),hN(t)) и построим последовательность функций

Ф о , Ф 1 ,, Ф N ,...,                          (24)

определенных и непрерывных на отрезке [to,T] , в силу системы (15), (16), приняв

V n + 1 = F V n , N = 0,1,2,...         (25)

т.е. u (t) - оптимальное управление в задаче

и

Ф о (t ) - ( c , h o ).                      (26)

Поскольку функция (23) принадлежит к множеству Q T , то согласно равенству (22) все функции последовательности (24) также принадлежат к Q T .

Рассмотрим функциональное уравнение

Ф = Р ф .                (27)

Поскольку оператор F отображает множество Q T в себя, одна из его итераций является сжатием [10]. Поэтому уравнение (27) имеет на множестве Q решение ф , которое может быть получено по формуле *

Ф ( t ) = lim V n ( t ),            (28)

N→∞ где сходимость равномерна на отрезке [t0, T] [10, С. 12].

Но так как по построению h0=Pz(T), то согласно (26) последовательность (25) удовлетворяет начальным приближениям (11) и (12). Поэтому из равенств (6) и (28) следует существование функций u (t) и x (t), построенных по формулам *

lim U n ( t ) = u ( t )                (29)

N→∞ и *

lim xN ( t ) = x ( t ),              (30)

N→∞ где сходимость равномерна на отрезке [t0, T].

Поэтому функция x (t) является соответствующим u (t) решением уравнения (1) с начальным условием x (t0 )=c.

Более того, по построению

* lim J N ( U n ) J ( u )

N →∞

и

JN(uN) ≤JN(u) T для всех u Е L2 , откуда и следует, что для каждой функции u ∈LT2

*

lim JN ( uN ) = J ( u ) lim JN ( u ), N →∞               N →∞

(1)-(3).

Результирующая теорема. Согласно равенствам (29) и (30) уравнение (16)

переходит в уравнение

h *( t ) = -[ A - BR -1 B'K ( t )] h *( t ) - Qz ( t ) +

+ K ( t ) f ( x *( t ), u *( t ))

с граничным условием

h*(T) = Pz(T).           (32)

Аналогичным образом закон управления (6) - в закон управления u (t) = R 1B‘[h (t)- K(t)x (t)].    (33)

Предположим,         что         на множестве,задаваемом неравенствами t0 < t

IX (t) c - c\< a, \H (t) h0- h0^ a, функции f и f удовлетворяют неравенствам 1        3

lfi(t,T,x,h) l

10 < t 0 0 < s

\ x (t)-c\< a, \h (t)-h0< a функция f2 неравенству

| f2 (t, s, x, h)\< I .

Тогда имеет место следующая теорема. Предположим, что число Т удовлетворяет условию

M ((T -10) +1)( T -10) a.           (34)

Тогда задача (1) - (3) имеет решение x*(t),u*(t). При этом, оказывается, что при t0 ^t ^T справедлив закон управления (33).

Таким образом, установленная выше теорема дает решение задачи (1)-(3) в виде закона управления с обратной связью (33). При этом неравенство (34) определяет оценку границы существования такого решения.

ВестникВГУИТ, № 3, 2012

Статья научная