Минимизация вырожденного квадратичного функционала на траекториях квазилинейной системы
Автор: Андреева И.Ю., Гредасова Н.В., Сесекин А.Н.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Теоретическая механика
Статья в выпуске: 4, 2025 года.
Бесплатный доступ
В работе рассматривается задача минимизации вырожденного квадратичного функционала на траекториях квазилинейной управляемой системы. Особенность задачи состоит в том, что решение задачи существует в пространстве обобщенных функций. Для исходной задачи строится вспомогательная задача. Её решение существует в пространстве абсолютно непрерывных функций. Для ее решения применяются методы разложения по параметру и принцип максимума Л. С. Понтрягина. В результате конечного числа итераций строится субоптимальное управление для вспомогательной задачи. С помощью этого управления конструируется субоптимальное управление для исходной задачи. Это управление имеет импульсные составляющие, сосредоточенные в начальный и конечный моменты. Между этими моментами управление является непрерывной функцией. Построенное управление является программным. С его помощью можно построить позиционное управление, которое в случае воздействия возмущений на систему будет по- рождать импульсно-скользящий режим.
Вырожденная линейно-квадратичная задача, асимптотически оптимальное управление, импульсные воздействия
Короткий адрес: https://sciup.org/148332488
IDR: 148332488 | УДК: 517.977 | DOI: 10.18101/2304-5728-2025-4-40-52
Текст научной статьи Минимизация вырожденного квадратичного функционала на траекториях квазилинейной системы
Системы, содержащие малый параметр при нелинейных членах в правой части дифференциальных уравнений, широко используются при решении различных задач. В теории оптимального управления также есть немало работ, посвященных задачам управления объектами, описываемыми квазилинейными дифференциальными уравнениями (см. например, [1] и библиографию этой книги). Задача оптимизации квадратичного функционала на траекториях квазилинейной системы рассматривалась в [2] . В статье рассмотрим задачу оптимизации вырожденного квадратичного функционала на траекториях квазилинейной системы. Будет показано, что субоптимальным управлением, решающим эту задачу, будут управления, содержащие импульсные составляющие.
1 Постановка задачи
Рассматривается квазилинейная система дифференциальных уравнений
x ( t ) = A ( t ) x ( t ) + ^f ( x, t ) + B ( t ) V ( t).
Мы будем минимизировать вырожденный квадратичный функционал
J [ u (')l = 1 / 2
t f
У xT ( t ) Q (t) x ( t ) dt
вдоль траекторий системы (1) . На допустимые траектории системы (1) будем накладывать граничные условия
x ( t o ) = x o , x t f = 0 .
Здесь решение системы (1) x(t) есть n-мерная функция ограниченной вариации, управление v(t) — m-мерная вектор-функция ограниченной вариации (при этом полагаем, что v(to) = 0), производные в (1) понимаются в смысле теории обобщенных функций, µ — малый параметр, to и tf —заданные начальный и конечный моменты времени, f (x,t) — нелинейная n-мерная вектор-функция, A(t) и Q(t) есть непрерывные nxn матрицы, при этом Q(t) является симметричной и неотрицательно определенной. Матрица B(t) является непрерывно дифференцируемой n x m-матрицей-функцией. Отметим, что частный случай этой задачи докладывался на конференции [5].
Как отмечалось выше, задача (1) — (3) в классе измеримых управлений решения не имеет. При ^ = 0 задача (1) — (3) рассмотрена в [3, 4] .
2 Построение вспомогательной задачи
Далее будем предполагать, что матрица B ( t) имеет структуру
—
B ( t ) =
B ( t )
где B ( t ) — m x m непрерывно дифференцируемая невырожденная матрица, 0 — нулевая ( n — m ) x m матрица. Будем обозначать первые n — m вектора x через X и последние m координат этого вектора через X. Также далее будем предполагать что вектор-функция f ( x, t ) будет зависеть не от всего вектора х, а только от его первых n — m координат, т. е.
f ( x,t ) = f 1 ( x,t ) .
Исходная задача является вырожденной и в классе измеримых функций решения не имеет. Сделаем в задаче (1) , (2) , (3) редукцию с помощью замены
y ( t ) = x ( t ) — B ( t ) v ( t ) .
Эта замена применялась при построении расширений задач оптимального управления, в частности, в [3] , [4] , [6] , [7] , [8] .
Выполняя замену (5) в задаче (1), (2), (3), получим следующую вспомогательную задачу. Требуется минимизировать функционал tf
J [ u () = 1 / 2
J [yT (t)Q(t)y(t) + 2vT (t)BT (t)Q(t)y(t)+ t0
+ vT ( t ) B ( t)T Q ( t ) B ( t ) v ( t )] dt (6)
вдоль траекторий системы дифференциальных уравнений
y ( t ) = A ( t ) y ( t ) + ^f i (y , t ) + B i ( t ) v ( t ) , (7)
где
B i ( t )= A (t) B ( t ) — B ( t ) , а согласно (5) и (4) f ( x,t ) = f ( y,t ) .
Краевое условие при t = t o будет иметь вид y ( t o ) = x o (v ( t o ) = 0 ) и при t = t f
y ( t f ) = - B ( t f ) v ( t f ) . (8)
Учитывая структуру матрицы (5) из (8) , имеем, что первые n - m координат вектора y ( t f ) будут нулевыми. Следовательно, не накладывая никаких ограничений на y ( t f ) , условие (8) можно всегда обеспечить, полагая
v ( t f ) = - B - 1 ( t f ) y ( t f ) . (9)
Таким образом, краевое условие x(t f ) = 0 исходной задачи во вспомогательной задаче превращается в условие y ( t f ) = 0 , а остальные координаты вектора y ( t f ) могут быть произвольными. Для исходной задачи условие (9) означает, что последние n - m координат вектора x ( t f ) будут зануляться за счет импульса в конечный момент.
Как ив [2] , при у, = 0 задача минимизации функционала (6) вдоль траекторий системы (7) будет называться базовой.
Пусть v 0 ( t ) , y 0 ( t ) — оптимальное управление и оптимальная траектория в базовой задаче (t G [ t o ,t f ] ). Согласно принципу максимума [9] существует решение сопряженной системы
^ ( t ) = - A T ( t ) ^ ( t ) + Q ( t )y°( t ) + Q ( t ) B ( t ) v 0 ( t ) , соответствующее v 0 ( t ) , y 0 ( t ) , которое будем обозначать как ^ ° ( t ) . Для этого решения выполняется следующее условие:
< ( t ) B i ( t ) v0 ( t )- 2 v 0T (t) B(t)T ( t ) Q ( t ) B ( t ) y o ( t )- v o T ( t ) BT ( t ) Q ( t)B (t) v° ( t ) =
= max(^0T (t)Bi(t)v(t)-1 vT (t)B T (t)Q(t)B (t)y0(t)-vT (t)B T (t)Q(t)B(t)v (t). veRm
Из этого условия в предположении, что det BT(t)Q(t)B(t) = 0 Vt G [to,tf], можно найти оптимальное управление в базовой задаче v0(t) = (BT(t)Q(t)B(t))-1(BT(tW0(t) - BT(t)Q(t)y°(t)).(10)
Пусть p o = ^ o ( t o ) , тогда y 0 ( t ) , ^° ( t ) , t G [ t o ,t f ] есть решение следующей начальной задачи:
y(t) = (A(t) - M(t)BT(t)Q(t))y(t) + M(t)B1 (t)^(t),(11)
^(t) = (Q(t) - N(t)BT(t)Q(t))y(t - (AT(t) - N(t)BT№(!),(12)
где
M ( t ) = B i (t)( B T ( t ) Q (t) B ( t ))-1 , N ( t ) = Q ( t ) B ( t )( BT ( t ) Q ( t ) B ( t )) - 1 . (13)
Обозначим через F ( t, s' ) фундаментальную матрицу этой системы. Эта матрица будет являться решением такой начальной задачи
F = A(t)F, F (to) = E2n, где
Ш = ( A ( t - M ( t ) B T (Ж® ( t ) V Q ( t ) - N ( t ) B T ( t ) Q ( t )
M ( t ) B l ( t ) - ( AT ( t ) - N ( t ) B l ( t ))
( F 11 F 12 \
F 21 F 22
Для произвольной матрицы G, содержащей n строк, обозначим через G первые n - m строк матрицы G и через G — последние m строк матрицы G. В результате матрицу перепишем в виде
F ( t,s ) =
/ F ii ( t,s ) F ii ( t,s) F 2i ( t,s ) \ Fi^s)
F i2 ( t,s ) \
F i2 ( t, s )
F 22 ( t, s )
F 22 ( t, s )
С учетом введенных обозначений решение системы (11) , (12) можно
записать в виде
( y( t ) \ Ft) F t t )
\ ^( t ) /
/ F ii ( t,t o ) F i2 ( t,t o ) \ / y ( t o ) \
F ii ( t,t o ) F i2 ( t,t o ) y ( t o )
F 2i ( t,t o ) F 22 ( t,to' ) p
\ F2i ( t,t o ) F 22(t,to') / \ P J
Учитывая, что y(t f ) = 0 и ^ ( t f ) = 0 , из (14) следует
( yt t o ) \ y ( t f ) \ = ( F ii ( t f ,t 0 ) F i2 ( t,t 0 ) \ y t t o )
F ( t f ) J \ F 2i ( t f ,t o ) F 22 ( t,t o ) J p
\ p )
где 0 n — нулевой n-мерный вектор. В предположении, что
F i2 ( t f , t o )
F 22 ( t f , t o )
из (15) мы можем найти начальное условие для сопряженной перемен- ной p = - ( Fi2(tf,to) \-1 ( Fii(tf,to) \ ( y(to) \
V F22(tf ^o') / V F2i(tf ,to') / \ y(to) / в базовой задаче.
3 Решение вспомогательной задачи
Теперь рассмотрим задачу минимизации функционала (6) на траекториях системы (7) . Применим принцип максимума [9] к этой задаче.
H ( У, ^, v, t ) = ^ T ( AtMt ) + f ( У, t ) + B i ( t ) v ( t )) - 1 / 2 ( y T ( t ) Q ( t)y ( t ) +
+2 vT ( t ) BT ( t ) Q ( t ) y ( t ) + V T ( t ) B ( t )T Q ( t ) B ( t ) v ( t ) ) .
Сопряженная система будет следующей
t ( t ) = Q ( t ) y ( t ) + Q ( t ) B ( t ) v ( t ) - (а{) + fy^V^ ( t ) . (17)
∂y
Из условия максимума функции H ( y,^,v,t ) по v получим, что экстремальное управление в этой задаче будет иметь вид (10) , т. е. совпадать с оптимальным управлением в базовой задаче. Этот факт является следствием того, что функция f i ( y,t ) не зависит от управления v.
Подставим управление (10) в (6) и (17) . Получим систему уравнений
y ( t ) = ( A ( t ) - M (t)BT ( t ) Q ( t )) y ( t ) + fy,t ) + M ( t ) B 1 ( t ) t ( t ) , (18)
t ( t ) = ( Q ( t ) - N ( t ) BT ( t)Q ( t))y (t)
- [ T ( t ) + y ( fd^ T — N ( t ) B T ( t)} t ( t ) . (19)
Рассмотрим задачу Коши (18) , (19) с начальными условиями y ( t o ) = x o , t ( t o ) = p. При сделанных выше предположениях найдутся такие e o и µ 0 , при которых задача (18) , (19) будет иметь единственное решение y ( t,p,y ) , ^ ( t,p,y ) , t G [ t o ,t f ] при выполнении условий ||p - p o k < e o , | µ | < µ 0 .
Теорема. При сделанных ранее предположениях относительно задачи (6) , (7) при достаточно малых µ существует единственное оптимальное управление:
v°(t) = (BT(t)Q(t)B(t))-1 (BT(t)^(t,p(y),y) - BT(t)Q(t)y(t,p(y),y)) , t G [to,tf], yi(tf,p,p) = 0,i = 1,2,..., (n - m),tj (tt^p) =0, j = n - m + 1, ...,n, p(y) G Cl, p(0) = po.
Доказательство теоремы аналогично доказательству аналогичного результата в [2] и поэтому здесь не приводится.
Пользуясь алгоритмом, представленным в статье [2], продолжим изложение построения приближенного решения исходной задачи. Пусть задано натуральное число K и K < l. Так как v(») G Cl и v(0) = vq, то имеет место равенство p(») = p^K^») + o(»K), где
K
P(K Ч)) = PQ + X PkPk k=i есть полином Тейлора K-й степени. Тогда вектор-функция
V K Kt,» ) = (bt ( t ) Q ( t ) B ( t )) -1 ( n 1 ( t)^ ( t,p ( K4 p),p )
-BT ( t ) Q ( t ) y ( t,p ( K4 »' ) , » ) )
будет приближенным управлением K -го порядка во вспомогательной задаче. Далее будем рассматривать процедуру нахождения коэффициентов p k , k = 1 ,...,K из разложения (18) , изложенную в статье [2] . Согласно алгоритму из [2] следует разложить левую часть уравнений
y ( t f ^p) = 0 ,^ ( t f ,P,» ) = 0 (20)
по степеням малого параметра, применяя классическую технику Пуанкаре к системе (18) , (19) . Вектор-функции y ( t,p,» ) , ^ ( t,p,p ) в каждой точке области определения имеют частные производные по µ до порядка q включительно. Следовательно, y ( t,p,» ) и ^ ( t,p,p ) представимы в виде
K
У^Р,») = X»k Ук (t,P) + o(PK), k=Q
K
^ ( t,p,» ) = X »^ k ( t,p )+ o ( » K ) . (21)
k =Q
Используя метод Пуанкаре, составим дифференциальные уравнения для yk (t,p) и ^k (t,p), k = 1,...,K при фиксированном p.
y o ( t,p ) = ( A (t)- M ( t ) B T ( t ) Q ( t )) y o ( t,p )+ M ( t ) B T ( t ) ^ o ( t,p ) , y o ( t o ,p ) = x q ,
4 Q ( t,P ) = ( Q ( t ) - N ( t ) B T ( t ) Q ( t )) y Q ( t,P )
— A(t) — N(t)BT(t) ^o(t,p), ^o(to,p) = p, yi(t,p) = (A(t) - M(t)BT(t)Q(t))yi
+ f i ( Уо^ ) + M ( t ) B i ( t ) ^ 1 (t,p' ) , y i ( t Q ,p ) = 0 ,
4 i ( t,p ) = ( Q ( t ) - N (t)BT( t ) Q ( t )) y i ( t,p )-
- ( A T ( t ) — N ( t ) B T ( t ) ) ^ 1 ( t,p ) - ( fy^ T ^ o ( t,p ) , ^ 1 ( t o ,p ) = 0 , (22)
y 2 ( t,p ) = ( A ( t ) - M ( t - BT ( t - Q(:t' -- У 2 (t’P - + df 1 ( y0At - y 1 ( t,p )+ ∂y
+M(t)B1 (t)^2(t,p), , y2(t0,p) = 0, ih(t,p) = (Q(t) -N(t)BT(t-Q(t--y2(t,p) - (AT(t) - N(t-BT(t)) ^1(t,p)-
-( df 1 (y 0 ’t) ) T ^ i ( t,p ) - ^ T ( t,p ) - ( dfy^y i ( t,p ) , ^ 2 ( t o ,t ) =0 и так далее.
Из приведенных выше систем (22) видно, что нахождение коэффициентов в представлениях (21) при заданном p сводится к последовательному решению начальных задач для систем линейных дифференциальных уравнений. В силу (21) левая часть уравнения (20) предста- вима в виде
K
Rfa^ = X P k R k ( P ) + o ( ^ K ) .
k=1
Здесь R k ( p ) = y k ( t f ’P ) k = 0 , ...,K. Составим системы линейных уравнений для векторов p k , к = 1 , ...,K. В соответствии с алгоритмом, изложенным в [2] , применим здесь метод неопределенных коэффициентов. Разложим в ряд вектор-функцию P K =1 P k R k ( P k )( p— по степеням p до порядка N . Затем приравняем коэффициенты разложения. В результате получим следующие невырожденные системы линейных уравнений для последовательного нахождения векторов V k , к = 1 ,...,N :
∂R 1
F 12 ( t 0 ’t f ) P 1 = - R 1 ( P 0 ) ’ F 12 ( t 0 ,t f ) P 2 = - R 2 ( P 0 )--dp ( P 0 ) P 1 ’ ... (23)
Для построения правых частей этих систем необходимо знать значения функций y k ( t,p) и их частных производных по компонентам вектора p в точке ( t o ,p o ) . Искомые значения получаются в результате интегрирования уравнений (22) . Начальные задачи для производных получаем в результате дифференцирования этих же уравнений. Приведем пример для производной функции y 0 ( t, p ) :
d ∂y 0 dt ∂p
d ∂ψ 0 dt ∂p
A ( t ) д о + BMP - 1 ( t ) B 2 ( t ) ^ ’ . (< « ) = 0 ’
Q(t)dp + [Q(t)B^P-1(t)B2(t) - AT(t)]dp0’ d? (to) = E ∂p
При вычислении правых частей систем (22) должны выполняться равенства y o ( t,v o ) = y o ( t ) , ф o ( t,v o ) = ф^ ) , t G [ t o ,t f ] . Тогда R i ( v o ) = y o ( t f ) , а вектор-функции y 0 ( t ) , ф у фф являются решениями задачи:
y i ( t ) = A ( t ) y i ( t ) + f i (-Mt ) ,y o ( t ) ,t) + B i ( t ) P - 1 ( t ) B 2 ( t ) ^ i ( t ) , y i ( t o ) = 0 ,
Ф i ( t ) = Q ( t ) y i ( t) + [ Q ( t ) B ( t ) P -i ( t ) B 2 ( t ) - A T ( t )] ф 1 ( t )-
- dh ( ^ 0 (^,У 0 ( t ) ,t ) , ^ i ( t o ) = 0 . ∂y
В результате последовательного решения системы (22) находим p k , к = 1 , ...,N и строим полином p ( NЧц)- Управление v N( t, ц ) является приближенным управлением N -го порядка во вспомогательной задаче. Теперь необходимо решить задачу при p = p( N Чц)- Тогда
^(t,v(N Чц)ц = Ф^)(t, ц) + o(^N), где
N
Ф^4t,P ) = X ц к ^ k ( t ) , t G [ t o ,t f ] .
k=o
Величины ^ k ( t ) определяются путем последовательного решения задач Коши, отличающихся от (22) только начальными условиями для ф k : ф k ( to) = V k , к = 0 ,..., N . Управление
v (N Ч^ц ) = P - i ( t ) B2 ( t),/ N \фц\ t G [ to,t f ] (24)
вместе с V N Ч^ц ) является приближенным управлением N -го порядка во вспомогательной задаче. Так как ф ) ( t,ц ) = Ф° ( Ф ) , t G [ t o ,t f ] , то v (0) ( t,ц ) = ^( t ) является решением базовой задачи и приближенным управлением нулевого порядка во вспомогательной задаче. Аппроксимация управления первого порядка представимо в виде:
v (1) ( t,ц )= P - i ( t ) B 2 ( t)^ o ( t ) + ц ( ф 1l ( t ) + F 22 ( t,t o ) v i )) , t G [ t o ,t f ] .
Коэффициенты полиномов, с помощью которых строятся приближенные управления, зависят от начального состояния исходной системы. При построении приближенных управлений нулевого и первого порядка эта зависимость будет учтена. Далее будем считать, что выполнено условие det F i2 ( t f ,t o ) = 0 при всех to < t f . Момент t f будем считать также заданным. Из формулы (16) следует, что
P o ( y^,t o ) = - Fi2(t f ,to)F ii ( t f ,t o ) yo.
Согласно (24) имеем
v (0) ( t,y o ,t o )) = P - 1 ( t ) B 2 ( t ) ^ ( O) ( t,y o ,t o ) , t € [ t o ,t f ] .
А так как ^ (0) ( t o , y o , t o ) = p o ( y o ,t o ) , то
u (o) ( t o ,y o ,t o )) = P - 1 ( t ) B 2 ( t ) v o ( y o ,t o ) .
Поскольку (yo,to) — произвольное начальное состояние, то вектор-функция vW(y,t) = -P - и,. - i 2 f ,t)Fu(tf ,t)y представляет собой оптимальное управление типа обратной связи в базовой задаче. Для всех t < tf справедливо равенство F(tf ,t) = G(t), где матрица
G ( t ) =
G ii ( t ) G i2 ( t ) \
G 21 ( t ) G 22 ( t )
является решением краевой задачи
G = - GA ( t ) , G ( t f )= E ,n .
Поэтому асимптотически субоптимальная обратная связь нулевого порядка может быть записана в виде
v (04 y,t ) = - P - 1 ( t ) B 2 ( t ) G - 1 ( t ) G ii ( t ) y.
Асимптотически субоптимальная обратная связь первого порядка представима в следующей форме:
v(14y,t) = -P-1(t)B2(t)G-21(t)Ri(y,t), где
t f
Rifat ) = y i ( t f ,y,t ) = J ( G 11 ( T ) f ( u,C i ( T,t ) y,T ) -
- G 12 ( t ) Jh ( C 1 ( T, tfa C 2 ( т, tfa T )) dT, ∂y
C 1 ( t,t 0 ) = F 11 ( t,t 0 ) — F 12 ( t,t 0 ) G12 ( t 0 ) G 11 ( t 0 ) , C 2 ( t,t o) = F 21 ( t,t 0 ) — F 22 ( t,t 0 ) G - 2 ( t 0 ) G 11 ( t 0 ) .
Последовательно будет построено субоптимальное управление вспомо- гательной задачи v(N)(y(t),t).
4 Субоптимальное управление в исходной задаче
Для построения субоптимального решения исходной задачи нужно продифференцировать полученное решение вспомогательной задачи в смысле теории обобщенных функций. Учитывая, что v(N)(y(t),t) = 0 при t < to, дифференцируя функцию v(N)(y(t),t), получим субоптимальное управление для исходной задачи. Оно будет иметь вид vn(t) = AtoVN(to,x(to),^(t-to')+vNr>(t, P) + Atf VN(tf, x(tf ),p)S(t-tf ),
(25) где 6 ( t ) — дельта-функция Дирака.
В (25) первое слагаемое A t 0 v n ( t o ,x ( t o) , ^ ) определяет интенсивность импульсного воздействия, реализуемого в начальный момент, которое обеспечивает начальный скачок траектории. Слагаемое vj N ( t, ^ ) является непрерывной функцией и осуществляет управление системой на интервале ( t o , if ) • В конечный момент управление с помощью импульса сделает нулевыми последние n - m координат фазового вектора.
Управление (25) является программным. Переход к позиционному алгоритму управления приведет к появлению импульсно-скользящих режимов [10] .
Заключение
В работе предложена рекуррентная процедура построения субоптимального управления. Особенность задачи состоит в том, что искомое управление имеет импульсные составляющие. Сначала строится вспомогательная задача, решение которой существует в классе кусочно непрерывных управлений. С помощью решения вспомогательной задачи строится субоптимальное решение исходной задачи.