Один подход к улучшению управления в системах с ограничениями на основе краевой задачи
Автор: Трунин Д.О.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 3, 2023 года.
Бесплатный доступ
Рассмотрены нелинейные по состоянию задачи оптимального управления при наличии дополнительного ограничения на фазовую траекторию терминального типа. Для рассмотренных задач предложен новый подход к улучшению допустимых управлений на основе точной формулы приращения функционала Лагранжа с помощью решения специальной краевой задачи, которая является существенно более простой, чем краевая задача принципа максимума. Для ее решения предлагается специальный итерационный процесс на основе последовательного решения задач Коши и определения вспомогательного множителя из условия выполнения функционального ограничения. В отличие от большинства стандартных численных методов задач оптимального управления (игольчатой линеаризации, условного градиента) предлагаемый подход не использует операцию изменения по малому параметру в окрестности текущего приближения. Кроме того, он обладает возможностью строгого улучшения неоптимальных экстремальных управлений.
Динамическая управляемая система, терминальное ограничение, улучшение допустимого управления, краевая задача, итерационный метод
Короткий адрес: https://sciup.org/148326990
IDR: 148326990 | DOI: 10.18101/2304-5728-2023-3-70-77
Текст научной статьи Один подход к улучшению управления в системах с ограничениями на основе краевой задачи
В работах [1–4] построены специальные методы улучшения допустимых управлений для задач оптимального управления со свободным правым концом (как линейных, так и нелинейных по фазовому состоянию) на основе точных формул приращения функционала с использованием модификации сопряженной системы.
В работе [5] предложены процедуры улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления при наличии дополнительных ограничений на фазовую траекторию терминального типа на основе специальной задачи о неподвижной точке.
В данной статье для нелокального улучшения допустимых управлений для задач с ограничениями предлагается подход, основанный на решении специальной краевой задачи.
-
1 Постановка задачи
Рассматривается задача оптимального управления x = A(x,t)u + b(x,t), t gT = [t0, t1 ], x(t0) = xs, u(t) g U c Rr, t gT, (1) Фо(u) = ф(x(ti)) + JT({d(x,t),u) + g(x,t))dt ^min, (2)
Ф 1 ( u ) = x ( x ( t 1 ) ) = 0. (3)
Используются стандартные обозначения x ( t ) g R ” — состояние, u ( t ) g Rr — управление, t 0, t 1 — заданные числа, t 0< t 1, x s g R ” — заданный вектор; U c Rr — выпуклый компакт в Rr .
Определим множество (доступные управления)
V = { u g PC ( T ): u ( t ) e U , t e T } .
Для управления v g V обозначим через x ( t , v ), t g T соответствующую ему фазовую траекторию.
Множество допустимых управлений
W = { u g V : x ( x ( t 1 , u ) ) = 0}.
Функция Понтрягина имеет вид
H ( p , x , u , t ) = H 0 ( p , x , t ) + H 1 ( p , x , t ), u ), где
-
H 0 < p , x , t ) = ( p , b ( x , t )) - g ( x , t ), H 1 ( p , x , t ) = A ( x , t ) T p - d ( x , t ).
Функционал Лагранжа
L ( u , Л ) = Ф 0( u ) + Я Ф 1( u ), 1g R .
Нетрудно видеть, что для допустимого управления u
L ( u , Л ) = Ф 0( u ).
Пусть u 0 g V , v g V .
Формула приращения:
A v L ( u 0, Л ) = - [ ( H 1 ( p ( t , u 0, v , Л ), x ( t , v ), t ), v ( t ) - u °( t )) dt , (4)
T где p(t, u0,v, Л), t g T — решение модифицированной сопряженной системы [3].
Пусть u 0 g W . Для этого управления поставим задачу: найти управление v g W такое, что
Ф 0 ( v ) -Ф 0 ( u °).
-
2 Подход улучшения
Для фиксированного параметра a > 0 определим вектор-функцию u a ( p , x , t ) = P U ( u 0( t ) + a H i( p , x , t ) ) , p e R n , x e R n , a > 0, t e T , где P U — оператор проектирования на множество U .
Имеет место оценка [1]
-
j^^ H i( p , x , t ), u a ( p , x , t ) - u 0( t )^ dt > — j^| u a ( p , x , t ) - u 0( t )|| dt .
Тогда из (4) и (5) следует оценка приращения функционала
A vL ( и °, Л ) < - — £ |u a ( p , x , t ) - u 0( t )| 2 dt .
На основе формулы приращения (4) для улучшения допустимого управления u 0 предлагается следующий подход.
Рассмотрим краевую задачу улучшения x = A(x,t)ua (p,x,t) + b(x,t), t e T = [10, /1 ], x(10) = xs, p = - Hx ( p, x( t, u °X u 0( t X t )- r ( tX
/Hx ( p , x ( t , u °), u °( t ), t ) , x ( t ) - x ( t , u °)\ + ( r ( t ), x ( t ) - x ( t , u °)) =
' „ ’ „ \ (7)
= H ( p , x ( t ), u ( t ), t ) - H ( p , x ( t , u ), u ( t ), t ) ,
p ( t i ) = ф/ ( x ( t i , u 0) )- "X x ( x ( t i , u 0) )- q ,
^Ф x ( x ( t i , u °) ) + Л/ x ( x ( 1 1 , u °) ) , x ( t i ) - x ( t i , u °)^ + qq , x ( t i ) - x ( 1 1 , u °)^ =
= ф ( x ( t i ) ) - ф ( x ( t i , u °) ) + Л ( % ( x ( t i ) ) - x ( x ( t i , u 0) ) ) .
x ( x ( t i ) ) = 0.
Пусть (Л,xx (t), px (t)), t e T — решение задачи (7). Сформируем управление
v ( t ) = u a ( p x ( t ), x " ( t ), t ), t e T .
Выходное управление v является допустимым и обеспечивает невозрастание функционала Лагранжа
L ( v , Л ) < L ( u 0, Л ).
В силу допустимости управлений u 0, v имеем
A v Ф 0( u 0)< - — — J T||v ( t ) - u 0( t f dt .
К решению задачи (7) применяется специальный итерационный процесс с индексом к > 0
xк + i ( t ) = A ( xk + i ( t ), t ) ua ( p + i ( t ), xk + i ( t ), t ) + b ( xk + i ( t ), t ), t e T = [ 1 0 , 1 1 ] ,
x(t 0) = xs, pk+i(t) = -Hx (pk+i(t),x(t,u°),u0(t),t)-r(t),
H x ( p k ( t ), x ( t , u °), u °( t ), t ) , x k ( t ) - x ( t , u °)^ + Г( ( t ), xk ( t ) - x ( t , u °)^ = = H ( p k ( t ), x ( t ), u 0 ( t ), t ) - H ( p k ( t ), x ( t , u 0), u 0 ( t ), t ) ,
p ( t i ) = Ф . ( x ( t i , u 0) )- ^X x ( x ( t i , u 0) )- q ,
(Фх ( x ( t i , u °) ) + XX x ( x ( 1 1 , u °) ) , x k ( t i ) - x ( t i , u °)} + qq , x k ( 1 J - x ( 1 1 , u °)} =
= ф ( x k ( t i ) ) - ф ( x ( t i , u 0) ) + X ( x ( x k ( t i ) ) - x ( x ( t i , u 0) ) ) .
x ( x k + i( t i ) ) = 0.
Задается начальное приближение ( x 0( t ), p 0( t ) ) , t e T .
На k-й итерации процесса (8) находится решение pk+i(t, X), t e T вспомогательной задачи Коши pk+i(t) = -Hx (pk+i(t),x(t,u°),u0(t),t)-r(t),
Hx ( pk ( t ), x ( t , u °), u °( t ), t ) , xk ( t ) - x ( t , u °)^ + ^ r ( t ), xk ( t ) - x ( t , u °)^ =
= H ( pk ( t ), x ( t ), u 0 ( t ), t ) - H ( pk ( t ), x ( t , u 0), u 0 ( t ), t ) ,
p ( t i ) = -Фх ( x ( t i , u 0) )- XX x ( x ( t i , u 0) )- q ,
^Ф x ( x ( t i , u °) ) + XX x ( x ( t i , u °) ) , xk ( t i ) - x ( t i , u °)^ + qq , xk ( t , ) - x ( t„u °)} = = ф ( xk ( t i ) ) - ф ( x ( t i , u 0) ) + x ( x ( xk ( t i ) ) - x ( x ( t i , u °) ) ) .
Затем находится решение xk+i (t, X), t e T специальной задачи Коши xk+i (t) = A(xk+i (t), t)u“ (pk+i (t, X),xk+i (t), t) + b(xk+i (t), t), t e T, x(10) = xs.
Значение вспомогательного множителя X e R (множитель Лагранжа) определяется из условия
x ( xk + i( t i , X ) ) = 0.
Формируется управление
v ( t ) = u a ( pk + i( t , X ), xk + i( t , X ), t ), t e T .
Условие окончания итерационного процесса (8)
Ф о ( V ) ^Ф о ( u °) (улучшение управления u 0).
В итоге, на основе итерационного процесса (8) формируется метод последовательных улучшений допустимых управлений в исходной задаче (i)-(3).
Пример 1.
-
3 Примеры
x = u , t e T = [ 0, 2 ] , x (0) = 1, | u ( t )| < 1, 2
Ф 0 ( u ) = j x 2 dt ^ min, x (2) = 1.
Рассмотрим u 0( t ) = 0, t e T , x ( t , u 0) = 1, Ф 0( u 0) = 2. Функция Понтрягина
H = pu - x 2, H 0 = - x 2, H 1 = p .
Сопряженная система p = x(t, v) + x(t, u0), p(2) = -X.
Положим a = 1. Тогда отображение ua принимает вид '1, p > 1, ua (p) = /—1, p <—1,
- 1 < p < 1.
Предположим | p ( t )| < 1, t e T.
Тогда краевая задача улучшения (7) принимает вид x = p , p = x + 1, t e T , x (0) = 1, p (2) = -X .
Итерационный процесс (8) принимает вид x = p , p = x k ( t ) + 1, t e T , x (0) = 1, p (2) = -X .
Для начального приближения возьмем функцию x 0 ( t ) ^ 0, t е T . Тогда
, , , , t 2
p ’( t , X ) = t - ( X + 2 ) , x ’( t , X ) = — - ( X + 2 ) t + 1, t e T .
Значение множителя Лагранжа Xe R определяется условием x ’(2, X) = 1, откуда
X = -1.
Тогда p 1( t) = t -1, t e T
(условие | p 1 ( t )| < 1, t e T выполнено).
Выходное управление v (t) = t -1,
Ф о ( v ) = 15< Ф о ( u °) = 2.
Пример 2. Данный пример иллюстрирует строгое улучшение неоптимального экстремального управления.
5с = u , t e Т = [0, п ] , x (0) = 0, | u ( t )| < 2, t eT, п
Ф о ( u ) = - j x 2 dt ^ min,
о
Ф 1( u ) = x ( п ) = 0.
Рассмотрим u 0( t ) = 0, t e T . При этом x ( t , u 0) = 0, t e T , Ф о( u 0) = 0.
В данном случае имеем
H = pu + x 2, H 0 = x 2, H 1 = p .
Положим a = 1. Отображение ua u“(Р) = ‘
-
2, p > 2, - 2, p <- 2, _ Р , \p |< 2.
Краевая задача
:x = ua (p), p = -x - x(t, u0), t e T, x (0) = x (п) = 0.
Предположим |p(t)| < 2, t eT. Тогда итерационный процесс (8) принимает вид x = p, p = -xk (t), t e T, x(0) = 0 , p(п) = -X.
Для начального приближения возьмем функцию x 0 ( t ) ^ 1, t e T . Тогда
t
p’(t,X) = -1 + (п -X), x’(t,X) = -—+ (п -X)t, t e T.
Значение множителя Лагранжа Xe R определяется условием x !(п, X) = 0, откуда
X = -
.
Тогда
p’(t) = -t + j, t eT
(условие I p 1 ( t ) I ≤2, t ∈ T выполнено).
Таким образом, выходное управление v имеет вид
π
v(t)=-t+2,t∈T и строго улучшает исходное
Φ 0 ( v ) =- 1 π 20 ≈- 2.55< Φ 0 ( u 0) = 0.
Заключение
Особенности предлагаемого подхода:
-
1. Улучшение допустимых управлений без процедуры изменения по малому параметру в окрестности текущего приближения(нелокальность улучшения).
-
2. Возможность строгого улучшения экстремальных управлений (в частности, особых), удовлетворяющих тем или иным стандартным необходимым условиям оптимальности (принцип максимума, дифференциальный принцип максимума).
Эти особенности обуславливают повышенную эффективность предлагаемого подхода в сравнении со стандартными численными методами оптимального управления (игольчатой линеаризации, условного градиента).
Список литературы Один подход к улучшению управления в системах с ограничениями на основе краевой задачи
- Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с.
- Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
- Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. Сер. Математика. 2009. Т. 2, № 1. С. 94-106.
- Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского государственного университета. Математика, информатика. 2020. № 1. С. 35-53.
- Трунин Д. О. Условия и методы улучшения управлений в нелинейных системах с ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2022. № 2. С. 50-61.