Об одном подходе к нелокальному улучшению управлений в квадратичных по состоянию системах с терминальными ограничениями
Автор: Трунин Дмитрий Олегович
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 2, 2017 года.
Бесплатный доступ
В статье предлагается подход к нелокальному улучшению допустимых управлений в квадратичных по состоянию задачах оптимального управления с частично закрепленным правым концом на основе решения системы функциональных уравнений, которая определяет условия нелокального улучшения. К решению рассматриваемой системы в статье применяется метод возмущений, основанный на выделении линейной по состоянию части и параметризации нелинейной части с помощью параметра возмущения. Решение невозмущенной задачи сводится к решению алгебраического уравнения. Для решения возмущенной задачи строится итерационный процесс, на каждой итерации которого решается задача, аналогичная невозмущенной.
Задача оптимального управления, терминальные ограничения, нелокальное улучшение, метод возмущений
Короткий адрес: https://sciup.org/14835218
IDR: 14835218 | DOI: 10.18101/2304-5728-2017-2-40-45
Текст научной статьи Об одном подходе к нелокальному улучшению управлений в квадратичных по состоянию системах с терминальными ограничениями
В монографии [1] рассмотрены вопросы построения процедур нелокального улучшения допустимых управлений в классе полиномиальных по состоянию задач оптимального управления со свободным правым концом. Отсутствие трудоемкой операции параметрического варьирования и возможность строгого улучшения управлений, удовлетворяющих принципу максимума, обеспечивают повышенную эффективность таких процедур. Одним из подходов к нелокальному улучшению управлений в рассматриваемом классе задач является подход возмущений, основанный на введении в задачу параметра возмущения таким образом, чтобы при некотором (нулевом) значении параметра возмущения задача (невозмущенная задача) допускала простое решение. Для решения возмущенной задачи при ненулевом значении параметра возмущения строится итерационный процесс, на каждой итерации которого решается задача, аналогичная невозмущенной. В данной статье подход возмущений обобщается на задачи оптимального управления с терминальными ограничениями.
1. Постановка задачи
В качестве характерной рассмотрим квадратичную по состоянию и линейную по управлению задачу оптимального управления с одним терми нальным ограничением x = A(x,t)u + b(x,t), t e T = [t0, t1 ],(1)
x (t0) = x0, u (t) e U,(2)
Ф(u) = Cc,x(tj)) ^ min,(3)
xi( tj = xj1.
Матричная функция A(x, t) и вектор-функция b(x, t) являются квадра тичными по x и непрерывными по t на R" х T, c e R" — заданный вектор, c1 = 0, x/ — заданное число.
В качестве доступных управлений рассматривается множество кусоч-но-непрерывных функций со значениями в компактном множестве U о R r
V = { u e PC (T ): u ( t ) e U , t e T } .
Для управления u e V обозначим x ( t , u ), t e T — решение задачи Коши (1), (2) при u = u ( t ).
Определим множество допустимых управлений
W = { u e V : x 1 ( t 1 , u ) = x /} .
Для задачи (1)-(4) функция Понтрягина с сопряженной переменной p e R " имеет вид
H ( p , x , u , t ) = H o ( p , x , t ) + ( H 1 ( p , x , t ), u) , где H o ( p , x , t ) = pp , b ( x , t )}, H 1 ( p , x , t ) = A ( x , t ) T p .
Рассмотрим нормальный функционал Лагранжа
L ( u , Я ) = ( c , x ( t 1)} + Я ( x 1 ( t 1 ) - x 1 1 ) , Я e R .
Приращение функционала Лагранжа на паре доступных управлений ( u 0, v ) в соответствии с [1] имеет вид
AvL(u0, Я) = - f (H1 (p(t, u0, v, Я), x(t, v), t), v(t) - u0 (t)\ dt, T где p(t,u°,v,Я) — решение модифицированной сопряженной системы p = - Hx ( p, x, u, t) - 2 Hxx ( p, x, u, t) У, p1(t1) = -Я, p,( t1) = - c, 1 = 2,", при u = u0(t), x = x(t,u0), y = x(t,v) -x(t,u0).
Для управления u0 e V образуем аналогично [1] вектор-функцию ua (p,x,t) = PU (u0(t) + aH 1(p,x,t)), p e R", x e R", a > 0, где PU — оператор проектирования на множество U в евклидовой норме. В [3] показано, что для нелокального улучшения управления и0 e W следует решить краевую задачу x = A(x, t)ua (p,x, t) + b(x, t), te T, p = -Hx (p, x(t, u0 X u0(tX t) - 1 Hxx (p, x(t, u°X u0 (tX t)(x - x(t, u0)X
2 (5)
x(to) = x0, x,(/,) = x,1, p,(t 1) = -c, i = 2".
Нетрудно показать, что краевая задача улучшения (5) эквивалентна следующей системе функциональных уравнений в пространстве управлений
v ( t ) = u a ( p ( t , u 0, v , Л ), x ( t , v ), t ), a > 0, x , ( t , , v ) = x 1.
Для решения краевой задачи (5) (эквивалентной системы функциональных уравнений (6)) предлагается процедура, основанная на известном [1] подходе возмущений.
2. Метод возмущений
К решению задачи нелокального улучшения допустимого управления u 0 применим подход возмущений, основанный на параметризации исходной задачи оптимального управления с помощью параметра возмущения £ e [ 0, 1 ] .
Выделим в задаче (1)-(4) линейную по состоянию часть и представим ее в форме x = A(u,t)x + b0(u,t) + /1 (x,u,t), t e T = [10, 11 ],
x ( 1 0 ) = x 0, u ( t ) e U ,
Ф ( u ) = ( c , x ( t 1 )^ ^ min, x 1 ( t 1 ) = x 1 .
Рассмотрим возмущенную задачу оптимального управления с пара -метром возмущения £ e [ 0, 1 ]
xc = A 0 ( u , t ) x + b 0 ( u , t ) + £ f 1 ( x , u , t ), / e T = [ 1 0 , 1 1 ] ,
x ( 1 0 ) = x 0, u ( t ) e U ,
Ф ( u ) = cc , x ( t 1 )^ ^ min, x 1 ( t 1 ) = x 1 .
Соответствующую функцию Понтрягина
H £ ( p , x , u , t ) = ( p , A 0 ( u , t ) x + b 0 ( u , t )} + £( p , / 1 ( x , u , t )} назовем возмущенной.
В силу линейности по u возмущенная функция Понтрягина имеет следующую структуру
Hs ( p , x , u , t ) = H 0 ( p , x , t ) + ( H £ , ( p , x , t ), U) .
Введем возмущенное отображение u“ с помощью следующего соот- u“E (p,x,t) = Pu(u0(t) + aHEX(p,x,t)), p g Rn, x g Rn, t g T.
Краевую задачу улучшения в возмущенной задаче оптимального управления определим как возмущенную краевую задачу x = Ao (u£“ (p, x,t), t)x + bо (u£“ (p,x,t), t) + sfi(x, ua (p, x, t), t), t g T,
x ( t o ) = x X x , ( t 1 ) = x 1, (7)
p = — H s x ( p , x ( t , U °X U 0( t X t ) —
-
— 2 H s xx ( p , x ( t , U °X U 0( t X t )( x — x ( t , U 0)X
p , ( t l ) = - c i , i = 2 n .
Значение s = 0 соответствует невозмущенному случаю. При этом невозмущенная краевая задача улучшения сводится к решению уравнения с одним неизвестным параметром.
Действительно, рассмотрим невозмущенную задачу ( s = 0)
x = Ao(u,t)x + bo(u,t), t g T = [to, t1], x (to) = xo, u (t) g U, (8)
Ф ( u ) = ( c , x ( t 1 )^ ^ min, x 1 ( t 1 ) = x j .
Функция Понтрягина для задачи (8) принимает вид H o ( p , x , u , t ) = ( p , A o ( u , t ) x + b o ( u , t )) ,
H o ( p , x , u , t ) = H oo ( p , x , t ) + ( H oi ( p , x , t ), u) .
Невозмущенное отображение u ^
u ^ (p , x , t ) = P u ( u o( t ) + a H oi ( p , x , t )), p g R n , x g R n , t g T .
Невозмущенная краевая задача принимает вид
;x = A o ( u a ( p , x , t ), t ) x + b o ( u a ( p , x , t ), t ), t g T ,
x ( t o ) = x °, x i ( t i ) = x j, (9)
p = -Hox (p, x(t, U °X U °(t), t), p ,(ti) = - ci, i = 2 n.
Отметим, что в краевой задаче (9) уравнения для сопряженных переменных не зависят от x . Данное обстоятельство позволяет применить к решению задачи (9) следующий подход на основе известного [2] метода стрельбы.
Будем полагать pi( ti) = a, где a g R — пока неизвестный параметр, подлежащий определению.
Обозначим через p(t, a), t e T решение задачи Коши p = -H0х (Р, x(t, u °X u 0(tX tX
Р 1 ( t i ) = a , P , ( t i ) = - c i , i = 2, n .
Обозначим через x(t, a), t e T решение задачи Коши x = A (Uo“ (p(t, a), x, t), t)x + b0 (u^ (p(t, a), x, t), t), t e T, x (t 0) = x 0.
Тогда решение невозмущенной задачи сводится к нахождению корня уравнения xi( t, a) = x^
Для решения возмущенной краевой задачи (7) при s > 0 предлагается итерационный процесс с индексом к > 0
x k + i = A ( u ( p k + i, x k + i, t ), t ) x k + i + ь 0 ( u ( p k + i, x k + i, t ), t ) +
-
+ s f i ( x k + i, < ( p k + i, x k + i, t ), t ), t e T = [ 1 0 , t i ] ,
xk + i( 1 0 ) = x 0, x i k + i( t i ) = x i , (i0)
pk + i =- H s x ( pk + i, x ( t , u 0), u 0( t ), t ) -
-
— 2 H s xx ( pk + i, x ( t , u 0X u 0( t ), t )( xk ( t ) - x ( t , u 0)X
pk + i( t i ) = - c , i = 2, n .
В качестве начального приближения ( x 0, p 0) при k = 0 выбирается решение невозмущенной задачи. На каждой итерации процесса (I0) решается задача, по трудоемкости аналогичная невозмущенной задаче.
Расчет краевых задач проводится до первого улучшения управления. Далее строится новая краевая задача и алгоритм возмущений. Таким образом, метод возмущений для решения краевых задач порождает в целом метод возмущений для решения задач оптимального управления.
Заключение
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в малой окрестности улучшаемого управления с выполнением всех терминальных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с терминальными ограничениями.
Список литературы Об одном подходе к нелокальному улучшению управлений в квадратичных по состоянию системах с терминальными ограничениями
- Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во БГУ, 2008. 260 с.
- Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989. 432 с.
- Трунин Д.О. Проекционная процедура нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с терминальными ограничениями//Вестник Бурятского государственного университета. 2009. Вып. 9. С. 52-57.