Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
Автор: Булдаев А. С., Думнов В. А.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 2, 2021 года.
Бесплатный доступ
В рассматриваемом классе дискретно-непрерывных управляемых систем конструируются формулы приращения целевой функции стандартного вида с остаточными членами разложений и нестандартные формулы, не содержащие остаточных членов разложений. На основе полученных формул строятся условия нелокального улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений. Такое представление условий дает возможность применить и модифицировать известную теорию и методы неподвижных точек для построения итерационных алгоритмов поиска экстремальных управлений и построения релаксационных последовательностей управлений в рассматриваемых дискретно-непрерывных задачах оптимального управления. Предлагаемые итерационные алгоритмы обладают свойством нелокальности последовательных приближений управления и отсутствием процедуры параметрического поиска улучшающего приближения на каждой итерации, характерной для методов градиентного типа.
Дискретно-непрерывная система, условия улучшения и оптимальности управления, задача о неподвижной точке, итерационный алгоритм
Короткий адрес: https://sciup.org/148322424
IDR: 148322424 | УДК: 517.977 | DOI: 10.18101/2304-5728-2021-2-28-43
Methods of fixed points in one class of discrete-continuous problems of optimizing controlled systems
In the considered class of discrete-continuous control systems, formulas for the increment of the objective function of the standard form with remainder terms of the expansions and non-standard formulas that do not contain the remainder terms of the expansions are constructed. Based on the formulas obtained, conditions for nonlocal improvement and control optimality are constructed in the form of fixed point problems in the control space. Such a representation of conditions makes it possible to apply and modify the well-known theory and methods of fixed points for constructing iterative algorithms for searching for extremal controls and constructing relaxation sequences of controls in the considered discrete-continuous optimal control problems. The proposed iterative algorithms have the property of nonlocality of successive control approximations and the absence of a parametric search procedure for an improving approximation at each iteration, which is characteristic of gradient-type methods.
Текст научной статьи Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
Актуальность и интерес разработки дискретно-непрерывных моделей управляемых процессов диктуются несколькими важными обстоятельствами.
С одной стороны, в настоящее время многие модели управляемых процессов в актуальных эколого-экономических, медико-биологических, технических приложениях не могут быть адекватно представлены классическими дифференциальными уравнениями, не изменяющими структуру в течение рассматриваемого периода времени. К ним относятся, например, системы, описываемые дифференциальными уравнениями с разрывными правыми частями, дифференциальными уравнениями различных порядков на различных временных отрезках либо содержащие кроме дифференци -альных уравнений объекты другой природы. В этом случае одним из распространенных подходов к моделированию является полная или частичная дискретизация моделируемого процесса по управлению и состоянию. При этом возникают разнообразные модели неоднородной структуры [1-5].
С другой стороны, подобная дискретизация выступает в качестве эффективного инструмента исследования непрерывных задач и поиска приближенно-оптимальных решений таких задач, которые могут быть использованы в качестве хороших начальных приближений для последующего уточнения решений исходных задач. Подобные приемы хорошо разработаны и апробированы во многих приложениях [6; 7].
Кроме того, существует ряд задач, в частности, в области моделирования управления летательными и космическими аппаратами [8] или управления электропоездами [9], в которых управление технически может быть реализуемо лишь с дискретным регулированием силы тяги.
Дискретно-непрерывный подход к моделированию управляемых систем на основе частичной дискретизации только по управлению рассматривался во многих работах [10; 11]. В работах [12; 13] рассматриваются дискретнонепрерывные модели задач оптимального управления на основе кусочнолинейных аппроксимаций управления с представлением динамики состояния системы на интервалах аппроксимации управления в форме дифференциальных уравнений. Анализ решения задач в работе [12] проводится на основе градиентных методов, применяемых для эквивалентных конечномерных задач в пространстве управляющих параметров. В работе [13] в классе квадратичных задач строятся эквивалентные конечномерные квад -ратичные задачи в пространстве управляющих параметров, для решения которых модифицируются методы принципа максимума.
В настоящей работе предлагается новый подход для решения дискретно-непрерывных задач рассматриваемого класса на основе представления необходимых условий оптимальности и улучшения управления в эквивалентных конечномерных моделях в форме задач о неподвижной точке в пространстве управляющих параметров. Подход иллюстрируется в рамках задач оптимального управления с кусочно-постоянными управлениями.
1 Дискретно-непрерывная задача оптимального управления Рассматривается задача оптимального управления:
I ( u ) = ф ( x ( t N )) ^ inf (Г)
u = { и г,..., U n } gQ
x ( t ) = fk ( x ( t ), uk , t ), x ( t 0 ) = x °, U k g U k c R m ( k > , t g T = [ t k -„ t k ], k = 1 N , (2) в которой функция ф ( x ) непрерывно дифференцируема на R ” , функции fk ( x , uk , t ), k = 1, N и их частные производные по переменным x , uk являются непрерывными на множествах Rn х Uk х Tk , k = 1, N . Функции fk ( x , u k , t ) удовлетворяют условию Липшица по x в Rn х U k х T k с константами L k > 0 : \\_fk ( x , u k , t ) - fk ( y , uk , t )|| < L k\\ x - y ||, k = 1, N . В качестве допустимых управлений рассматриваются N -мерные наборы m ( k )-мерных векторов u = { ur,..., un }, uk g Uk , k = 1, N . О — множество допустимых наборов. Множества Uk c R m ( k ) , k = 1, N компактны и выпуклы. Начальное состояние x 0 и интервалы Tk , k = 1, N фиксированы.
Для управления v = { vr,...,v N } gQ обозначим x ( t , v ), t g T = [ t 0 , t N ] — решение системы (2). Значения x ( t , v ), t g Tk , k = 1, N определяются последовательным интегрированием системы (2) на интервалах разбиения Tk при uk = vk , t G T k , k = 1, N .
Задачу (1), (2) можно рассматривать как специальную задачу математического программирования, в которой требуется определить набор векторов u = { U j ,..., uN } на заданном разбиении интервала T на N непересекающихся интервалов так, чтобы достигался минимум целевой функции (1).
Будем использовать следующее обозначение частного приращения произвольной вектор-функции g ( уг,...,yt ) по переменным y ^ , ys^ :
AZS,ZS g(yi,...,y:) = g(yi,...,zs,...,zs2,...,yi)-g(yi,...,yS1,...,y$2,...,yi). sj s2 1212
Приращение функции (1) на допустимых управлениях u , v в соответствии с введенными обозначениями можно записать в виде:
АvI(u) =Аx(tN,v)ф(x(tN, u)).(3)
Дополнительно обозначим A x ( t ) = x ( t , v ) - x ( t , u ), А u ( t ) = v ( t ) - u ( t ).
Рассмотрим кусочно-дифференцируемую вектор-функцию
P ( t ) = ( P i ( t ),..., p „ ( t )), t g T с условием:
p(tN) = -Фx(x(tN,u))- q, где величина q удовлетворяет алгебраическому уравнению фФx (x(tN , u)) + q, Ax(tN )) = Ax(tN,v)ф(x(tN , u)) .
При этом по определению полагаем q = 0 в случае линейности функции ф по x , а также в случае x ( tN , v ) = x ( tN , u ). Тогда приращение (3) можно представить в виде:
А V I ( u ) = -( p ( t N X А х ( t N )Y
Рассмотрим тождество:
(p ( t N ), А х ( t N Y -( p ( 1 0 ), A x ( toY = £ « p ( t k ), A x ( t k Y - { p ( t k J, A x ( t k J) ) = £ л. k = 1 k = 1
Определим на каждом интервале T k , k = 1, N сопряженные переменные p k ( t ) = ( p k i ( t X---, pk n ( t )) сусловиями:
p N ( t N ) = p ( t N ) > p k ( t k ) = p k + 1 ( t k ) , k = 1 N — 1.
Введем на каждом интервале Tk , k = 1, N функцию Понтрягина:
H k ( pk , x , w k , t ) = < pk , f k ( x , w k , t ) > , pk g R n , w k g U k ( n ) , и определим с ее помощью дифференциально-алгебраическую систему для функции pk ( t ) в форме:
p k ( t ) = - H kx ( pk ( t X x ( t , u X u k , t ) - Г ( t ), t g T k , (6)
где величина rk ( t ) = ( rk 1( t ),..., r kn ( t )) определяется в каждый момент времени t g Tk из алгебраического уравнения:
(H kx ( p k ( t X x ( t , u X u k , t ) + rk ( t X A x ( t )) = A x ( t , v ) H k ( p k ( t X x ( t , u ), u k , t ). (7)
При этом по определению полагаем rk ( t ) = 0 в случае линейности функции fk по x , а также в случае равенства x ( t , v ) = x ( t , u ).
Определим функцию p ( t ), t g T по правилу:
p ( t ) = p k ( t ), t g T k , k = 1, N .
Тогда каждое слагаемое Ik , k = 1, N в указанном выше тождестве можно записать в виде:
I k =( p k ( t k ), A x ( t k y —{ p k ( t k — 1 ), A x ( t k - 1 )) = J T ddt(p k ( t ), A x ( t )} dt =
= J T {( p k ( t ), A x ( t )) + ( p k ( t ), A x ( t , v ), vk f k ( x ( t , U ), u k , t ) )} dt =
= J T { -A x ( t , V ) H k ( p k ( t ), x ( t , U ), u k , t ) + A x ( t , v ), vk H k ( p k ( t ), x ( t , U ), u k , t ) } dt =
=L A vt H k ( p k ( t ), x ( t , v ), u k , t ) dt .
T k k
На основе полученного соотношения приращение (3) принимает вид:
N
A v 1 ( U ) =- EJ, A vk H k ( p k ( t ), x ( t , v ), u k , t ) dt . (8)
k = 1 T k
Таким образом, значения функции p(t), t g T определяются последовательным интегрированием дифференциальных систем (6), включающих алгебраические уравнения (7), на интервалах разбиения Tk, к = 1, N с начальным условием (4), включающим уравнение (5). Для представления полученной формулы (8) на основе функции p(t), t е T введем дифференциально-алгебраическую систему для переменной p(t), t е T сле дующими соотношениями:
p(t) = -Hkx(Р(tXх(tXwk,t)-rk(t), tеTk, k = 1N,
(Hkx (Р(tX X(tX wk , t) + rk (tX У (t) - X(t)) = Аy (t)Hk (Р(tX X(tX wk, t) , с начальным условием:
Р (tN ) = -Фх (X (tN )) - q,
{Фх (X(tN X + q, У (tN ) - X(tN )) = Аy(tN )Ф(X(tN X , в которой по определению полагаем rk (t) = 0, q = 0 в случае линейности функций ф, fk, k = 1, N по х (линейная по состоянию задача (1), (2)), а также в случае y(t) = х(t) при соответствующих t е T.
Обозначим p ( t , u , v ), t е T = [ 1 0 , t N ] — решение системы (9)-(12), полученное последовательным интегрированием на интервалах разбиения T k , k = 1, N при W k = U k , t е T k , k = 1, N , x ( t ) = x ( t , u ), y ( t ) = x ( t , v ), t е T . Тогда формула приращения (8) приобретает следующую форму:
N
А v I ( u ) =-Е L А vk H k ( p ( t , u , v )» х ( t , v )» u k , t ) dt . (13)
k = 1 k
Формула приращения (13) характеризуется отсутствием каких-либо остаточных членов разложений. Аналог классических формул приращения с остаточными членами разложения, полученных для непрерывных задач оптимального управления в работах [14; 15], применительно к рассматриваемой дискретно-непрерывной задаче (1), (2) можно получить по указанной выше схеме вывода следующим образом.
Рассмотрим кусочно-дифференцируемую вектор-функцию
v (t ) = ( ^ 1 ( t ),..., V n ( t )), t е T с условием:
V(tN ) = -Фх (x(tN,u)).(14)
Тогда приращение (3) представляется в виде:
А v I ( U ) =- V ( t N X А х ( t N )) + o (|| А х ( t N )| I) .
Рассмотрим тождество:
(v( tN), Ах (tN)) - V( 10), Ах (t 0)) = Е ( (v( tk), Ах (tk)} - (v( tk-1), Ах (tk-1)) ) = Е J k. k=1
На каждом интервале Tk , k = 1, N с помощью функции Понтрягина Hk определим дифференциальную систему для сопряженных переменных V k ( t ) = ( V k 1 ( t),.. , V kn ( t )) в форме:
с условиями:
V n ( t N ) = V ( t N ) , V k ( t k ) = V k + i ( t k ) , k = 1 N - 1.
Определим функцию v ( t ), t g T соотношениями:
V ( t ) = V k ( t ), t G Tk , k = 1 ,N .
Тогда каждое слагаемое Jk , k = 1, N в указанном выше тождестве можно записать в виде:
J k = ( V k ( t k ), A x ( t k )}- ( V k ( t k - 1 ), A x ( t k - 1)) = J T d ( V k ( t ), A x ( t )) dt =
= J T { V k ( t ), A x ( t )} + ( V k ( t ), A x ( t , v ), vk fk ( x ( t , u ), u k , t )}} dt =
= J T { —{ H kx ( V k ( t ), x ( t , u ), u k , t ), A x ( t )} + A x ( t , v ), vk H k ( V k ( t ), x ( t , u ), u k , t )} dt .
Полученное выражение в соответствии с [14; 15] можно представить в форме:
Jk = J T A vk H k ( V k ( t ), x ( t , v ), u k , t ) dt + o (|| A u k 11).
В итоге приращение (3) принимает вид:
AvI(u) = —L Jr AVk Hk (Vk (t), x(t, v), Uk, t)dt + o(^LIIAUk 1) • (16) k =1 kk
Введем систему для переменной v ( t ), t g T следующими соотношениями:
с начальным условием:
V(tN ) = -Фх (x(tN )).(18)
Обозначим v ( t , v ), t g T = [ 1 0 , t N ] — решение системы (17)-(18), полученное последовательным интегрированием на интервалах разбиения Tk , k = 1, N при w k = v k , t g Tk , k = 1, N , x ( t ) = x ( t , v ), t g T . Тогда формула приращения (16) приобретает следующую форму:
AvI(u) = -L Jr Avk Hk (V(t, u), x(t, u), Uk, t)dt + o(L ||AUk ||).(19)
k =1 kk
Из формулы (19) следует формула стандартного вида с линейной по приращению управления главной частью приращения целевой функции:
AvI(u) = -L JT (Hk„(V(t,u),x(t,u),uk,t), Au^dt +o(L||Auk|).(20)
k =1 Tkk
Отметим, что в линейной по управлению задаче (1), (2) (функции fk , k = 1, N линейны по u ) формулы (19) и (20) совпадают.
В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (9)-(12) в силу определения совпадает с сопряженной системой (17), (18) стандартного вида. Из определений также следует очевидное равенство p ( t , u , u ) = v ( t , u ), t g T .
В нелинейной по состоянию задаче (1), (2) алгебраические уравнения (10) и (12) всегда можно аналитически разрешить относительно величин r ( t ) и q в виде явных или условных формул (возможно, не единственным образом). Таким образом, дифференциально-алгебраическую сопряженную систему (9)-(12) всегда можно свести (возможно, не единствен -ным образом) к дифференциальной сопряженной системе с однозначно определенными величинами r ( t ) и q .
2 Условия оптимальности и улучшения управления
На основе формулы приращения (20) нетрудно получить необходимое условие оптимальности в задаче (1), (2) для управления и еО в форме следующего неравенства:
N
EL Hkh.(^(t,uXx(t,uXuk,tXwk — ukddt ^ 0 , w = {w1,-.wn}, k=1 T*k wk е Uk, k = 1, N.
Это неравенство можно представить в форме эквивалентной системы неравенств:
f T( H u ( ^ ( t , и ), x ( t , и ), U k , t ), w — u^dt ^ 0, w е U k , k = 1, N . (21)
Систему неравенств (21) можно записать в виде системы уравнений:
U k = arg max f (Hku M t , и ), x ( t , u ), U k , t ), w) dt , k = 1, N . w ∈ Uk T k
Обозначим P Y — оператор проектирования на множество Y с Rk в евклидовой норме:
p y ( z ) = argmin(|| У - z ), z е R k .
y ∈ Y
С помощью оператора проектирования систему неравенств (21) можно также представить в проекционной форме c параметром a > 0:
U k = P Ut ( Uk + a f т H ku ( ^ ( t , U X x ( t , U X U k , t ) dt ), k = 1, N . k Tk
Отметим, что для выполнения необходимого условия оптимальности (21) достаточно проверить условие (23) для некоторого a > 0. Обратно, из условия (21) следует выполнение условия (23) для всех a > 0 .
Для поиска экстремальных управлений, т. е. удовлетворяющих необходимым условиям оптимальности, можно применить и модифицировать известные градиентные методы и их модификации, основывающиеся на формуле приращения (20).
В работе рассматривается новый подход к поиску экстремальных управлений, основывающийся на представлении необходимых условий оптимальности (22) и (23) в форме задач о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов u = {u1,...,uN}. Такое представление дает возможность применить и модифицировать известную теорию и методы неподвижных точек для конструирования новых итерационных алгоритмов поиска экстремальных управлений как решений рассматриваемых задач о неподвижной точке.
Рассмотрим задачу об улучшении допустимого набора u = { и1,...,U N }: найти допустимый набор v = { v 1,..., vN } с условием A vI ( и ) < 0.
Для улучшения управления и = { и1,...,U N } можно модифицировать известные градиентные методы, основывающиеся на формуле приращения (20), которые относятся к локальным методам улучшения. В работе рассматриваются новые методы нелокального улучшения, основывающиеся на конструировании с помощью нестандартной формулы приращения (13) условий нелокального улучшения управления в форме задач о неподвижной точке в пространстве управлений.
Покажем, что для улучшения управления в задаче (1), (2) достаточно решить следующую систему уравнений:
V k = arg max f H ( p ( t , и , v ), x ( t , v ), w , t ) dt , k = 1, N . w ∈ Uk T k
Действительно, для решения v = {v1,...,vN} системы (24) выполняется неравенство:
L H k ( P ( t , и , v ), x ( t , v ), vk , t ) dt ^f H k ( P ( t , и , v ), x ( t , v ), U k , t ) dt , k = 1, N . TkTk
Суммируя эти соотношения по индексу k , на основе формулы (13) получаем требуемое соотношение A vI ( и ) < 0.
Другое условие нелокального улучшения управления построим в линейной по управлению задаче (1),(2), в которой формула (13) принимает следующий вид:
N
A v I ( и ) =—EL H ( p ( t , и , v х x ( t , v х u k , t x A u k} dt .
k = 1 T*k
Рассмотрим систему уравнений:
v k = PUt ( U k + «t H ku ( P ( t , и , v ), x ( t , v ), U k , t ) dt ), k = 1, N . k Tk
Для решения v = {v1,...,vN} системы (26) на основе известного свойства операции проектирования получаем неравенство:
I T ( h ^u ( p ( t , и , v ), x ( t , v ), u k , t ), a u k) dt ^ -« ii a u k 112.
В результате из формулы (25) следует улучшение управления и = { и 1,..., un } с оценкой:
1 Х „2
A v 1 ( и ) <— E A U k .
a k = 1
В данной работе системы (24) и (26) рассматриваются как задачи о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов v = {у,...,vN}. Такой подход дает возможность конструировать новые итерационные алгоритмы для поиска улучшающих управлений.
Условия улучшения управления представим в стандартной операторной форме задач о неподвижной точке.
Для допустимых управлений u = { u 1 ,...,uN }, v = {у,..., vN } введем отображения с помощью соотношений:
W k ( u , v ) = arg max I" Нк ( p ( t , u , v ), x ( t , v ), w , t ) dt , k = 1, N . (28)
W^Uk T*k
С помощью введенных отображений (28) систему уравнений (24) можно записать в следующей операторной форме v = W*(u,v) = G*(v), W*= W,...,WN), которая для заданного управления u = {Mj,...,uN} принимает стандартный вид задачи о неподвижной точке с оператором G*. Обозначим О(u) с О — множество неподвижных точек задачи (24).
Определим следующие отображения c параметром a > 0:
W T ( u , v ) = P Ut ( u k + a H ku ( p ( t , u , v ), x ( t , v ), uk , t ) dt ), k = 1, N . (29)
k Tk
С помощью введенных отображений (29) систему уравнений (26) для улучшения управления u = { u 1 ,...,uN } в линейной по управлению задаче (2), (3) можно записать в операторной форме:
v = W a ( u , v ) = G a ( v ), W a = (W a ,..., W N ).
Обозначим O a ( u ) сО — множество неподвижных точек задачи (26).
Покажем, что рассматриваемый подход неподвижных точек для представления условий улучшения управления позволяет в линейной по управлению задаче (1), (2) сформулировать необходимые условия оптимальности (22) и (23) в терминах конструируемых задач о неподвижной точке. При этом оценка улучшения (27) позволяет усилить и получить новое необходимое условие оптимальности по сравнению с необходимым условием (23).
В линейной по управлению задаче (1), (2) отображения (28) можно представить в виде:
W * ( u , v ) = argmax I" lHh ( P ( t , u , v ), x ( t , v ), u k , t ), w)dt , k = 1, N .
w^Uk TTk
На основе этого представления в линейной по управлению задаче (1), (2) получаем следующее утверждение.
Лемма 1. u еО(u) тогда и только тогда, когда u = {ux,...,uN} удовлетворяет необходимому условию оптимальности (22).
Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (22) можно сформулировать в терминах задачи о неподвижной точке (24) в форме следующего утверждения.
Теорема 1 . Пусть управление u = { их,...,U N } является оптимальным в линейной по управлению задаче (1), (2). Тогда u eQ ( и ).
Следствия (в линейной по управлению задаче (1), (2)).
-
1. Задача о неподвижной точке (24) всегда разрешима для управления и = { и х,..., U N }, удовлетворяющего необходимому условию оптимальности (22).
-
2. Отсутствие неподвижных точек в задаче (24) или невыполнение условия и eQ ( и ) свидетельствует о неоптимальности управления и = { U j ,..., U n }.
-
3. В случае неединственности решения задачи о неподвижной точке (24) появляется принципиальная возможность строгого улучшения управления и = { и х,..., un }, удовлетворяющего необходимому условию оптимальности (22).
На основе задачи о неподвижной точке (26) в линейной по управлению задаче (1), (2) получаем аналогичные утверждения.
Лемма 2. и е^ “ ( и ) тогда и только тогда, когда и = { их,..., un } удовлетворяет необходимому условию оптимальности (23).
Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (23) можно сформулировать в форме следующего утверждения.
Теорема 2. Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда и eQa ( и ) для некоторого a > 0.
Cледствия (в линейной по управлению задаче (1), (2)).
-
1. Задача о неподвижной точке (26) всегда разрешима для управления и = { их ,..., un }, удовлетворяющего необходимому условию оптимальности (23).
-
2. Отсутствие неподвижных точек в задаче (26) или невыполнение условия и е^ “ ( и ) для всех a > 0 свидетельствует о неоптимальности управления и = { и х,..., U N }.
-
3. В случае неединственности решения задачи о неподвижной точке (26) управление и = { и х,..., U N }, удовлетворяющее необходимому условию (23), строго улучшается на управлении v eQa ( и ), v * и согласно оценке (27).
Оценка (27) дает возможность сформулировать усиленное необходи-мое условие оптимальности по сравнению с условием (23) в линейной по управлению задаче (2), (3) в терминах задачи о неподвижной точке (26).
Теорема 3 (усиленное необходимое условие оптимальности) . Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда для всех a > 0 управление и = { и х,..., U N } является единственным решением задачи о неподвижной точке (26), т. е.
Qa ( и ) = { и } , a > 0.
Действительно, в случае существования при некотором a > 0 неподвижной точки v eQa ( и ), v ^ и , в силу оценки (27) получаем строгое улучшение A vI ( и ) < 0, что противоречит оптимальности управления и = { u ^..., U n }.
Проекционная задача о неподвижной точке (26), в отличие от задачи о неподвижной точке на основе операции максимизации (24), в случае существования решения v ^ и , v eQ a ( и ) позволяет на основе оценки (27) получить вывод о строгом улучшении управления u ∈ Ω без вычисления целевой функции. Таким образом, в случае существования неподвижных точек v ^ и , v eQ a ( и ) можно сделать вывод о неоптимальности экстремального управления и eQ без вычисления целевой функции.
3 Итерационные алгоритмы
Для численного решения задачи о неподвижной точке оператора G: VE ^ VE, действующего на множестве VE в полном нормированном пространстве E с нормой ||-||Е, v = G(v), ve Ve, (30)
можно использовать известный в вычислительной математике метод последовательных приближений и его модификации [17]. В частности, можно применить явный метод простой итерации с индексом $ > 0, имеющий форму:
v $ + 1 = G ( v $ ), v 0 e V e . (31)
Для улучшения сходимости итерационного процесса задачу о неподвижной точке (32) можно преобразовать к эквивалентной задаче с параметром 5 ^ 0 :
v = v + 5 ( v - G ( v )), v e V E , на основе которой получаем модификацию итерационного процесса:
v $ + 1 = v $ + 5 ( v $ - G ( v $ )), v 0 e V E .
Выбором параметра 5 ^ 0 можно регулировать сходимость рассматриваемой модификации метода простой итерации.
Сходимость указанного итерационного процесса можно анализировать с помощью известного принципа сжимающих отображений. Операторный аналог известной теоремы [17] можно получить в следующей форме.
Теорема 4. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:
B(v 0,1) = {v e VE : I v - v g| |E < 1, v0 e VE, 1 > 0} с константой 0 < M = M(v0,1) < 1:
||G ( v ) - G ( и )|^ < M|v - u |^, v e B ( v 0 , 1 ), и e B ( v 0 , 1 ). (32)
При этом выполняется условие:
||G ( v 0) - v 0|^< (1 - M ) l . (33)
Тогда задача о неподвижной точке (30) имеет единственное решение v е B ( v 0, l ) и итерационный процесс (31) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0, l ). Для погрешности метода выполняется оценка:
II v s - v L< M s l v 0 - v L, s > 0.
Доказательство теоремы несложно проводится по методике аналогично работе [17].
Следует отметить, что условие (33) вводится для того, чтобы итерационные приближения процесса (31) принадлежали множеству B ( v 0, l ), на котором выполняется условие Липшица (32).
Для решения задач о неподвижной точке необходимых условий оптимальности (22) и (23) методы простой итерации с заданными начальными приближениями и 0 е Q принимают соответственно следующий вид:
usk+1 = argmaxf H (^ (t, us), x (t, us), uk, t), w\dt, k = 1, N, s > 0. (34) w∈U Tk uk+1 = Pu(uk + at Hu (v(t,us),x(t, us),uk,t)dt), k = LN, s > 0. (35) Tk
В отличие от известных градиентных методов предлагаемые методы неподвижных точек (34) и (35) для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации методов. Свойство релаксации компенсируется нелокальностью последовательных приближений управления и отсутствием на каждой итерации достаточно трудоемкой операции выпуклого или игольчатого варьирования управления в окрестности текущего приближения управления.
На основе теоремы 4 можно показать аналогично работе [18], что при достаточно малых параметрах проектирования a > 0 процесс (35) определяет последовательность однозначно определенных и непрерывно зависящих от параметра проектирования итерационных приближений, которая обладает принципиальной сходимостью к экстремальному управлению, удовлетворяющему необходимому условию оптимальности (23).
Таким образом, проекционный метод неподвижных точек (35) в отличие от (34) обладает важной возможностью регулировки свойства сходимости к экстремальному управлению за счет настройки параметра проектирования.
Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения уравнения (23), сходимость итерационного процесса (35) к тому или иному экстремальному управлению определяется выбором начального приближения.
Условия нелокального улучшения (24) и (26) позволяют конструировать итерационные алгоритмы для построения релаксационных по целевой функции последовательностей управлений и получения приближенных решений задачи оптимального управления (1), (2).
Методы простой итерации для решения задач о неподвижной точке (24) и (26) с начальными приближениями v 0 eQ соответственно имеют вид:
vk+1 = arg max [ H(p(t, u, vs), x(t, vs), w, t)dt, k = 1, N, s > 0. weU * T vk+1 = Pu (Uk + afHu (p (t, u, vs), x(t, vs), Uk, t)dt), k = 1, N, s > 0.
Tk
Итерации по индексу s > 0 проводятся до первого строгого улучшения управления u eQ по целевой функции: I(vs+1) < I(u). Далее строится новая задача о неподвижной точке для улучшения полученного расчетного управления и итерационный процесс повторяется.
Если строгое улучшение управления не происходит, то итерационный процесс проводится до выполнения условия:
II vs Я-'I * 4 1 4
где £ > 0 — заданная точность расчета задачи о неподвижной точке. На этом итерации расчета последовательных задач улучшения управления предлагаемыми методами неподвижных точек для построения релаксационных последовательностей управлений заканчиваются.
Заключение
В рассматриваемом классе дискретно-непрерывных управляемых систем построены новые конструктивные условия улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений, на основе которых разработаны итерационные методы решения оптимизационных задач.
Предложенные методы неподвижных точек для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации в отличие от градиентных методов, но компенсируют это свойство нелокальностью последовательных приближений управления, а также отсутствием трудоемкой операции варьирования управления в окрестности текущего приближения с вычислением значений целевой функции, характерной для градиентных методов.
Предложенные методы неподвижных точек для построения релаксационных последовательностей управлений в рассматриваемом классе оптимизационных задач обладают следующими свойствами.
-
1. Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления на каждой итерации, характерной для градиентных методов.
-
2. Возможность строгого улучшения неоптимальных экстремальных управлений. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.
Оптимизация управлений на основе конструируемых задач о неподвижной точке предлагаемыми итерационными методами последовательных приближений характеризуется простотой вычислительной реализации и сводится к чередующемуся решению задач Коши для фазовых и сопряженных переменных с предварительно вычисляемыми управлениями.
Указанные свойства предлагаемых методов неподвижных точек являются важными факторами для повышения вычислительной и качественной эффективности решения дискретно-непрерывных задач оптимального управления и могут определять перспективное направление разработки эффективных методов оптимизации таких задач.
Список литературы Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
- Emelyanov S., Korovin S., Mamedov I. Variable Structure Control Systems. Discrete and Digital. CRC Press, USA, 1995. 316 p.
- The Control Handbook: Control System Advanced Methods. In: Levine, W. (eds). CRC Press, London, 2010. 1798 p.
- Van der Schaft A., Schumacher H. An Introduction to Hybrid Dynamical Systems. Springer, London, 2000. 174 p.
- Gurman V., Rasina I. Discrete-continuous Representations of Impulsive Processes in the Controllable Systems // Automation and Remote Control. 2012. № 8(73). P. 1290-1300.
- Mastaliyev R. Necessary Optimality Conditions in Optimal Control Problems by Discrete-continuous Systems // Tomsk State University Journal of Control and Computer Science. 2015. № 1(30). P. 4-10.
- Evtushenko Y. Numerical Optimization Techniques. Publications Division, New York, 1985. 562 p.
- Табак Д., Куо Б. Оптимальное управление и математическое программирование. Москва: Наука, 1975. 279 с. Текст: непосредственный.
- Gurman V., Ni Ming Kang. Degenerate Problems of Optimal Control. I. Automation and Remote Control. 2011. № 4(72). P. 727-739.
- Moiseev A. Optimal ^ntM Under Discrete Control Actions. Automation and Remote Control. 1991. № 9(52). P. 1274-1280.
- Teo K., Goh C., Wong K. A Unified Computational Approach to Optimal Control Problem. Longman Group Limited. New York, 1991. 329 p.
- Rahimov A. On an Approach to Solution to Optimal Control Problems on the Classes of Piecewise Constant, Piecewise Linear, and Piecewise Given Functions // Tomsk State University Journal of Control and Computer Science. 2012. № 2(19). P. 20-30.
- Gorbunov V. A Method for the Parametrization of Optimal Control Problems // USSR Computational Mathematics and Mathematical Physics. 1979. № 2(19). P. 292-303.
- Srochko V., Aksenyushkina E. Parametrization of Some Control Problems for Linear Systems // The Bulletin of Irkutsk State University. Series Mathematics. 2019. Vol. 30. P. 83-98.
- Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.
- Vasiliev O. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.
- Buldaev A., Khishektueva I.-Kh. The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters // The Bulletin of Irkutsk State University. Series Mathematics. 2017. Vol. 19. P. 89-104.
- Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.
- Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского госуниверситета. Математика, информатика. 2020. № 1. С. 35-53. Текст: непосредственный.