Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
Автор: Булдаев А. С., Думнов В. А.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 2, 2021 года.
Бесплатный доступ
В рассматриваемом классе дискретно-непрерывных управляемых систем конструируются формулы приращения целевой функции стандартного вида с остаточными членами разложений и нестандартные формулы, не содержащие остаточных членов разложений. На основе полученных формул строятся условия нелокального улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений. Такое представление условий дает возможность применить и модифицировать известную теорию и методы неподвижных точек для построения итерационных алгоритмов поиска экстремальных управлений и построения релаксационных последовательностей управлений в рассматриваемых дискретно-непрерывных задачах оптимального управления. Предлагаемые итерационные алгоритмы обладают свойством нелокальности последовательных приближений управления и отсутствием процедуры параметрического поиска улучшающего приближения на каждой итерации, характерной для методов градиентного типа.
Дискретно-непрерывная система, условия улучшения и оптимальности управления, задача о неподвижной точке, итерационный алгоритм
Короткий адрес: https://sciup.org/148322424
IDR: 148322424 | DOI: 10.18101/2304-5728-2021-2-28-43
Текст научной статьи Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
Актуальность и интерес разработки дискретно-непрерывных моделей управляемых процессов диктуются несколькими важными обстоятельствами.
С одной стороны, в настоящее время многие модели управляемых процессов в актуальных эколого-экономических, медико-биологических, технических приложениях не могут быть адекватно представлены классическими дифференциальными уравнениями, не изменяющими структуру в течение рассматриваемого периода времени. К ним относятся, например, системы, описываемые дифференциальными уравнениями с разрывными правыми частями, дифференциальными уравнениями различных порядков на различных временных отрезках либо содержащие кроме дифференци -альных уравнений объекты другой природы. В этом случае одним из распространенных подходов к моделированию является полная или частичная дискретизация моделируемого процесса по управлению и состоянию. При этом возникают разнообразные модели неоднородной структуры [1-5].
С другой стороны, подобная дискретизация выступает в качестве эффективного инструмента исследования непрерывных задач и поиска приближенно-оптимальных решений таких задач, которые могут быть использованы в качестве хороших начальных приближений для последующего уточнения решений исходных задач. Подобные приемы хорошо разработаны и апробированы во многих приложениях [6; 7].
Кроме того, существует ряд задач, в частности, в области моделирования управления летательными и космическими аппаратами [8] или управления электропоездами [9], в которых управление технически может быть реализуемо лишь с дискретным регулированием силы тяги.
Дискретно-непрерывный подход к моделированию управляемых систем на основе частичной дискретизации только по управлению рассматривался во многих работах [10; 11]. В работах [12; 13] рассматриваются дискретнонепрерывные модели задач оптимального управления на основе кусочнолинейных аппроксимаций управления с представлением динамики состояния системы на интервалах аппроксимации управления в форме дифференциальных уравнений. Анализ решения задач в работе [12] проводится на основе градиентных методов, применяемых для эквивалентных конечномерных задач в пространстве управляющих параметров. В работе [13] в классе квадратичных задач строятся эквивалентные конечномерные квад -ратичные задачи в пространстве управляющих параметров, для решения которых модифицируются методы принципа максимума.
В настоящей работе предлагается новый подход для решения дискретно-непрерывных задач рассматриваемого класса на основе представления необходимых условий оптимальности и улучшения управления в эквивалентных конечномерных моделях в форме задач о неподвижной точке в пространстве управляющих параметров. Подход иллюстрируется в рамках задач оптимального управления с кусочно-постоянными управлениями.
1 Дискретно-непрерывная задача оптимального управления Рассматривается задача оптимального управления:
I ( u ) = ф ( x ( t N )) ^ inf (Г)
u = { и г,..., U n } gQ
x ( t ) = fk ( x ( t ), uk , t ), x ( t 0 ) = x °, U k g U k c R m ( k > , t g T = [ t k -„ t k ], k = 1 N , (2) в которой функция ф ( x ) непрерывно дифференцируема на R ” , функции fk ( x , uk , t ), k = 1, N и их частные производные по переменным x , uk являются непрерывными на множествах Rn х Uk х Tk , k = 1, N . Функции fk ( x , u k , t ) удовлетворяют условию Липшица по x в Rn х U k х T k с константами L k > 0 : \\_fk ( x , u k , t ) - fk ( y , uk , t )|| < L k\\ x - y ||, k = 1, N . В качестве допустимых управлений рассматриваются N -мерные наборы m ( k )-мерных векторов u = { ur,..., un }, uk g Uk , k = 1, N . О — множество допустимых наборов. Множества Uk c R m ( k ) , k = 1, N компактны и выпуклы. Начальное состояние x 0 и интервалы Tk , k = 1, N фиксированы.
Для управления v = { vr,...,v N } gQ обозначим x ( t , v ), t g T = [ t 0 , t N ] — решение системы (2). Значения x ( t , v ), t g Tk , k = 1, N определяются последовательным интегрированием системы (2) на интервалах разбиения Tk при uk = vk , t G T k , k = 1, N .
Задачу (1), (2) можно рассматривать как специальную задачу математического программирования, в которой требуется определить набор векторов u = { U j ,..., uN } на заданном разбиении интервала T на N непересекающихся интервалов так, чтобы достигался минимум целевой функции (1).
Будем использовать следующее обозначение частного приращения произвольной вектор-функции g ( уг,...,yt ) по переменным y ^ , ys^ :
AZS,ZS g(yi,...,y:) = g(yi,...,zs,...,zs2,...,yi)-g(yi,...,yS1,...,y$2,...,yi). sj s2 1212
Приращение функции (1) на допустимых управлениях u , v в соответствии с введенными обозначениями можно записать в виде:
АvI(u) =Аx(tN,v)ф(x(tN, u)).(3)
Дополнительно обозначим A x ( t ) = x ( t , v ) - x ( t , u ), А u ( t ) = v ( t ) - u ( t ).
Рассмотрим кусочно-дифференцируемую вектор-функцию
P ( t ) = ( P i ( t ),..., p „ ( t )), t g T с условием:
p(tN) = -Фx(x(tN,u))- q, где величина q удовлетворяет алгебраическому уравнению фФx (x(tN , u)) + q, Ax(tN )) = Ax(tN,v)ф(x(tN , u)) .
При этом по определению полагаем q = 0 в случае линейности функции ф по x , а также в случае x ( tN , v ) = x ( tN , u ). Тогда приращение (3) можно представить в виде:
А V I ( u ) = -( p ( t N X А х ( t N )Y
Рассмотрим тождество:
(p ( t N ), А х ( t N Y -( p ( 1 0 ), A x ( toY = £ « p ( t k ), A x ( t k Y - { p ( t k J, A x ( t k J) ) = £ л. k = 1 k = 1
Определим на каждом интервале T k , k = 1, N сопряженные переменные p k ( t ) = ( p k i ( t X---, pk n ( t )) сусловиями:
p N ( t N ) = p ( t N ) > p k ( t k ) = p k + 1 ( t k ) , k = 1 N — 1.
Введем на каждом интервале Tk , k = 1, N функцию Понтрягина:
H k ( pk , x , w k , t ) = < pk , f k ( x , w k , t ) > , pk g R n , w k g U k ( n ) , и определим с ее помощью дифференциально-алгебраическую систему для функции pk ( t ) в форме:
p k ( t ) = - H kx ( pk ( t X x ( t , u X u k , t ) - Г ( t ), t g T k , (6)
где величина rk ( t ) = ( rk 1( t ),..., r kn ( t )) определяется в каждый момент времени t g Tk из алгебраического уравнения:
(H kx ( p k ( t X x ( t , u X u k , t ) + rk ( t X A x ( t )) = A x ( t , v ) H k ( p k ( t X x ( t , u ), u k , t ). (7)
При этом по определению полагаем rk ( t ) = 0 в случае линейности функции fk по x , а также в случае равенства x ( t , v ) = x ( t , u ).
Определим функцию p ( t ), t g T по правилу:
p ( t ) = p k ( t ), t g T k , k = 1, N .
Тогда каждое слагаемое Ik , k = 1, N в указанном выше тождестве можно записать в виде:
I k =( p k ( t k ), A x ( t k y —{ p k ( t k — 1 ), A x ( t k - 1 )) = J T ddt(p k ( t ), A x ( t )} dt =
= J T {( p k ( t ), A x ( t )) + ( p k ( t ), A x ( t , v ), vk f k ( x ( t , U ), u k , t ) )} dt =
= J T { -A x ( t , V ) H k ( p k ( t ), x ( t , U ), u k , t ) + A x ( t , v ), vk H k ( p k ( t ), x ( t , U ), u k , t ) } dt =
=L A vt H k ( p k ( t ), x ( t , v ), u k , t ) dt .
T k k
На основе полученного соотношения приращение (3) принимает вид:
N
A v 1 ( U ) =- EJ, A vk H k ( p k ( t ), x ( t , v ), u k , t ) dt . (8)
k = 1 T k
Таким образом, значения функции p(t), t g T определяются последовательным интегрированием дифференциальных систем (6), включающих алгебраические уравнения (7), на интервалах разбиения Tk, к = 1, N с начальным условием (4), включающим уравнение (5). Для представления полученной формулы (8) на основе функции p(t), t е T введем дифференциально-алгебраическую систему для переменной p(t), t е T сле дующими соотношениями:
p(t) = -Hkx(Р(tXх(tXwk,t)-rk(t), tеTk, k = 1N,
(Hkx (Р(tX X(tX wk , t) + rk (tX У (t) - X(t)) = Аy (t)Hk (Р(tX X(tX wk, t) , с начальным условием:
Р (tN ) = -Фх (X (tN )) - q,
{Фх (X(tN X + q, У (tN ) - X(tN )) = Аy(tN )Ф(X(tN X , в которой по определению полагаем rk (t) = 0, q = 0 в случае линейности функций ф, fk, k = 1, N по х (линейная по состоянию задача (1), (2)), а также в случае y(t) = х(t) при соответствующих t е T.
Обозначим p ( t , u , v ), t е T = [ 1 0 , t N ] — решение системы (9)-(12), полученное последовательным интегрированием на интервалах разбиения T k , k = 1, N при W k = U k , t е T k , k = 1, N , x ( t ) = x ( t , u ), y ( t ) = x ( t , v ), t е T . Тогда формула приращения (8) приобретает следующую форму:
N
А v I ( u ) =-Е L А vk H k ( p ( t , u , v )» х ( t , v )» u k , t ) dt . (13)
k = 1 k
Формула приращения (13) характеризуется отсутствием каких-либо остаточных членов разложений. Аналог классических формул приращения с остаточными членами разложения, полученных для непрерывных задач оптимального управления в работах [14; 15], применительно к рассматриваемой дискретно-непрерывной задаче (1), (2) можно получить по указанной выше схеме вывода следующим образом.
Рассмотрим кусочно-дифференцируемую вектор-функцию
v (t ) = ( ^ 1 ( t ),..., V n ( t )), t е T с условием:
V(tN ) = -Фх (x(tN,u)).(14)
Тогда приращение (3) представляется в виде:
А v I ( U ) =- V ( t N X А х ( t N )) + o (|| А х ( t N )| I) .
Рассмотрим тождество:
(v( tN), Ах (tN)) - V( 10), Ах (t 0)) = Е ( (v( tk), Ах (tk)} - (v( tk-1), Ах (tk-1)) ) = Е J k. k=1
На каждом интервале Tk , k = 1, N с помощью функции Понтрягина Hk определим дифференциальную систему для сопряженных переменных V k ( t ) = ( V k 1 ( t),.. , V kn ( t )) в форме:
с условиями:
V n ( t N ) = V ( t N ) , V k ( t k ) = V k + i ( t k ) , k = 1 N - 1.
Определим функцию v ( t ), t g T соотношениями:
V ( t ) = V k ( t ), t G Tk , k = 1 ,N .
Тогда каждое слагаемое Jk , k = 1, N в указанном выше тождестве можно записать в виде:
J k = ( V k ( t k ), A x ( t k )}- ( V k ( t k - 1 ), A x ( t k - 1)) = J T d ( V k ( t ), A x ( t )) dt =
= J T { V k ( t ), A x ( t )} + ( V k ( t ), A x ( t , v ), vk fk ( x ( t , u ), u k , t )}} dt =
= J T { —{ H kx ( V k ( t ), x ( t , u ), u k , t ), A x ( t )} + A x ( t , v ), vk H k ( V k ( t ), x ( t , u ), u k , t )} dt .
Полученное выражение в соответствии с [14; 15] можно представить в форме:
Jk = J T A vk H k ( V k ( t ), x ( t , v ), u k , t ) dt + o (|| A u k 11).
В итоге приращение (3) принимает вид:
AvI(u) = —L Jr AVk Hk (Vk (t), x(t, v), Uk, t)dt + o(^LIIAUk 1) • (16) k =1 kk
Введем систему для переменной v ( t ), t g T следующими соотношениями:
с начальным условием:
V(tN ) = -Фх (x(tN )).(18)
Обозначим v ( t , v ), t g T = [ 1 0 , t N ] — решение системы (17)-(18), полученное последовательным интегрированием на интервалах разбиения Tk , k = 1, N при w k = v k , t g Tk , k = 1, N , x ( t ) = x ( t , v ), t g T . Тогда формула приращения (16) приобретает следующую форму:
AvI(u) = -L Jr Avk Hk (V(t, u), x(t, u), Uk, t)dt + o(L ||AUk ||).(19)
k =1 kk
Из формулы (19) следует формула стандартного вида с линейной по приращению управления главной частью приращения целевой функции:
AvI(u) = -L JT (Hk„(V(t,u),x(t,u),uk,t), Au^dt +o(L||Auk|).(20)
k =1 Tkk
Отметим, что в линейной по управлению задаче (1), (2) (функции fk , k = 1, N линейны по u ) формулы (19) и (20) совпадают.
В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (9)-(12) в силу определения совпадает с сопряженной системой (17), (18) стандартного вида. Из определений также следует очевидное равенство p ( t , u , u ) = v ( t , u ), t g T .
В нелинейной по состоянию задаче (1), (2) алгебраические уравнения (10) и (12) всегда можно аналитически разрешить относительно величин r ( t ) и q в виде явных или условных формул (возможно, не единственным образом). Таким образом, дифференциально-алгебраическую сопряженную систему (9)-(12) всегда можно свести (возможно, не единствен -ным образом) к дифференциальной сопряженной системе с однозначно определенными величинами r ( t ) и q .
2 Условия оптимальности и улучшения управления
На основе формулы приращения (20) нетрудно получить необходимое условие оптимальности в задаче (1), (2) для управления и еО в форме следующего неравенства:
N
EL Hkh.(^(t,uXx(t,uXuk,tXwk — ukddt ^ 0 , w = {w1,-.wn}, k=1 T*k wk е Uk, k = 1, N.
Это неравенство можно представить в форме эквивалентной системы неравенств:
f T( H u ( ^ ( t , и ), x ( t , и ), U k , t ), w — u^dt ^ 0, w е U k , k = 1, N . (21)
Систему неравенств (21) можно записать в виде системы уравнений:
U k = arg max f (Hku M t , и ), x ( t , u ), U k , t ), w) dt , k = 1, N . w ∈ Uk T k
Обозначим P Y — оператор проектирования на множество Y с Rk в евклидовой норме:
p y ( z ) = argmin(|| У - z ), z е R k .
y ∈ Y
С помощью оператора проектирования систему неравенств (21) можно также представить в проекционной форме c параметром a > 0:
U k = P Ut ( Uk + a f т H ku ( ^ ( t , U X x ( t , U X U k , t ) dt ), k = 1, N . k Tk
Отметим, что для выполнения необходимого условия оптимальности (21) достаточно проверить условие (23) для некоторого a > 0. Обратно, из условия (21) следует выполнение условия (23) для всех a > 0 .
Для поиска экстремальных управлений, т. е. удовлетворяющих необходимым условиям оптимальности, можно применить и модифицировать известные градиентные методы и их модификации, основывающиеся на формуле приращения (20).
В работе рассматривается новый подход к поиску экстремальных управлений, основывающийся на представлении необходимых условий оптимальности (22) и (23) в форме задач о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов u = {u1,...,uN}. Такое представление дает возможность применить и модифицировать известную теорию и методы неподвижных точек для конструирования новых итерационных алгоритмов поиска экстремальных управлений как решений рассматриваемых задач о неподвижной точке.
Рассмотрим задачу об улучшении допустимого набора u = { и1,...,U N }: найти допустимый набор v = { v 1,..., vN } с условием A vI ( и ) < 0.
Для улучшения управления и = { и1,...,U N } можно модифицировать известные градиентные методы, основывающиеся на формуле приращения (20), которые относятся к локальным методам улучшения. В работе рассматриваются новые методы нелокального улучшения, основывающиеся на конструировании с помощью нестандартной формулы приращения (13) условий нелокального улучшения управления в форме задач о неподвижной точке в пространстве управлений.
Покажем, что для улучшения управления в задаче (1), (2) достаточно решить следующую систему уравнений:
V k = arg max f H ( p ( t , и , v ), x ( t , v ), w , t ) dt , k = 1, N . w ∈ Uk T k
Действительно, для решения v = {v1,...,vN} системы (24) выполняется неравенство:
L H k ( P ( t , и , v ), x ( t , v ), vk , t ) dt ^f H k ( P ( t , и , v ), x ( t , v ), U k , t ) dt , k = 1, N . TkTk
Суммируя эти соотношения по индексу k , на основе формулы (13) получаем требуемое соотношение A vI ( и ) < 0.
Другое условие нелокального улучшения управления построим в линейной по управлению задаче (1),(2), в которой формула (13) принимает следующий вид:
N
A v I ( и ) =—EL H ( p ( t , и , v х x ( t , v х u k , t x A u k} dt .
k = 1 T*k
Рассмотрим систему уравнений:
v k = PUt ( U k + «t H ku ( P ( t , и , v ), x ( t , v ), U k , t ) dt ), k = 1, N . k Tk
Для решения v = {v1,...,vN} системы (26) на основе известного свойства операции проектирования получаем неравенство:
I T ( h ^u ( p ( t , и , v ), x ( t , v ), u k , t ), a u k) dt ^ -« ii a u k 112.
В результате из формулы (25) следует улучшение управления и = { и 1,..., un } с оценкой:
1 Х „2
A v 1 ( и ) <— E A U k .
a k = 1
В данной работе системы (24) и (26) рассматриваются как задачи о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов v = {у,...,vN}. Такой подход дает возможность конструировать новые итерационные алгоритмы для поиска улучшающих управлений.
Условия улучшения управления представим в стандартной операторной форме задач о неподвижной точке.
Для допустимых управлений u = { u 1 ,...,uN }, v = {у,..., vN } введем отображения с помощью соотношений:
W k ( u , v ) = arg max I" Нк ( p ( t , u , v ), x ( t , v ), w , t ) dt , k = 1, N . (28)
W^Uk T*k
С помощью введенных отображений (28) систему уравнений (24) можно записать в следующей операторной форме v = W*(u,v) = G*(v), W*= W,...,WN), которая для заданного управления u = {Mj,...,uN} принимает стандартный вид задачи о неподвижной точке с оператором G*. Обозначим О(u) с О — множество неподвижных точек задачи (24).
Определим следующие отображения c параметром a > 0:
W T ( u , v ) = P Ut ( u k + a H ku ( p ( t , u , v ), x ( t , v ), uk , t ) dt ), k = 1, N . (29)
k Tk
С помощью введенных отображений (29) систему уравнений (26) для улучшения управления u = { u 1 ,...,uN } в линейной по управлению задаче (2), (3) можно записать в операторной форме:
v = W a ( u , v ) = G a ( v ), W a = (W a ,..., W N ).
Обозначим O a ( u ) сО — множество неподвижных точек задачи (26).
Покажем, что рассматриваемый подход неподвижных точек для представления условий улучшения управления позволяет в линейной по управлению задаче (1), (2) сформулировать необходимые условия оптимальности (22) и (23) в терминах конструируемых задач о неподвижной точке. При этом оценка улучшения (27) позволяет усилить и получить новое необходимое условие оптимальности по сравнению с необходимым условием (23).
В линейной по управлению задаче (1), (2) отображения (28) можно представить в виде:
W * ( u , v ) = argmax I" lHh ( P ( t , u , v ), x ( t , v ), u k , t ), w)dt , k = 1, N .
w^Uk TTk
На основе этого представления в линейной по управлению задаче (1), (2) получаем следующее утверждение.
Лемма 1. u еО(u) тогда и только тогда, когда u = {ux,...,uN} удовлетворяет необходимому условию оптимальности (22).
Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (22) можно сформулировать в терминах задачи о неподвижной точке (24) в форме следующего утверждения.
Теорема 1 . Пусть управление u = { их,...,U N } является оптимальным в линейной по управлению задаче (1), (2). Тогда u eQ ( и ).
Следствия (в линейной по управлению задаче (1), (2)).
-
1. Задача о неподвижной точке (24) всегда разрешима для управления и = { и х,..., U N }, удовлетворяющего необходимому условию оптимальности (22).
-
2. Отсутствие неподвижных точек в задаче (24) или невыполнение условия и eQ ( и ) свидетельствует о неоптимальности управления и = { U j ,..., U n }.
-
3. В случае неединственности решения задачи о неподвижной точке (24) появляется принципиальная возможность строгого улучшения управления и = { и х,..., un }, удовлетворяющего необходимому условию оптимальности (22).
На основе задачи о неподвижной точке (26) в линейной по управлению задаче (1), (2) получаем аналогичные утверждения.
Лемма 2. и е^ “ ( и ) тогда и только тогда, когда и = { их,..., un } удовлетворяет необходимому условию оптимальности (23).
Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (23) можно сформулировать в форме следующего утверждения.
Теорема 2. Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда и eQa ( и ) для некоторого a > 0.
Cледствия (в линейной по управлению задаче (1), (2)).
-
1. Задача о неподвижной точке (26) всегда разрешима для управления и = { их ,..., un }, удовлетворяющего необходимому условию оптимальности (23).
-
2. Отсутствие неподвижных точек в задаче (26) или невыполнение условия и е^ “ ( и ) для всех a > 0 свидетельствует о неоптимальности управления и = { и х,..., U N }.
-
3. В случае неединственности решения задачи о неподвижной точке (26) управление и = { и х,..., U N }, удовлетворяющее необходимому условию (23), строго улучшается на управлении v eQa ( и ), v * и согласно оценке (27).
Оценка (27) дает возможность сформулировать усиленное необходи-мое условие оптимальности по сравнению с условием (23) в линейной по управлению задаче (2), (3) в терминах задачи о неподвижной точке (26).
Теорема 3 (усиленное необходимое условие оптимальности) . Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда для всех a > 0 управление и = { и х,..., U N } является единственным решением задачи о неподвижной точке (26), т. е.
Qa ( и ) = { и } , a > 0.
Действительно, в случае существования при некотором a > 0 неподвижной точки v eQa ( и ), v ^ и , в силу оценки (27) получаем строгое улучшение A vI ( и ) < 0, что противоречит оптимальности управления и = { u ^..., U n }.
Проекционная задача о неподвижной точке (26), в отличие от задачи о неподвижной точке на основе операции максимизации (24), в случае существования решения v ^ и , v eQ a ( и ) позволяет на основе оценки (27) получить вывод о строгом улучшении управления u ∈ Ω без вычисления целевой функции. Таким образом, в случае существования неподвижных точек v ^ и , v eQ a ( и ) можно сделать вывод о неоптимальности экстремального управления и eQ без вычисления целевой функции.
3 Итерационные алгоритмы
Для численного решения задачи о неподвижной точке оператора G: VE ^ VE, действующего на множестве VE в полном нормированном пространстве E с нормой ||-||Е, v = G(v), ve Ve, (30)
можно использовать известный в вычислительной математике метод последовательных приближений и его модификации [17]. В частности, можно применить явный метод простой итерации с индексом $ > 0, имеющий форму:
v $ + 1 = G ( v $ ), v 0 e V e . (31)
Для улучшения сходимости итерационного процесса задачу о неподвижной точке (32) можно преобразовать к эквивалентной задаче с параметром 5 ^ 0 :
v = v + 5 ( v - G ( v )), v e V E , на основе которой получаем модификацию итерационного процесса:
v $ + 1 = v $ + 5 ( v $ - G ( v $ )), v 0 e V E .
Выбором параметра 5 ^ 0 можно регулировать сходимость рассматриваемой модификации метода простой итерации.
Сходимость указанного итерационного процесса можно анализировать с помощью известного принципа сжимающих отображений. Операторный аналог известной теоремы [17] можно получить в следующей форме.
Теорема 4. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:
B(v 0,1) = {v e VE : I v - v g| |E < 1, v0 e VE, 1 > 0} с константой 0 < M = M(v0,1) < 1:
||G ( v ) - G ( и )|^ < M|v - u |^, v e B ( v 0 , 1 ), и e B ( v 0 , 1 ). (32)
При этом выполняется условие:
||G ( v 0) - v 0|^< (1 - M ) l . (33)
Тогда задача о неподвижной точке (30) имеет единственное решение v е B ( v 0, l ) и итерационный процесс (31) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0, l ). Для погрешности метода выполняется оценка:
II v s - v L< M s l v 0 - v L, s > 0.
Доказательство теоремы несложно проводится по методике аналогично работе [17].
Следует отметить, что условие (33) вводится для того, чтобы итерационные приближения процесса (31) принадлежали множеству B ( v 0, l ), на котором выполняется условие Липшица (32).
Для решения задач о неподвижной точке необходимых условий оптимальности (22) и (23) методы простой итерации с заданными начальными приближениями и 0 е Q принимают соответственно следующий вид:
usk+1 = argmaxf H (^ (t, us), x (t, us), uk, t), w\dt, k = 1, N, s > 0. (34) w∈U Tk uk+1 = Pu(uk + at Hu (v(t,us),x(t, us),uk,t)dt), k = LN, s > 0. (35) Tk
В отличие от известных градиентных методов предлагаемые методы неподвижных точек (34) и (35) для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации методов. Свойство релаксации компенсируется нелокальностью последовательных приближений управления и отсутствием на каждой итерации достаточно трудоемкой операции выпуклого или игольчатого варьирования управления в окрестности текущего приближения управления.
На основе теоремы 4 можно показать аналогично работе [18], что при достаточно малых параметрах проектирования a > 0 процесс (35) определяет последовательность однозначно определенных и непрерывно зависящих от параметра проектирования итерационных приближений, которая обладает принципиальной сходимостью к экстремальному управлению, удовлетворяющему необходимому условию оптимальности (23).
Таким образом, проекционный метод неподвижных точек (35) в отличие от (34) обладает важной возможностью регулировки свойства сходимости к экстремальному управлению за счет настройки параметра проектирования.
Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения уравнения (23), сходимость итерационного процесса (35) к тому или иному экстремальному управлению определяется выбором начального приближения.
Условия нелокального улучшения (24) и (26) позволяют конструировать итерационные алгоритмы для построения релаксационных по целевой функции последовательностей управлений и получения приближенных решений задачи оптимального управления (1), (2).
Методы простой итерации для решения задач о неподвижной точке (24) и (26) с начальными приближениями v 0 eQ соответственно имеют вид:
vk+1 = arg max [ H(p(t, u, vs), x(t, vs), w, t)dt, k = 1, N, s > 0. weU * T vk+1 = Pu (Uk + afHu (p (t, u, vs), x(t, vs), Uk, t)dt), k = 1, N, s > 0.
Tk
Итерации по индексу s > 0 проводятся до первого строгого улучшения управления u eQ по целевой функции: I(vs+1) < I(u). Далее строится новая задача о неподвижной точке для улучшения полученного расчетного управления и итерационный процесс повторяется.
Если строгое улучшение управления не происходит, то итерационный процесс проводится до выполнения условия:
II vs Я-'I * 4 1 4
где £ > 0 — заданная точность расчета задачи о неподвижной точке. На этом итерации расчета последовательных задач улучшения управления предлагаемыми методами неподвижных точек для построения релаксационных последовательностей управлений заканчиваются.
Заключение
В рассматриваемом классе дискретно-непрерывных управляемых систем построены новые конструктивные условия улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений, на основе которых разработаны итерационные методы решения оптимизационных задач.
Предложенные методы неподвижных точек для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации в отличие от градиентных методов, но компенсируют это свойство нелокальностью последовательных приближений управления, а также отсутствием трудоемкой операции варьирования управления в окрестности текущего приближения с вычислением значений целевой функции, характерной для градиентных методов.
Предложенные методы неподвижных точек для построения релаксационных последовательностей управлений в рассматриваемом классе оптимизационных задач обладают следующими свойствами.
-
1. Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления на каждой итерации, характерной для градиентных методов.
-
2. Возможность строгого улучшения неоптимальных экстремальных управлений. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.
Оптимизация управлений на основе конструируемых задач о неподвижной точке предлагаемыми итерационными методами последовательных приближений характеризуется простотой вычислительной реализации и сводится к чередующемуся решению задач Коши для фазовых и сопряженных переменных с предварительно вычисляемыми управлениями.
Указанные свойства предлагаемых методов неподвижных точек являются важными факторами для повышения вычислительной и качественной эффективности решения дискретно-непрерывных задач оптимального управления и могут определять перспективное направление разработки эффективных методов оптимизации таких задач.
Список литературы Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем
- Emelyanov S., Korovin S., Mamedov I. Variable Structure Control Systems. Discrete and Digital. CRC Press, USA, 1995. 316 p.
- The Control Handbook: Control System Advanced Methods. In: Levine, W. (eds). CRC Press, London, 2010. 1798 p.
- Van der Schaft A., Schumacher H. An Introduction to Hybrid Dynamical Systems. Springer, London, 2000. 174 p.
- Gurman V., Rasina I. Discrete-continuous Representations of Impulsive Processes in the Controllable Systems // Automation and Remote Control. 2012. № 8(73). P. 1290-1300.
- Mastaliyev R. Necessary Optimality Conditions in Optimal Control Problems by Discrete-continuous Systems // Tomsk State University Journal of Control and Computer Science. 2015. № 1(30). P. 4-10.
- Evtushenko Y. Numerical Optimization Techniques. Publications Division, New York, 1985. 562 p.
- Табак Д., Куо Б. Оптимальное управление и математическое программирование. Москва: Наука, 1975. 279 с. Текст: непосредственный.
- Gurman V., Ni Ming Kang. Degenerate Problems of Optimal Control. I. Automation and Remote Control. 2011. № 4(72). P. 727-739.
- Moiseev A. Optimal ^ntM Under Discrete Control Actions. Automation and Remote Control. 1991. № 9(52). P. 1274-1280.
- Teo K., Goh C., Wong K. A Unified Computational Approach to Optimal Control Problem. Longman Group Limited. New York, 1991. 329 p.
- Rahimov A. On an Approach to Solution to Optimal Control Problems on the Classes of Piecewise Constant, Piecewise Linear, and Piecewise Given Functions // Tomsk State University Journal of Control and Computer Science. 2012. № 2(19). P. 20-30.
- Gorbunov V. A Method for the Parametrization of Optimal Control Problems // USSR Computational Mathematics and Mathematical Physics. 1979. № 2(19). P. 292-303.
- Srochko V., Aksenyushkina E. Parametrization of Some Control Problems for Linear Systems // The Bulletin of Irkutsk State University. Series Mathematics. 2019. Vol. 30. P. 83-98.
- Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.
- Vasiliev O. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.
- Buldaev A., Khishektueva I.-Kh. The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters // The Bulletin of Irkutsk State University. Series Mathematics. 2017. Vol. 19. P. 89-104.
- Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.
- Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского госуниверситета. Математика, информатика. 2020. № 1. С. 35-53. Текст: непосредственный.