Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем

Бесплатный доступ

В рассматриваемом классе дискретно-непрерывных управляемых систем конструируются формулы приращения целевой функции стандартного вида с остаточными членами разложений и нестандартные формулы, не содержащие остаточных членов разложений. На основе полученных формул строятся условия нелокального улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений. Такое представление условий дает возможность применить и модифицировать известную теорию и методы неподвижных точек для построения итерационных алгоритмов поиска экстремальных управлений и построения релаксационных последовательностей управлений в рассматриваемых дискретно-непрерывных задачах оптимального управления. Предлагаемые итерационные алгоритмы обладают свойством нелокальности последовательных приближений управления и отсутствием процедуры параметрического поиска улучшающего приближения на каждой итерации, характерной для методов градиентного типа.

Еще

Дискретно-непрерывная система, условия улучшения и оптимальности управления, задача о неподвижной точке, итерационный алгоритм

Короткий адрес: https://sciup.org/148322424

IDR: 148322424   |   DOI: 10.18101/2304-5728-2021-2-28-43

Текст научной статьи Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем

Актуальность и интерес разработки дискретно-непрерывных моделей управляемых процессов диктуются несколькими важными обстоятельствами.

С одной стороны, в настоящее время многие модели управляемых процессов в актуальных эколого-экономических, медико-биологических, технических приложениях не могут быть адекватно представлены классическими дифференциальными уравнениями, не изменяющими структуру в течение рассматриваемого периода времени. К ним относятся, например, системы, описываемые дифференциальными уравнениями с разрывными правыми частями, дифференциальными уравнениями различных порядков на различных временных отрезках либо содержащие кроме дифференци -альных уравнений объекты другой природы. В этом случае одним из распространенных подходов к моделированию является полная или частичная дискретизация моделируемого процесса по управлению и состоянию. При этом возникают разнообразные модели неоднородной структуры [1-5].

С другой стороны, подобная дискретизация выступает в качестве эффективного инструмента исследования непрерывных задач и поиска приближенно-оптимальных решений таких задач, которые могут быть использованы в качестве хороших начальных приближений для последующего уточнения решений исходных задач. Подобные приемы хорошо разработаны и апробированы во многих приложениях [6; 7].

Кроме того, существует ряд задач, в частности, в области моделирования управления летательными и космическими аппаратами [8] или управления электропоездами [9], в которых управление технически может быть реализуемо лишь с дискретным регулированием силы тяги.

Дискретно-непрерывный подход к моделированию управляемых систем на основе частичной дискретизации только по управлению рассматривался во многих работах [10; 11]. В работах [12; 13] рассматриваются дискретнонепрерывные модели задач оптимального управления на основе кусочнолинейных аппроксимаций управления с представлением динамики состояния системы на интервалах аппроксимации управления в форме дифференциальных уравнений. Анализ решения задач в работе [12] проводится на основе градиентных методов, применяемых для эквивалентных конечномерных задач в пространстве управляющих параметров. В работе [13] в классе квадратичных задач строятся эквивалентные конечномерные квад -ратичные задачи в пространстве управляющих параметров, для решения которых модифицируются методы принципа максимума.

В настоящей работе предлагается новый подход для решения дискретно-непрерывных задач рассматриваемого класса на основе представления необходимых условий оптимальности и улучшения управления в эквивалентных конечномерных моделях в форме задач о неподвижной точке в пространстве управляющих параметров. Подход иллюстрируется в рамках задач оптимального управления с кусочно-постоянными управлениями.

1 Дискретно-непрерывная задача оптимального управления Рассматривается задача оптимального управления:

I ( u ) = ф ( x ( t N )) ^     inf                           (Г)

u = { и г,..., U n } gQ

x ( t ) = fk ( x ( t ), uk , t ), x ( t 0 ) = x °, U k g U k c R m ( k > , t g T = [ t k -„ t k ], k = 1 N , (2) в которой функция ф ( x ) непрерывно дифференцируема на R , функции fk ( x , uk , t ), k = 1, N и их частные производные по переменным x , uk являются непрерывными на множествах Rn х Uk х Tk , k = 1, N . Функции fk ( x , u k , t ) удовлетворяют условию Липшица по x в Rn х U k х T k с константами L k 0 : \\_fk ( x , u k , t ) - fk ( y , uk , t )|| <  L k\\ x - y ||, k = 1, N . В качестве допустимых управлений рассматриваются N -мерные наборы m ( k )-мерных векторов u = { ur,..., un }, uk g Uk , k = 1, N . О — множество допустимых наборов. Множества Uk c R m ( k ) , k = 1, N компактны и выпуклы. Начальное состояние x 0 и интервалы Tk , k = 1, N фиксированы.

Для управления v = { vr,...,v N } gQ обозначим x ( t , v ), t g T = [ t 0 , t N ] — решение системы (2). Значения x ( t , v ), t g Tk , k = 1, N определяются последовательным интегрированием системы (2) на интервалах разбиения Tk при uk = vk , t G T k , k = 1, N .

Задачу (1), (2) можно рассматривать как специальную задачу математического программирования, в которой требуется определить набор векторов u = { U j ,..., uN } на заданном разбиении интервала T на N непересекающихся интервалов так, чтобы достигался минимум целевой функции (1).

Будем использовать следующее обозначение частного приращения произвольной вектор-функции g ( уг,...,yt ) по переменным y ^ , ys^ :

AZS,ZS g(yi,...,y:) = g(yi,...,zs,...,zs2,...,yi)-g(yi,...,yS1,...,y$2,...,yi). sj s2            1212

Приращение функции (1) на допустимых управлениях u , v в соответствии с введенными обозначениями можно записать в виде:

АvI(u) =Аx(tN,v)ф(x(tN, u)).(3)

Дополнительно обозначим A x ( t ) = x ( t , v ) - x ( t , u ), А u ( t ) = v ( t ) - u ( t ).

Рассмотрим кусочно-дифференцируемую вектор-функцию

P ( t ) = ( P i ( t ),..., p ( t )), t g T с условием:

p(tN) = -Фx(x(tN,u))- q, где величина q удовлетворяет алгебраическому уравнению фФx (x(tN , u)) + q, Ax(tN )) = Ax(tN,v)ф(x(tN , u)) .

При этом по определению полагаем q = 0 в случае линейности функции ф по x , а также в случае x ( tN , v ) = x ( tN , u ). Тогда приращение (3) можно представить в виде:

А V I ( u ) = -( p ( t N X А х ( t N )Y

Рассмотрим тождество:

(p ( t N ), А х ( t N Y -( p ( 1 0 ), A x ( toY = £ « p ( t k ), A x ( t k Y - { p ( t k J, A x ( t k J) ) = £ л. k = 1                                                                k = 1

Определим на каждом интервале T k , k = 1, N сопряженные переменные p k ( t ) = ( p k i ( t X---, pk n ( t )) сусловиями:

p N ( t N ) = p ( t N ) > p k ( t k ) = p k + 1 ( t k ) , k = 1 N 1.

Введем на каждом интервале Tk , k = 1, N функцию Понтрягина:

H k ( pk , x , w k , t ) = < pk , f k ( x , w k , t ) > , pk g R n , w k g U k ( n ) , и определим с ее помощью дифференциально-алгебраическую систему для функции pk ( t ) в форме:

p k ( t ) = - H kx ( pk ( t X x ( t , u X u k , t ) - Г ( t ), t g T k ,                (6)

где величина rk ( t ) = ( rk 1( t ),..., r kn ( t )) определяется в каждый момент времени t g Tk из алгебраического уравнения:

(H kx ( p k ( t X x ( t , u X u k , t ) + rk ( t X A x ( t )) = A x ( t , v ) H k ( p k ( t X x ( t , u ), u k , t ).     (7)

При этом по определению полагаем rk ( t ) = 0 в случае линейности функции fk по x , а также в случае равенства x ( t , v ) = x ( t , u ).

Определим функцию p ( t ), t g T по правилу:

p ( t ) = p k ( t ), t g T k , k = 1, N .

Тогда каждое слагаемое Ik , k = 1, N в указанном выше тождестве можно записать в виде:

I k =( p k ( t k ), A x ( t k y —{ p k ( t k 1 ), A x ( t k - 1 )) = J T ddt(p k ( t ), A x ( t )} dt =

= J T {( p k ( t ), A x ( t )) + ( p k ( t ), A x ( t , v ), vk f k ( x ( t , U ), u k , t ) )} dt =

= J T { -A x ( t , V ) H k ( p k ( t ), x ( t , U ), u k , t ) + A x ( t , v ), vk H k ( p k ( t ), x ( t , U ), u k , t ) } dt =

=L A vt H k ( p k ( t ), x ( t , v ), u k , t ) dt .

T k k

На основе полученного соотношения приращение (3) принимает вид:

N

A v 1 ( U ) =- EJ, A vk H k ( p k ( t ), x ( t , v ), u k , t ) dt .                   (8)

k = 1 T k

Таким образом, значения функции p(t), t g T определяются последовательным интегрированием дифференциальных систем (6), включающих алгебраические уравнения (7), на интервалах разбиения Tk, к = 1, N с начальным условием (4), включающим уравнение (5). Для представления полученной формулы (8) на основе функции p(t), t е T введем дифференциально-алгебраическую систему для переменной p(t), t е T сле дующими соотношениями:

p(t) = -Hkx(Р(tXх(tXwk,t)-rk(t), tеTk, k = 1N,

(Hkx (Р(tX X(tX wk , t) + rk (tX У (t) - X(t)) = Аy (t)Hk (Р(tX X(tX wk, t) , с начальным условием:

Р (tN ) = -Фх (X (tN )) - q,

{Фх (X(tN X + q, У (tN ) - X(tN )) = Аy(tN )Ф(X(tN X , в которой по определению полагаем rk (t) = 0, q = 0 в случае линейности функций ф, fk, k = 1, N по х (линейная по состоянию задача (1), (2)), а также в случае y(t) = х(t) при соответствующих t е T.

Обозначим p ( t , u , v ), t е T = [ 1 0 , t N ] — решение системы (9)-(12), полученное последовательным интегрированием на интервалах разбиения T k , k = 1, N при W k = U k , t е T k , k = 1, N , x ( t ) = x ( t , u ), y ( t ) = x ( t , v ), t е T . Тогда формула приращения (8) приобретает следующую форму:

N

А v I ( u ) =-Е L А vk H k ( p ( t , u , v х ( t , v u k , t ) dt .             (13)

k = 1 k

Формула приращения (13) характеризуется отсутствием каких-либо остаточных членов разложений. Аналог классических формул приращения с остаточными членами разложения, полученных для непрерывных задач оптимального управления в работах [14; 15], применительно к рассматриваемой дискретно-непрерывной задаче (1), (2) можно получить по указанной выше схеме вывода следующим образом.

Рассмотрим кусочно-дифференцируемую вектор-функцию

v (t ) = ( ^ 1 ( t ),..., V n ( t )), t е T с условием:

V(tN ) = -Фх (x(tN,u)).(14)

Тогда приращение (3) представляется в виде:

А v I ( U ) =- V ( t N X А х ( t N )) + o (|| А х ( t N )| I) .

Рассмотрим тождество:

(v( tN), Ах (tN)) - V( 10), Ах (t 0)) = Е ( (v( tk), Ах (tk)} - (v( tk-1), Ах (tk-1)) ) = Е J k. k=1

На каждом интервале Tk , k = 1, N с помощью функции Понтрягина Hk определим дифференциальную систему для сопряженных переменных V k ( t ) = ( V k 1 ( t),.. , V kn ( t )) в форме:

с условиями:

V n ( t N ) = V ( t N ) , V k ( t k ) = V k + i ( t k ) , k = 1 N - 1.

Определим функцию v ( t ), t g T соотношениями:

V ( t ) = V k ( t ), t G Tk , k = 1 ,N .

Тогда каждое слагаемое Jk , k = 1, N в указанном выше тождестве можно записать в виде:

J k = ( V k ( t k ), A x ( t k )}- ( V k ( t k - 1 ), A x ( t k - 1)) = J T d ( V k ( t ), A x ( t )) dt =

= J T { V k ( t ), A x ( t )} + ( V k ( t ), A x ( t , v ), vk fk ( x ( t , u ), u k , t )}} dt =

= J T { —{ H kx ( V k ( t ), x ( t , u ), u k , t ), A x ( t )} + A x ( t , v ), vk H k ( V k ( t ), x ( t , u ), u k , t )} dt .

Полученное выражение в соответствии с [14; 15] можно представить в форме:

Jk = J T A vk H k ( V k ( t ), x ( t , v ), u k , t ) dt + o (|| A u k 11).

В итоге приращение (3) принимает вид:

AvI(u) = —L Jr AVk Hk (Vk (t), x(t, v), Uk, t)dt + o(^LIIAUk 1) • (16) k =1 kk

Введем систему для переменной v ( t ), t g T следующими соотношениями:

с начальным условием:

V(tN ) = -Фх (x(tN )).(18)

Обозначим v ( t , v ), t g T = [ 1 0 , t N ] — решение системы (17)-(18), полученное последовательным интегрированием на интервалах разбиения Tk , k = 1, N при w k = v k , t g Tk , k = 1, N , x ( t ) = x ( t , v ), t g T . Тогда формула приращения (16) приобретает следующую форму:

AvI(u) = -L Jr Avk Hk (V(t, u), x(t, u), Uk, t)dt + o(L ||AUk ||).(19)

k =1 kk

Из формулы (19) следует формула стандартного вида с линейной по приращению управления главной частью приращения целевой функции:

AvI(u) = -L JT (Hk„(V(t,u),x(t,u),uk,t), Au^dt +o(L||Auk|).(20)

k =1 Tkk

Отметим, что в линейной по управлению задаче (1), (2) (функции fk , k = 1, N линейны по u ) формулы (19) и (20) совпадают.

В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (9)-(12) в силу определения совпадает с сопряженной системой (17), (18) стандартного вида. Из определений также следует очевидное равенство p ( t , u , u ) = v ( t , u ), t g T .

В нелинейной по состоянию задаче (1), (2) алгебраические уравнения (10) и (12) всегда можно аналитически разрешить относительно величин r ( t ) и q в виде явных или условных формул (возможно, не единственным образом). Таким образом, дифференциально-алгебраическую сопряженную систему (9)-(12) всегда можно свести (возможно, не единствен -ным образом) к дифференциальной сопряженной системе с однозначно определенными величинами r ( t ) и q .

2 Условия оптимальности и улучшения управления

На основе формулы приращения (20) нетрудно получить необходимое условие оптимальности в задаче (1), (2) для управления и еО в форме следующего неравенства:

N

EL Hkh.(^(t,uXx(t,uXuk,tXwk — ukddt ^ 0 , w = {w1,-.wn}, k=1 T*k wk е Uk, k = 1, N.

Это неравенство можно представить в форме эквивалентной системы неравенств:

f T( H u ( ^ ( t , и ), x ( t , и ), U k , t ), w u^dt ^ 0, w е U k , k = 1, N .    (21)

Систему неравенств (21) можно записать в виде системы уравнений:

U k = arg max f (Hku M t , и ), x ( t , u ), U k , t ), w) dt , k = 1, N . w Uk T k

Обозначим P Y — оператор проектирования на множество Y с Rk в евклидовой норме:

p y ( z ) = argmin(|| У - z ),     z е R k .

y Y

С помощью оператора проектирования систему неравенств (21) можно также представить в проекционной форме c параметром a 0:

U k = P Ut ( Uk + a f т H ku ( ^ ( t , U X x ( t , U X U k , t ) dt ), k = 1, N . k              Tk

Отметим, что для выполнения необходимого условия оптимальности (21) достаточно проверить условие (23) для некоторого a 0. Обратно, из условия (21) следует выполнение условия (23) для всех a 0 .

Для поиска экстремальных управлений, т. е. удовлетворяющих необходимым условиям оптимальности, можно применить и модифицировать известные градиентные методы и их модификации, основывающиеся на формуле приращения (20).

В работе рассматривается новый подход к поиску экстремальных управлений, основывающийся на представлении необходимых условий оптимальности (22) и (23) в форме задач о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов u = {u1,...,uN}. Такое представление дает возможность применить и модифицировать известную теорию и методы неподвижных точек для конструирования новых итерационных алгоритмов поиска экстремальных управлений как решений рассматриваемых задач о неподвижной точке.

Рассмотрим задачу об улучшении допустимого набора u = { и1,...,U N }: найти допустимый набор v = { v 1,..., vN } с условием A vI ( и ) 0.

Для улучшения управления и = { и1,...,U N } можно модифицировать известные градиентные методы, основывающиеся на формуле приращения (20), которые относятся к локальным методам улучшения. В работе рассматриваются новые методы нелокального улучшения, основывающиеся на конструировании с помощью нестандартной формулы приращения (13) условий нелокального улучшения управления в форме задач о неподвижной точке в пространстве управлений.

Покажем, что для улучшения управления в задаче (1), (2) достаточно решить следующую систему уравнений:

V k = arg max f H ( p ( t , и , v ), x ( t , v ), w , t ) dt , k = 1, N . w Uk T k

Действительно, для решения v = {v1,...,vN} системы (24) выполняется неравенство:

L H k ( P ( t , и , v ), x ( t , v ), vk , t ) dt ^f H k ( P ( t , и , v ), x ( t , v ), U k , t ) dt , k = 1, N . TkTk

Суммируя эти соотношения по индексу k , на основе формулы (13) получаем требуемое соотношение A vI ( и ) 0.

Другое условие нелокального улучшения управления построим в линейной по управлению задаче (1),(2), в которой формула (13) принимает следующий вид:

N

A v I ( и ) =—EL H ( p ( t , и , v х x ( t , v х u k , t x A u k} dt .

k = 1 T*k

Рассмотрим систему уравнений:

v k = PUt ( U k + «t H ku ( P ( t , и , v ), x ( t , v ), U k , t ) dt ), k = 1, N . k               Tk

Для решения v = {v1,...,vN} системы (26) на основе известного свойства операции проектирования получаем неравенство:

I T ( h ^u ( p ( t , и , v ), x ( t , v ), u k , t ), a u k) dt ^ ii a u k 112.

В результате из формулы (25) следует улучшение управления и = { и 1,..., un } с оценкой:

1 Х „2

A v 1 ( и ) <— E A U k .

a k = 1

В данной работе системы (24) и (26) рассматриваются как задачи о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов v = {у,...,vN}. Такой подход дает возможность конструировать новые итерационные алгоритмы для поиска улучшающих управлений.

Условия улучшения управления представим в стандартной операторной форме задач о неподвижной точке.

Для допустимых управлений u = { u 1 ,...,uN }, v = {у,..., vN } введем отображения с помощью соотношений:

W k ( u , v ) = arg max I" Нк ( p ( t , u , v ), x ( t , v ), w , t ) dt , k = 1, N .       (28)

W^Uk T*k

С помощью введенных отображений (28) систему уравнений (24) можно записать в следующей операторной форме v = W*(u,v) = G*(v), W*= W,...,WN), которая для заданного управления u = {Mj,...,uN} принимает стандартный вид задачи о неподвижной точке с оператором G*. Обозначим О(u) с О — множество неподвижных точек задачи (24).

Определим следующие отображения c параметром a >  0:

W T ( u , v ) = P Ut ( u k + a H ku ( p ( t , u , v ), x ( t , v ), uk , t ) dt ), k = 1, N .    (29)

k               Tk

С помощью введенных отображений (29) систему уравнений (26) для улучшения управления u = { u 1 ,...,uN } в линейной по управлению задаче (2), (3) можно записать в операторной форме:

v = W a ( u , v ) = G a ( v ), W a = (W a ,..., W N ).

Обозначим O a ( u ) сО — множество неподвижных точек задачи (26).

Покажем, что рассматриваемый подход неподвижных точек для представления условий улучшения управления позволяет в линейной по управлению задаче (1), (2) сформулировать необходимые условия оптимальности (22) и (23) в терминах конструируемых задач о неподвижной точке. При этом оценка улучшения (27) позволяет усилить и получить новое необходимое условие оптимальности по сравнению с необходимым условием (23).

В линейной по управлению задаче (1), (2) отображения (28) можно представить в виде:

W * ( u , v ) = argmax I" lHh ( P ( t , u , v ), x ( t , v ), u k , t ), w)dt , k = 1, N .

w^Uk TTk

На основе этого представления в линейной по управлению задаче (1), (2) получаем следующее утверждение.

Лемма 1. u еО(u) тогда и только тогда, когда    u = {ux,...,uN} удовлетворяет необходимому условию оптимальности (22).

Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (22) можно сформулировать в терминах задачи о неподвижной точке (24) в форме следующего утверждения.

Теорема 1 . Пусть управление u = { их,...,U N } является оптимальным в линейной по управлению задаче (1), (2). Тогда u eQ ( и ).

Следствия (в линейной по управлению задаче (1), (2)).

  • 1.    Задача о неподвижной точке (24) всегда разрешима для управления и = { и х,..., U N }, удовлетворяющего необходимому условию оптимальности (22).

  • 2.    Отсутствие неподвижных точек в задаче (24) или невыполнение условия и eQ ( и ) свидетельствует о неоптимальности управления и = { U j ,..., U n }.

  • 3.    В случае неединственности решения задачи о неподвижной точке (24) появляется принципиальная возможность строгого улучшения управления и = { и х,..., un }, удовлетворяющего необходимому условию оптимальности (22).

На основе задачи о неподвижной точке (26) в линейной по управлению задаче (1), (2) получаем аналогичные утверждения.

Лемма 2. и е^ ( и ) тогда и только тогда, когда и = { их,..., un } удовлетворяет необходимому условию оптимальности (23).

Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (23) можно сформулировать в форме следующего утверждения.

Теорема 2. Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда и eQa ( и ) для некоторого a >  0.

Cледствия (в линейной по управлению задаче (1), (2)).

  • 1.    Задача о неподвижной точке (26) всегда разрешима для управления и = { их ,..., un }, удовлетворяющего необходимому условию оптимальности (23).

  • 2.    Отсутствие неподвижных точек в задаче (26) или невыполнение условия и е^ ( и ) для всех a >  0 свидетельствует о неоптимальности управления и = { и х,..., U N }.

  • 3.    В случае неединственности решения задачи о неподвижной точке (26) управление и = { и х,..., U N }, удовлетворяющее необходимому условию (23), строго улучшается на управлении v eQa ( и ), v * и согласно оценке (27).

Оценка (27) дает возможность сформулировать усиленное необходи-мое условие оптимальности по сравнению с условием (23) в линейной по управлению задаче (2), (3) в терминах задачи о неподвижной точке (26).

Теорема 3 (усиленное необходимое условие оптимальности) . Пусть управление и = { их,..., un } является оптимальным в линейной по управлению задаче (1), (2). Тогда для всех a >  0 управление и = { и х,..., U N } является единственным решением задачи о неподвижной точке (26), т. е.

Qa ( и ) = { и } , a >  0.

Действительно, в случае существования при некотором a 0 неподвижной точки v eQa ( и ), v ^ и , в силу оценки (27) получаем строгое улучшение A vI ( и ) 0, что противоречит оптимальности управления и = { u ^..., U n }.

Проекционная задача о неподвижной точке (26), в отличие от задачи о неподвижной точке на основе операции максимизации (24), в случае существования решения v ^ и , v eQ a ( и ) позволяет на основе оценки (27) получить вывод о строгом улучшении управления u Ω без вычисления целевой функции. Таким образом, в случае существования неподвижных точек v ^ и , v eQ a ( и ) можно сделать вывод о неоптимальности экстремального управления и eQ без вычисления целевой функции.

3 Итерационные алгоритмы

Для численного решения задачи о неподвижной точке оператора G: VE ^ VE, действующего на множестве VE в полном нормированном пространстве E с нормой ||-||Е, v = G(v), ve Ve,                               (30)

можно использовать известный в вычислительной математике метод последовательных приближений и его модификации [17]. В частности, можно применить явный метод простой итерации с индексом $ 0, имеющий форму:

v $ + 1 = G ( v $ ), v 0 e V e .                              (31)

Для улучшения сходимости итерационного процесса задачу о неподвижной точке (32) можно преобразовать к эквивалентной задаче с параметром 5 ^ 0 :

v = v + 5 ( v - G ( v )), v e V E , на основе которой получаем модификацию итерационного процесса:

v $ + 1 = v $ + 5 ( v $ - G ( v $ )), v 0 e V E .

Выбором параметра 5 ^ 0 можно регулировать сходимость рассматриваемой модификации метода простой итерации.

Сходимость указанного итерационного процесса можно анализировать с помощью известного принципа сжимающих отображений. Операторный аналог известной теоремы [17] можно получить в следующей форме.

Теорема 4. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:

B(v 0,1) = {v e VE : I v - v g| |E < 1, v0 e VE, 1 > 0} с константой 0 < M = M(v0,1) < 1:

||G ( v ) - G ( и )|^ <  M|v - u |^, v e B ( v 0 , 1 ), и e B ( v 0 , 1 ).        (32)

При этом выполняется условие:

||G ( v 0) - v 0|^< (1 - M ) l . (33)

Тогда задача о неподвижной точке (30) имеет единственное решение v е B ( v 0, l ) и итерационный процесс (31) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0, l ). Для погрешности метода выполняется оценка:

II v s - v L< M s l v 0 - v L, s > 0.

Доказательство теоремы несложно проводится по методике аналогично работе [17].

Следует отметить, что условие (33) вводится для того, чтобы итерационные приближения процесса (31) принадлежали множеству B ( v 0, l ), на котором выполняется условие Липшица (32).

Для решения задач о неподвижной точке необходимых условий оптимальности (22) и (23) методы простой итерации с заданными начальными приближениями и 0 е Q принимают соответственно следующий вид:

usk+1 = argmaxf H (^ (t, us), x (t, us), uk, t), w\dt, k = 1, N, s > 0. (34) w∈U Tk uk+1 = Pu(uk + at Hu (v(t,us),x(t, us),uk,t)dt), k = LN, s > 0. (35) Tk

В отличие от известных градиентных методов предлагаемые методы неподвижных точек (34) и (35) для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации методов. Свойство релаксации компенсируется нелокальностью последовательных приближений управления и отсутствием на каждой итерации достаточно трудоемкой операции выпуклого или игольчатого варьирования управления в окрестности текущего приближения управления.

На основе теоремы 4 можно показать аналогично работе [18], что при достаточно малых параметрах проектирования a 0 процесс (35) определяет последовательность однозначно определенных и непрерывно зависящих от параметра проектирования итерационных приближений, которая обладает принципиальной сходимостью к экстремальному управлению, удовлетворяющему необходимому условию оптимальности (23).

Таким образом, проекционный метод неподвижных точек (35) в отличие от (34) обладает важной возможностью регулировки свойства сходимости к экстремальному управлению за счет настройки параметра проектирования.

Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения уравнения (23), сходимость итерационного процесса (35) к тому или иному экстремальному управлению определяется выбором начального приближения.

Условия нелокального улучшения (24) и (26) позволяют конструировать итерационные алгоритмы для построения релаксационных по целевой функции последовательностей управлений и получения приближенных решений задачи оптимального управления (1), (2).

Методы простой итерации для решения задач о неподвижной точке (24) и (26) с начальными приближениями v 0 eQ соответственно имеют вид:

vk+1 = arg max [ H(p(t, u, vs), x(t, vs), w, t)dt, k = 1, N, s > 0. weU * T vk+1 = Pu (Uk + afHu (p (t, u, vs), x(t, vs), Uk, t)dt), k = 1, N, s > 0.

Tk

Итерации по индексу s > 0 проводятся до первого строгого улучшения управления u eQ по целевой функции: I(vs+1) < I(u). Далее строится новая задача о неподвижной точке для улучшения полученного расчетного управления и итерационный процесс повторяется.

Если строгое улучшение управления не происходит, то итерационный процесс проводится до выполнения условия:

II vs Я-'I * 4 1 4

где £ >  0 — заданная точность расчета задачи о неподвижной точке. На этом итерации расчета последовательных задач улучшения управления предлагаемыми методами неподвижных точек для построения релаксационных последовательностей управлений заканчиваются.

Заключение

В рассматриваемом классе дискретно-непрерывных управляемых систем построены новые конструктивные условия улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений, на основе которых разработаны итерационные методы решения оптимизационных задач.

Предложенные методы неподвижных точек для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации в отличие от градиентных методов, но компенсируют это свойство нелокальностью последовательных приближений управления, а также отсутствием трудоемкой операции варьирования управления в окрестности текущего приближения с вычислением значений целевой функции, характерной для градиентных методов.

Предложенные методы неподвижных точек для построения релаксационных последовательностей управлений в рассматриваемом классе оптимизационных задач обладают следующими свойствами.

  • 1.    Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления на каждой итерации, характерной для градиентных методов.

  • 2.    Возможность строгого улучшения неоптимальных экстремальных управлений. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.

Оптимизация управлений на основе конструируемых задач о неподвижной точке предлагаемыми итерационными методами последовательных приближений характеризуется простотой вычислительной реализации и сводится к чередующемуся решению задач Коши для фазовых и сопряженных переменных с предварительно вычисляемыми управлениями.

Указанные свойства предлагаемых методов неподвижных точек являются важными факторами для повышения вычислительной и качественной эффективности решения дискретно-непрерывных задач оптимального управления и могут определять перспективное направление разработки эффективных методов оптимизации таких задач.

Список литературы Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем

  • Emelyanov S., Korovin S., Mamedov I. Variable Structure Control Systems. Discrete and Digital. CRC Press, USA, 1995. 316 p.
  • The Control Handbook: Control System Advanced Methods. In: Levine, W. (eds). CRC Press, London, 2010. 1798 p.
  • Van der Schaft A., Schumacher H. An Introduction to Hybrid Dynamical Systems. Springer, London, 2000. 174 p.
  • Gurman V., Rasina I. Discrete-continuous Representations of Impulsive Processes in the Controllable Systems // Automation and Remote Control. 2012. № 8(73). P. 1290-1300.
  • Mastaliyev R. Necessary Optimality Conditions in Optimal Control Problems by Discrete-continuous Systems // Tomsk State University Journal of Control and Computer Science. 2015. № 1(30). P. 4-10.
  • Evtushenko Y. Numerical Optimization Techniques. Publications Division, New York, 1985. 562 p.
  • Табак Д., Куо Б. Оптимальное управление и математическое программирование. Москва: Наука, 1975. 279 с. Текст: непосредственный.
  • Gurman V., Ni Ming Kang. Degenerate Problems of Optimal Control. I. Automation and Remote Control. 2011. № 4(72). P. 727-739.
  • Moiseev A. Optimal ^ntM Under Discrete Control Actions. Automation and Remote Control. 1991. № 9(52). P. 1274-1280.
  • Teo K., Goh C., Wong K. A Unified Computational Approach to Optimal Control Problem. Longman Group Limited. New York, 1991. 329 p.
  • Rahimov A. On an Approach to Solution to Optimal Control Problems on the Classes of Piecewise Constant, Piecewise Linear, and Piecewise Given Functions // Tomsk State University Journal of Control and Computer Science. 2012. № 2(19). P. 20-30.
  • Gorbunov V. A Method for the Parametrization of Optimal Control Problems // USSR Computational Mathematics and Mathematical Physics. 1979. № 2(19). P. 292-303.
  • Srochko V., Aksenyushkina E. Parametrization of Some Control Problems for Linear Systems // The Bulletin of Irkutsk State University. Series Mathematics. 2019. Vol. 30. P. 83-98.
  • Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.
  • Vasiliev O. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.
  • Buldaev A., Khishektueva I.-Kh. The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters // The Bulletin of Irkutsk State University. Series Mathematics. 2017. Vol. 19. P. 89-104.
  • Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.
  • Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского госуниверситета. Математика, информатика. 2020. № 1. С. 35-53. Текст: непосредственный.
Еще
Статья научная