Аналог уравнения Эйлера и необходимые условия оптимальности второго порядка в задаче оптимального управления нелинейным интегральным уравнением Вольтерра
Автор: Агшин Абиль оглы Абдуллаев
Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Математика
Статья в выпуске: 1 (68), 2025 года.
Бесплатный доступ
Рассматривается задача оптимального управления о минимуме многоточечного функционала, определенного на решениях нелинейного интегрального уравнения, получены неявные необходимые условия оптимальности первого и второго порядков. Также, используя их, установлен аналог уравнения Эйлера и получены конструктивно проверяемые необходимые условия оптимальности второго порядка. Изучены особые, в классическом смысле, управления на оптимальность.
Задача оптимального управления, многоточечный функционал качества, функция Гамильтона-Понтрягина, необходимое условие оптимальности, допустимое управление, аналог уравнения Эйлера, аналог уравнения Лежандра - Кле, особое управление в классическом смысле
Короткий адрес: https://sciup.org/147247345
IDR: 147247345 | DOI: 10.17072/1993-0550-2025-1-6-17
Текст научной статьи Аналог уравнения Эйлера и необходимые условия оптимальности второго порядка в задаче оптимального управления нелинейным интегральным уравнением Вольтерра
Эта работа © 2025 Абдуллаев А.А. распространяется под лицензией CC BY 4.0. Чтобы просмотреть копию этой лицензии, посетите
Многие сложные процессы описываются различными интегральными уравнениями типа Вольтерра (см. напр. [1–6]). Поэтому изучаются различные задачи оптимального управления, описываемые интегральными уравнениями. В работах [1, 7–9] и др. исследованы ряд задач оптимального управления, описываемые интегральными уравнениями типа Вольтерра с критериями качества типа Лагранжа или же терминального типа, и установлены некоторые необходимые условия оптимальности первого порядка при различных предположениях на данные задачи.
Но нередко условия оптимальности первого порядка, вырождаясь, становятся неэффективными (см. напр. [10]). Поэтому возникает необходимость в получении необходимых условий оптимальности высокого, в частности второго, порядка. Они позволяют также сузить множество допустимых управлений, подозрительных на оптимальность.
В предлагаемой работе рассматривается задача о минимуме многоточечного функционала, определенного на решениях нелинейного интегрального уравнения, порожденных всевозможными кусочно-непрерывными управляющими функциями (с конечным числом точек разрыва первого рода) при предположении об открытости области управления.
Для начала были получены неявные необходимые условия оптимальности первого и второго порядков. Используя их, был установлен аналог уравнения Эйлера (необходимое условие оптимальности первого порядка), и получен ряд конструктивно проверяемых необходимых условий оптимальности второго порядка.
В конце работы изучены особые в классическом смысле [10] управления на оптимальность.
Постановка задачи
Предположим, что управляемый объект описывается на заданном отрезке времени [^ 0 , t 1 ] системой нелинейных одномерных интегральных уравнений типа Вольтерра.
t
z(t) = J f(t i ,T,z(T),u(T))dT, T,t G [t o ,t i ]. (1)
t 0
Здесь f(t, t,z,u) - заданная n -мерная вектор-функция непрерывная по совокупности переменных вместе с частными производными по ( z, и) до второго порядка включительно, u(t) - г-мерный кусочно-непрерывный (с конечным числом точек разрыва первого рода) вектор управляющих воздействий со значениями из заданного непустого, ограниченного и открытого множества U - r-мерного линейного пространства Rr т.е.
u(t) EU ^ Rr,t Е [t0t 1 ]. (2)
Каждую управляющую функцию с вышеприведенными свойствами назовем допустимым управлением.
Предполагается, что при заданном допустимом управлении u(t) интегральное уравнение (1) имеет единственное непрерывное решение z(t) интегрального уравнения (1).
На решениях интегрального уравнения (1), порожденных допустимыми управлениями, определим многоточечный функционал:
Здесь p(z 1 ,z2, —Z k ) - заданная непрерывно-дифференцируемая скалярная функция, а ТЕ (t0, t 1 ], i = 1,к - заданные точки, причем
<Т 1 <Т 2 < "' < Т к — t i .
Рассмотрим задачу о минимуме функционала (3) при ограничениях (1), (2).
Допустимое управление, доставляющее минимальное значение функционалу (3) при ограничениях (1), (2), назовем оптимальным управлением.
Целью работы является вывод необходимых условий оптимальности первого и второго порядков, носящие конструктивный характер. Как видно, многоточечный функционал (3) является более общим, чем терминальный функционал.
Вычисление первых и вторых вариаций функционала качества
Предположим, что (u(t),z(t)) и (u(t) = u(t) + Au(t),Z(t) = z(t) + ^z(t)") некоторые допустимые процессы.
Тогда ясно, что приращение Az(t) будет решением интегрального уравнения
t
^z(i) = $ т^.ы^^
t 0
Запишем приращение многоточечного функционала (3):
N^ =J(u} —J(u) = p(z(T i ),Z(T2) .— Z(Tk)) — p(z(T i ),z(T2) —Z(Tk)}. (5) Пусть ^(t) пока произвольная n - мерная вектор-функция.
Тогда из тождества (4) получим, что ti
= $ [$ ^ ‘ (t)(f(t,T,z(T),n(r))—f(t,T,z(T),u(T)))drldt.
J to t0to J
Из формулы (6), применяя формулу Дирихле (см. напр. [11], с. 136), будем иметь t
t i
$ ^ ‘ (t)Ax(t)dt = $ $ ^ , (r)(f(
t
T,t,z(t),u(t)~) — f(r,t,z(t),u(t))) dr dt.
Далее из соотношения (4) следует, что
^z(T i ) = I (f(Tb t, z(t), u(t)) —f^T, t z(t), u(t))) dt.
J to
Пусть a i (t), i = 1, к характеристические функции на отрезках [ t0, T] i = 1, к.
Тогда последнее соотношение может быть записано в виде t1
^x(T j) = I a^t) ( f(T i , t, z(t) u(t)) - f(T i , t, z(t) u(t))) dt.
J to
Используя формулу Tейлoра из (5), получим, что
цуУ^^^^+
2Z—iZ—i i dztdzi i=i]=1
(\у№(Ъ)\\ ).
Заметим, что здесь выражение \|а| является нормой вектора а = (а1, а2,^ ,ап) в Rn, которая вычисляется по формуле \|а|| = X^=1lajl, а (') штрих - операция транспони- рования.
Учитывая формулы (7) и (8) в формуле приращения (9) получим
^J(u) = I 9 Ф( ( 1 ), (*) —,-(^a i (t) ( f(T i , t,z(t),u(t)~) + f(T j , t,z(t),u(t))~) dt + t o
+ | y(t)&z(t)dt— I [I ^ ' (t) (f(r, t,z(t),u(t)) — f (t, tl-(t),u(t))') dT] dt +
([ у ( ^ z(Ti ' xi))] ).
+iyyz(na^^+
2Z—iZ—i j dzidzJ i=i j=i
Теперь для рассматриваемой задачи оптимального управления введем аналог функции Гамильтона–Понтрягина в виде:
H (t,z(t),u(t),1(t) ) =
д(p(-(T1),z(T2),.,-(Tk))
= —yai (t)---------—--------ff(Tb t, z(t), u(t)) + i=i i ti
+ I 1 ' (T)f(T,t,z(t),u(t))dT.
Учитывая вид функции Гамильтона–Понтрягина в формуле (10), получим y(u = — I l1'(t)Az(t)dt — t to
— I (h (t, z(t), u(t),1(t)) — H(t, z(t), u(t),1(t))) dt +
J to x
■.'y. y
А из формулы (11), на основании формулы Тейлора, будем иметь
(tl\dH ' (t,z(t),u(_t),1(_t)) dH ' (t,z(t),u(t),1(t)) ]
AJ(u) = — I ---------------------^z(t) +--------------------- ^u(t) \ dt —
Jt0 dz du \ ti
_1 Г [ awm^^ + 2Ди‘(0™ц«^ +
2 J [ dz2 dudz to
+Uu ' (t)
ti d2H(t,z(t),u(t),)(t))
---L122_12^Au(t)ldt- | o2([||Az(t)|| + ||Mt)|im du2 J J to
+ 0 i ([Siu^l] ) + ft 1 ^ ' (t)^z(t)dt.
Предположим, что )(t) удовлетворяет соотношению dH(tlz(t)lu(t),)(t)) )(t) =---------HZ---------.
Соотношение (13) является линейным неоднородным интегральным уравнением относительно )(t) (сопряженная система) [10-12].
При этом формула приращения (12) примет вид:
t i
( dH'(t,z(t),u(t),)(t)) UJ(u) = — ------------------- -uu(t)dt
J ou to
t i
— 1 Г [uz ‘ °н^.и^
2 J [ dz2
t o
+2Uu'(t)
+ d2H(t,z(t),u(t),)(t))
dudz
Uz(t) +Uu'(t)
d2H(t,zCt),u(t),)Ct))
du2
Uu(t)] dt +
+O i ([SlUz(T ‘ )l] )—Jo 2 ([|Uz(t)| + |Uu(t)|] 2 )dt.
В дальнейшем нам понадобится оценка нормы приращения траектории x(t~).
Из формулы (4), переходя к норме, и используя условие Липшица получаем, что t
|Uz(t)| где L1 = const > 0 некоторое постоянное. Применяя к последнему неравенству лемму Гронуолла–Беллмана (см. напр. [11]), получим, что t ||Uz(t)| (L2 = const > 0). Из уравнения (4) получаем, что Uz(t) является решением линеаризованной системы уравнений Uz(t) = — ,T,z(T),u(T)) Л . . , --HZ------ uz(^ + dz to + df(t, t,z(t),u(t)) du Uu(z) +Оз(\№(т)1+ lUu(T)l)]dc. По предположению множество U (область управления) является открытой. Поэтому специальное приращение допустимого управления u(t) можно определить по формуле Au£(t) = s8u(t),t е [t0,t1]. (17) Здесь г достаточно малое по абсолютной величине число, а 8u(t) е Rr, t е [t0, t1] произвольная кусочно-непрерывная и ограниченная вектор-функция. Через Az£(t) обозначим специальное приращение траектории z(t), отвечающее специальному приращению (17) управления u(t). Из оценки (15) следует, что ||△ze(t)П < Ьз£,1 e[to,ti],(18) (L3 = const > 0) Учитывая формулу (17) и оценку (18) в формуле (16), получим, что tt df(t,T,z(T),u(T)) df(t,т,z(т'),u)т')) Az£(t) = I 7 V ' ' n 7Az£(T)dT + g I V , ' ^u(T)dT + o4(£;t). £ J dz * Jdu to При помощи этого разложения доказывается Лемма. Для специального приращения Az£(t) траектории z(t) имеет место разложение Az£(t) = c8z(t) + о5(г; t),(19) здесь 8z(t) является решением линейного неоднородного интегрального уравнения Вольтерра t\df(t,T,z(T),u(T)) df(t,T,z(T'),u(T')') 8z)t)=I Iм,' ^J8z(+ + V , ' ^u(T)ldr.(20) J to I dz duJ Лемма доказывается по схеме, аналогичной схеме из [10], используемой в случае задачи оптимального управления обыкновенными дифференциальными уравнениями. Учитывая разложение (19) и формулу (17) в приращении (14) функционала, полу- чим, что t1 S(u + Au*) — S(u) = —г I dH,(t,z)t),u)t),^)t)') du 8u(t)dt + 7 к к +^2is5z‘(Ti) to d2^(z(Ti),z(T2),.,z(Tk)) dzldzj Sz(Tj) — ti —7 / [8z’(t) t0 d2H(t,z)t),u)t)/ф)t)) dz2 8z(t) + 28u‘(t) d2H(t,z)t),u)t)/ф)t)') dudz 8z(t) + d2H(t,z(t),u(t),^(t)) +8u'(t)---------—--------— 8u(t) dt + о(г2). На основании этого разложения заключаем, что первая и вторая вариации (в классическом смысле) функционала (3) имеют, соответственно, вид: ti dH'(t,z)t),u)t)/ф)t)') 81J)u;8u) = —| ---^—^-^--^u^dt,(21) Jdu t0 9 z 4 д2^)z)T).z)T)z(Tky). 82J)u;8u)=) ) 8z')Ti)—^-^-^---^^Lsz)—- Z—iZ—i dz^dz; 1=1j=1 t1 ( L d2H(t,z(tXu(tX^(t)) d2H(jt,z(t(Mt(Mt)) ? ,^ , - 8z‘(t)---------7—:---------8z(t) + 28u'(t)---------——---------8z(t) + J [ dz2 dudz to d2H(t,z(t),uCt),^Ct)). +8u (t)----------——----------8u(t) \ at. du2 J Необходимые условия оптимальности Поскольку по предположению множество U открытое, то для оптимальности управления необходимо, чтобы первая вариация функционала вдоль оптимального управления u(t) была равной нулю и вторая должна быть неотрицательной (см. напр. [10-13]). Поэтому из соотношений (21) и (22) следует, что вдоль оптимального управления u(t), для всех 8u(t), t Е Т (вариация управления) ti ( dH\t,z(t),u(t),V(t)} I -----------------------ou(t)at = 0,(23) Jdu to VVs ,п.лд2ЧТ)т1>.....z(TiM. „.4 fL .^д^.гЮ.иЮ.фЮ) LL8zm-----dz^,-----8z(T) - J [8z (t)-------az?-------8z(t) + i=U=i 1 Jto (24) d2H(t,z(t^u(t^(t)) * A d2H(t,zu(,u(t},)(t}} +28u\t)--------——---------8z(t) + 8u (t)--------——--------8u(t) at > 0. dudz du2J Соотношения (23) и (24) являются неявными необходимыми условиями первого и второго порядка, соответственно. Из них надо получить необходимые условия оптимальности, явно выраженные через параметры рассматриваемой задачи. Из тождества (23) следует Теорема 1. Для оптимальности допустимого управления u(t) необходимо, чтобы соотношение dH(0,z(0),u(0),^(0)) = q du выполнялось для всех 0 Е [t0,t1). Здесь 0 Е [t0,t1) произвольная точка непрерывности управления u(t). Соотношение (25) является аналогом уравнения Эйлера из вариационного исчисления (см. напр. [10, 11]). Каждое допустимое управление, являющееся решением уравнения Эйлера (25), назовем классической экстремалью. В принципе, число классических экстремалей может быть достаточно большим. Поэтому необходимо иметь необходимые условия оптимальности второго порядка носящие явный характер. Пусть R (t, т) (п х п) - матричная функция, являющаяся решением матричного линейного интегрального уравнения t df(t, t,z(t),u(t)) dz . Г df(s,T,z(T),u(T)) R(t,T)= I R(t, s) M , J ds + J dz T Тогда решение z(t) уравнения (20) допускает представление (см. напр. [6]) t / т \t . С df(T,s,z(sYu(s) z \ C df(t,T,z(T),u(T)_ 8z(t) = I R(t,T) | , 8u(s)ds dT+ I „ 8u(r)dT. J \ J du I JOU t0 \t0 / Отсюда применяя формулу Дирихле получаем, что tTt f\C df(s,T,z(T),u(T)) fd((t,T,z(Tuu(T)) 8z(t) = I I R(t,s) V ’ ;5u(T)ds di+ I „ J 8u(T)dt. J dz \ Jou t0 LT_l Полагая t df(t, t,z(t),u(t)) du Г df{s,T,z(T),u(T)) Q(t,T) = I R(t,s) M я Jou т получим t 8z(t) = I Q(t,T)8u(T)dT. t0 Из представления (26) следует, что t1 8z(Ti) = J ai(t) Q(Ti,t)8u(t)dt. to Теперь, используя представления (26) и (27), займемся преобразованием отдельных слагаемых в неравенстве (22). На основе формулы (27) получаем, что 8z’(Td d2^(z(T1),z(T2).^,z(Tk)) ti ti = I I ai(T')aj(s)8u(T')Q(Ti,T') to to d2^(z(Ti),z(T2) ...,z(Tky) x-------—-------- dzidzj 8z(Tj) = dzidzj Q^Tps^us^dsdT. Используя формулу (26), будем иметь: ti { к d2H(t,z(t),u(t),Ф(t)) x \ 8u(t)--------—---------8z(t)dt = J dudz to t1 Г t [ d2H(t’ z(t),u(t),^(t)) ЧР z ЧЛ 4 dt, = 8u(t)---------t—---------Q(t,T)8u(T)dT) J J du2 to Lt0 t i x o2H(t,z(t),u(t),^(t)) x z.4. 8z'(t)---------—---------8z(t)at = Jdz to ti ti ПГ {t1 d2H(t,z(t),u(t),^(t))1 8u'(t) I I Q'(t, t)-----------t—^-----------Q(t, s)dt I 8u(s~)dt.(30) max(T,s) dzJ to to По аналогии ([12]) введем обозначение Л Л d2(p(z( T1),z(T2),.,z(Tk)), K(r,s) = -^^ai(T)a'j(s) Q'(Т^т)---------dTdz----------Q(Ts') + 1=17=1 t1 yd2H + Q (t,?)---------— ---------Q(t,s)dt.(31) J max(r,s) Учитывая введенные обозначение К(т, s') и тождества (28)-(31) из неравенства (22) получим. Теорема 2. Для оптимальности классической экстремали u(t) необходимо, чтобы Как видно, неравенство (32), являясь общим интегральным необходимым условием оптимальности второго порядка, носит конструктивный характер. Более того, из него можно, за счет произвольности допустимых вариаций 8u(t) управляющей функции u(t) получить ряд еще более легко проверяемых необходимых условий оптимальности. Приведем одну из них. Теорема 3. Для оптимальности классической экстремали u(t) необходимо, чтобы неравенство , d2H(0,z(0),u(0),^(0)) V’------------------V <0 du2 выполнялось для всех 0 Е [t0, t1) и V Е Rr. Здесь 0 Е [t0, t1) - произвольная точка непрерывности управления u(t). Неравенство (33) есть аналог условия Лежандра–Клебша из вариационного исчис- ления [10–12] для рассматриваемой задачи. Докажем условие оптимальности (33). Пусть 0 Е [t0, t1) - произвольная точка непрерывности управления u(t), г > 0 достаточно малое произвольное число, такое что, 0 < г < t1, иv Е Rr произвольный век- тор. В силу произвольности допустимой вариации 8u(t) управления u(t), его определим по формуле _ (V, tЕ [0, 0+ г) Sus(t) {0, t Е [to,ti]\[0,0+ г). (34) Учитывая выражение 8uE(t), в формуле (34) из неравенства (32), после некоторых преобразований получим, что sv' d2H(0,z(0),u(0),^(0)) du2 V + о(г) < 0. Разделив обе части последнего неравенства на е и переходя к переделу при е ^ 0 получим утверждение теоремы 3. Теорема 2 позволяет получить необходимые условия оптимальности также при вырождении аналога условия Лежандра-Клебша. По аналогии с работами [10, 12] введем понятие особого в классическом смысле управления. Определение. Если для всех в G [t0. tj и v G Rr , д2Н(в^(в\и(вУ^(в) v'--------—--------v = 0, то классический экстремаль будем называть особым (в классическом смысле) управлением в задаче (1)-(3). Из введенного определения ясно, что для особых в классическом смысле управлений аналог условия Лежандра-Клебша, вырождаясь, становится неэффективным. Пусть u(t) особое (в классическом смысле) оптимальное управление. Учитывая формулу (36) в неравенстве (32), получим, что в особом случае E2v'K(e, e}v + 2 ,д2Н(в,z(в).u(в).ф(в)) 2 V'--------——---------Q(e,e)v + dudz +о(е2) < 0 . Отсюда, в силу произвольности е > 0 получаем, что Г z д2Н(в^(вУи(ву-ф(в) z 1 v' 1к(в, в) +----Q(e.e)l v < 0 [ audz J Таким образом, доказана Теорема 4. Для оптимальности особого в классическом смысле управления u(t) необходимо, чтобы неравенство (36) выполнялось для всех в G [t0. t1) и v G Rr. Замечание. Как известно, (см. напр. [13]) применение серии игольчатых вариаций при доказательстве необходимых условий оптимальности первого порядка не усиливает ни принципа максимума Понтрягина, ни его следствия. В особом случае же использование серии игольчатых вариаций позволяет усилить необходимые условия оптимальности, особых управлений, полученных с помощью простых игольчатых вариаций (см. напр. [13, 14, 16, 17]). Исходя из этого, результат Теоремы 4 можно усилить. Заметим, что ряд необходимых условий оптимальности первого и второго порядков, в частности аналог условия Лежандра–Клебша для задачи оптимального управления, описываемого системой обыкновенных дифференциальных уравнений с нетиповым критерием качества, получены в работе [15]. Заключение В работе рассматривается задача минимизации многоточечного функционала, определенного на решениях нелинейного интегрального уравнения в классе кусочно-непрерывных управляющих функций при предположении, что область управления является ограниченным и открытым множеством. Методом приращения выведены первая и вторая вариации критерия качества. Из условия равенства первой вариации функционала вдоль оптимального управления получен аналог уравнения Эйлера. А из условия неотрицательности второй вариации функционала получены общие необходимые условия оптимальности, позволяющие установить аналог условия Ле-жандра–Клебша и исследовать особые (в классическом смысле) управления на оптимальность.
неравенство
t1 t1
J J 8u‘(v)K(T,s)8u(s)dsdT +
to to
t1
+ J [Jt8u‘(t) -Ht z(^ ^ Q(t, t)8u(t)dt] dt +
0 '^HtzVuWMt)).
+ 8u (t)--------—--------8u(t)dt < 0 (32)
ou2
Lo
выполнялось для всех 8(u) Е Rr, t Е Т.
Список литературы Аналог уравнения Эйлера и необходимые условия оптимальности второго порядка в задаче оптимального управления нелинейным интегральным уравнением Вольтерра
- Винокуров В.Р. Оптимальное управление процессами, описываемыми интегральными уравнениями // Изв. Вузов, сер. Математика. 1967, № 7. С. 21–33.
- Владимиров В.С. Уравнение математической физики. М.: Наука, 1976, 528 с.
- Вольтерра В. Теория функционалов, интегральных и интегро-дифференциальных уравнений. М.: Наука, 1982. 304 с.
- Абуладзе А.А. Задачи оптимального управления для систем, описываемых интегральными уравнениями. Тбилиси: Изд-во ТГУ, 1988. 117 с.
- Васильева А.Б., Тихонов Н.А. Интегральные уравнения. М.: Изд-во МГУ, 1989. 156 с.
- Смирнов В.И. Курс высшей математики. Т. IV, ч. I. М.: Наука, 1974. 336 с.
- Мансимов К.Б., Мустафаев М.Г. Некоторые необходимые условия оптимальности в задачах управления, описываемые интегральными уравнениями типа Вольтерра // Известия АН Азерб. ССР. Сер. физ-техн. и матем. Наук. 1985, № 5. С. 35–41.
- Carlson D.A. An elementary Proof of the maximum principle for optimal control problems gov-erned by Volterra integral equations // Yourn. of Optim. theory and Apple. 1987. Vol. 54, № L. P. 32–45. DOI: 10.1007/bf00940404 EDN: YLWVEX.
- De la Vega Constanta. Necessary conditions for optimal terminal time control problems governed by a Volterra integral equation // Journal Optimization theory and Apple. 2006. Vol. 130, no. 1. P. 79–93. DOI: 10.1007/s10957-006-9087-7.
- Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М.: Либроком, 2011. 259 с.
- Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Физмат-лит, 2018. 384 с.
- Мансимов К.Б. Особые управления в системах с запаздыванием. Баку: "Элм", 1999. 176 с.
- Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. Минск: изд-во "Наука и техника", 1974. 272 с.
- Мансимов К.Б., Марданов М.Дж. Качественная теория оптимального управления в системах Гурса–Дарбу. Баку: "Элм", 2010. 360 с.
- Мансимов К.Б., Нагиева И.Ф. Необходимые условия оптимальности первого и второго порядков в одной задаче оптимального управления с нетиповым критерием качества // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2023, № 64. С. 11–20. DOI: 10.17223/19988605/64/2 EDN: GHXADE.
- Гороховик С.Я. Необходимые условия оптимальности в задаче с подвижным правым концом траектории // Дифференциальные уравнения. 1975, № 10. С. 1765–1773.
- Срочко В.А. Многоточечные условия оптимальности для особых управлений // В сб. "Численные методы анализа (прикладная математика)". Иркутск, СО АН СССР, 1976. С. 43–50.