Локальная управляемость, траектория геометрического локального инфимума и условия второго порядка в оптимальном управлении

Автор: Аваков Е.Р., Магарил-Ильяев Г.Г.

Журнал: Владикавказский математический журнал @vmj-ru

Статья в выпуске: 1 т.28, 2026 года.

Бесплатный доступ

В теории оптимального управления вопросы, связанные с необходимыми условиями оптимальности и управляемости системы, являются одними из основных. В данной работе для управляемой системы обыкновенных дифференциальных уравнений определяются понятие ее локальной управляемости относительно произвольной непрерывной функции и понятие траектории геометрического локального инфимума. Отметим, что они двойственны друг к другу в том смысле, что либо управляемая система локально управляема относительно данной функции, либо эта функция является траекторией геометрического локального инфимума. Понятие траектории геометрического локального инфимума обобщает понятие траектории локального инфимума (ранее введенного авторами), которое, в свою очередь, обобщает классическое понятие оптимальной траектории. Траектория локального инфимума - это функция, на которой целевой функционал достигает своего минимума. При этом она, вообще говоря, не является допустимой траекторией, но есть равномерный предел таковых. Оптимальная траектория может не существовать, но существование траектории локального инфимума, очевидно, вполне достаточно для приложений. Ранее указанная двойственность понятий локальной управляемости относительно произвольной непрерывной функции и траектории геометрического локального инфимума исследовалась авторами в случае, когда необходимые условия траектории локального инфимума были первого порядка. В данной работе речь идет о необходимых условиях второго порядка. Следует сказать, что необходимые условия первого и второго порядков траектории локального инфимума усиливают соответствующие все классические условия (в частности, принцип максимума Понтрягина). Наша основная цель - показать, что введение более общих понятий (локальная управляемость относительно произвольной функции, траектория геометрического локального инфимума) позволяет единообразно смотреть на вопросы управляемости и оптимальности в оптимальном управлении. Важную роль играют примеры в конце статьи.

Еще

Траектория геометрического локального инфимума, локальная управляемость, оптимальное управление, условия второго порядка

Короткий адрес: https://sciup.org/143185541

IDR: 143185541   |   УДК: 517.977.52   |   DOI: 10.46698/a7281-6269-9782-p

Local Controlability, Trajectory Geometric Local Infimuma, and Second-Order Conditions in Optimal Control

In optimal control theory, questions related to necessary optimality conditions and the controllability of a control system are among the fundamental ones. In this paper, for a control system of ordinary differential equations, the concept of its local controllability with respect to an arbitrary continuous function and the concept of a trajectory of a geometric local infimum are defined. These concepts are dual to each other in the sense that either the control system is locally controllable with respect to a given function or this function is a trajectory of a geometric local infimum. The concept of a trajectory of a geometric local infimum generalizes the concept of a trajectory of a local infimum (previously introduced by the authors), and generalizes the classical concept of an optimal trajectory. A trajectory of a local infimum is a function such that the objective functional attains its minimum, but, generally speaking, it is not a feasible trajectory and it is a uniform limit of such trajectories. An optimal trajectory may not exist, but the existence of a local infimum trajectory is clearly sufficient for applications. The previously mentioned duality between the concepts of local controllability with respect to an arbitrary continuous function and the trajectory of a geometric local infimum was investigated by the authors in the case, where the necessary conditions for the trajectory of a local infimum were first-order. In this paper we focus on second-order necessary conditions. Note that first-order and second-order necessary conditions for the trajectory of a local infimum are improved the corresponding classical conditions (in partuicular, the Pontryagin maximum principle). Our goal is to show that the introduction of more general concepts (local controllability with respect to an arbitrary function, the trajectory of a geometric local infimum) allows to a unified approach of controllability and optimality in optimal control. Our examples also play an important role.

Еще

Текст научной статьи Локальная управляемость, траектория геометрического локального инфимума и условия второго порядка в оптимальном управлении

  • 1.    Основные определения и утверждения

Пусть U — непустое подмножество R r , заданы отображение ^: R х R n х R r ^ R n переменных t, x и и и отображения f: R n х R n ^ R m 1 и g : R n х R n ^ R m 2 переменных Z i G R n , i = 0,1.

Рассмотрим управляемую систему x = ^(t,x,u), u(t) G U для п. в. t G [to,t1],                      (1)

f (x(t o ) ,x(t i )) С 0, g(x(t o ),x(t i )) = 0,                             (2)

где неравенство понимается покоординатно.

Всюду далее мы предполагаем, что отображение ϕ непрерывно вместе со своей вто рой частной производной по (x, и) на R x R n x R r , а отображения f и g дважды непрерывно дифференцируемы на R n x R n .

Пространства непрерывных вектор-функций на [t o , t i ] со значениями в R n , абсолютно непрерывных вектор-функций со значениями в R n и существенно ограниченных вектор-функций со значениями в R r обозначаются соответственно C ([t o , t i ], R n ), AC ([t o ,t i ], R n ) и L ^ ([t o , t i ], R r ) (если r = 1, то пишем L ^ ([t o ,t 1 ])).

Пара (x( - ),u( - )) G C ([t o ,t i ], R n ) x L M ([t o ,t i ], R r ) допустима для управляемой системы (слово «управляемая» далее опускаем) (1), (2), если выполняются условия (1) и (2). Функцию x0 в этом случае называем допустимой траекторией для системы (1), (2).

Обозначим Z = C ([t o ,t i ], R n ) x L M ([t o ,t i ], R r ) и определим следующее множество достижимости для системы (1), (2) относительно открытого множества V С C ([t o ,t i ], R n ):

R(V ) = { У = (У 1 2 ) G R m 1 x R m 2 : 3 (x( - ),u( - )) G Z, удовлетворяющая :

f (x(t o ),x(t i )) С y i , g(x(t o ),x(t i )) = y 2 , x( - ) G V } .

Определение 1. Скажем, что система (1), (2) локально управляема относительно функции ж0 G C ([t o , t i ], R n ), если для любой окрестности V этой функции выполняется включение

  • 0 G int R(V ).

Обозначим через D множество всех допустимых траекторий для системы (1), (2), рассматриваемое как подмножество C ([t o ,t i ], R n ), а через cl D — его замыкание.

Важно отметить, что в определении 1 функция х( - ) не обязана принадлежать D, но из этого определения следует, что х( - ) G cl D и удовлетворяет условию (2). Действительно, любая окрестность ж0 содержит функции x0 такие, что пара (x( - ),u( - )) G Z удовлетворяет условию (1), f (x(t o ),x(t i )) С y i и g(x(t o ),x(t i )) = У 2 для всех достаточно малых по норме y i и y 2 . В частности, при y i = 0, y 2 = 0, получаем, что в любой окрестности J( - ) есть допустимая траектория для системы (1), (2), т. е. х( - ) G cl D и, очевидно, х0 удовлетворяет условию (2).

При стандартном определении локальной управляемости предполагается, что х(-) — допустимая траектория (см., например, [1, 2]).

Через ∂A будем обозначать границу множества A .

Определение 2. Функция х( - ) G clD называется траекторией геометрического локального инфимума для системы (1), (2), если существует окрестность V С C ([t o ,t i ], R n ) этой функции такая, что

0 G dR(V ).

Так как функция х( - ) может не принадлежать D, то легко заметить, что данное определение обобщает определение геометрически оптимальной траектории (см. [3]), которое дословно совпадает с определением 2, если заменить cl D на D .

Под двойственностью понятий, введенных в определениях 1 и 2, понимается (отмеченный ранее в [4]) следующий факт: если J( - ) g cl D, то либо система (1) , (2) локально управляема относительно функции x() , либо x() — траектория геометрического локального инфимума для этой системы . Это непосредственно следует из приведенных определений.

Отсюда, в частности, следует, что отрицание любых достаточных условий локальной управляемости системы (1), (2) относительно функции x() является необходимыми условиями того, что х( ^) — траектория геометрического локального инфимума для этой системы.

Первый результат, который мы хотим здесь сформулировать — это достаточные условия локальной управляемости системы (1), (2) относительно функции ж0. Для этого понадобятся некоторые дополнительные обозначения и определения.

Для каждого k g N положим

Ak = { а(9 = (а1(),.. .,ak(•)) g (L^([to,ti]))k : a(t) g Sk для п. в. t g [to,ti]}, где

S k = |a = (a i ,..., a k ) g R + :

E a i = 4 , i =i         )

и определим множество

U = { u() g L M ([t 0 ,t 1 ], R r ) : u(t) g U для п. в. t g [t o ,t i ] } .

Сопоставим системе (1), (2) следующую управляемую систему:

k x = E ai(t)

i=i f (x(to),x(ti)) < 0, g(x(to),x(ti)) = 0,                             (4)

где a() = (a i ( ),... ,a k ( )) и u() = (u i ( ),... ,U k ( )), которую будем называть овыпукле-нием системы (1), (2) или просто выпуклой системой. Ясно, что при k = 1 эта система совпадает с исходной системой (1), (2).

Как и выше, тройку (x( ),a( ), и( )) g C ([t o ,t i ], R n ) х A k х U k называем допустимой для выпуклой системы (3), (4), если выполняются условия (3), (4), и функцию xQ в этом случае называем допустимой траекторией для выпуклой системы (3), (4).

Нам понадобятся некоторые обозначения. Евклидову норму в R n обозначаем | () | . Значение линейного функционала А = (A i ,..., A n ) g ( R n ) * (векторы из R n мы рассматриваем как вектор-столбцы, тогда, как известно, сопряженное к R n отождествляется с R n , где векторы суть вектор-строки) на элементе x = (x i ,...,x n ) T g R n (T — символ транспонирования) обозначаем ( A, x ) = n =H=i A i x i - Через ( R n ) * обозначим множество функционалов на R n , принимающих неотрицательные значения на неотрицательных векторах.

Если фиксирована функция х(), то для сокращения записи, частные производные отображений f, g по Z o и Z i , их первые производные и вторые производные в точке (i(t o ),J(t i )) записываем соответственно как f z i , д& , i = 0,1, f , д и f ‘‘ , д ’’ (причем вторые производные стандартным образом отождествляются с соответствующими симметричными билинейными формами).

Если B : X х X ^ Y — билинейное отображение, то действие B на элементе (x i , Х 2 ) записываем так: B [x i , Х 2 ].

Если A : X ^ Y — линейный оператор, то его действие на элементе x иногда будет удобно записывать как A[x], что не приведет к путанице.

Далее, для сокращения записи, вместо ж( - ), «( ), u( - ), h(), v( ' ) и т. д. часто будем писать просто ж, а, и, h, v и т. д.

----------                                                                                                                                                                     .--ч .---- .----

Пусть k G N и тройка (ж, а, и) , где а = (а,.

.., ak) и и = («1,..., Uk), допустима для выпуклой системы (3), (4). Введем следующее множество критических вариаций для -ч -ч этой системы в точке (ж, а, и):

K(х,а,и) = | q = (h,e,v) G AC ([t o ,t i ], R ) х (A k - а) х (L ^ ([W i ], R )) k :

kk

h(t) = ^ & i (t)^ x (t,x(t),U i (t))h(t) + ^ e i (t)^(t,x(t),U i (t)) i =1                                 i =1

k

+ £ a i (t> u (t,x(t),:U i (t))v i (t),f a [h(t o ),h(t i )] 0, o),h(ti)] =0 }, i=1

где в = (e i ,---,e k ), v = (v i ,---,v k ), а f a — вектор, который получается из f = (f i ,...,f m1 ) удалением тех функций f i , для которых f i (x(t o ),x(t i )) < 0. Если f(X(t 0 ),x(t i )') <  0, то неравенство f a [h(t 0 ),h(t i )] 0 в определении K(х,а,и) отсутствует.

Пусть тройка (ж, а, и) допустима для выпуклой системы (3), (4), и G int U k и q = (h,e,v) G K (х,а,и). Обозначим через Л(ж,а, и, q) множество наборов (X f ,X g ,p) G ( R m 1 ) + х ( R m 2 ) * х AC ([t o ,t i ], ( R n ) * ), удовлетворяющих соотношениям:

k

p(t) = -P(t) £ ai(t)Vx (t,x(t),Ui(t)), i=1

pfo) = Xf fZo + XggZo, p(ti) = -Xf fZi - XggZi, {xf, f (x(to),x(ti))) = 0, max(p(t), v(t, X~(t), и)) = (p(t), xTt)) для п. в. t G [to,ti], u∈U k t1

-

£ / a i (t)^p(t),^ xx (t,x(f),H i (t))[h, h](t) +2^ xu (t,x(f),H i (t))[h,V i ](t) i =1 t 0

+^ uu (t,x(t),H i (t))[v i , v i ](t)^ dt

  • k t 1

  • - 2 £ / e i (t) ^p (t),^ x (t,X(t),U i (t))h(t) + V u (t,x(t),H i (t))v i (t)^ dt i =1 t 0

+ (Xf,f'[n,n]) + (Xg,g"[П,П]) > 0, где n = (h(to), h(ti)).

Ясно, что нулевой набор этим соотношениям удовлетворяет.

Заметим, что если k = 1, a 1 = 1, U i = и и e i = 0, то данные соотношения представляют собой условия оптимальности второго порядка с функцией Понтрягина H( t ) = (p(t),p(t,x(t),u(t)))■

Теорема 1. Пусть k Е N , тройка (x,a,u), где u Е int U k , допустима для выпуклой

.—— .——

-—' ■—',

системы (3) , (4) и q Е K(x,a,u) такие, что Л(X,a,u,q) = { 0 } . Тогда система (1) , (2) локально управляема относительно функции х.

Эта теорема доказана в работе авторов [5].

Из отмеченной выше двойственности и теоремы 1 непосредственно следует

Теорема 2. Если функция X является траекторией геометрического локального ин-

.—— .——

■—4 ■——.

фимума для системы (1) , (2) , то Л(—, a, U, q) = { 0 } для любой допустимой тройки (X, a, u) и любого q Е K(X, a, u).

Понятие траектории геометрического локального инфимума обобщает понятие траектории локального инфимума, введенное в работе авторов [6]. Действительно, рассмотрим следующую задачу оптимального управления:

f o (x(t o ),x(t 1 )) ^ min, при ограничениях (1), (2),

где функция f o : R n х R n ^ R переменных Z i Е R n , i = 0,1, обладает теми же свойствами, что и отображения f и g . Об этой задаче будем говорить как о задаче (1), (2), (6).

Задача (1), (2), (6) — стандартная задача оптимального управления, записанная, как иногда говорят, в канонической форме, или как задача в форме Майера. Если в исходной задаче минимизируемый функционал и/или граничные условия содержат интегральные функционалы, то введением дополнительных переменных такая задача легко сводится к задаче вида (1), (2), (6).

Напомним стандартное определение сильного минимума для этой задачи.

Определение 3. Допустимая пара (X( ),X( )) доставляет сильный минимум (или является оптимальным процессом) в задаче (1), (2), (6), если существует окрестность V С C ([t o ,t i ], R n ) функции —( ) такая, что для любой допустимой пары (x( - ),u( - )), для которой x0 Е V, справедливо неравенство f o (x(t o ), x(t 1 )) ^ f o (—(t o ),—(t 1 )).

В этом случае мы говорим, что —( ) — оптимальная траектория в задаче (1), (2), (6).

Ясно, что, если —( ) — oптимальная траектория в задаче (1), (2), (6), то это равносильно тому, что —( ) доставляет локальный минимум функционалу f o на множестве D допустимых траекторий для системы (1), (2).

Следующее определение, введенное в работе [6], обобщает понятие оптимальной траектории.

Определение 4. Функция —( ) Е C ([t o ,t i ], R n ) называется траекторией локального инфимума в задаче (1), (2), (6), если она доставляет локальный минимум функционалу f 0 на замыкании множества допустимых траекторий для системы (1), (2).

Понятно, что значение f 0 на траектории локального инфимума совпадает с точной нижней гранью f 0 по всем допустимым траекториям из данной окрестности (отсюда и название: траектория локального инфимума).

Легко видеть, что если —( ) — оптимальная траектория в задаче (1), (2), (6), то —( ) — траектория локального инфимума в этой задаче. С другой стороны, если функция —( ) — траектория локального инфимум в задаче (1), (2), (6) и допустима, то —( ) — оптимальная траектория в данной задаче.

Пусть —( ) Е C ([t o ,t 1 ], R n ) и отображение f: R n х R n ^ R 1+ m 1 имеет вид f = (f o f o (—(t o ), —(t 1 )), f). Справедливо следующее

Предложение 1. Если функция —( ) — траектория локального инфимума в задаче (1) , (2) , (6) , то она является траекторией геометрического локального инфимума для системы (1) , (2) , где отображение f заменено на отображение f.

<1 Если U0 — траектория локального инфимума в задаче (1), (2), (6), то существует окрестность V функции i( - ) такая, что f o (x(t o ), x(t 1 )) ^ f o (x(t o ),U(t 1 )) для всех допустимых для системы (1), (2) функций х0 G V.

Обозначим через R(V) множество достижимости для системы (1), (2) относительно V, где f заменено на f. Тогда, в силу определения 4, для любого е >  0 точка У = 1 2 ) = ( - е, 0) G R х R m 1 + m 2 не принадлежит R(V ). Отсюда, так как (0, 0) G R(V ), следует, что (0, 0) G dR(V), и значит, Х( ) является траекторией геометрического локального инфимума для системы (1), (2), где f заменено на f. >

Из теоремы 2 и предложения 1 вытекает следующая теорема о необходимых условиях для траектории локального инфимума, доказанная в работе [7], где в силу того, что f заменяется на f, в соотношениях (5) вектор X f заменяется на вектор (X o ,X f ), при этом в (5) изменяются только второе, третье и шестое условия.

Теорема 3. Если функция U G C ([t o ,t i ], R n ) является траекторией локального инфимума в задаче (1) , (2) , (6) , то для любых k G N , а = (a i ,..., U k ) и u = (U i ,..., U k ), где u G int U k , для которых тройка (U, a, u) допустима для выпуклой системы (3) , (4) , и любого q o = (h,e,v) G K o (x,a,u) найдутся ненулевой набор (X o ,X f ,X g ) G R + х ( R m 1 ) + х ( R m 2 ) * и вектор-функция p G AC ([t o , t i ], ( R n ) * ) такие, что выполнены

  • 1)    условие стационарности по х:

k p = —P E a(t)^x(t,x,Ui(t));

i =1

  • 2)    условия трансверсальности:

p(t o ) = X o f oZi + X f f Zi + X g g Zi , p(t i ) = -X o f oZ2 — X f f Z2 X g g Z2 ;

  • 3)    условие дополняющей нежесткости:

(X f ,f (x(t o ),x(t i )) ) = 0;

  • 4)    условие максимума:

max(p(t),^(t,U(t),u)) = ( p(t),U(t) ) для п. в. t G [t o ,t 1 ]; u U

  • 5)    условие неотрицательности квадратичной формы:

k t 1

X o f o [n,n] - E / U i ( t )(p(t),^ xx (t,X(t),u i ( t ))[ h,h ]( t ) i =1 t 0

+ 2^xu(t,U(t),ui(t))[h,Vi](t) + ^uu(t,x(t),U(t))[vi,Vi](t)^ dt k t1

  • - 2 E / e i (t)(p(t),p x (t,x(t),u i (t))h(t) + ^ u (t,x(t),u i (t))v i (t)^ dt i =1 t 0

  • 2.    Примеры

+ (Xf, /‘‘[П,П]) + (Xg,U'[n>n]) > 0, где n = (h(to), h(ti)).

Если множество U компактно, то траектория локального инфимума в задаче (1) , (2) , (6) является допустимой для выпуклой системы (3) , (4) при k = n + 1 .

Как можно видеть, необходимые условия представляют собой семейство соотношений, параметризованное тройками (x,a,u). При этом, если, в частности, U — оптимальная траектория в задаче (1), (2), (6), то эти соотношения при k = 1, U i =1, U i = U и в 1 = 0 содержат известные условия оптимальности второго порядка (см., например, [8, 9]), а также и другие соотношения, которые, вообще говоря, дают дополнительную информацию об оптимальной траектории (см. пример 2 ниже). Таким образом, сформулированная теорема усиливает и обобщает принцип максимума Понтрягина и известные условия оптимальности второго порядка.

Из последнего утверждения теоремы следует, что если множество U компактно, то для траектории локального инфимума в задаче (1), (2), (6) всегда можно выписать семейство необходимых условий оптимальности второго порядка вида 1)-5).

Пример 1. Это пример управляемой системы, для которой можно дать критерий ее локальной управляемости относительно функции, вообще говоря, не являющейся допустимой для этой системы.

Отметим, что если в определенном выше множестве U множество U открыто, то несложно проверить, что в этом случае само множество U также открыто.

Пусть U 0 — открытое подмножество R , содержащее элементы разных знаков, и U таково, что U o С U С clU o .

Рассмотрим следующую управляемую систему:

х 1 = и, х 2 = x 1 f 1 (u) + x 2 f 2 (u), u(t) Е U для п. в. t 6 [0,1], Х 2 (1) - Х 2 (0) 0, Х 1 (0) = 0,  Х 1 (1)=0,

где функции f i и f 2 дважды непрерывно дифференцируемы на R , f i (0) =0 и f 2 (0) ^ 0.

Заметим, что функция U = (U i ,U 2 ) = (0,0) может быть недопустима для данной системы.

Предложение 2. Система (7) локально управляема относительно функции U = (0, 0) тогда и только тогда, когда соотношения f i (u) = Y i u и f 2 (u) ^ Y 2 u, u Е U, не выполняются одновременно ни для каких Y i Е R , i = 1, 2 .

  • <1 Необходимость. Пусть система (7) локально управляема относительно функции U = (0, 0). Покажем, что указанные соотношения не выполняются. Допустим, что они выполняются для некоторых Y i Е R , i = 1, 2. Тогда для любой допустимой для системы (7) траектории х0 = (x i ( - ),Х 2 ( - )), интегрируя по частям, будем иметь

Х 2 (1)

х 2 (0) =

У (x 1 (t)f 1 (u(t)) + x 2 (t)f 2 (u(t))) dt

>

У (Y 1 Х 1 (t):Х i (t) + Y 2 x 1 (t)Х i (t)) dt = 0, 0

т. е. функция х0 Н х 2 (1) х 2 (0) не может принимать никаких отрицательных значений и значит, система (7) не является локально управляемой относительно U.

Достаточность. Пусть соотношения, указанные в предложении, не выполняются одновременно. Покажем, что в этом случае система (7) локально управляема относительно функции х = (0, 0). Снова доказываем от противного. Предположим, что система (7) не локально управляема относительно х. Тогда не выполнены достаточные условия управляемости и тем самым, согласно теореме 1, для любых Ui G Uo и ai G [0,1], i = 1, 2, ai + a2 = 1, для которых справедливы равенства

0 = a i u i + a 2 U 2 , 0 = a i (0f i (u i ) + 0f 2 (u i )) + a 2 (0f i (u 2 ) + 0f 2 (u 2 )),          (9)

i i (0) = 0, i i (1) = 0 и любого набора (h,e,v) G AC ([0,1], R 2 ) x (A 2 a ) x (L ^ ([0,1])) 2 (в = (в 1 2 ), v = (v i ,V 2 ), a = (a i ,a 2 )) из множества критических вариаций K(x,a,u) найдутся набор множителей Лагранжа (A o ,A i ,A 2 ), A o ^ 0, и вектор-функция р0 = (Р 1 ( ' )>Р 2 ( )), не равные одновременно нулю, такие, что выполнены соотношения:

p1(t) = —P2(t)(ai (f1(ui) +0f2(ui)) + a2(fi(u2) + 0f2 (U2))), p2(t)=0, pi(0) = Ai, pi(1) = —A2, P2(0) = P2(1) = —Ao, выполнено условие максимума для п. в. t G [0, 1]:

max p i (t)u = 0                                  (11)

u∈R и справедливо условие неотрицательности квадратичной формы:

Е/ i =1 0

a i (p(t),^ xx (0, U i )[h, h](t) + 2^ xu (0,U i )[h, V i ](t) + ^ uu (0, U i )[v i ,v i ](t) ) dt

2

21 z i =1 0

e i (t)(p(t),^ x (0, U i )h(t) + ^ u (0, U i )v i (t)) dt 0.

Из (10) и (11) следует, что p0 = (0,p 2 ) и p 2 <  0.

Ясно, что любые U i < 0 и U 2 >  0, принадлежащие U o , a i = ui u2 и a 2 = u 1 - u 2 удовлетворяют первому уравнению в (9). Второе выполняется всегда. Подставляя эти α 1 и α 2 в первое уравнение в (10), получаем, что справедливо соотношение

U 2 f i (U i ) = U i f i (U 2 )

для всех указанных U i и U 2 . Отсюда следует, что частное f 1 Uu ) есть константа на U o \{ 0 } , т. е.

fi(U) = YiU для всех u G Uo, отличных от нуля и некоторого Yi• Если 0 G Uo, то равенство сохраняется, так как fi(0) = 0, а тогда, по непрерывности, оно верно и для всех U G U.

Докажем теперь, что существует такая константа Y2, что f2(u) ^ Y2 и для всех и G U. В рассматриваемом случае K(a, a, и) — это совокупность таких наборов (h, e,v), что h = (ai^x (0, Ui) + a2^x (0, U2 ))h + ei (tM0, Ui) + в2^Ы0, U2)

+ ai^u(0,Ui)vi(t) + a2^u(0,U2)v2(t),   h2(1) — h2(0) < 0,   hi(0) = hi(1) = 0}, где h = (hi, h2)T и напомним, ^(х,и) = (и, xifi(u) + x‘If2(u)')T.

Так как ^x (0,Ui) = (0, fi(Ui))T, i = 1, 2, то в силу доказанной линейности fi и того, что aiUi + a2U2 = 0, имеем ai^x(0, Ui) + a2^x(0, U2) = (0, Yi(aiUi + a2U2))T = (0, 0)T.

Далее, ^u(0,Ui) = (1, 0)T, i = 1, 2, и поэтому включение (h,e,v) € K(x,a, и) означает, что hi = ei(t)ui + e2(t)u2 + aivi(t) + a2V2(t), h2 = 0, Ы1) - Ы0) < 0, hi(0)= hi(1)=0.

Несложные вычисления показывают, что ^ xx (0,u i )[h,h] = (0, 2f 2 (u i )h 2 ) T , ¥ xu (0,U i )[h,v i ] = (0, f i (u i )h i V i )T и ^ uu (0,u i )[v i ,V i ] = (0, 0) T , i = 1, 2. Подставляя это в квадратичную форму (12), будем иметь

  • - 2p 2 J ^(a i f 2 (u i ) + a 2 f 2 (u 2 ))h 1 (t) + (aifi (u i )v i (t) + a 2 f i (u 2 )v 2 (t)^ h i (t) 0

+ (e i (t)f i (u i ) + e 2 (t)f i (u 2 ))h i (t)) dt 0.

Учитывая то, что f i (u) = Y i u и выражение для h i , получим

(a i f i (u i )v i (t) + a 2 f i (u2)v 2 (t))h i (t) + (e i (t)f i (u i ) + e 2 (t')f i (u2')')h i (t)

= Y i (a i v i (t) + a 2 V 2 (t) + e i (t)u i + e 2 (t)u 2 )h i (t) = Y i h i (t)h i (t).

Так как h i (0) = h i (1) = 0, то интеграл от этого выражения равен нулю. Следовательно, неотрицательность квадратичной формы означает, что

(a i f 2 (u i ) + 0 2 / 2^2 ))

J h2(t) dt 0

и поэтому aif2(ui)+ 02/2(0,2) > 0. Подставляя сюда ai = -ц^ и a2 = u-u-u-, приходим к неравенству u2f2(ui) > uif2(u2), справедливому для любых ui < 0 и u2 > 0, принадлежащих U. Далее, рассуждая аналогично предыдущему (см. равенство (13)), получим, что f2(u) ^ Y2 u для всех u € U и некоторого γ2 .

Таким образом, доказано, что если система (7) не локально управляема относительно х = (0, 0), то выполняются одновременно соотношения f i (u) = Y i u и f 2 (u) ^ Y 2 u для всех u U и некоторых Y i и Y 2 . Этим доказана достаточность. >

Теперь приведем пример, когда теорема 3 дает больше информации по сравнению с принципом максимума Понтрягина и известными необходимыми условиями второго порядка.

Пример 2. Рассмотрим следующую задачу вариационного исчисления:

J(х()) = ((x)f)/\(x(t)) + х 2 (t)f 2 (:b(t))) dt ^ min, 0

х(0) = 0, х(1) = 0, (15)

где функции f i и f 2 дважды непрерывно дифференцируемы на R , f i (0) =0 и 7 2 (0) ^ 0.

Задачу будем рассматривать на пространстве функций х( - ) AC([0, 1]), для которых Х0 L ^ ([0, 1]). Напомним, что функция х(^) доставляет сильный минимум в задаче (15), если существует такая ее окрестность O в C([0, 1]), что J(х(^)) ^ J(Х(У) для всех допустимых функций х( - ) O .

Нулевая функция, очевидно, допустима в задаче (15). Нетрудно показать, что для этой функции выполняется принцип максимума Понтрягина и известные необходимые условия минимума второго порядка и тем самым она подозрительна на сильный минимум (независимо от того какой вид имеют функции f 1 и f 2 ). Но рассматривая эту задачу как задачу оптимального управления и применяя теорему 3, можно получить дополнительные содержательные условия.

Действительно, запишем задачу (15) как задачу оптимального управления в форме Майера:

X 2 (1) - X 2 (0) ^ min, x i = u, x 2 = x i f i (u) + x i f 2 (u), u(t) G R для п. в. t G [0,1], x 1 (0) = 0, x 1 (1) = 0.

Очевидно, что X i — сильный минимум в задаче (15) тогда и только тогда, когда пара (x,u), где x = (x i ,x 2~ ) и и = X i , доставляет сильный минимум в задаче (16).

Справедливо следующее

Предложение 3. Для того чтобы нулевая функция доставляла сильный минимум в задаче (15) необходимо и достаточно, чтобы существовали такие константы γ 1 и γ 2 , что f 1 (u) = Y 1 u, а f 2 (u) Y 2 u для всех и G R .

  • <1 Из предложения 1 следует, что если нулевая функция доставляет сильный минимум в задаче (16), т. е. является оптимальной траекторией для этой задачи, то она есть геометрически оптимальная траектория для управляемой системы

X 1 = u,   X 2 = x i f i (u) + x i f 2 (u),    u(t) G R для п. в. t G [0,1],

x 2 (1) x 2 (0) C 0, x 1 (0) = 0,   x 1 (1) = 0.

Необходимыми условиями для нее являются, как было отмечено ранее, отрицание любых достаточных условий локальной управляемости системы (17) относительно нулевой функции. В предложении 2 (где надо взять U o = U = R ) сформулированы достаточные условия, заключающиеся в том, что соотношения f i (u) = Y i u и f 2 (u) ^ Y 2 u, u G R , не выполняются одновременно ни для каких Y i G R , i = 1, 2. Следовательно, если нулевая функция доставляет сильный минимум в задаче (15), то существуют такие константы Y i и Y 2 , что f i (u) = Y i u, а f 2 (u) ^ Y 2 u для всех u G R . Необходимость доказана.

Достаточность следует из того, что если выполняются указанные соотношения, то, согласно (8), нулевая функция доставляет глобальный (и тем самым сильный) минимум интегралу в (15). >