Методы поиска особых экстремальных управлений в линейных по управлению системах
Автор: Казьмин И.Д., Булдаев А.С., Мижидон А.Д.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 1, 2025 года.
Бесплатный доступ
В классе линейных по управлению задач оптимального управления предлагаются новые формы принципа максимума в виде задач о неподвижной точке операторов управления. На основе новых форм принципа максимума даются новые определения особых экстремальных управлений и показывается их эквивалентность известному понятию особого экстремального управления. Предлагаемые новые формы принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений с однозначно определяемыми приближениями особых значений управления. Доказываются теоремы о сходимости итерационных процессов предлагаемых методов.
Управляемая система, принцип максимума, особое управление, задача о неподвижной точке, итерационный метод
Короткий адрес: https://sciup.org/148331685
IDR: 148331685 | УДК: 517.977 | DOI: 10.18101/2304-5728-2025-1-26-41
Methods for searching degenerate extremal controls in linear control systems
In the class of control-linear optimal control problems, new forms of the maximum principle are proposed in the form of problems about a fixed point of control operators. Based on the new forms of the maximum principle, new definitions of degenerate extremal controls are given and their equivalence to the known concept of a degenerate extremal control is shown. The proposed new forms of the maximum principle allow constructing new iterative methods for searching for degenerate extremal controls with uniquely determined approximations of degenerate control values. Theorems on the convergence of iterative processes of the proposed methods are proved.
Текст научной статьи Методы поиска особых экстремальных управлений в линейных по управлению системах
Многие модели оптимизации управляемых процессов в области биологии, экономики, медицины, энергетики описываются системами, линейными по управлению. В классе линейных по управлению задач оптималь- ного управления часто встречаются особые задачи, в которых необходимые условия оптимальности в форме классического принципа максимума не позволяют однозначно определять значения экстремального управления. Это приводит к существенному усложнению поиска особых экстремальных управлений. В частности, метод краевой задачи принципа максимума и градиентные методы [1-5] становятся не эффективными в особых задачах.
В настоящей работе в классе линейных по управлению задач рассматриваются новые формы принципа максимума в виде операторных задач о неподвижной точке в пространстве управлений. Доказываются теоремы об эквивалентности рассматриваемых форм условий принципа максимума известному условию принципа максимума. Определяются понятия особых экстремальных управлений на основе сконструированных задач о неподвижной точке. Доказываются утверждения об эквивалентности введенных понятий с известным определением особого экстремального управления. Построенные задачи о неподвижной точке принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений, обладающие свойством однозначного определения итерационных приближений особых значений экстремального управления и свойством сходимости по управлению в широких предположениях.
Рассматривается класс линейных по управлению задач оптимального управления:
Ф ( и ) = ф ( x ( t 1 )) + j (( a ( x ( t ), t ), u ( t )) + d ( x ( t ), t )) dt ^ inf , (1)
x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x °, и ( t ) g U c R m , t g T = [ 1 0 , 1 1 ], (2) в котором x ( t ) = ( x 1 ( t ),..., xn ( t )) — вектор состояния системы, и ( t ) = ( и1(t ),..., u m ( t )) — вектор управления. В качестве допустимых управлений и ( t ) = ( и1(t ),..., u m ( t )) рассматривается множество V кусочнонепрерывных функций на интервале T со значениями в компактном и выпуклом множестве U c R m . Начальное состояние x0 и интервал T заданы. Функция у ( x ) дифференцируема на Rn , функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ) дифференцируемы по переменной x и непрерывны по переменной t на множестве Rn х T .
Функция Понтрягина с сопряженной переменной у в задаче (1), (2) представляется в следующем виде:
H ( у , x , и , t ) = H о ( у , x , t ) + < H 1 ( у , x , t ), и ) ,
H о ( у , x , t ) = < y , b ( x , t ) ) - d ( x , t ), H i ( y , x , t ) = A T ( x , t ) y - a ( x , t ).
Стандартная сопряженная система рассматривается в следующей форме:
y & ( t ) = - H x ( у ( t ), x ( t ), и ( t ), t ) , t g T , y ( 1 1 ) = -y x ( x ( t i )) . (3)
Введем следующие обозначения для v g V :
-
- x ( t , v ), t e T — решение системы (2) при u ( t ) = v ( t ) ;
-
- щ ( t , v ) , t e T — решение системы (3) при x ( t ) = x ( t, v ) , u ( t ) = v ( t ) . Будем использовать следующее обозначение частного приращения произвольной вектор-функции h ( y , ,..., y l ) по переменным yS [ , ys^ :
A z, z h ( У 1 ,..., У1 ) = h ( У 1 ,•••, zs ,•••, zs ,-, У1 ) - h ( У 1 ,•••, ySl ,-, yS2 ,-, У1 ). s I , s 2 12 12
Стандартная формула приращения функционала [2-4] на управлениях u e V , v e V в рассматриваемом классе задач (1), (2) может быть представлена в следующем виде:
А v ф ( u ) = — £,( Н 1 ( Щ ( t , u ), x ( t , u ), t ), v ( t ) - u ( t )) dt + o( j T||v ( t ) - u ( t )|| dt ) . (4)
Формула приращения (4) является основой для получения известных условий принципа максимума.
Рассмотрим отображение на основе операции максимизации:
u * ( щ , x , t ) = arg max (Н 1 ( щ , x , t ), w} , x e R n , щ e R n , t e T .
w ∈ U
С помощью отображения u ∗ условие известного принципа максимума [1-5] для управления u e V в задаче (1), (2) можно записать в виде:
u ( t ) = u * ( щ ( t , u ), x ( t , u ), t ), t e T . (5)
Обозначим P Y — оператор проектирования на множество Y с R k в евклидовой норме:
P y ( z ) = arg min(|| y - z ||), z e R k .
y ∈ Y
Важным свойством оператора проектирования является выполнение неравенства:
(У — P Y ( z X z — P Y ( z )) ^ 0 , У e Y .
Определим отображение u a с параметром a > 0 на основе операции проектирования:
u a ( щ , x , w , t ) = P U ( w + a H 1 ( щ , x , t ) ) , x e R n , щ e R n , w e U , t e T .
С помощью отображения u a условие принципа максимума (5) в задаче (1), (2) можно записать в эквивалентном виде:
u ( t ) = u a ( щ ( t , u ), x ( t , u ), u ( t ), t ), t e T . (6)
Управление u e V , удовлетворяющее необходимым условиям оптимальности, называется экстремальным.
Рассмотрим функцию переключения:
g ( щ , x , t ) = H 1 ( y ,x , t ).
В соответствии с известным определением особого управления [3; 5] управление u e V в задаче (1), (2) называется особым, если для этого управления существует интервал времени [ 0 , , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g ( щ ( t , u ), x ( t , u ), t ) = 0.
Для особого экстремального управления условия (5) и (6) на особом интервале выполняются тривиально и не могут служить для однозначного определения значений экстремального управления на особом интервале. Задача (1), (2) называется особой, если существует хотя бы одно особое экстремальное управление .
1 Задачи о неподвижной точке принципа максимума Определим отображения X , Т , V a , a > 0 следующими соотношениями:
X ( и ) = x , и е V , x ( t ) = x ( t , u ), t е T , Т ( и ) = щ , и е V , щ ( t ) = щ ( t , и ) , t G T , V a ( щ ,x , и ) = v a , щ G C ( T ), x G C ( T ), и G V , v a ( t ) = и а ( щ (t ), x ( t ), и ( t ), t ) , t G T , где C ( T ) — пространство непрерывных на T функций.
С помощью введенных отображений условие принципа максимума (6) можно представить как задачу о неподвижной точке c оператором управления G 1 a :
и = V a ( Т ( и ), X ( и ), и ) = G a ( и ), и g V . (7)
Введем отображение X a следующим образом:
X a ( щ , и ) = x , щ g C(T ), и е V , где x ( t ), t е T является решением специальной задачи Коши: x ( t ) = A ( x ( t ), t ) и а ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0. Рассмотрим задачу о неподвижной точке с оператором управления G a : и = V a ( Т ( и ), X a ( Т ( и ), и ), и ) = G a ( и ), и е V . (8)
Построим оператор Т a по правилу:
Т a ( x , и ) = щ , x е C ( T ), и е V , где щ ( t ), t е T — решение сопряженной задачи Коши:
щ ( t ) = - H x ( щ ( t ), x ( t ), и а ( щ ( t ), x ( t ), и ( t ), t ), t ), щ ( t i ) = -^x ( x ( t i )). Рассмотрим задачу о неподвижной точке с оператором управления G a :
и = V a ( Т a ( X ( и ), и ), X ( и ), и ) = G a ( и ), и е V . (9)
Докажем следующее утверждение.
Теорема 1. Задачи о неподвижной точке (8) и (9) являются эквивалентными условию принципа максимума (6).
Условие принципа максимума в проекционной форме (6) является эквивалентным следующей дифференциально-алгебраической краевой задаче:
x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x 0, (10)
щ ( t ) = - H x ( щ ( t ), x ( t ), и ( t ), t ), щ ( t i ) = -( P x ( x ( t 1 )), (11)
и ( t ) = и а ( щ ( t ), x ( t ), и ( t ), t ), t G T .
Покажем, что задача о неподвижной точке (8) эквивалентна условию принципа максимума (6).
Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11). Это значит, что функция x ( t , u ), t е T является решением задачи Коши x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x °, т. е. X ( u ) = X a ( T ( u ), u ).
Следовательно, получаем, что u = Va (T(u), X(u), u) = Va (T(u), Xa (T(u), u), u).
Обратно, пусть u е V является решением уравнения (13), т. е.
u ( t ) = u a ( ^ ( t , u ), x ( t ), u ( t ), t ), t е T , где x ( t ), t е T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Следовательно, x ( t ) = x ( t , u ), t е T , т. е. X a ( T ( u ), u ) = X ( u ). Получаем следующее:
u = V a ( T ( u ), X a ( T ( u ), u ), u ) = V a ( T ( u ), X ( u ), u ).
Аналогично покажем эквивалентность задачи о неподвижной точке (9) и условия принципа максимума (6).
Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11).
Это значит, что функция ^ ( t , u ), t е T является решением задачи Коши:
Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -^x ( x ( t 1 , u )). т. е. T ( u ) = T a ( X ( u ), u ).
Следовательно, получаем, что u = V a ( T ( u ), X ( u ), u ) = V a ( T a ( X ( u ), u ), X ( u ), u ).
Обратно, пусть u е V является решением уравнения (14), т. е.
u ( t ) = u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t е T , где щ (t ), t е T является решением специальной задачи Коши:
Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -v x ( x ( t 1 , u )). Следовательно, y (t ) = ^ ( t , u ), t е T , т. е. T a ( X ( u ), u ) = T ( u ).
Получаем следующее:
u = V a ( T a ( X ( u ), u ), X ( u ), u ) = V a ( T ( u ), X ( u ), u ).
Доказательство окончено.
2 Особые экстремальные управления
Задача о неподвижной точке (8) в поточечной форме принимает вид: u(t) = ua (^(t,u),x(t),u(t), t), t е T, где x(t), t g T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( у ( t , u),x ( t ), u ( t ), t ) + b ( x ( t),t), x ( 1 0 ) = x°. (12)
Для управления u ∈ V введем функцию переключения g 1 ( x, t ) = g ( у ( t, u ), x , t ) . Аналогично определению особого решения [4] решение x ( t ), t g T задачи Коши (12) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g i ( x ( t ), t ) = 0.
Управление u g V назовем особым для задачи Коши (12), если существует особое решение x ( t ), t g T этой задачи Коши.
Экстремальное управление u g V , удовлетворяющее условию (8), назовем особым, если управление u g V является особым для соответствующей задачи Коши (12).
Для особого экстремального управления, удовлетворяющего условию (8) с соответствующей задачей Коши (12), соотношение u ( t ) = u a ( у ( t , u ), x ( t ), u ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.
Лемма 1. Особое экстремальное управление, удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (8) с соответствующей задачей Коши (12), и наоборот. При этом соответствующие особые интервалы совпадают.
Действительно, пусть экстремальное управление u g V является особым на основе функции переключения g ( у , x , t ), т. е.
g( у (t , u ), x ( t , u ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления u g V выполняется соотношение u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).
Следовательно, функция x ( t ) = x ( t , u ), t g T удовлетворяет задаче Коши (12) для соотношения u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ). При этом получаем g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ) = 0 , t g [ 0 1 , 0 2 ] с T .
Обратно, пусть экстремальное управление u g V , удовлетворяющее условию (8) с соответствующей задачей Коши (12), является особым, т. е. g 1 ( x ( t ), t ) = g( у (t , u ), x ( t ), t ) = 0, t g [ 0 1, 0 2] с T , где x ( t ), t g T является решением задачи Коши (12). В силу системы (12) и условия экстремальности u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ) имеем x ( t ) = x ( t , u ), t g T . Следовательно, получаем 0 = g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ), t g [ 0 1, 0 2] с T и условие экстремальности
u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).
Доказательство окончено.
Задача о неподвижной точке (9) в поточечной форме принимает вид:
и ( t ) = u a ( у ( t ), x ( t,u ), u ( t ), t ) , t G T, где у ( t ), t g T является решением специальной сопряженной задачи Коши:
у ( t ) = - H x ( у ( t ), x ( t , и ), u a ( у ( t ), x ( t , и ), и ( t ), t ), t ), у ( t ^ ) = -yx ( x ( t i , и )). (13)
Введем функцию переключения g 2 ( у , t ) = g ( у , x ( t , и ), t ). Решение у ( t ), t g T задачи Коши (13) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g 2 ( ^ ( t ), t ) = 0.
Управление и g V назовем особым для задачи Коши (13), если существует особое решение у ( t ), t g T этой задачи Коши.
Экстремальное управление и g V , удовлетворяющее условию (9), называется особым, если управление и g V является особым для соответствующей задачи Коши (13).
Для особого экстремального управления, удовлетворяющего условию (9) с соответствующей задачей Коши (13), соотношение и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.
Имеет место утверждение, аналогичное Лемме 1.
Лемма 2. Особое экстремальное управление и g V , удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (9) с соответствующей задачей Коши (13), и наоборот. При этом соответствующие особые интервалы совпадают.
Действительно, пусть экстремальное управление и g V является особым на основе функции переключения g ( у , x , t ), т. е. g( у (t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления и g V имеем соотношение и ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ). Следовательно, функция у ( t ) = у ( t , и ), t g T удовлетворяет задаче Коши (13) для соотношения и ( t ) = u a ( у ( t ), x ( t , и ), и ( t ), t ). При этом получаем g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T .
Обратно, пусть экстремальное управление и g V , удовлетворяющее условию (9) с соответствующей задачей Коши (13), является особым, т. е. g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t ), t ) = 0, t g [ 0 , 0 2 ] с T , где у ( t ), t g T является решением задачи Коши (13). В силу системы (13) и условия экстремальности и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) имеем у ( t ) = у ( t , и ), t g T . Следовательно, получаем 0 = g 2( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ), t G [ 0 1 , 0 2 ] с T и условие экстремальности
u ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ).
Доказательство окончено.
3 Методы неподвижных точек принципа максимума
При заданном a > 0 для численного решения задач о неподвижной точке принципа максимума (8) и (9) рассмотрим соответствующие итерационные процессы метода простой итерации при k > 0 :
v k + 1 = V a ( Y ( v k ), X a ( Y ( v k ), v k ), v k ), v k + 1 = V a ( Y a ( X ( v k ), v k ), X ( v k ), v k ).
Процесс (14) в поточечной форме имеет вид: vk+1( t) = ua (V (t, vk), x (t), vk (t), t), t g T, где x(t), t g T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( v ( t , v k ), x ( t ), v k ( t ), t ) + b ( x ( t ), t ), x ( t o) = x 0.
Понятно, что x ( t ) = x ( t , v k + 1), t g T . Таким образом, итерационный процесс (14) в поточечной форме может быть записан в следующем неявном виде:
v k + 1( t ) = u a ( V ( t , v k ), x ( t , v k + 1), v k ( t ), t ), v0 g V , t g T (16) или в операторной форме:
v k + 1 = V a ( Y ( v k ), X ( v k + 1), v k ), v0 g V .
Процесс (15) в поточечной форме принимает вид:
v k + 1( t ) = u a ( V ( t ), x ( t , v k ), v k ( t ), t ), t g T , (17)
где v ( t ), t g T является решением специальной сопряженной задачи Коши:
-
V ( t ) = - H x ( V ( t )> x ( t , vk ), u a ( v ( t ), x ( t , vk X vk ( t X t X t X
k (18)
V ( t 1 ) = -9* ( x ( t 1 , v ))-
В классе билинейных задач для решения v ( t ), t g T имеет место очевидное соотношение:
V ( t ) = V ( t , v k + 1), t g T .
Следовательно, в классе билинейных задач итерационный процесс (17), (18) может быть записан в следующей неявной поточечной форме:
v k + 1( t ) = u a ( V ( t , v k + 1), x ( t , v k ), v k ( t ), t ), v0 g V , a > 0, t g T . (19)
Для сравнения предлагаемых проекционных методов неподвижных точек представим в используемых обозначениях стандартный метод проекции градиента с a > 0 [3; 4]:
vka (t) = ua (V(t,vk),x(t,vk),vk (t),t), t g T, a g (0, да): Ф(vka) <Ф(vk) ^ vk+1 = va .
На каждой итерации рассматриваемого метода проекции градиента проекционный параметр a > 0 варьируется для обеспечения улучшения имеющегося управления.
В построенных проекционных методах неподвижных точек (14) и (15), в отличие от стандартного метода проекции градиента, параметр проектирования a > 0 фиксируется в итерационном процессе последовательных приближений управления. Таким образом, на каждой итерации предлагаемых методов релаксация по целевому функционалу не гарантируется, но это свойство релаксации компенсируется следующими свойствами предлагаемых методов:
-
- нелокальность последовательных приближений управления;
-
- отсутствие достаточно трудоемкой операции варьирования управления в окрестности текущего приближения для обеспечения улучшения по функционалу задачи;
-
- трудоемкость вычислительной реализации одной итерации методов (14) и (15) составляет две задачи Коши для фазовых и сопряженных переменных.
4 Условия сходимости итерационных процессов
Анализ сходимости построенных итерационных процессов (14) и (15) можно осуществить на основе известного принципа сжимающих отображений [6, 7].
Рассмотрим задачу о неподвижной точке в следующей общей форме:
v = G ( v ), v е V e , (20)
в которой G : V E ^ V E является оператором, действующим на множестве V E . Для численного решения задачи (20) рассмотрим итерационный процесс метода простой итерации при k > 0 :
v k + 1 = G ( v k ), v 0 е V E , k > 0. (21)
Для задачи (20) можно доказать следующий аналог известной теоремы [7].
Теорема 2. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:
B(v 0, l) = {v е VE : I v — v cl |E < l, v0 е VE, l > 0} с константой 0 < M = M(v0, l) < 1:
II G ( v ) - G ( u )| |e< M\\v - u| Ie , v е B ( v 0 , l ), u е B ( v 0 , l ). (22)
При этом выполняется условие:
|| G ( v 0 ) - v d |e< (1 - M ) l . (23)
Тогда задача о неподвижной точке (20) имеет единственное решение v е B ( v 0 , l ) и итерационный процесс (21) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0 , l ). Для погрешности метода выполняется оценка:
II v k - v l Ie< M 'W v ° - v l Ie , k > 0.
Доказательство теоремы повторяет доказательство известной теоремы [7] с необходимыми очевидными изменениями, связанными с рассматриваемой постановкой задачи (20), и поэтому не приводится.
Отметим, что условие (23) вводится для того, чтобы обеспечить невыход итерационных приближений процесса (21) за пределы множества B ( v 0 , l ), на котором выполняется условие Липшица (22).
Докажем с помощью теоремы 2 следующие утверждения о сходимости указанных процессов (14) и (15) к решениям соответствующих задач о неподвижной точке на подмножестве непрерывных допустимых управлений:
VC = {v е C (T): v (t) е U, t е T} с V с нормой ||v||C = max|v(t)||, v е VC.
Пусть семейство фазовых траекторий системы (2) на множестве V является ограниченным:
x ( t , v ) е X , t е T , v е V , (24)
где X с R n — выпуклое компактное множество.
Отметим, что достаточным условием ограниченности (24) может быть выполнение известной оценки [4] с константой C > 0 :
|| A ( x , t ) u + b ( x , t )|| < C (|| x || + 1), x е R n , u е U , t е T .
Предположим дополнительно, что функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n х T и R n .
При выполнении ограничения (24) на основе достаточного условия применительно к сопряженной системе с учетом ее линейности получаем условие ограниченности семейства траекторий сопряженной системы:
щ ( t , v ) е P , t е T , v е V , (25)
где P с R n — выпуклое компактное множество.
При сделанных предположениях можно показать аналогично [3; 4], что операторы X , Т удовлетворяют условию Липшица с константами Q > 0, C 2 > 0:
II X ( v ) - X ( u )| I C < C 1 | v - u|| C , v е V C , u е V C ,
||Т( v ) - Т ( u )|| C < C 2 | v - u||c , v е V C , u е V C .
Для отображения X a , определяемого соотношением:
X a ( щ , u ) = x , щ е C(T ), и е V , обозначим x ( t ) = x ( t , щ , и ), t е T — решение специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Для отображения Т a , определяемого по правилу:
Т a ( x , и ) = щ , x е C ( T ), и е V , обозначим щ ( t ) = щ ( t , x , и ), t е T — решение сопряженной задачи Коши:
V ( t ) = - H x ( V ( t ), x ( t ), u a ( v ( t ), x ( t ), u ( t ), t ), t ), V ( t i ) = - ^ x ( x ( t i )).
Используя условие Липшица для оператора проектирования PU и условий ограниченности (24) и (25), получаем:
II x ( t , p , u ) - x ( t , q , v )|| =
= || x ( t , V a ( p , X a ( p , u ), u )) - x ( t , V a ( q , X a ( q , v ), v ))|| <
-
< M i f| \V a ( p , X a ( p , u ), u )L - V a ( q , X a ( q , v ), v )\t\dt <
T
-
< M 2 f| | u ( t ) - v ( t )| \dt +
T
+a M 2 f | \H i ( p ( t ), x ( t , p , u ), t ) - H i ( q ( t ), x ( t , q , v ), t )| \dt ,
T где t g T, u, v g VC, p, q g C(T), Mi = const > 0, M2 = const > 0.
Аналогично получаем:
I V ( t , x , u ) - v ( t , y , v )|| =
= ^tt , V a ( T a ( x , u ), x , u )) - v ( t , V a ( T a ( y , v ), y , v ))|| <
-
< M з f| V a ( T a ( x , u ), x , u )\t - V a ( T a ( y , v ), y , v )\t\\dt <
-
< M 4 J| u ( t ) - v ( t )|| dt +
T
+a M 4 f|| H i ( v ( t , x , u ), x ( t ), u ( t ), t ) - H i ( v ( t , y , v ), y ( t ), v ( t ), t ) || dt ,
T где t g T, u, v g VC, x, y g C(T), M3 = const > 0, M4 = const > 0.
Отсюда нетрудно обосновать при достаточно малом a > 0 оценки:
II X a ( T ( . ), . ) - X a ( T ( v ), v )| с < (j + a i M^| u - v i c ,
(1 a ^Z6)
II T a ( X ( u ), u ) -T a ( X ( v ), v )| C < ^ M ► - v C , (1 a M g )
где u g V C , v g V C , константы M i > 0 , i = 5,6,7,8.
На основании выполнения известного условия Липшица для оператора проектирования P U получаем:
||ua ( p , x , u , t ) - u a ( q , y , v , t )||2 < ||( u - v ) + a ( H i ( p , x , t ) - H i ( q , y , t ))||2 <
< l| u - v |P + 2 a (u - v , H i ( p , x , t ) - H i ( q , y , t )} +
+ a 21 H i ( p,x, t ) - H i ( q , y , t tf,
-
u , v g U , p , q g P , x , y g X , t g T .
Предположим, что в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 g V C для вектор-функции H i ( v , x , t ) выполняется условие:
Uu ( t ) - v ( t ), H 1 Ы t , u ), x ( t , V a ( У ( u ), X a ( T ( u ), u ), u )), t ) -
-
- H 1 ( ^ ( t,v ), x ( t,V a ( T ( v), X a ( ^ ( v ), v ), v )), t )) <- K 2 1 u ( t ) - v ( t )||2, u,v e B ( v 0 , l ), t e T,
где K 2 = const > 0.
Тогда на основе неравенства (26) при достаточно малом a > 0 можно получить оценку:
||V a ( У ( u ), X a ( У ( u ), u ), u ) - V a ( У ( v ), X a ( Т ( v ), v ), v )|| c <
< (1 - 2aK 2 + a 2 M J2] \u - v\\c , где M 10 = const > 0, u , v e B ( v 0 , l ).
Также предположим, что в шаре B ( v 0 , l ) с V C радиуса l > 0 с центром в точке v 0 e V C для вектор-функции H 1 ( ^ , x , t ) выполняется условие:
uu ( t ) - v ( t ), H 1 ( ^ ( t , V a ( У a ( X ( u ), u ), X ( u ), u )), x ( t , u ), t ) -
-
- H i( ^ ( t , V a ( Т a ( X ( v ), v ), X ( v ), v )), x ( t , v ), t )) <- K 3| | u ( t ) - v ( t )||2 ,
-
u , v e B ( v 0 , l ), t e T , где K 3 = const > 0 .
Тогда на основе неравенства (26) при достаточно малом a > 0 можно получить оценку:
||V а ( У a ( X ( u ), u ), X ( u ), u ) - V a ( У a ( X ( v ), v ), X ( v ), v )|| C <
-
< (1 - 2 a K з + a 2 M H) 2 || u - v|| C , где M 11 = const > 0, u , v e B ( v 0 , l ).
Таким образом, в сделанных предположениях при достаточно малых a > 0 операторы (X и G % удовлетворяют условию Липшица с константой меньше единицы на множестве B ( v 0 , l ).
В силу определения при достаточно малых a > 0 операторы G ^ и G a удовлетворяют условию (23) в норме ||-|| C пространства непрерывных функций C ( T ) для любого v 0 e V C .
Таким образом, при достаточно малых a > 0 итерационные приближения процессов (14) и (15) остаются в пределах множества B ( v 0 , l ) для любого начального приближения v 0 e B ( v 0 , l ).
В результате на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (14).
Теорема 3. Пусть
-
1) семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) e X , t e T , u e V , где X с R n — выпуклое компактное множество;
-
2) функции a ( x, t ), d ( x , t ) A ( x, t ), b ( x, t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n x T и R n ;
-
3) для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 е V C выполняется условие:
Uu ( t ) - v ( t ), H 1 ( ^ ( t , u ), x ( t , u ), t ) - H 1 ( ^ ( t , v ), x ( t , v ), t )) <
- K\\u ( t ) - v ( t )|| ,
U, v е B (v 0, l), t е T, где K = const > 0 и для w е B(v0,l) введено обозначение: функция x(t, w), t е T — решение специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , w ), x ( t ), w ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Тогда для достаточно малых параметрах проектирования a > 0 итерационный процесс (14) сходится в норме ||-|| C к единственному решению v a е B ( v 0 , l ) задачи о неподвижной точке (8) для любого начального приближения v 0 е B ( v 0 , l ) при k = 0 .
Аналогично на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (15).
Теорема 4. Пусть
-
1) семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) е X , t е T , u е V , где X c R n — выпуклое компактное множество;
-
2) функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах Rn x T и R n ;
-
3) для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 е V C выполняется условие:
uu ( t ) - v ( t ), H 1 ( w ( t , u ), x ( t , u ), t ) - H 1 ( w ( t , v ), x ( t , v ), t )) <
- K||u ( t ) - v ( t )|| ,
-
u , v е B ( v 0 , l ), t е T ,
где K = const > 0 и для w е B ( v 0 , l ) введено обозначение: функция t/%( t , w ), t е T — решение специальной сопряженной задачи Коши:
^ ( t ) = - H x ( ^ ( t ), x ( t , w ), u a ( ^ ( t ), x ( t , w ), w ( t ), t ), t ), ^ ( t 1 ) = -^ x ( x ( t 1 , w )).
Тогда для достаточно малых параметрах проектирования a > 0 итерационный процесс (15) сходится в норме ||-||C к единственному решению v “ е B(v0, l) задачи о неподвижной точке (9) для любого начального приближения v0 е B(v0, l) при k = 0 .
Следствие 1 . Пусть в условиях теорем 3 и 4 центр v 0 е V C шара B ( v 0 , l ) удовлетворяет условию принципа максимума. Тогда v a = v 0 .
Следствие 2 . В условиях теорем 3 и 4 итерационные процессы для непрерывных начальных приближений v 0 е B ( v 0 , l ) при k = 0 могут сходиться только к непрерывным экстремальным управлениям.
Результаты теорем 3 и 4 могут быть обобщены на более широкий класс измеримых функций:
V о Vl = {v е L „ (T): v (t) е U, t е T} с нормой ||v||= ess sup ||v(t)||, v е VL.
“ t е Т
Таким образом, при достаточно малых параметрах проектирования a > 0 процессы (14) и (15) определяют последовательности итерационных приближений, однозначно определенных и непрерывно зависящих от параметра проектирования, которые обладают принципиальной сходимостью к экстремальному управлению, в том числе к особому экстремальному управлению. Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения задач о неподвижной точке сходимость итерационных процессов к тому или иному экстремальному управлению определяется выбором начального приближения.
Заключение
В классе линейных по управлению задач оптимального управления:
-
- получены новые формы принципа максимума в виде задач о неподвижной точке в классе задач оптимального управления, линейных по управлению, и доказана их эквивалентность классическим условиям принципа максимума;
-
- определены новые понятия особых управлений на основе новых форм принципа максимума в виде задач о неподвижной точке и доказана их эквивалентность классическому определению особого управления в классе задач оптимального управления, линейных по управлению;
-
- разработаны новые итерационные методы на основе задач о неподвижной точке принципа максимума для поиска экстремальных управлений, в том числе особых управлений, и доказаны теоремы сходимости итерационных процессов.
Выделим следующие свойства предлагаемых методов неподвижных точек принципа максимума, определяющие их эффективность для поиска особых экстремальных управлений.
-
1. Существенное повышение точности расчета последовательных приближений управления, вычисляемых одновременно с переменными состояния в процессе решения специальных задач Коши.
-
2. Возможность получения приближений особых экстремальных управлений при достаточно малых параметрах проектирования, обеспечивающих принципиальную сходимость итерационных процессов.
-
3. Однозначное существование и допустимость значений последовательных приближений особых экстремальных управлений, которые обеспечиваются свойствами операции проектирования.
Дальнейшее развитие подхода неподвижных точек для реализации условий оптимальности и улучшения управления определяет перспективное направление для разработки новых методов поиска особых экстремальных управлений в различных классах управляемых систем.