Методы поиска особых экстремальных управлений в линейных по управлению системах
Автор: Казьмин И.Д., Булдаев А.С., Мижидон А.Д.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 1, 2025 года.
Бесплатный доступ
В классе линейных по управлению задач оптимального управления предлагаются новые формы принципа максимума в виде задач о неподвижной точке операторов управления. На основе новых форм принципа максимума даются новые определения особых экстремальных управлений и показывается их эквивалентность известному понятию особого экстремального управления. Предлагаемые новые формы принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений с однозначно определяемыми приближениями особых значений управления. Доказываются теоремы о сходимости итерационных процессов предлагаемых методов.
Управляемая система, принцип максимума, особое управление, задача о неподвижной точке, итерационный метод
Короткий адрес: https://sciup.org/148331685
IDR: 148331685 | DOI: 10.18101/2304-5728-2025-1-26-41
Текст научной статьи Методы поиска особых экстремальных управлений в линейных по управлению системах
Многие модели оптимизации управляемых процессов в области биологии, экономики, медицины, энергетики описываются системами, линейными по управлению. В классе линейных по управлению задач оптималь- ного управления часто встречаются особые задачи, в которых необходимые условия оптимальности в форме классического принципа максимума не позволяют однозначно определять значения экстремального управления. Это приводит к существенному усложнению поиска особых экстремальных управлений. В частности, метод краевой задачи принципа максимума и градиентные методы [1-5] становятся не эффективными в особых задачах.
В настоящей работе в классе линейных по управлению задач рассматриваются новые формы принципа максимума в виде операторных задач о неподвижной точке в пространстве управлений. Доказываются теоремы об эквивалентности рассматриваемых форм условий принципа максимума известному условию принципа максимума. Определяются понятия особых экстремальных управлений на основе сконструированных задач о неподвижной точке. Доказываются утверждения об эквивалентности введенных понятий с известным определением особого экстремального управления. Построенные задачи о неподвижной точке принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений, обладающие свойством однозначного определения итерационных приближений особых значений экстремального управления и свойством сходимости по управлению в широких предположениях.
Рассматривается класс линейных по управлению задач оптимального управления:
Ф ( и ) = ф ( x ( t 1 )) + j (( a ( x ( t ), t ), u ( t )) + d ( x ( t ), t )) dt ^ inf , (1)
x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x °, и ( t ) g U c R m , t g T = [ 1 0 , 1 1 ], (2) в котором x ( t ) = ( x 1 ( t ),..., xn ( t )) — вектор состояния системы, и ( t ) = ( и1(t ),..., u m ( t )) — вектор управления. В качестве допустимых управлений и ( t ) = ( и1(t ),..., u m ( t )) рассматривается множество V кусочнонепрерывных функций на интервале T со значениями в компактном и выпуклом множестве U c R m . Начальное состояние x0 и интервал T заданы. Функция у ( x ) дифференцируема на Rn , функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ) дифференцируемы по переменной x и непрерывны по переменной t на множестве Rn х T .
Функция Понтрягина с сопряженной переменной у в задаче (1), (2) представляется в следующем виде:
H ( у , x , и , t ) = H о ( у , x , t ) + < H 1 ( у , x , t ), и ) ,
H о ( у , x , t ) = < y , b ( x , t ) ) - d ( x , t ), H i ( y , x , t ) = A T ( x , t ) y - a ( x , t ).
Стандартная сопряженная система рассматривается в следующей форме:
y & ( t ) = - H x ( у ( t ), x ( t ), и ( t ), t ) , t g T , y ( 1 1 ) = -y x ( x ( t i )) . (3)
Введем следующие обозначения для v g V :
-
- x ( t , v ), t e T — решение системы (2) при u ( t ) = v ( t ) ;
-
- щ ( t , v ) , t e T — решение системы (3) при x ( t ) = x ( t, v ) , u ( t ) = v ( t ) . Будем использовать следующее обозначение частного приращения произвольной вектор-функции h ( y , ,..., y l ) по переменным yS [ , ys^ :
A z, z h ( У 1 ,..., У1 ) = h ( У 1 ,•••, zs ,•••, zs ,-, У1 ) - h ( У 1 ,•••, ySl ,-, yS2 ,-, У1 ). s I , s 2 12 12
Стандартная формула приращения функционала [2-4] на управлениях u e V , v e V в рассматриваемом классе задач (1), (2) может быть представлена в следующем виде:
А v ф ( u ) = — £,( Н 1 ( Щ ( t , u ), x ( t , u ), t ), v ( t ) - u ( t )) dt + o( j T||v ( t ) - u ( t )|| dt ) . (4)
Формула приращения (4) является основой для получения известных условий принципа максимума.
Рассмотрим отображение на основе операции максимизации:
u * ( щ , x , t ) = arg max (Н 1 ( щ , x , t ), w} , x e R n , щ e R n , t e T .
w ∈ U
С помощью отображения u ∗ условие известного принципа максимума [1-5] для управления u e V в задаче (1), (2) можно записать в виде:
u ( t ) = u * ( щ ( t , u ), x ( t , u ), t ), t e T . (5)
Обозначим P Y — оператор проектирования на множество Y с R k в евклидовой норме:
P y ( z ) = arg min(|| y - z ||), z e R k .
y ∈ Y
Важным свойством оператора проектирования является выполнение неравенства:
(У — P Y ( z X z — P Y ( z )) ^ 0 , У e Y .
Определим отображение u a с параметром a > 0 на основе операции проектирования:
u a ( щ , x , w , t ) = P U ( w + a H 1 ( щ , x , t ) ) , x e R n , щ e R n , w e U , t e T .
С помощью отображения u a условие принципа максимума (5) в задаче (1), (2) можно записать в эквивалентном виде:
u ( t ) = u a ( щ ( t , u ), x ( t , u ), u ( t ), t ), t e T . (6)
Управление u e V , удовлетворяющее необходимым условиям оптимальности, называется экстремальным.
Рассмотрим функцию переключения:
g ( щ , x , t ) = H 1 ( y ,x , t ).
В соответствии с известным определением особого управления [3; 5] управление u e V в задаче (1), (2) называется особым, если для этого управления существует интервал времени [ 0 , , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g ( щ ( t , u ), x ( t , u ), t ) = 0.
Для особого экстремального управления условия (5) и (6) на особом интервале выполняются тривиально и не могут служить для однозначного определения значений экстремального управления на особом интервале. Задача (1), (2) называется особой, если существует хотя бы одно особое экстремальное управление .
1 Задачи о неподвижной точке принципа максимума Определим отображения X , Т , V a , a > 0 следующими соотношениями:
X ( и ) = x , и е V , x ( t ) = x ( t , u ), t е T , Т ( и ) = щ , и е V , щ ( t ) = щ ( t , и ) , t G T , V a ( щ ,x , и ) = v a , щ G C ( T ), x G C ( T ), и G V , v a ( t ) = и а ( щ (t ), x ( t ), и ( t ), t ) , t G T , где C ( T ) — пространство непрерывных на T функций.
С помощью введенных отображений условие принципа максимума (6) можно представить как задачу о неподвижной точке c оператором управления G 1 a :
и = V a ( Т ( и ), X ( и ), и ) = G a ( и ), и g V . (7)
Введем отображение X a следующим образом:
X a ( щ , и ) = x , щ g C(T ), и е V , где x ( t ), t е T является решением специальной задачи Коши: x ( t ) = A ( x ( t ), t ) и а ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0. Рассмотрим задачу о неподвижной точке с оператором управления G a : и = V a ( Т ( и ), X a ( Т ( и ), и ), и ) = G a ( и ), и е V . (8)
Построим оператор Т a по правилу:
Т a ( x , и ) = щ , x е C ( T ), и е V , где щ ( t ), t е T — решение сопряженной задачи Коши:
щ ( t ) = - H x ( щ ( t ), x ( t ), и а ( щ ( t ), x ( t ), и ( t ), t ), t ), щ ( t i ) = -^x ( x ( t i )). Рассмотрим задачу о неподвижной точке с оператором управления G a :
и = V a ( Т a ( X ( и ), и ), X ( и ), и ) = G a ( и ), и е V . (9)
Докажем следующее утверждение.
Теорема 1. Задачи о неподвижной точке (8) и (9) являются эквивалентными условию принципа максимума (6).
Условие принципа максимума в проекционной форме (6) является эквивалентным следующей дифференциально-алгебраической краевой задаче:
x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x 0, (10)
щ ( t ) = - H x ( щ ( t ), x ( t ), и ( t ), t ), щ ( t i ) = -( P x ( x ( t 1 )), (11)
и ( t ) = и а ( щ ( t ), x ( t ), и ( t ), t ), t G T .
Покажем, что задача о неподвижной точке (8) эквивалентна условию принципа максимума (6).
Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11). Это значит, что функция x ( t , u ), t е T является решением задачи Коши x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x °, т. е. X ( u ) = X a ( T ( u ), u ).
Следовательно, получаем, что u = Va (T(u), X(u), u) = Va (T(u), Xa (T(u), u), u).
Обратно, пусть u е V является решением уравнения (13), т. е.
u ( t ) = u a ( ^ ( t , u ), x ( t ), u ( t ), t ), t е T , где x ( t ), t е T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Следовательно, x ( t ) = x ( t , u ), t е T , т. е. X a ( T ( u ), u ) = X ( u ). Получаем следующее:
u = V a ( T ( u ), X a ( T ( u ), u ), u ) = V a ( T ( u ), X ( u ), u ).
Аналогично покажем эквивалентность задачи о неподвижной точке (9) и условия принципа максимума (6).
Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11).
Это значит, что функция ^ ( t , u ), t е T является решением задачи Коши:
Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -^x ( x ( t 1 , u )). т. е. T ( u ) = T a ( X ( u ), u ).
Следовательно, получаем, что u = V a ( T ( u ), X ( u ), u ) = V a ( T a ( X ( u ), u ), X ( u ), u ).
Обратно, пусть u е V является решением уравнения (14), т. е.
u ( t ) = u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t е T , где щ (t ), t е T является решением специальной задачи Коши:
Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -v x ( x ( t 1 , u )). Следовательно, y (t ) = ^ ( t , u ), t е T , т. е. T a ( X ( u ), u ) = T ( u ).
Получаем следующее:
u = V a ( T a ( X ( u ), u ), X ( u ), u ) = V a ( T ( u ), X ( u ), u ).
Доказательство окончено.
2 Особые экстремальные управления
Задача о неподвижной точке (8) в поточечной форме принимает вид: u(t) = ua (^(t,u),x(t),u(t), t), t е T, где x(t), t g T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( у ( t , u),x ( t ), u ( t ), t ) + b ( x ( t),t), x ( 1 0 ) = x°. (12)
Для управления u ∈ V введем функцию переключения g 1 ( x, t ) = g ( у ( t, u ), x , t ) . Аналогично определению особого решения [4] решение x ( t ), t g T задачи Коши (12) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g i ( x ( t ), t ) = 0.
Управление u g V назовем особым для задачи Коши (12), если существует особое решение x ( t ), t g T этой задачи Коши.
Экстремальное управление u g V , удовлетворяющее условию (8), назовем особым, если управление u g V является особым для соответствующей задачи Коши (12).
Для особого экстремального управления, удовлетворяющего условию (8) с соответствующей задачей Коши (12), соотношение u ( t ) = u a ( у ( t , u ), x ( t ), u ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.
Лемма 1. Особое экстремальное управление, удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (8) с соответствующей задачей Коши (12), и наоборот. При этом соответствующие особые интервалы совпадают.
Действительно, пусть экстремальное управление u g V является особым на основе функции переключения g ( у , x , t ), т. е.
g( у (t , u ), x ( t , u ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления u g V выполняется соотношение u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).
Следовательно, функция x ( t ) = x ( t , u ), t g T удовлетворяет задаче Коши (12) для соотношения u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ). При этом получаем g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ) = 0 , t g [ 0 1 , 0 2 ] с T .
Обратно, пусть экстремальное управление u g V , удовлетворяющее условию (8) с соответствующей задачей Коши (12), является особым, т. е. g 1 ( x ( t ), t ) = g( у (t , u ), x ( t ), t ) = 0, t g [ 0 1, 0 2] с T , где x ( t ), t g T является решением задачи Коши (12). В силу системы (12) и условия экстремальности u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ) имеем x ( t ) = x ( t , u ), t g T . Следовательно, получаем 0 = g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ), t g [ 0 1, 0 2] с T и условие экстремальности
u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).
Доказательство окончено.
Задача о неподвижной точке (9) в поточечной форме принимает вид:
и ( t ) = u a ( у ( t ), x ( t,u ), u ( t ), t ) , t G T, где у ( t ), t g T является решением специальной сопряженной задачи Коши:
у ( t ) = - H x ( у ( t ), x ( t , и ), u a ( у ( t ), x ( t , и ), и ( t ), t ), t ), у ( t ^ ) = -yx ( x ( t i , и )). (13)
Введем функцию переключения g 2 ( у , t ) = g ( у , x ( t , и ), t ). Решение у ( t ), t g T задачи Коши (13) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:
g 2 ( ^ ( t ), t ) = 0.
Управление и g V назовем особым для задачи Коши (13), если существует особое решение у ( t ), t g T этой задачи Коши.
Экстремальное управление и g V , удовлетворяющее условию (9), называется особым, если управление и g V является особым для соответствующей задачи Коши (13).
Для особого экстремального управления, удовлетворяющего условию (9) с соответствующей задачей Коши (13), соотношение и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.
Имеет место утверждение, аналогичное Лемме 1.
Лемма 2. Особое экстремальное управление и g V , удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (9) с соответствующей задачей Коши (13), и наоборот. При этом соответствующие особые интервалы совпадают.
Действительно, пусть экстремальное управление и g V является особым на основе функции переключения g ( у , x , t ), т. е. g( у (t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления и g V имеем соотношение и ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ). Следовательно, функция у ( t ) = у ( t , и ), t g T удовлетворяет задаче Коши (13) для соотношения и ( t ) = u a ( у ( t ), x ( t , и ), и ( t ), t ). При этом получаем g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T .
Обратно, пусть экстремальное управление и g V , удовлетворяющее условию (9) с соответствующей задачей Коши (13), является особым, т. е. g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t ), t ) = 0, t g [ 0 , 0 2 ] с T , где у ( t ), t g T является решением задачи Коши (13). В силу системы (13) и условия экстремальности и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) имеем у ( t ) = у ( t , и ), t g T . Следовательно, получаем 0 = g 2( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ), t G [ 0 1 , 0 2 ] с T и условие экстремальности
u ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ).
Доказательство окончено.
3 Методы неподвижных точек принципа максимума
При заданном a > 0 для численного решения задач о неподвижной точке принципа максимума (8) и (9) рассмотрим соответствующие итерационные процессы метода простой итерации при k > 0 :
v k + 1 = V a ( Y ( v k ), X a ( Y ( v k ), v k ), v k ), v k + 1 = V a ( Y a ( X ( v k ), v k ), X ( v k ), v k ).
Процесс (14) в поточечной форме имеет вид: vk+1( t) = ua (V (t, vk), x (t), vk (t), t), t g T, где x(t), t g T является решением специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( v ( t , v k ), x ( t ), v k ( t ), t ) + b ( x ( t ), t ), x ( t o) = x 0.
Понятно, что x ( t ) = x ( t , v k + 1), t g T . Таким образом, итерационный процесс (14) в поточечной форме может быть записан в следующем неявном виде:
v k + 1( t ) = u a ( V ( t , v k ), x ( t , v k + 1), v k ( t ), t ), v0 g V , t g T (16) или в операторной форме:
v k + 1 = V a ( Y ( v k ), X ( v k + 1), v k ), v0 g V .
Процесс (15) в поточечной форме принимает вид:
v k + 1( t ) = u a ( V ( t ), x ( t , v k ), v k ( t ), t ), t g T , (17)
где v ( t ), t g T является решением специальной сопряженной задачи Коши:
-
V ( t ) = - H x ( V ( t )> x ( t , vk ), u a ( v ( t ), x ( t , vk X vk ( t X t X t X
k (18)
V ( t 1 ) = -9* ( x ( t 1 , v ))-
В классе билинейных задач для решения v ( t ), t g T имеет место очевидное соотношение:
V ( t ) = V ( t , v k + 1), t g T .
Следовательно, в классе билинейных задач итерационный процесс (17), (18) может быть записан в следующей неявной поточечной форме:
v k + 1( t ) = u a ( V ( t , v k + 1), x ( t , v k ), v k ( t ), t ), v0 g V , a > 0, t g T . (19)
Для сравнения предлагаемых проекционных методов неподвижных точек представим в используемых обозначениях стандартный метод проекции градиента с a > 0 [3; 4]:
vka (t) = ua (V(t,vk),x(t,vk),vk (t),t), t g T, a g (0, да): Ф(vka) <Ф(vk) ^ vk+1 = va .
На каждой итерации рассматриваемого метода проекции градиента проекционный параметр a > 0 варьируется для обеспечения улучшения имеющегося управления.
В построенных проекционных методах неподвижных точек (14) и (15), в отличие от стандартного метода проекции градиента, параметр проектирования a > 0 фиксируется в итерационном процессе последовательных приближений управления. Таким образом, на каждой итерации предлагаемых методов релаксация по целевому функционалу не гарантируется, но это свойство релаксации компенсируется следующими свойствами предлагаемых методов:
-
- нелокальность последовательных приближений управления;
-
- отсутствие достаточно трудоемкой операции варьирования управления в окрестности текущего приближения для обеспечения улучшения по функционалу задачи;
-
- трудоемкость вычислительной реализации одной итерации методов (14) и (15) составляет две задачи Коши для фазовых и сопряженных переменных.
4 Условия сходимости итерационных процессов
Анализ сходимости построенных итерационных процессов (14) и (15) можно осуществить на основе известного принципа сжимающих отображений [6, 7].
Рассмотрим задачу о неподвижной точке в следующей общей форме:
v = G ( v ), v е V e , (20)
в которой G : V E ^ V E является оператором, действующим на множестве V E . Для численного решения задачи (20) рассмотрим итерационный процесс метода простой итерации при k > 0 :
v k + 1 = G ( v k ), v 0 е V E , k > 0. (21)
Для задачи (20) можно доказать следующий аналог известной теоремы [7].
Теорема 2. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:
B(v 0, l) = {v е VE : I v — v cl |E < l, v0 е VE, l > 0} с константой 0 < M = M(v0, l) < 1:
II G ( v ) - G ( u )| |e< M\\v - u| Ie , v е B ( v 0 , l ), u е B ( v 0 , l ). (22)
При этом выполняется условие:
|| G ( v 0 ) - v d |e< (1 - M ) l . (23)
Тогда задача о неподвижной точке (20) имеет единственное решение v е B ( v 0 , l ) и итерационный процесс (21) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0 , l ). Для погрешности метода выполняется оценка:
II v k - v l Ie< M 'W v ° - v l Ie , k > 0.
Доказательство теоремы повторяет доказательство известной теоремы [7] с необходимыми очевидными изменениями, связанными с рассматриваемой постановкой задачи (20), и поэтому не приводится.
Отметим, что условие (23) вводится для того, чтобы обеспечить невыход итерационных приближений процесса (21) за пределы множества B ( v 0 , l ), на котором выполняется условие Липшица (22).
Докажем с помощью теоремы 2 следующие утверждения о сходимости указанных процессов (14) и (15) к решениям соответствующих задач о неподвижной точке на подмножестве непрерывных допустимых управлений:
VC = {v е C (T): v (t) е U, t е T} с V с нормой ||v||C = max|v(t)||, v е VC.
Пусть семейство фазовых траекторий системы (2) на множестве V является ограниченным:
x ( t , v ) е X , t е T , v е V , (24)
где X с R n — выпуклое компактное множество.
Отметим, что достаточным условием ограниченности (24) может быть выполнение известной оценки [4] с константой C > 0 :
|| A ( x , t ) u + b ( x , t )|| < C (|| x || + 1), x е R n , u е U , t е T .
Предположим дополнительно, что функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n х T и R n .
При выполнении ограничения (24) на основе достаточного условия применительно к сопряженной системе с учетом ее линейности получаем условие ограниченности семейства траекторий сопряженной системы:
щ ( t , v ) е P , t е T , v е V , (25)
где P с R n — выпуклое компактное множество.
При сделанных предположениях можно показать аналогично [3; 4], что операторы X , Т удовлетворяют условию Липшица с константами Q > 0, C 2 > 0:
II X ( v ) - X ( u )| I C < C 1 | v - u|| C , v е V C , u е V C ,
||Т( v ) - Т ( u )|| C < C 2 | v - u||c , v е V C , u е V C .
Для отображения X a , определяемого соотношением:
X a ( щ , u ) = x , щ е C(T ), и е V , обозначим x ( t ) = x ( t , щ , и ), t е T — решение специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Для отображения Т a , определяемого по правилу:
Т a ( x , и ) = щ , x е C ( T ), и е V , обозначим щ ( t ) = щ ( t , x , и ), t е T — решение сопряженной задачи Коши:
V ( t ) = - H x ( V ( t ), x ( t ), u a ( v ( t ), x ( t ), u ( t ), t ), t ), V ( t i ) = - ^ x ( x ( t i )).
Используя условие Липшица для оператора проектирования PU и условий ограниченности (24) и (25), получаем:
II x ( t , p , u ) - x ( t , q , v )|| =
= || x ( t , V a ( p , X a ( p , u ), u )) - x ( t , V a ( q , X a ( q , v ), v ))|| <
-
< M i f| \V a ( p , X a ( p , u ), u )L - V a ( q , X a ( q , v ), v )\t\dt <
T
-
< M 2 f| | u ( t ) - v ( t )| \dt +
T
+a M 2 f | \H i ( p ( t ), x ( t , p , u ), t ) - H i ( q ( t ), x ( t , q , v ), t )| \dt ,
T где t g T, u, v g VC, p, q g C(T), Mi = const > 0, M2 = const > 0.
Аналогично получаем:
I V ( t , x , u ) - v ( t , y , v )|| =
= ^tt , V a ( T a ( x , u ), x , u )) - v ( t , V a ( T a ( y , v ), y , v ))|| <
-
< M з f| V a ( T a ( x , u ), x , u )\t - V a ( T a ( y , v ), y , v )\t\\dt <
-
< M 4 J| u ( t ) - v ( t )|| dt +
T
+a M 4 f|| H i ( v ( t , x , u ), x ( t ), u ( t ), t ) - H i ( v ( t , y , v ), y ( t ), v ( t ), t ) || dt ,
T где t g T, u, v g VC, x, y g C(T), M3 = const > 0, M4 = const > 0.
Отсюда нетрудно обосновать при достаточно малом a > 0 оценки:
II X a ( T ( . ), . ) - X a ( T ( v ), v )| с < (j + a i M^| u - v i c ,
(1 a ^Z6)
II T a ( X ( u ), u ) -T a ( X ( v ), v )| C < ^ M ► - v C , (1 a M g )
где u g V C , v g V C , константы M i > 0 , i = 5,6,7,8.
На основании выполнения известного условия Липшица для оператора проектирования P U получаем:
||ua ( p , x , u , t ) - u a ( q , y , v , t )||2 < ||( u - v ) + a ( H i ( p , x , t ) - H i ( q , y , t ))||2 <
< l| u - v |P + 2 a (u - v , H i ( p , x , t ) - H i ( q , y , t )} +
+ a 21 H i ( p,x, t ) - H i ( q , y , t tf,
-
u , v g U , p , q g P , x , y g X , t g T .
Предположим, что в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 g V C для вектор-функции H i ( v , x , t ) выполняется условие:
Uu ( t ) - v ( t ), H 1 Ы t , u ), x ( t , V a ( У ( u ), X a ( T ( u ), u ), u )), t ) -
-
- H 1 ( ^ ( t,v ), x ( t,V a ( T ( v), X a ( ^ ( v ), v ), v )), t )) <- K 2 1 u ( t ) - v ( t )||2, u,v e B ( v 0 , l ), t e T,
где K 2 = const > 0.
Тогда на основе неравенства (26) при достаточно малом a > 0 можно получить оценку:
||V a ( У ( u ), X a ( У ( u ), u ), u ) - V a ( У ( v ), X a ( Т ( v ), v ), v )|| c <
< (1 - 2aK 2 + a 2 M J2] \u - v\\c , где M 10 = const > 0, u , v e B ( v 0 , l ).
Также предположим, что в шаре B ( v 0 , l ) с V C радиуса l > 0 с центром в точке v 0 e V C для вектор-функции H 1 ( ^ , x , t ) выполняется условие:
uu ( t ) - v ( t ), H 1 ( ^ ( t , V a ( У a ( X ( u ), u ), X ( u ), u )), x ( t , u ), t ) -
-
- H i( ^ ( t , V a ( Т a ( X ( v ), v ), X ( v ), v )), x ( t , v ), t )) <- K 3| | u ( t ) - v ( t )||2 ,
-
u , v e B ( v 0 , l ), t e T , где K 3 = const > 0 .
Тогда на основе неравенства (26) при достаточно малом a > 0 можно получить оценку:
||V а ( У a ( X ( u ), u ), X ( u ), u ) - V a ( У a ( X ( v ), v ), X ( v ), v )|| C <
-
< (1 - 2 a K з + a 2 M H) 2 || u - v|| C , где M 11 = const > 0, u , v e B ( v 0 , l ).
Таким образом, в сделанных предположениях при достаточно малых a > 0 операторы (X и G % удовлетворяют условию Липшица с константой меньше единицы на множестве B ( v 0 , l ).
В силу определения при достаточно малых a > 0 операторы G ^ и G a удовлетворяют условию (23) в норме ||-|| C пространства непрерывных функций C ( T ) для любого v 0 e V C .
Таким образом, при достаточно малых a > 0 итерационные приближения процессов (14) и (15) остаются в пределах множества B ( v 0 , l ) для любого начального приближения v 0 e B ( v 0 , l ).
В результате на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (14).
Теорема 3. Пусть
-
1) семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) e X , t e T , u e V , где X с R n — выпуклое компактное множество;
-
2) функции a ( x, t ), d ( x , t ) A ( x, t ), b ( x, t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n x T и R n ;
-
3) для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 е V C выполняется условие:
Uu ( t ) - v ( t ), H 1 ( ^ ( t , u ), x ( t , u ), t ) - H 1 ( ^ ( t , v ), x ( t , v ), t )) <
- K\\u ( t ) - v ( t )|| ,
U, v е B (v 0, l), t е T, где K = const > 0 и для w е B(v0,l) введено обозначение: функция x(t, w), t е T — решение специальной задачи Коши:
x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , w ), x ( t ), w ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.
Тогда для достаточно малых параметрах проектирования a > 0 итерационный процесс (14) сходится в норме ||-|| C к единственному решению v a е B ( v 0 , l ) задачи о неподвижной точке (8) для любого начального приближения v 0 е B ( v 0 , l ) при k = 0 .
Аналогично на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (15).
Теорема 4. Пусть
-
1) семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) е X , t е T , u е V , где X c R n — выпуклое компактное множество;
-
2) функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах Rn x T и R n ;
-
3) для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l > 0 с центром в точке v 0 е V C выполняется условие:
uu ( t ) - v ( t ), H 1 ( w ( t , u ), x ( t , u ), t ) - H 1 ( w ( t , v ), x ( t , v ), t )) <
- K||u ( t ) - v ( t )|| ,
-
u , v е B ( v 0 , l ), t е T ,
где K = const > 0 и для w е B ( v 0 , l ) введено обозначение: функция t/%( t , w ), t е T — решение специальной сопряженной задачи Коши:
^ ( t ) = - H x ( ^ ( t ), x ( t , w ), u a ( ^ ( t ), x ( t , w ), w ( t ), t ), t ), ^ ( t 1 ) = -^ x ( x ( t 1 , w )).
Тогда для достаточно малых параметрах проектирования a > 0 итерационный процесс (15) сходится в норме ||-||C к единственному решению v “ е B(v0, l) задачи о неподвижной точке (9) для любого начального приближения v0 е B(v0, l) при k = 0 .
Следствие 1 . Пусть в условиях теорем 3 и 4 центр v 0 е V C шара B ( v 0 , l ) удовлетворяет условию принципа максимума. Тогда v a = v 0 .
Следствие 2 . В условиях теорем 3 и 4 итерационные процессы для непрерывных начальных приближений v 0 е B ( v 0 , l ) при k = 0 могут сходиться только к непрерывным экстремальным управлениям.
Результаты теорем 3 и 4 могут быть обобщены на более широкий класс измеримых функций:
V о Vl = {v е L „ (T): v (t) е U, t е T} с нормой ||v||= ess sup ||v(t)||, v е VL.
“ t е Т
Таким образом, при достаточно малых параметрах проектирования a > 0 процессы (14) и (15) определяют последовательности итерационных приближений, однозначно определенных и непрерывно зависящих от параметра проектирования, которые обладают принципиальной сходимостью к экстремальному управлению, в том числе к особому экстремальному управлению. Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения задач о неподвижной точке сходимость итерационных процессов к тому или иному экстремальному управлению определяется выбором начального приближения.
Заключение
В классе линейных по управлению задач оптимального управления:
-
- получены новые формы принципа максимума в виде задач о неподвижной точке в классе задач оптимального управления, линейных по управлению, и доказана их эквивалентность классическим условиям принципа максимума;
-
- определены новые понятия особых управлений на основе новых форм принципа максимума в виде задач о неподвижной точке и доказана их эквивалентность классическому определению особого управления в классе задач оптимального управления, линейных по управлению;
-
- разработаны новые итерационные методы на основе задач о неподвижной точке принципа максимума для поиска экстремальных управлений, в том числе особых управлений, и доказаны теоремы сходимости итерационных процессов.
Выделим следующие свойства предлагаемых методов неподвижных точек принципа максимума, определяющие их эффективность для поиска особых экстремальных управлений.
-
1. Существенное повышение точности расчета последовательных приближений управления, вычисляемых одновременно с переменными состояния в процессе решения специальных задач Коши.
-
2. Возможность получения приближений особых экстремальных управлений при достаточно малых параметрах проектирования, обеспечивающих принципиальную сходимость итерационных процессов.
-
3. Однозначное существование и допустимость значений последовательных приближений особых экстремальных управлений, которые обеспечиваются свойствами операции проектирования.
Дальнейшее развитие подхода неподвижных точек для реализации условий оптимальности и улучшения управления определяет перспективное направление для разработки новых методов поиска особых экстремальных управлений в различных классах управляемых систем.