Методы поиска особых экстремальных управлений в линейных по управлению системах

Бесплатный доступ

В классе линейных по управлению задач оптимального управления предлагаются новые формы принципа максимума в виде задач о неподвижной точке операторов управления. На основе новых форм принципа максимума даются новые определения особых экстремальных управлений и показывается их эквивалентность известному понятию особого экстремального управления. Предлагаемые новые формы принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений с однозначно определяемыми приближениями особых значений управления. Доказываются теоремы о сходимости итерационных процессов предлагаемых методов.

Управляемая система, принцип максимума, особое управление, задача о неподвижной точке, итерационный метод

Короткий адрес: https://sciup.org/148331685

IDR: 148331685   |   DOI: 10.18101/2304-5728-2025-1-26-41

Текст научной статьи Методы поиска особых экстремальных управлений в линейных по управлению системах

Многие модели оптимизации управляемых процессов в области биологии, экономики, медицины, энергетики описываются системами, линейными по управлению. В классе линейных по управлению задач оптималь- ного управления часто встречаются особые задачи, в которых необходимые условия оптимальности в форме классического принципа максимума не позволяют однозначно определять значения экстремального управления. Это приводит к существенному усложнению поиска особых экстремальных управлений. В частности, метод краевой задачи принципа максимума и градиентные методы [1-5] становятся не эффективными в особых задачах.

В настоящей работе в классе линейных по управлению задач рассматриваются новые формы принципа максимума в виде операторных задач о неподвижной точке в пространстве управлений. Доказываются теоремы об эквивалентности рассматриваемых форм условий принципа максимума известному условию принципа максимума. Определяются понятия особых экстремальных управлений на основе сконструированных задач о неподвижной точке. Доказываются утверждения об эквивалентности введенных понятий с известным определением особого экстремального управления. Построенные задачи о неподвижной точке принципа максимума позволяют конструировать новые итерационные методы поиска особых экстремальных управлений, обладающие свойством однозначного определения итерационных приближений особых значений экстремального управления и свойством сходимости по управлению в широких предположениях.

Рассматривается класс линейных по управлению задач оптимального управления:

Ф ( и ) = ф ( x ( t 1 )) + j (( a ( x ( t ), t ), u ( t )) + d ( x ( t ), t )) dt ^ inf ,      (1)

x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x °, и ( t ) g U c R m , t g T = [ 1 0 , 1 1 ], (2) в котором x ( t ) = ( x 1 ( t ),..., xn ( t )) — вектор состояния системы, и ( t ) = ( и1(t ),..., u m ( t )) — вектор управления. В качестве допустимых управлений и ( t ) = ( и1(t ),..., u m ( t )) рассматривается множество V кусочнонепрерывных функций на интервале T со значениями в компактном и выпуклом множестве U c R m . Начальное состояние x0 и интервал T заданы. Функция у ( x ) дифференцируема на Rn , функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ) дифференцируемы по переменной x и непрерывны по переменной t на множестве Rn х T .

Функция Понтрягина с сопряженной переменной у в задаче (1), (2) представляется в следующем виде:

H ( у , x , и , t ) = H о ( у , x , t ) + < H 1 ( у , x , t ), и ) ,

H о ( у , x , t ) = < y , b ( x , t ) ) - d ( x , t ), H i ( y , x , t ) = A T ( x , t ) y - a ( x , t ).

Стандартная сопряженная система рассматривается в следующей форме:

y & ( t ) = - H x ( у ( t ), x ( t ), и ( t ), t ) ,       t g T , y ( 1 1 ) = -y x ( x ( t i )) .        (3)

Введем следующие обозначения для v g V :

  • - x ( t , v ), t e T — решение системы (2) при u ( t ) = v ( t ) ;

  • - щ ( t , v ) , t e T — решение системы (3) при x ( t ) = x ( t, v ) , u ( t ) = v ( t ) . Будем использовать следующее обозначение частного приращения произвольной вектор-функции h ( y , ,..., y l ) по переменным yS [ , ys^ :

A z, z h ( У 1 ,..., У1 ) = h ( У 1 ,•••, zs ,•••, zs ,-, У1 ) - h ( У 1 ,•••, ySl ,-, yS2 ,-, У1 ). s I , s 2              12           12

Стандартная формула приращения функционала [2-4] на управлениях u e V , v e V в рассматриваемом классе задач (1), (2) может быть представлена в следующем виде:

А v ф ( u ) = — £,( Н 1 ( Щ ( t , u ), x ( t , u ), t ), v ( t ) - u ( t )) dt + o( j T||v ( t ) - u ( t )|| dt ) . (4)

Формула приращения (4) является основой для получения известных условий принципа максимума.

Рассмотрим отображение на основе операции максимизации:

u * ( щ , x , t ) = arg max 1 ( щ , x , t ), w} , x e R n , щ e R n , t e T .

w U

С помощью отображения u условие известного принципа максимума [1-5] для управления u e V в задаче (1), (2) можно записать в виде:

u ( t ) = u * ( щ ( t , u ), x ( t , u ), t ), t e T .                     (5)

Обозначим P Y — оператор проектирования на множество Y с R k в евклидовой норме:

P y ( z ) = arg min(|| y - z ||), z e R k .

y Y

Важным свойством оператора проектирования является выполнение неравенства:

P Y ( z X z P Y ( z )) ^ 0 , У e Y .

Определим отображение u a с параметром a 0 на основе операции проектирования:

u a ( щ , x , w , t ) = P U ( w + a H 1 ( щ , x , t ) ) , x e R n , щ e R n , w e U , t e T .

С помощью отображения u a условие принципа максимума (5) в задаче (1), (2) можно записать в эквивалентном виде:

u ( t ) = u a ( щ ( t , u ), x ( t , u ), u ( t ), t ), t e T .                 (6)

Управление u e V , удовлетворяющее необходимым условиям оптимальности, называется экстремальным.

Рассмотрим функцию переключения:

g ( щ , x , t ) = H 1 ( y ,x , t ).

В соответствии с известным определением особого управления [3; 5] управление u e V в задаче (1), (2) называется особым, если для этого управления существует интервал времени [ 0 , , 0 2 ] с T ненулевой меры, на котором выполняется условие:

g ( щ ( t , u ), x ( t , u ), t ) = 0.

Для особого экстремального управления условия (5) и (6) на особом интервале выполняются тривиально и не могут служить для однозначного определения значений экстремального управления на особом интервале. Задача (1), (2) называется особой, если существует хотя бы одно особое экстремальное управление .

1 Задачи о неподвижной точке принципа максимума Определим отображения X , Т , V a , a 0 следующими соотношениями:

X ( и ) = x , и е V , x ( t ) = x ( t , u ), t е T , Т ( и ) = щ , и е V , щ ( t ) = щ ( t , и ) , t G T , V a ( щ ,x , и ) = v a , щ G C ( T ), x G C ( T ), и G V , v a ( t ) = и а ( щ (t ), x ( t ), и ( t ), t ) , t G T , где C ( T ) — пространство непрерывных на T функций.

С помощью введенных отображений условие принципа максимума (6) можно представить как задачу о неподвижной точке c оператором управления G 1 a :

и = V a ( Т ( и ), X ( и ), и ) = G a ( и ), и g V .                (7)

Введем отображение X a следующим образом:

X a ( щ , и ) = x , щ g C(T ), и е V , где x ( t ), t е T является решением специальной задачи Коши: x ( t ) = A ( x ( t ), t ) и а ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0. Рассмотрим задачу о неподвижной точке с оператором управления G a : и = V a ( Т ( и ), X a ( Т ( и ), и ), и ) = G a ( и ), и е V .       (8)

Построим оператор Т a по правилу:

Т a ( x , и ) = щ , x е C ( T ), и е V , где щ ( t ), t е T — решение сопряженной задачи Коши:

щ ( t ) = - H x ( щ ( t ), x ( t ), и а ( щ ( t ), x ( t ), и ( t ), t ), t ), щ ( t i ) = -^x ( x ( t i )). Рассмотрим задачу о неподвижной точке с оператором управления G a :

и = V a ( Т a ( X ( и ), и ), X ( и ), и ) = G a ( и ), и е V .        (9)

Докажем следующее утверждение.

Теорема 1. Задачи о неподвижной точке (8) и (9) являются эквивалентными условию принципа максимума (6).

Условие принципа максимума в проекционной форме (6) является эквивалентным следующей дифференциально-алгебраической краевой задаче:

x ( t ) = A ( x ( t ), t ) и ( t ) + b ( x ( t ), t ), x ( 1 0 ) = x 0,          (10)

щ ( t ) = - H x ( щ ( t ), x ( t ), и ( t ), t ), щ ( t i ) = -( P x ( x ( t 1 )),          (11)

и ( t ) = и а ( щ ( t ), x ( t ), и ( t ), t ),       t G T .

Покажем, что задача о неподвижной точке (8) эквивалентна условию принципа максимума (6).

Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11). Это значит, что функция x ( t , u ), t е T является решением задачи Коши x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x °, т. е. X ( u ) = X a ( T ( u ), u ).

Следовательно, получаем, что u = Va (T(u), X(u), u) = Va (T(u), Xa (T(u), u), u).

Обратно, пусть u е V является решением уравнения (13), т. е.

u ( t ) = u a ( ^ ( t , u ), x ( t ), u ( t ), t ), t е T , где x ( t ), t е T является решением специальной задачи Коши:

x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , u ), x ( t ), u ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.

Следовательно, x ( t ) = x ( t , u ), t е T , т. е. X a ( T ( u ), u ) = X ( u ). Получаем следующее:

u = V a ( T ( u ), X a ( T ( u ), u ), u ) = V a ( T ( u ), X ( u ), u ).

Аналогично покажем эквивалентность задачи о неподвижной точке (9) и условия принципа максимума (6).

Действительно, пусть u е V удовлетворяет условию (6), т. е. тройка ( x ( t , u ), ^ ( t , u ), u ( t )), t е T является решением краевой задачи (10), (11).

Это значит, что функция ^ ( t , u ), t е T является решением задачи Коши:

Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -^x ( x ( t 1 , u )). т. е. T ( u ) = T a ( X ( u ), u ).

Следовательно, получаем, что u = V a ( T ( u ), X ( u ), u ) = V a ( T a ( X ( u ), u ), X ( u ), u ).

Обратно, пусть u е V является решением уравнения (14), т. е.

u ( t ) = u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t е T , где щ (t ), t е T является решением специальной задачи Коши:

Ч & ( t ) = - H x ( ^ ( t ), x ( t , u ), u a ( ^ ( t ), x ( t , u ), u ( t ), t ), t ), ^ ( t 1 ) = -v x ( x ( t 1 , u )). Следовательно, y (t ) = ^ ( t , u ),    t е T , т. е.      T a ( X ( u ), u ) = T ( u ).

Получаем следующее:

u = V a ( T a ( X ( u ), u ), X ( u ), u ) = V a ( T ( u ), X ( u ), u ).

Доказательство окончено.

2    Особые экстремальные управления

Задача о неподвижной точке (8) в поточечной форме принимает вид: u(t) = ua (^(t,u),x(t),u(t), t), t е T, где x(t), t g T является решением специальной задачи Коши:

x ( t ) = A ( x ( t ), t ) u a ( у ( t , u),x ( t ), u ( t ), t ) + b ( x ( t),t), x ( 1 0 ) = x°.    (12)

Для управления u V введем функцию переключения g 1 ( x, t ) = g ( у ( t, u ), x , t ) . Аналогично определению особого решения [4] решение x ( t ), t g T задачи Коши (12) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:

g i ( x ( t ), t ) = 0.

Управление u g V назовем особым для задачи Коши (12), если существует особое решение x ( t ), t g T этой задачи Коши.

Экстремальное управление u g V , удовлетворяющее условию (8), назовем особым, если управление u g V является особым для соответствующей задачи Коши (12).

Для особого экстремального управления, удовлетворяющего условию (8) с соответствующей задачей Коши (12), соотношение u ( t ) = u a ( у ( t , u ), x ( t ), u ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.

Лемма 1. Особое экстремальное управление, удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (8) с соответствующей задачей Коши (12), и наоборот. При этом соответствующие особые интервалы совпадают.

Действительно, пусть экстремальное управление u g V является особым на основе функции переключения    g ( у , x , t ),  т. е.

g( у (t , u ), x ( t , u ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления u g V выполняется соотношение      u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).

Следовательно, функция x ( t ) = x ( t , u ), t g T удовлетворяет задаче Коши (12) для соотношения u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ). При этом получаем g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ) = 0 , t g [ 0 1 , 0 2 ] с T .

Обратно, пусть экстремальное управление u g V , удовлетворяющее условию (8) с соответствующей задачей Коши (12), является особым, т. е. g 1 ( x ( t ), t ) = g( у (t , u ), x ( t ), t ) = 0, t g [ 0 1, 0 2] с T , где x ( t ), t g T является решением задачи Коши (12). В силу системы (12) и условия экстремальности u ( t ) = u a ( у (t , u ), x ( t ), u ( t ), t ) имеем x ( t ) = x ( t , u ), t g T . Следовательно, получаем 0 = g 1 ( x ( t ), t ) = g ( у ( t , u ), x ( t , u ), t ), t g [ 0 1, 0 2] с T и условие экстремальности

u ( t ) = u a ( у (t , u ), x ( t , u ), u ( t ), t ).

Доказательство окончено.

Задача о неподвижной точке (9) в поточечной форме принимает вид:

и ( t ) = u a ( у ( t ), x ( t,u ), u ( t ), t ) , t G T, где у ( t ), t g T является решением специальной сопряженной задачи Коши:

у ( t ) = - H x ( у ( t ), x ( t , и ), u a ( у ( t ), x ( t , и ), и ( t ), t ), t ), у ( t ^ ) = -yx ( x ( t i , и )). (13)

Введем функцию переключения g 2 ( у , t ) = g ( у , x ( t , и ), t ). Решение у ( t ), t g T задачи Коши (13) назовем особым, если существует интервал времени [ 0 1 , 0 2 ] с T ненулевой меры, на котором выполняется условие:

g 2 ( ^ ( t ), t ) = 0.

Управление и g V назовем особым для задачи Коши (13), если существует особое решение у ( t ), t g T этой задачи Коши.

Экстремальное управление и g V , удовлетворяющее условию (9), называется особым, если управление и g V является особым для соответствующей задачи Коши (13).

Для особого экстремального управления, удовлетворяющего условию (9) с соответствующей задачей Коши (13), соотношение и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) выполняется тождественно на особом интервале и не может использоваться для определения значений экстремального управления на особом интервале.

Имеет место утверждение, аналогичное Лемме 1.

Лемма 2. Особое экстремальное управление и g V , удовлетворяющее условию (6), является особым экстремальным управлением, удовлетворяющим условию (9) с соответствующей задачей Коши (13), и наоборот. При этом соответствующие особые интервалы совпадают.

Действительно, пусть экстремальное управление и g V является особым на основе функции переключения g ( у , x , t ), т. е. g( у (t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T . В силу экстремальности управления и g V имеем соотношение и ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ). Следовательно, функция у ( t ) = у ( t , и ), t g T удовлетворяет задаче Коши (13) для соотношения и ( t ) = u a ( у ( t ), x ( t , и ), и ( t ), t ). При этом получаем g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ) = 0, t g [ 0 1 , 0 2 ] с T .

Обратно, пусть экстремальное управление и g V , удовлетворяющее условию (9) с соответствующей задачей Коши (13), является особым, т. е. g 2 ( у ( t ), t ) = g ( у ( t , и ), x ( t ), t ) = 0, t g [ 0 , 0 2 ] с T , где у ( t ), t g T является решением задачи Коши (13). В силу системы (13) и условия экстремальности и ( t ) = u a ( у (t ), x ( t , и ), и ( t ), t ) имеем у ( t ) = у ( t , и ), t g T . Следовательно, получаем 0 = g 2( у ( t ), t ) = g ( у ( t , и ), x ( t , и ), t ), t G [ 0 1 , 0 2 ] с T и условие экстремальности

u ( t ) = u a ( у (t , и ), x ( t , и ), и ( t ), t ).

Доказательство окончено.

3    Методы неподвижных точек принципа максимума

При заданном a >  0 для численного решения задач о неподвижной точке принципа максимума (8) и (9) рассмотрим соответствующие итерационные процессы метода простой итерации при k 0 :

v k + 1 = V a ( Y ( v k ), X a ( Y ( v k ), v k ), v k ), v k + 1 = V a ( Y a ( X ( v k ), v k ), X ( v k ), v k ).

Процесс (14) в поточечной форме имеет вид: vk+1( t) = ua (V (t, vk), x (t), vk (t), t),      t g T, где x(t), t g T является решением специальной задачи Коши:

x ( t ) = A ( x ( t ), t ) u a ( v ( t , v k ), x ( t ), v k ( t ), t ) + b ( x ( t ), t ), x ( t o) = x 0.

Понятно, что x ( t ) = x ( t , v k + 1), t g T . Таким образом, итерационный процесс (14) в поточечной форме может быть записан в следующем неявном виде:

v k + 1( t ) = u a ( V ( t , v k ), x ( t , v k + 1), v k ( t ), t ), v0 g V , t g T (16) или в операторной форме:

v k + 1 = V a ( Y ( v k ), X ( v k + 1), v k ), v0 g V .

Процесс (15) в поточечной форме принимает вид:

v k + 1( t ) = u a ( V ( t ), x ( t , v k ), v k ( t ), t ), t g T ,         (17)

где v ( t ), t g T является решением специальной сопряженной задачи Коши:

  • V ( t ) = - H x ( V ( t )> x ( t , vk ), u a ( v ( t ), x ( t , vk X vk ( t X t X t X

k                                              (18)

V ( t 1 ) = -9* ( x ( t 1 , v ))-

В классе билинейных задач для решения v ( t ), t g T имеет место очевидное соотношение:

V ( t ) = V ( t , v k + 1), t g T .

Следовательно, в классе билинейных задач итерационный процесс (17), (18) может быть записан в следующей неявной поточечной форме:

v k + 1( t ) = u a ( V ( t , v k + 1), x ( t , v k ), v k ( t ), t ), v0 g V , a >  0, t g T .        (19)

Для сравнения предлагаемых проекционных методов неподвижных точек представим в используемых обозначениях стандартный метод проекции градиента с a 0 [3; 4]:

vka (t) = ua (V(t,vk),x(t,vk),vk (t),t),       t g T, a g (0, да):     Ф(vka) <Ф(vk) ^ vk+1 = va .

На каждой итерации рассматриваемого метода проекции градиента проекционный параметр a 0 варьируется для обеспечения улучшения имеющегося управления.

В построенных проекционных методах неподвижных точек (14) и (15), в отличие от стандартного метода проекции градиента, параметр проектирования a > 0 фиксируется в итерационном процессе последовательных приближений управления. Таким образом, на каждой итерации предлагаемых методов релаксация по целевому функционалу не гарантируется, но это свойство релаксации компенсируется следующими свойствами предлагаемых методов:

  • -    нелокальность последовательных приближений управления;

  • -    отсутствие достаточно трудоемкой операции варьирования управления в окрестности текущего приближения для обеспечения улучшения по функционалу задачи;

  • -    трудоемкость вычислительной реализации одной итерации методов (14) и (15) составляет две задачи Коши для фазовых и сопряженных переменных.

4 Условия сходимости итерационных процессов

Анализ сходимости построенных итерационных процессов (14) и (15) можно осуществить на основе известного принципа сжимающих отображений [6, 7].

Рассмотрим задачу о неподвижной точке в следующей общей форме:

v = G ( v ), v е V e ,                             (20)

в которой G : V E ^ V E является оператором, действующим на множестве V E . Для численного решения задачи (20) рассмотрим итерационный процесс метода простой итерации при k 0 :

v k + 1 = G ( v k ), v 0 е V E , k 0.                             (21)

Для задачи (20) можно доказать следующий аналог известной теоремы [7].

Теорема 2. Пусть оператор G : V E ^ V E , действующий на множестве V E в полном нормированном пространстве E с нормой ||-||Е, удовлетворяет условию Липшица в шаре:

B(v 0, l) = {v е VE : I v — v cl |E < l, v0 е VE, l > 0} с константой 0 < M = M(v0, l) < 1:

II G ( v ) - G ( u )| |e< M\\v - u| Ie ,      v е B ( v 0 , l ), u е B ( v 0 , l ).         (22)

При этом выполняется условие:

|| G ( v 0 ) - v d |e< (1 - M ) l .                           (23)

Тогда задача о неподвижной точке (20) имеет единственное решение v е B ( v 0 , l ) и итерационный процесс (21) сходится к v в норме ||-||Е для любого начального приближении v 0 е B ( v 0 , l ). Для погрешности метода выполняется оценка:

II v k - v l Ie< M 'W v ° - v l Ie , k > 0.

Доказательство теоремы повторяет доказательство известной теоремы [7] с необходимыми очевидными изменениями, связанными с рассматриваемой постановкой задачи (20), и поэтому не приводится.

Отметим, что условие (23) вводится для того, чтобы обеспечить невыход итерационных приближений процесса (21) за пределы множества B ( v 0 , l ), на котором выполняется условие Липшица (22).

Докажем с помощью теоремы 2 следующие утверждения о сходимости указанных процессов (14) и (15) к решениям соответствующих задач о неподвижной точке на подмножестве непрерывных допустимых управлений:

VC = {v е C (T): v (t) е U, t е T} с V с нормой ||v||C = max|v(t)||, v е VC.

Пусть семейство фазовых траекторий системы (2) на множестве V является ограниченным:

x ( t , v ) е X , t е T , v е V ,                        (24)

где X с R n — выпуклое компактное множество.

Отметим, что достаточным условием ограниченности (24) может быть выполнение известной оценки [4] с константой C >  0 :

|| A ( x , t ) u + b ( x , t )|| C (|| x || + 1), x е R n , u е U , t е T .

Предположим дополнительно, что функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n х T и R n .

При выполнении ограничения (24) на основе достаточного условия применительно к сопряженной системе с учетом ее линейности получаем условие ограниченности семейства траекторий сопряженной системы:

щ ( t , v ) е P ,      t е T , v е V ,                           (25)

где P с R n — выпуклое компактное множество.

При сделанных предположениях можно показать аналогично [3; 4], что операторы X , Т удовлетворяют условию Липшица с константами Q > 0, C 2 > 0:

II X ( v ) - X ( u )| I C C 1 | v - u|| C ,        v е V C , u е V C ,

||Т( v ) - Т ( u )|| C C 2 | v - u||c ,        v е V C , u е V C .

Для отображения X a , определяемого соотношением:

X a ( щ , u ) = x , щ е C(T ), и е V , обозначим x ( t ) = x ( t , щ , и ), t е T — решение специальной задачи Коши:

x ( t ) = A ( x ( t ), t ) u a ( щ ( t ), x ( t ), и ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.

Для отображения Т a , определяемого по правилу:

Т a ( x , и ) = щ , x е C ( T ), и е V , обозначим щ ( t ) = щ ( t , x , и ), t е T — решение сопряженной задачи Коши:

V ( t ) = - H x ( V ( t ), x ( t ), u a ( v ( t ), x ( t ), u ( t ), t ), t ), V ( t i ) = - ^ x ( x ( t i )).

Используя условие Липшица для оператора проектирования PU и условий ограниченности (24) и (25), получаем:

II x ( t , p , u ) - x ( t , q , v )|| =

= || x ( t , V a ( p , X a ( p , u ), u )) - x ( t , V a ( q , X a ( q , v ), v ))|| <

  • < M i f| \V a ( p , X a ( p , u ), u )L - V a ( q , X a ( q , v ), v )\t\dt <

T

  • < M 2 f| | u ( t ) - v ( t )| \dt +

T

+a M 2 f | \H i ( p ( t ), x ( t , p , u ), t ) - H i ( q ( t ), x ( t , q , v ), t )| \dt ,

T где t g T, u, v g VC, p, q g C(T), Mi = const > 0, M2 = const > 0.

Аналогично получаем:

I V ( t , x , u ) - v ( t , y , v )|| =

= ^tt , V a ( T a ( x , u ), x , u )) - v ( t , V a ( T a ( y , v ), y , v ))|| <

  • < M з f| V a ( T a ( x , u ), x , u )\t - V a ( T a ( y , v ), y , v )\t\\dt <

  • < M 4 J| u ( t ) - v ( t )|| dt +

T

+a M 4 f|| H i ( v ( t , x , u ), x ( t ), u ( t ), t ) - H i ( v ( t , y , v ), y ( t ), v ( t ), t ) || dt ,

T где t g T, u, v g VC, x, y g C(T), M3 = const > 0, M4 = const > 0.

Отсюда нетрудно обосновать при достаточно малом a 0 оценки:

II X a ( T ( . ), . ) - X a ( T ( v ), v )| с (j + a i M^| u - v i c ,

(1 a ^Z6)

II T a ( X ( u ), u ) -T a ( X ( v ), v )| C < ^ M ► - v C , (1 a M g )

где u g V C , v g V C , константы M i 0 , i = 5,6,7,8.

На основании выполнения известного условия Липшица для оператора проектирования P U получаем:

||ua ( p , x , u , t ) - u a ( q , y , v , t )||2 < ||( u - v ) + a ( H i ( p , x , t ) - H i ( q , y , t ))||2 <

< l| u - v |P + 2 a (u - v , H i ( p , x , t ) - H i ( q , y , t )} +

+ a 21 H i ( p,x, t ) - H i ( q , y , t tf,

  • u , v g U , p , q g P , x , y g X , t g T .

Предположим, что в шаре B ( v 0 , l ) c V C радиуса l 0 с центром в точке v 0 g V C для вектор-функции H i ( v , x , t ) выполняется условие:

Uu ( t ) - v ( t ), H 1 Ы t , u ), x ( t , V a ( У ( u ), X a ( T ( u ), u ), u )), t ) -

  • -    H 1 ( ^ ( t,v ), x ( t,V a ( T ( v), X a ( ^ ( v ), v ), v )), t )) <- K 2 1 u ( t ) - v ( t )||2, u,v e B ( v 0 , l ), t e T,

где K 2 = const >  0.

Тогда на основе неравенства (26) при достаточно малом a 0 можно получить оценку:

||V a ( У ( u ), X a ( У ( u ), u ), u ) - V a ( У ( v ), X a ( Т ( v ), v ), v )|| c <

< (1 - 2aK 2 + a 2 M J2] \u - v\\c , где M 10 = const >  0, u , v e B ( v 0 , l ).

Также предположим, что в шаре B ( v 0 , l ) с V C радиуса l 0 с центром в точке v 0 e V C для вектор-функции H 1 ( ^ , x , t ) выполняется условие:

uu ( t ) - v ( t ), H 1 ( ^ ( t , V a ( У a ( X ( u ), u ), X ( u ), u )), x ( t , u ), t ) -

  • -    H i( ^ ( t , V a ( Т a ( X ( v ), v ), X ( v ), v )), x ( t , v ), t )) <- K 3| | u ( t ) - v ( t )||2 ,

  • u , v e B ( v 0 , l ), t e T , где K 3 = const 0 .

Тогда на основе неравенства (26) при достаточно малом a 0 можно получить оценку:

||V а ( У a ( X ( u ), u ), X ( u ), u ) - V a ( У a ( X ( v ), v ), X ( v ), v )|| C <

  • < (1 - 2 a K з + a 2 M H) 2 || u - v|| C , где M 11 = const 0, u , v e B ( v 0 , l ).

Таким образом, в сделанных предположениях при достаточно малых a 0 операторы (X и G % удовлетворяют условию Липшица с константой меньше единицы на множестве B ( v 0 , l ).

В силу определения при достаточно малых a 0 операторы G ^ и G a удовлетворяют условию (23) в норме ||-|| C пространства непрерывных функций C ( T ) для любого v 0 e V C .

Таким образом, при достаточно малых a 0 итерационные приближения процессов (14) и (15) остаются в пределах множества B ( v 0 , l ) для любого начального приближения v 0 e B ( v 0 , l ).

В результате на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (14).

Теорема 3. Пусть

  • 1)    семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) e X , t e T , u e V , где X с R n — выпуклое компактное множество;

  • 2)    функции a ( x, t ), d ( x , t ) A ( x, t ), b ( x, t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах R n x T и R n ;

  • 3)    для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l 0 с центром в точке v 0 е V C выполняется условие:

Uu ( t ) - v ( t ), H 1 ( ^ ( t , u ), x ( t , u ), t ) - H 1 ( ^ ( t , v ), x ( t , v ), t )) <

- K\\u ( t ) - v ( t )|| ,

U, v е B (v 0, l), t е T, где K = const > 0 и для w е B(v0,l) введено обозначение: функция x(t, w), t е T — решение специальной задачи Коши:

x ( t ) = A ( x ( t ), t ) u a ( ^ ( t , w ), x ( t ), w ( t ), t ) + b ( x ( t ), t ), x ( 1 0) = x 0.

Тогда для достаточно малых параметрах проектирования a 0 итерационный процесс (14) сходится в норме ||-|| C к единственному решению v a е B ( v 0 , l ) задачи о неподвижной точке (8) для любого начального приближения v 0 е B ( v 0 , l ) при k = 0 .

Аналогично на основе теоремы 2 можно сформулировать следующее утверждение о сходимости итерационного процесса (15).

Теорема 4. Пусть

  • 1)    семейство фазовых траекторий в задаче (1), (2) ограничено: x ( t , u ) е X , t е T , u е V , где X c R n — выпуклое компактное множество;

  • 2)    функции a ( x , t ), d ( x , t ), A ( x , t ), b ( x , t ), ф ( x ) дважды непрерывно дифференцируемы по совокупности переменных на соответствующих множествах Rn x T и R n ;

  • 3)    для функции H j ( ^ , x , t ) в шаре B ( v 0 , l ) c V C радиуса l 0 с центром в точке v 0 е V C выполняется условие:

uu ( t ) - v ( t ), H 1 ( w ( t , u ), x ( t , u ), t ) - H 1 ( w ( t , v ), x ( t , v ), t )) <

- K||u ( t ) - v ( t )|| ,

  • u , v е B ( v 0 , l ), t е T ,

где K = const 0 и для w е B ( v 0 , l ) введено обозначение: функция t/%( t , w ), t е T — решение специальной сопряженной задачи Коши:

^ ( t ) = - H x ( ^ ( t ), x ( t , w ), u a ( ^ ( t ), x ( t , w ), w ( t ), t ), t ), ^ ( t 1 ) = -^ x ( x ( t 1 , w )).

Тогда для достаточно малых параметрах проектирования a > 0 итерационный процесс (15) сходится в норме ||-||C к единственному решению v “ е B(v0, l) задачи о неподвижной точке (9) для любого начального приближения v0 е B(v0, l) при k = 0 .

Следствие 1 . Пусть в условиях теорем 3 и 4 центр v 0 е V C шара B ( v 0 , l ) удовлетворяет условию принципа максимума. Тогда v a = v 0 .

Следствие 2 . В условиях теорем 3 и 4 итерационные процессы для непрерывных начальных приближений v 0 е B ( v 0 , l ) при k = 0 могут сходиться только к непрерывным экстремальным управлениям.

Результаты теорем 3 и 4 могут быть обобщены на более широкий класс измеримых функций:

V о Vl = {v е L „ (T): v (t) е U, t е T} с нормой ||v||= ess sup ||v(t)||, v е VL.

“          t е Т

Таким образом, при достаточно малых параметрах проектирования a 0 процессы (14) и (15) определяют последовательности итерационных приближений, однозначно определенных и непрерывно зависящих от параметра проектирования, которые обладают принципиальной сходимостью к экстремальному управлению, в том числе к особому экстремальному управлению. Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения задач о неподвижной точке сходимость итерационных процессов к тому или иному экстремальному управлению определяется выбором начального приближения.

Заключение

В классе линейных по управлению задач оптимального управления:

  • -    получены новые формы принципа максимума в виде задач о неподвижной точке в классе задач оптимального управления, линейных по управлению, и доказана их эквивалентность классическим условиям принципа максимума;

  • -    определены новые понятия особых управлений на основе новых форм принципа максимума в виде задач о неподвижной точке и доказана их эквивалентность классическому определению особого управления в классе задач оптимального управления, линейных по управлению;

  • -    разработаны новые итерационные методы на основе задач о неподвижной точке принципа максимума для поиска экстремальных управлений, в том числе особых управлений, и доказаны теоремы сходимости итерационных процессов.

Выделим следующие свойства предлагаемых методов неподвижных точек принципа максимума, определяющие их эффективность для поиска особых экстремальных управлений.

  • 1.    Существенное повышение точности расчета последовательных приближений управления, вычисляемых одновременно с переменными состояния в процессе решения специальных задач Коши.

  • 2.    Возможность получения приближений особых экстремальных управлений при достаточно малых параметрах проектирования, обеспечивающих принципиальную сходимость итерационных процессов.

  • 3.    Однозначное существование и допустимость значений последовательных приближений особых экстремальных управлений, которые обеспечиваются свойствами операции проектирования.

Дальнейшее развитие подхода неподвижных точек для реализации условий оптимальности и улучшения управления определяет перспективное направление для разработки новых методов поиска особых экстремальных управлений в различных классах управляемых систем.

Статья научная