Принцип максимума в задачах оптимального управления процессами, описываемыми гибридными функционально-дифференциальными уравнениями

Бесплатный доступ

При исследовании и решении задач гладкого оптимального управления обычно используется линеаризация уравнений состояния управляемого процесса, и, естественно, здесь применимы современные результаты по теории линейных функционально-дифференциальных уравнений. Была поставлена следующая задача: получить такие необходимые условия оптимальности в виде принципа максимума, что должно быть справедливо для всех классов функционально-дифференциальных уравнений. В результате построена собственная схема получения необходимых условий оптимальности в теории экстремальных задач. С ее помощью можно вкратце и в довольно общей форме сформулировать теорию принципа максимума. С помощью указанной схемы принципа максимума и теории линейных функциональнодифференциальных уравнений необходимые условия оптимальности получаются и доказываются в задачах гладкого оптимального управления.

Еще

Принцип максимума, гибридные линейные функционально-дифференциальные уравнения, сопряженный оператор

Короткий адрес: https://sciup.org/147245391

IDR: 147245391   |   УДК: 517.977.52   |   DOI: 10.17072/1993-0550-2018-3-20-25

The maximum principle in problems of optimal control of processes described by hybrid functional differential equations

In view of the fact that in the investigation and solution of smooth optimal control problems the linearization of the equations of state of a controlled process is usually used, the idea naturally appeared to apply here the available modern results on the theory of linear functional differential equations. The following problem was posed: to obtain such necessary optimality conditions in the form of the maximum principle, which should be valid for all classes of equations with deviating argument known to us. This allowed us to construct our own scheme for obtaining the necessary conditions for optimality in the theory of extremal problems. With its help, it was possible to briefly and in a rather general form state the theory of the maximum principle. With the help of the mentioned scheme of the maximum principle and the theory of linear functional differential equations, necessary optimality conditions are obtained and proved in smooth optimal control problems.

Еще

Текст научной статьи Принцип максимума в задачах оптимального управления процессами, описываемыми гибридными функционально-дифференциальными уравнениями

Рассматриваются задачи оптимального управления процессами, состояние которых описывается гибридными функциональнодифференциальными уравнениями [5,  13].

Если это обыкновенные дифференциальные уравнения, то эффективным средством исследования и решения таких задач является принцип максимума Понтрягина [14–16]. Если это функционально-дифференциальные уравнения, то можно их исследовать с помощью принципа максимума Понтрягина [2–4, 6–8, 14].

В качестве метода исследования и решения поставленных ниже экстремальных

Работа выполнена при финансовой поддержке РФФИ, № 18-01-00332 A.

задач здесь применяется классический принцип максимума, схема которого построена в статьях [9–12]. Это сделано из следующих соображений. Для систем управления, описываемых так называемыми уравнениями "нейтрального" типа, принцип максимума Понтрягина, вообще говоря, не применим [4, 6–8].

Класс обычно рассматриваемых экстремальных задач представляет собой задачи на условный экстремум с ограничениями типа равенств и неравенств, задаваемых системой функционалов, и явными ограничениями на управление. Результаты, приведенные в статьях [9–12], позволяют рассматривать экстремальные задачи с самыми разнообразными ограничениями.

Надо отметить, что в задачах, где применим принцип максимума Понтрягина, требуется меньшая степень гладкости по управ- лению, чем в рассматриваемых в работах [9– 12] экстремальных задачах.

1. Задачи линейной оптимизации. Постановка задач оптимального управления

Ниже рассматриваются задачи оптимального управления, в которых состояние управляемого процесса на отрезке времени t е [0, T ] описывается гибридными линейными функционально-дифференциальными уравнениями [1, 13].

Критерием оптимальности является минимум линейного ограниченного функционала общего вида l 0: D n х nnQ p х L m х m™ ^ R , определенного равенством

T l0 (x, y, u, v) = j ^* (s)x(s)ds + ^*, x(0)^ + 0

tT

+ J ^ o ( s ) u ( s ) ds + ZX( t ) y ( t ) +

T - 1

+ ^0*, y (-1)} + E%‘ (t) v (t).(1)

t = 0

Пусть Lnp, 1 < p < ^ , - пространство функций f: [0, T] ^ Rn, компоненты которых суммируемы на [0, T] со степенью p , и с нор- мой

/ т                Л1/ p

II f\\  = JII f (t)||pndt . Dp, 1 < p ^ , - p      k 0              J пространство таких абсолютно непрерывных функций   x :[0, T] ^ Rn, что X е Ln, и

II x II D =1 x II L p + II x (0)||R n .

Пусть пространство npnp , 1 < p < x , век- тор-функций g(t) = £ X[t,t+1)(t)g(t), которое t=0

изоморфно      пространству      матриц g = {g (0), g (1),..., g (T)} с нормой

/ T            A1/ p

11 gl n =| Z II g JIr l .

p k i =0           J

Пространство nnOp,  1 < p < ^ , вектор- функций   y (t) = Z X[ t, t+1)(t)y (t), которое изо- t=-1

морфно       пространству       матриц y = {y(-1), y(0), y (I)»-, y(т)}     с нормой

/ T           k1/ p

При записи функционала (1) используется естественный изоморфизм пространств D n и Lnp х M n , который задается формулой

t

x ( t ) = x (0) + J x ( s)ds . Аналогично использу- 0

ется изоморфизм пространств f0 p и nn p х ® n , который задается формулой    y ( t )   =

Z Х [ t , t +1) ( t ) y ( t ) = y ( - 1) ^ - 1 ,0 ) ( t ) + y (0) Х [0,1) ( t ) + + y (1) X [1,2) ( t ) + ... + y (T - 1) X [ T - 1 T ) ( t ) .

Основное ограничение на управляемый процесс задается системой гибридных линейных функционально-дифференциальных уравнений:

Z 1 x + Ly y

= Qu x + Д10 x (0) + Q 12 y + A n0 y ( - 1)

Gnu + Gnv + f ,

^21 x + 22 y y

Q 21 x + Л0 x (0) + Q 22 у + A 22O у ( - 1) — — G21u + G22v + g .

Операторы £ц : D p ^ Ln p , >^2: C p ^ L np , £21 : D n ^ f p , £22 : C p ^ nnp предполагаются линейными и ограниченными.

Предположим, что система (2) разрешима при всех f е L n и всех g е £р .

Здесь £11: D n ^ Lnp - линейный ограниченный оператор, Q n : Lnp ^ Lnp - его главная часть, предполагается, что Q - нормально разрешим. Как правило, Q фредгольмов при естественных условиях его действия. An , An - матрицы со столбцами из Lnp ; A 21, A22 -матрицы со столбцами из nnp ; G n : L m ^ Lnp -линейный замкнутый оператор, где m n ; f -элемент пространства    Lnp .    G 12 : £ m ^ Lnp ,

G 21: L m ^ Гр , G 22 : tmr ^ F p - линейные замкнутые операторы, g - элемент пространства nnp .

Уравнение (2) охватывает широкий класс линейных гибридных уравнений с последействием. Типичными представителями этого класса являются: линейные обыкновенные дифференциальные уравнения, линейные уравнения с сосредоточенным и распределенным отклонением аргумента, линейные интегро-дифференциальные уравнения, линейные уравнения нейтрального типа, линейные разностные уравнения. Если оператор Q лишь нормально разрешим, то класс операторов (Z^J, вообще говоря, трудно обозрим. При этом, как правило, появляются дополнительные ограничения на гладкость оператора Gn. Фредгольмовость  Qn для большого класса экстремальных задач снимает практически все ограничения на оператор Gn .

Дополнительные ограничения:

T l (x, y, u, v) = j p* (s) x (s) ds + ^*, x (0)^ + 0

T

+ j ° ( s ) u ( s ) ds + ^ 0 * ( t ) y ( t ) + ($. , y (-0 +

T -1                                ____

+Тл(t)v(t)e Mi (i=1, k) • t=0

Ограничение (3) задается системой линейных ограниченных функционалов общего вида, определенных на D n х nnQ p х L m х m™ . Множества M. gR ( i = 1, к ) - выпуклы, могут быть точечными (ограничения типа равенств).

Преобразуем систему ограничений (3) следующим образом.

Определим линейный ограниченный вектор-функционал l: Dn х £пОр х Im х ^m > 1k равенством l (x, y, u, v) =

TT

= J Ф ( s ) x ( s ) ds + (T , x (0)} + j W ( s ) u ( s ) ds +

T-1

+ £©(t)y (t) + (S, y (-1)} + £Q( t )v (t), t=0

где Ф , T , W , © , S , Q -( к х n ) -матрицы, строки которых составлены из векторов р * , V i , o , , 0 i , & i , n i  ( i = 1, k ) •

Множество M o e R k определим, полагая

M 0 = { c°l{ y 1 ,..., y k }: y e M , (i = 1 k ) } • Очевидно, что M - выпукло.

Итак, систему ограничений (3) можно записать в более удобном виде:

l ( x , y , u , v ) =

= | ф ( s ) x ( s ) ds + (T , x (0)} + J W ( s ) u ( s ) ds + 0                                         0

+ £ © ( t ) y ( t ) + (S , y ( - 1)} + t = 0

+ £ Q ( t ) v ( t ) e M 0 •         (3’)

t =0

Дополнительные фазовые ограничения на траекторию и управление:

A1 j x + ^2 jy + G 11 j u + G 12 j v =

= Qn j x + A 11 j ( ) x (0) + Q 12 j y + A 12 j ( ) y ( - 1) +

+ G 11 j u + G 12 j V e U j ,

4 1 j x + ^2 j y + G 21 j u + G22jV =

= Q 21 j x + A 21 j 0 x (0) + Q 22 j y + A22 j ( * ) y ( - 1) +

+ G 21 j u + G 22 j V e V j  ( j = U) •

Ограничение (4) задается системой линейных операторов, определенных на элементах пространства D n х £пО р х L m х m^ и действующих в пространство L . Множества Uj , Vj G L 1 ( j = 1, k ) - выпуклы, могут быть точечными. По аналогии с ограничениями (3) ограничение (4) можно привести к более удобному виду:

£ll x + 4 2y + Gnu + G12v =

= Qnx + A n0 x (0) Q2 y + A ^o y ( - 1) +

+ Gu + G12v e U ,

_     _      _     _(4’)

Z^ x + £2 2 y + G21u + G22v =

= Q 21 x + A ^Q x (0) + Q 22 y + A 22 ( - ) y ( - 1) +

+ G21u + G22v e V ;

где      4 : Dn ^ Ip ,      4: Cp,

Д1: Dp >Zp , Д2: Г0 p  >. ;  Qu: In>

Q12: Cp >, Q21: Inp >, Q22: Cp >- их главная часть; Gn : Im > L , G12: £™ > L , G21: Im > 4 , G22: m > 4 ; An, A12 -(k х n) -матрица со столбцами из Ik1 , A21, A22 - (k х n) -матрица со столбцами из Zp ;

U g I , V g ^ k 1 - выпуклые множества.

Отметим, что в ограничении (4) пространство правых частей L ^ и k1^ выбрано таким образом исключительно для удобства работы. К операторам, действующим из Lnp , £П в Lp , £к^ легко строить сопряжение.

Ограничение на управление:

u g U с L m , v g V с m™ .        (5)

Здесь U , V - выпуклые множества. Отметим, ограничение (5) является частным случаем ограничения (4).

В теории оптимального управления четверку ( x , y , u, v ) как решение уравнения (2) называют управляемым процессом, и называют допустимым управляемым процессом, если эта четверка удовлетворяет дополнительным ограничениям (3)-(5). Допустимый процесс ( x 0, y 0, u 0, v 0) называется оптимальным, если на нем достигается минимум функционала (1).

  • 2.    Формализация задач линейной оптимизации

Экстремальной задаче (1)-(5) соответствует оператор F : L n х £}р х R n х n х L m х £™ ^ Lnp х Ук х L q х L m , определенный равенством:

f 6 11

Q 12    A 11    A 12

- G 11   ■

- G 12 2

*

6 21

Q 22    A 21   A 22

- G 21   -

- G 22

Ф

©ST

W

-

б"

Q 12    A 11    A 12

G 11

G 12

=

6 21

Q 22    A 21   A 22

G 21

G 22

0

000

I

0

v 0

000

0

I ,

f 6 1

6 21    ф *

Q 11   Q 21

0

0 1

6 1 * 2

6 2*2     © *

Q 12   Q 22

0

0

:  4 1

J*       1—1*

A 21    S

A 11    A 21

0

0

> 1

a 2*2   t*

A*

12      22

0

0

- 6

- G 2',   W ’

G 11    G 21

I

0

*

V G 12

- G 22   - *

G 12   G 22

0

I J

, то уравнением, сопряженным к задаче (1)-(5), является

6 1 2 1

6 1 * 2

4 1

6 2 2 1

6 2 2 2

4 2 2 1

Ф 2

© 2

2 s

6 2 1

6 12

4 1

6 2 * 1

Q 22

A 21

0

0

0

0 1

0

0

f 2

2

2

4 2

4 2 2 2

t *

> 1 * 2

A 22

0

0

4

- G 1 * 1

- G 2 * 1

W *

G 1 2 1

G 21

I

0

-5

2

2 G 12

2 G 22

- 2

r2

G 12

G 22

0

1 J

6

V 2

f

h h3

h 4 h

I h 6 J

F { x , y , x (0), у ( - 1), u , v } =

fa,

Q 12

A 11

A 12

- G 11

G 12

6 21

Q 22

A 21

A 22

G 21

- G 22

Ф

©

s

T

W

-2

6 11

Q 12

A 11

A 12

G 11

G 12

х

6 21

Q 22

A 21

A 22

G 21

G 22

0

0

0

0

I

0

1 0

0

0

0

0

I J

y x (0) У ( - 1)

х

Для того чтобы сформулировать прин- цип максимума в поставленной задаче, оста- лось записать сопряженную краевую задачу. Для этого достаточно построить оператор, сопряженный к оператору F . Так как

  • 3.    Принцип максимума

Здесь для задачи (1)-(5) формулируется принцип максимума.

Теорема. Пусть в сделанных предположениях пара (х0, у0, u0, v0) - оптимальный процесс в задаче (1)-(5). Тогда найдется функционал 2

{ Л 1 , 22Л 49 222 7 } g

L np х ^ П р' х ^к х L^ х £ к^ х L mm х £^ , удовлетворяющий одному из условий:

  • а)    Л - решение неоднородной системы уравнений (6) при { h , h , h , h 4, h 5, h 6, h } = { h 01 , h 02 , h 03 , h 04 , h 05 , h 06 , h 07 } ;

  • б)    Л - нетривиальное решение однородной системы уравнений (6); для которого в точках li ( Х 0 , У 0 , u 0 , v 0) ( i = 1, k ), Z^ x 0 + Д2 y 0 + G 11 u 0 + G 12 v 0 , £21 x 0 + 62 y 0 + G 2i u 0 + G 22 v 0 , и u 0, v 0 выполняются следующие условия:

2i l i( x 0 , У 0 , u 0 , v 0 ) = min 2 i y },       (7)

У е M i

Л 4( ^41 x 0 + ^2 y 0 + G 11 u 0 + G 12 v 0 ) =

= minЛ4(u1) ,(8)

u1 e U

A ( ^1 X0 + 22 y y 0 + G 21 u 0 + G 22 V 0 ) =

= minЛ5(Vi),(9)

v 1e V

Аб(u0) = minАб(u) ,(10)

u e U

Л( V0) = min A( v).

u e V

Если функционал Л является решением неоднородной системы уравнений (6), то условия (7)–(11) являются достаточными условиями оптимальности.

Замечание. Условия принципа максимума (11) в таких задачах совпадает с принципом максимума Понтрягина. Условия (7)– (10) позволяют исследовать задачи с достаточно сложными фазовыми ограничениями.

В задаче (3)–(5) функциональнодифференциальные не обязательно должны быть уравнениями с запаздывающим аргументом. Решение сопряженной системы уравнений ищется в пространствах суммируемых функций. Поэтому снижаются требования на гладкость коэффициентов исходной задачи оптимального управления.

Список литературы Принцип максимума в задачах оптимального управления процессами, описываемыми гибридными функционально-дифференциальными уравнениями

  • Азбелев Н.В., Максимов В.П., Рахматуллина Л.Ф. Элементы современной теории функционально-дифференциальных уравнений. Методы и приложения. М.: Институт компьютерных исследований, 2002. 384 с.
  • Андреева Е.А., Колмановский В.Б., Шайхет Л.Е. Управление системами с последействием. М.: Наука. Гл. ред. физ.-мат. лит., 1992.336 с.
  • Арутюнов А.В., Марданов М.Дж. К теории принципа максимума в задачах с запаздываниями // Дифференциальные уравнения. 1989. Т. 25, № 12. С. 2048-2058.
  • Ахиев С.С. О необходимых условиях оптимальности для систем функциональнодифференциальных уравнений // Докл. АН СССР. 1979. Т. 247. № 1. С. 11-14.
  • Бортаковский А.С. Аналитическое конструирование оптимальных регуляторов в классе логико-динамических (гибридных) систем // Автоматика и телемеханика. 2011. Вып. 12. С. 3-23.
  • Васильев Ф.П. Условия оптимальности для некоторых классов систем, не разрешенных относительно производной // Докл. АН СССР. 1969. Т. 184, № 6. С. 1267-1270.
  • Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971. 508 с.
  • Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. Минск: Наука и техника, 1974. 271 с.
  • Корытов С.Г. К вопросу об оптимальном управлении системами, описываемыми линейными функционально-дифференциальными уравнениями // Краевые задачи: межвуз сб. научн. тр. / Перм. политехн. инт. Пермь, 1986. С. 36-40.
  • Корытов С.Г. Об одной экстремальной задаче // Всесоюзн. школа "Оптимальное управление. Геометрия и анализ": Тез. докл. Кемерово, 29 сентября - 8 октября 1986 г. Кемерово, 1986. С. 26.
  • Корытов С.Г. К теории принципа максимума // Краевые задачи: межвуз сб. научн. тр. / Перм. политехн. ин-т. Пермь, 1987. С. 63-66.
  • Корытов С.Г. О продолжении линейных функционалов с сохранением заданных свойств / Челяб. политехн. ин-т. Челябинск, 1989. 19 с. Деп. в ВИНИТИ 15.11.89, № 6869-89.
  • Максимов В.П. Функционально-дифференциальные непрерывно-дискретные системы // Изв. ИМИ УдГУ. 2012. Вып. 1(39). С. 88-89
  • Матвеев А.С., Якубович В.А. Оптимальные системы управления: обыкновенные дифференциальные уравнения. Специальные задачи: учеб. пособие. СПб.: Изд-во С.-Петербург. ун-та, 2003. 540 с.
  • Пантелеев А.В., Бортаковский А.С. Теория управления в примерах и задачах: учеб. пособие. М.: Высш. шк., 2003. 583 с.
  • Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. 392 с.
Еще