О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

Бесплатный доступ

Рассматриваются вопросы сводимости оптимальной проблемы моментов задачи оптимального управления с функционалами типа нормы в ( ) для многомерных линейных систем к частным проблемам моментов при декомпозиции исходной системы в прямую сумму парциальных подсистем меньшей размерности. Решение рассматриваемых задач находится с помощью принципа максимума Н.Н. Красовского.

Декомпозиция, оптимальное управление, функционал, проблема моментов

Короткий адрес: https://sciup.org/148201639

IDR: 148201639   |   УДК: 517.977.5

On the reducibility of the optimal moments problem to the partial problems in the problems of multivariable linear systems control

The questions of reducibility of the optimal moments problem of the optimal control problem with functionals of the norm type in ( ) for multivariable linear systems to particular moments problems in decomposition of the initial system to the direct sum of partial subsystems of smaller dimension are considered. The decision of considered problems are found using Krasovsky's maximum principle.

Текст научной статьи О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

Решение задач оптимального управления для многомерных динамических систем связано, как правило, с существенными затруднениями. В этих случаях находит применение принцип Сандерса [1], существо которого заключается в том, что многомерная система управления декомпозируется на парциальные подсистемы меньшей размерности так, чтобы решение задач оптимального управления для таких систем не представляло значительных затруднений. Получаемые таким образом частные решения затем принимаются в качестве начального или последующего (в рамках соответствующих итерационных процедур [1]) приближения для решения исходной задачи оптимального управления.

Если многомерная динамическая система является линейной и вполне управляемой, то ее декомпозиция по входам осуществляется с приведением к канонической форме управляемости с двусторонней связью, предложенной Луенберге-ром [2, 3]. Для линейной системы

dx

— = Ax + Bu (!) dt где X Е Rn - вектор переменных состояния, UЕ Rm - вектор управляющих параметров, A Е Rnхn — матрица динамики, B Е Rnхm - матрица входов, каноническая форма управляемости с двусторонней связью имеет вид dz                  m

-=- = F k x k + e nk u k + Z D kj z j , k = 1, m , (2) dt                           j =1

( j * k )

где Z k Е R nk - вектор переменных состояния k

m подсистемы ( Znt = n), enk = col(0>—,0J)ERnk, k=1

Fk =

0 n k -1

Enk -1

Е R n k х n k - матрица Фро

бениуса, в которой E n k -1 - единичная матрица соответствующего порядка, а ^ k = col ( a n k , a n k - 1) - вектор коэффициентов характеристического многочлена, сопровождаемого матрицей F k , а также

D kj =

0 ( n k -1)х n

d T kj

Rnk х n j                        v j – матрицы связей, а

d kj Е R n j - вектор коэффициентов связей; j = 1,2,..., m , d kk =- co1 ( a n k , a n k -1 ) . Если вве-

сти

m вектор-функции f^ = Z Dkjzj k=1

, то парци-

альные системы (2) будут представляться в виде nk -кратных интеграторов. Аналогичная декомпозиция возможна и для нелинейных систем уп-

dx равления ----= f (t, X, u) , если они допуска- dt

ют представление в таком виде:

dx

---= Ax + Bu + CT (t, x, u)     (3) dt где a (t, X, u) - вектор-функция “остаток” от f (t, X, u) после выделения в последней линейной части по x и u ; отметим, что в общем случае матрицы динамики и входов в (3) могут

зависеть от t . Соответствующий подход был рассмотрен в [4] с помощью итерационной процедуры синтеза решения задачи оптимальной переориентации космического аппарата в пространстве и при сведении последней к задачам оптимального управления по отдельным каналам ориентации.

1. ПОСТАНОВКА ЗАДАЧИ

где u ( т ) - оптимальное управление. В (7), (8) l T C = 1 и, h T ( . ) = l T ® ( t f , т ) B = [ Л 1 o ( T )| ^ | Л m 0 ( т )] ,

|| h ( ' ) |л" = L p

f (|| й «) pt k p

V t 0                      V

1 p <^ ,

|| h OHt ) = max || h ( т ) ||v , "      те[ 1 0 , t f ]

В связи с изложенным далее рассматриваются управляемые линейные системы такого вида:

d x

—— = Ax + Bu + f ( t ), dt

|| h ( т )|| у - векторная норма ( V = 1,2, ^ )

1 + 1 = 1

V Ц

Кроме того, предполагается, что для граничных

которые допускаю декомпозицию в прямую сумму парциальных подсистем вида (2):

dxr = Akxk + bkuk + fk(t) , k = 1, m , (5) dt где x = col (x1,...,xm)eRn , u = col (U1,...,um)eRm, матрицы динамики и входов имеют следующее устройство: A = diag {Ak}m, B = diag {bk}m, а пары {Ak, bk} имеют согласованные размеры при включении в состав (4) и являются вполне управляемыми для всех k = 1m, а f = col (ffm)e Rn (fk e Rnk) -’некоторая заданная вектор-функция (здесь и далее предполагается, что здесь f t = f k (t) ), с помощью которой могут моделироваться перекрестные связи как в (2) или (3) между подсистемами (5) системы (4).

Для граничных условий:

x ( t 0) = x 0 ; x ( t f- ) = x f , (6) задача управления (4), (6) на заданном интервале [ t o , t f ] - двухточечная граничная задача, сводящаяся при минимизации функционалов типа нормы в L q [ t 0 , t f ] ( q = 1,2, ^ ) к решению оптимальной проблемы моментов в L p , где

1 1 1

--1— = 1. Моментные равенства здесь имеют pq вид: f f Ф (tf, т) Bu (т) d т = c , где Ф(tf, т) - пе-

J t о         f реходная матрица системы (4), а вектор c вычисляется так: C = xf - Ф( tf, tо) x0 - P Ф( tf,т) f (т) dт.

0

Решение указанной проблемы моментов с помощью принципа максимума Н.Н. Красовского [5, 6] сводится к последовательному решению следующих двух задач:

А 0 ); P 0 = min|| l T Ф ( t, , ) B || L ) = || h 0 < . )|| L ) (7) l T c =1                         p                 p

Б 0) max

| u (<’ = -

L q P 0

f h 0 ( т ) u ( t ) d r = f h 0 ( т ) u ( т ) dr = 1 , (8)

условий (6) выполняется условие || c || V > 0 .

Соответственно, для граничных условий парциальных подсистем (5), задаваемых исходя из условий (6):

xk ( 1 0 ) = x k ; x k ( t f ) = xf f , ( k = 1, m ) (9) можно также рассматривать парциальные задачи оптимального управления для (5), (9) с функционалами типа нормы J k = H uk OH L q и также сформулировать соответствующие проблемы моментов в L p , которые сво дятся к решению следующих пар задач ( k = 1, m ):

A k ) л k = min П ^ T ф k ( t f , •) b k П L p =

5 1 Ck =1

kk

= min H 5 k g k (.)h

5 T Ck =1 kk

| L p = || g k 0 ( )|| L p ;

tf

Б k )      max 1 f g k 0 ( т ) uk ( т ) d т =

|| u k ('^ L q = n k 1 0

tf

= f g k 0 ( т ) u k ( т ) d т = 1 ,        (11)

t 0

где uk (т) - оптимальное управление, Фk (tf, т) -переходные матрицы для парциальных подсистем (5), а векторы ck вычисляются по форму- лам: Ck = xkf - 0k (tf, t0) xk - P 0k (tf,т) fk (т) dт ,

J t 0

|| C k | | V 0 ; если же C k = 0 , то управление k -й системой (5) не требуется, то есть ик ( т ) = 0 Vт e [ 1 0 , t f ] , поскольку в этом случае граничные условия (9) удовлетворяются автоматически. Отметим также, что g k 0 ( т ) = 5 T0 g k ( т ) , 5 k T0 C k = 1 , и по определению системы (4) и ее парциальных подсистем (5):

Ф ( t f , т ) B = diag { 0 k ( t f , т ) b k } m = diag { g k ( т )} m .

2. РЕШЕНИЯ ЗАДАЧ ПО СВЕДЕНИЮ ОПТИМАЛЬНОЙ ПРОБЛЕМЫ МОМЕНТОВ В L p К ПАРЦИАЛЬНЫМ ПРОБЛЕМАМ МОМЕНТОВ

решение задачи на минимум (10), где ^ к 0 = р k G kk с к ,

В настоящей статье рассматривается решение задач сведения проблемы моментов А0 ), Б д ) (7), (8) к пар циал ьным проблемам моментов А к ), Б к ), к = 1, m , (10), (11) и построению на их основе решения задачи оптимального управления для (4), (6). В общем случае имеется девять вариантов постановок таких задач с учетом того, что p = 1,2, то и v = 1,2, то . Очевидно, что не все из возможных вариантов постановок задач являются равноценными в аспекте решения прикладных задач. Тем не менее, далее представлены результаты по всем возможным вариантам, в том числе для случаев, когда оптимальная проблема моментов А 0 ), Б0) (7), (8) не сводится к парциальным А k ), Б k ) (10), (11), но получаемые при этом результаты не исключают построения на их основе вполне эффективных итерационных процедур для решения задачи оптимального управления рассматриваемого класса для систем вида (4), (5). Итак, далее в следующем порядке: p = 2,1, то , рассмотрим решения задач по сведению оптимальной проблемы моментов в L p к парциальным, отвечающим задачам оптимального управления для (5), (9), и возможности построения на основе их решений для задачи (7), (8).

Вариант L 2 ( p = 2 ). Вначале рассмотрим решения задач (7), (8) и (10), (11) в случае p, v = 2 . Для этого введем n представление l = col ( l ,..., l m ) , где l n k G К. , и с учетом структуры переходной матрицы для системы (4) задачу (7) перепишем в виде

tf

Gkk = J 8к(т)gT(т)dт ,    рк =(cTGkk1 ск Г1   и t0

^T Ск = 1. При этом также получим л к = Рк и u<т> = 7Т ^кТ0§к(т) = CTG§к(т), Vtg [t0,tf]. (12) рк                                     J

Сравнивая решения задач Б 0 ) и Б к ) ус тано вим, что hk 0 ( т ) = а кдк 0 ( 0 , 1 к 0 = а к £ к 0 , к = 1, m .

mm  m

Поскольку Z l T0 С к = Z a к ^ м с к = Z a к = 1 , то к =1            к =1                к =1

m

P 0 = Z' к =1

2_2

,а к Л к . Задача р 0

m

2_2

а к Л к имеет

m

Z а к =1 к -1

к = 1

m

-2    _-2

решение: а к = Л к Z Л j , к = 1, m , а также j=1

m

P0 = Z

Л к

V к =1     7

В конечном счете, имеет место:

P 0 = min ||[ l 1T g 1( - )| - I l m g m С)]^ = m

Z l k c = 1

к = 1

= !![ 1 T g 1 ( - )! - | l I c g m OlH^ .

Следовательно, р 0

t f m

= J Z h k 20( T ) d т а из (8)

1 0 k =1

получим:

t fm

JZ h k 0 ( t ) u к ( т ) d т = 1 ;

1 0 k =

t fm

J Z йк ( т ) d 7:.

,, к =1                Po

й к ( т ) = и к ( т ) , к = 1, m , Vte [ t 0 , t f ] , то есть решение задачи оптимального управления для системы (4) или, что то же самое, для решения задач А 0 ) и Б 0 ) в L 2 вполне достаточно решить задачи меньшей размерности А k ) и Б k ) (также в L 2 ) для подсистем (5), оптимальное управление для которых (12) также будет оптимальным управлением и для системы (4).

Задачи управления для случаев v = 1, ^ (при p = q = 2 ), по-видимому, не представляют особой ценности для решения прикладных задач и, с другой стороны, в общем случае они могут быть решены, как правило, только с помощью численных методов. В связи с этим следует отметить важное значение решение такого класса прикладных задач оптимального управления (1), (3), сводящихся к оптимальной проблеме моментов в L j с функционалами типа нормы !! U ( - )!!,-

L то ( Ц = 1,2, то ).

Вариант L 1 ( p = 1 ) . Тогда задачу (7) следует переписать так:

tf

P 0 =

Из (10) следует, что Л к

а в усло- t0

min

m

Z l T с = 1

к = 1

!![ 1 1T g 1 ( - )!-! l , T g m ( - >]Il L '1 > =

вии максимума (11) имеет место:

= !![ l T0 g 1 ( - )! - ! l ,T« g m ( - )]II , I , 1 , .

t f                      1

J[ и к ( т )] 2 d Т = — . Здесь д к 0 ( т ) = ^ T g k СО - t ,                    Л к

Здесь

P 0

t f

=J

t 0

m

Z! Кк 0( т )r к=1

1 V

d т , а из (8)

tf m следует j E hk0 (т)йk (т)dТ = 1 при условии, что

1 0 k =1

max || ( т )|| „=— . Последнее означает, что здесь

1E[ t о, tf ]

оптимальные управления ограничены по норме, а именно: при ц = 2 ограничения будут накладываться на модуль вектора управлений, то есть m1

max E u2k ( т ) <— ; при ц = ^ - на каждую ком-

Т t о, tf] к=1

поненту вектора управлений в отдельности, то есть здесь max | uk (т) | <   , Vк = 1, m . Если же t о, tf ]

ц = 1, то ограничивается суммарная “скорость”’ m1

расходов управления: max E i u k ( T )| <_.

TE [to’tf] k=1

Вначале рассмотрим случай ц = 2 . Тогда

в

t f m

(7), (8): P o = j E h k 2o ( T )

t к = 1 t o L-

2 d т ,

m max E uk (т)

ТЕ [ t o , t f ] k = 1

, P o

Из условия максимума в (8)

m

E a k л k = P o . Здесь имеет место: Л k = P o , k =1

k = 1, m , и, стало быть, оптимальные управления (14) будут оптимальными и для задачи (4), (6) с функционалом || U ( )|| L ) .

t f

Если ц = 1 , то в (7), (8) P o = j max | Z^g k (т) | dT

1-k < m to m1

и max E | u k ( t) | - —. Из условия максимума

ТЕ [to,tf] k=1

(8) здесь имеет место:

tf m                        m1

maxjE|zkogk(т)|^k(t)|dT=1; E|uk(t)|et, uk (•) , k_!                                        k=!

t o k =1

что эквивалентно простейшей задаче оптимального распределения заданного ресурса [7] для каждого момента времени ТЕ [ t o , t f ] . Решение этой задачи в силу линейности ее целевой функции является очевидным.

Вводя функцию ko (t) = arg max 11Togk (t) |, 1-k < m получим в рассматриваемом случае следующую программу оптимального управления

( V k = 1, m ):

u ( T )

1     h o( T )

P o H h o ( t )|| 2

или u k (t) =

1     h k o( T )

P o  H h o ( t )|| 2

k = 1, m , Vte [ t o , t f ] .

Соответственно, в задаче (10)

t f 1

Л k = fl gk o(T)| dT и | Uk (t)| < —, t                             " k to а из условия максимума (11) получим uk(Т) = — signgko(t), Vte[to,tf]. лk

Из сравнения (13) и (14) видно, что u k ( т ) не является оптимальным управлением для задачи (4), (6). Степень неоптимальности управлений (14) в сравнении с (13) можно оценить, если подставить u k ( т ) в (5) вместо U ( т ) . Если она мала, то u k ( т ) можно использовать как начальное приближение для решения задачи (4), (6) с функционалом J = || U ( )||^ .

В случае Ц = 00 из (7), (8) получим

U i k ( Т ) = — sign h k o ( т ) , V k = 1, m , а из (10), (11) P o                          m

- (14). При этом lko = akCko, где E ak = 1, и k=1

~ A   rEign lk о g k ( Т )

Uk (Т) = ^Po      ko o,

k = k o ( T );

, Vte [ t o , t f ] . k ^ W,

Из сравнения этой программы с (14) видно, что здесь, как и в случае ц = 2 , управление (14) не является оптимальным для двухточечной граничной задачи (4), (6) с функционалом J = || u ( )||™ . -•-'co

Вариант L ^ ( p = ^ ). Предваряя рассмотрения еще одного решения задачи сведения оптимальной проблемы моментов к парциальным, отметим, что выше установлено: решения задач (10), (11) доставляют решение и для задачи (7), (8) только в случаях p, v = 2 ( q,Ц= 2 ) и p ,v = 1 ( q , ц=^ ). В иных рассмотренных вариантах постановок задач (7), (8), когда v ^ p , получаемые решения для парциальных задач (10), (11) можно рассматривать только как соответствующие приближения. То же самое справедливо в общем случае и для варианта p = ^ , в котором при v = ^ решение задачи (10) будет иметь вид:

л k

= mm

< i c = 1 L

max | ^ T g k ( t )| te [ t o , t f ]

= | C To g k ( T ,k )|, 1 ik r k <~

где m k ( t ) = C iTo g k ( t ) — функция, наименее уклоняющаяся от нуля [8], а Т ik Е [ t o , t f ] - точки

максимума = ( т ) | . Здесь из условия максимума

(11) при

f              1

J |ик (т)| dт = — ,                Л к имеет место:

tf j юк (т)u= (т)dт = 1. Таким образом, отсюда сле- дует, что здесь оптимальное управление будет 5 -импульсным, а именно:

u k ( т )

0,

А i k 5 ( т"т i k )’

v^ [ t о , t f 1\ I k ;

т = т i k e I k ,    (15)

где It = {т, }. ;—, и, соответственно, полный k 1 ik ’Ч =1,rk rk                 1

импульс управления будет равен V | Аi | = —, ______               i k =1 k л k а значения А- , Ц = 1,Г, , отыскиваются с уче-ik kk том граничных условий (9).

Если теперь в (7) принять I T с = = tt k , где

m

V ttk = 1, и lk = аk£k0 ( k = 1,m ), то в силу k = 1

свойств функций ю= (т) тогда выполняются сле дующие условия: Ро = «1Л 1 = ■■■ = tt m Л m . Отсю да получаем tt k =-Р0- , k = 1m , то есть Ро -л k среднее гармоническое {лk }k=fm • Соответственно, оптимальное управление (15) для подсистем (5) является таковым и для системы (4).

ЗАКЛЮЧЕНИЕ

Основной результат в настоящей статье заключается в следующем: проблема моментов (7),

(8) в Lp , p = 1,2,^, для задачи оптимального управления (4), (6) в общем случае сводится к решению проблем моментов для парциальных подсистем (5), (6) только тогда, когда имеет место V = p для показателя векторной нормы ||(-)||v . Если V ^ p, то решения парциальных задач оптимального управления (5), (9) с соответствующими функционалами типа нормы в т / 1 1 , X

L q ( — + — = 1 ) не доставляют решения задачи pq

(4), (6), хотя в том случае, когда степень их нео-птимальности является вполне допустимой, они могут быть приняты не только как соответствующее приближение в процедуре реализации принципа Сандерса, но и в качестве приближенно оптимального управления для исходной многомерной системы (4), (6).

Список литературы О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

  • Цурков В.И. Динамические задачи большой размерности. М.: Наука, 1988. 288 с.
  • Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985. 296 с.
  • Luenberger, D.G. Canonical Form for Multivariable System/D.G. Luenberger//IEEE Trans. On Automatic Control. 1967. AC-12. P. 290-293.
  • Горелов Ю.Н., Данилов С.Б., Тропкина Е.А. Об одном подходе к приближенному решению задачи оптимального управления переориентацией космического аппарата//Обозрение прикл. и промышл. мат. 2011. Т.18, В.3. С.429-431.
  • Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.
  • Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.
  • Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 460 с.
  • Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи (Идеи и проблемы П.Л. Чебышева и А.А. Маркова и их дальнейшее развитие). М.: Наука, 1973. 552 с.