О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

Бесплатный доступ

Рассматриваются вопросы сводимости оптимальной проблемы моментов задачи оптимального управления с функционалами типа нормы в ( ) для многомерных линейных систем к частным проблемам моментов при декомпозиции исходной системы в прямую сумму парциальных подсистем меньшей размерности. Решение рассматриваемых задач находится с помощью принципа максимума Н.Н. Красовского.

Декомпозиция, оптимальное управление, функционал, проблема моментов

Короткий адрес: https://sciup.org/148201639

IDR: 148201639

Текст научной статьи О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

Решение задач оптимального управления для многомерных динамических систем связано, как правило, с существенными затруднениями. В этих случаях находит применение принцип Сандерса [1], существо которого заключается в том, что многомерная система управления декомпозируется на парциальные подсистемы меньшей размерности так, чтобы решение задач оптимального управления для таких систем не представляло значительных затруднений. Получаемые таким образом частные решения затем принимаются в качестве начального или последующего (в рамках соответствующих итерационных процедур [1]) приближения для решения исходной задачи оптимального управления.

Если многомерная динамическая система является линейной и вполне управляемой, то ее декомпозиция по входам осуществляется с приведением к канонической форме управляемости с двусторонней связью, предложенной Луенберге-ром [2, 3]. Для линейной системы

dx

— = Ax + Bu (!) dt где X Е Rn - вектор переменных состояния, UЕ Rm - вектор управляющих параметров, A Е Rnхn — матрица динамики, B Е Rnхm - матрица входов, каноническая форма управляемости с двусторонней связью имеет вид dz                  m

-=- = F k x k + e nk u k + Z D kj z j , k = 1, m , (2) dt                           j =1

( j * k )

где Z k Е R nk - вектор переменных состояния k

m подсистемы ( Znt = n), enk = col(0>—,0J)ERnk, k=1

Fk =

0 n k -1

Enk -1

Е R n k х n k - матрица Фро

бениуса, в которой E n k -1 - единичная матрица соответствующего порядка, а ^ k = col ( a n k , a n k - 1) - вектор коэффициентов характеристического многочлена, сопровождаемого матрицей F k , а также

D kj =

0 ( n k -1)х n

d T kj

Rnk х n j                        v j – матрицы связей, а

d kj Е R n j - вектор коэффициентов связей; j = 1,2,..., m , d kk =- co1 ( a n k , a n k -1 ) . Если вве-

сти

m вектор-функции f^ = Z Dkjzj k=1

, то парци-

альные системы (2) будут представляться в виде nk -кратных интеграторов. Аналогичная декомпозиция возможна и для нелинейных систем уп-

dx равления ----= f (t, X, u) , если они допуска- dt

ют представление в таком виде:

dx

---= Ax + Bu + CT (t, x, u)     (3) dt где a (t, X, u) - вектор-функция “остаток” от f (t, X, u) после выделения в последней линейной части по x и u ; отметим, что в общем случае матрицы динамики и входов в (3) могут

зависеть от t . Соответствующий подход был рассмотрен в [4] с помощью итерационной процедуры синтеза решения задачи оптимальной переориентации космического аппарата в пространстве и при сведении последней к задачам оптимального управления по отдельным каналам ориентации.

1. ПОСТАНОВКА ЗАДАЧИ

где u ( т ) - оптимальное управление. В (7), (8) l T C = 1 и, h T ( . ) = l T ® ( t f , т ) B = [ Л 1 o ( T )| ^ | Л m 0 ( т )] ,

|| h ( ' ) |л" = L p

f (|| й «) pt k p

V t 0                      V

1 p <^ ,

|| h OHt ) = max || h ( т ) ||v , "      те[ 1 0 , t f ]

В связи с изложенным далее рассматриваются управляемые линейные системы такого вида:

d x

—— = Ax + Bu + f ( t ), dt

|| h ( т )|| у - векторная норма ( V = 1,2, ^ )

1 + 1 = 1

V Ц

Кроме того, предполагается, что для граничных

которые допускаю декомпозицию в прямую сумму парциальных подсистем вида (2):

dxr = Akxk + bkuk + fk(t) , k = 1, m , (5) dt где x = col (x1,...,xm)eRn , u = col (U1,...,um)eRm, матрицы динамики и входов имеют следующее устройство: A = diag {Ak}m, B = diag {bk}m, а пары {Ak, bk} имеют согласованные размеры при включении в состав (4) и являются вполне управляемыми для всех k = 1m, а f = col (ffm)e Rn (fk e Rnk) -’некоторая заданная вектор-функция (здесь и далее предполагается, что здесь f t = f k (t) ), с помощью которой могут моделироваться перекрестные связи как в (2) или (3) между подсистемами (5) системы (4).

Для граничных условий:

x ( t 0) = x 0 ; x ( t f- ) = x f , (6) задача управления (4), (6) на заданном интервале [ t o , t f ] - двухточечная граничная задача, сводящаяся при минимизации функционалов типа нормы в L q [ t 0 , t f ] ( q = 1,2, ^ ) к решению оптимальной проблемы моментов в L p , где

1 1 1

--1— = 1. Моментные равенства здесь имеют pq вид: f f Ф (tf, т) Bu (т) d т = c , где Ф(tf, т) - пе-

J t о         f реходная матрица системы (4), а вектор c вычисляется так: C = xf - Ф( tf, tо) x0 - P Ф( tf,т) f (т) dт.

0

Решение указанной проблемы моментов с помощью принципа максимума Н.Н. Красовского [5, 6] сводится к последовательному решению следующих двух задач:

А 0 ); P 0 = min|| l T Ф ( t, , ) B || L ) = || h 0 < . )|| L ) (7) l T c =1                         p                 p

Б 0) max

| u (<’ = -

L q P 0

f h 0 ( т ) u ( t ) d r = f h 0 ( т ) u ( т ) dr = 1 , (8)

условий (6) выполняется условие || c || V > 0 .

Соответственно, для граничных условий парциальных подсистем (5), задаваемых исходя из условий (6):

xk ( 1 0 ) = x k ; x k ( t f ) = xf f , ( k = 1, m ) (9) можно также рассматривать парциальные задачи оптимального управления для (5), (9) с функционалами типа нормы J k = H uk OH L q и также сформулировать соответствующие проблемы моментов в L p , которые сво дятся к решению следующих пар задач ( k = 1, m ):

A k ) л k = min П ^ T ф k ( t f , •) b k П L p =

5 1 Ck =1

kk

= min H 5 k g k (.)h

5 T Ck =1 kk

| L p = || g k 0 ( )|| L p ;

tf

Б k )      max 1 f g k 0 ( т ) uk ( т ) d т =

|| u k ('^ L q = n k 1 0

tf

= f g k 0 ( т ) u k ( т ) d т = 1 ,        (11)

t 0

где uk (т) - оптимальное управление, Фk (tf, т) -переходные матрицы для парциальных подсистем (5), а векторы ck вычисляются по форму- лам: Ck = xkf - 0k (tf, t0) xk - P 0k (tf,т) fk (т) dт ,

J t 0

|| C k | | V 0 ; если же C k = 0 , то управление k -й системой (5) не требуется, то есть ик ( т ) = 0 Vт e [ 1 0 , t f ] , поскольку в этом случае граничные условия (9) удовлетворяются автоматически. Отметим также, что g k 0 ( т ) = 5 T0 g k ( т ) , 5 k T0 C k = 1 , и по определению системы (4) и ее парциальных подсистем (5):

Ф ( t f , т ) B = diag { 0 k ( t f , т ) b k } m = diag { g k ( т )} m .

2. РЕШЕНИЯ ЗАДАЧ ПО СВЕДЕНИЮ ОПТИМАЛЬНОЙ ПРОБЛЕМЫ МОМЕНТОВ В L p К ПАРЦИАЛЬНЫМ ПРОБЛЕМАМ МОМЕНТОВ

решение задачи на минимум (10), где ^ к 0 = р k G kk с к ,

В настоящей статье рассматривается решение задач сведения проблемы моментов А0 ), Б д ) (7), (8) к пар циал ьным проблемам моментов А к ), Б к ), к = 1, m , (10), (11) и построению на их основе решения задачи оптимального управления для (4), (6). В общем случае имеется девять вариантов постановок таких задач с учетом того, что p = 1,2, то и v = 1,2, то . Очевидно, что не все из возможных вариантов постановок задач являются равноценными в аспекте решения прикладных задач. Тем не менее, далее представлены результаты по всем возможным вариантам, в том числе для случаев, когда оптимальная проблема моментов А 0 ), Б0) (7), (8) не сводится к парциальным А k ), Б k ) (10), (11), но получаемые при этом результаты не исключают построения на их основе вполне эффективных итерационных процедур для решения задачи оптимального управления рассматриваемого класса для систем вида (4), (5). Итак, далее в следующем порядке: p = 2,1, то , рассмотрим решения задач по сведению оптимальной проблемы моментов в L p к парциальным, отвечающим задачам оптимального управления для (5), (9), и возможности построения на основе их решений для задачи (7), (8).

Вариант L 2 ( p = 2 ). Вначале рассмотрим решения задач (7), (8) и (10), (11) в случае p, v = 2 . Для этого введем n представление l = col ( l ,..., l m ) , где l n k G К. , и с учетом структуры переходной матрицы для системы (4) задачу (7) перепишем в виде

tf

Gkk = J 8к(т)gT(т)dт ,    рк =(cTGkk1 ск Г1   и t0

^T Ск = 1. При этом также получим л к = Рк и u<т> = 7Т ^кТ0§к(т) = CTG§к(т), Vtg [t0,tf]. (12) рк                                     J

Сравнивая решения задач Б 0 ) и Б к ) ус тано вим, что hk 0 ( т ) = а кдк 0 ( 0 , 1 к 0 = а к £ к 0 , к = 1, m .

mm  m

Поскольку Z l T0 С к = Z a к ^ м с к = Z a к = 1 , то к =1            к =1                к =1

m

P 0 = Z' к =1

2_2

,а к Л к . Задача р 0

m

2_2

а к Л к имеет

m

Z а к =1 к -1

к = 1

m

-2    _-2

решение: а к = Л к Z Л j , к = 1, m , а также j=1

m

P0 = Z

Л к

V к =1     7

В конечном счете, имеет место:

P 0 = min ||[ l 1T g 1( - )| - I l m g m С)]^ = m

Z l k c = 1

к = 1

= !![ 1 T g 1 ( - )! - | l I c g m OlH^ .

Следовательно, р 0

t f m

= J Z h k 20( T ) d т а из (8)

1 0 k =1

получим:

t fm

JZ h k 0 ( t ) u к ( т ) d т = 1 ;

1 0 k =

t fm

J Z йк ( т ) d 7:.

,, к =1                Po

й к ( т ) = и к ( т ) , к = 1, m , Vte [ t 0 , t f ] , то есть решение задачи оптимального управления для системы (4) или, что то же самое, для решения задач А 0 ) и Б 0 ) в L 2 вполне достаточно решить задачи меньшей размерности А k ) и Б k ) (также в L 2 ) для подсистем (5), оптимальное управление для которых (12) также будет оптимальным управлением и для системы (4).

Задачи управления для случаев v = 1, ^ (при p = q = 2 ), по-видимому, не представляют особой ценности для решения прикладных задач и, с другой стороны, в общем случае они могут быть решены, как правило, только с помощью численных методов. В связи с этим следует отметить важное значение решение такого класса прикладных задач оптимального управления (1), (3), сводящихся к оптимальной проблеме моментов в L j с функционалами типа нормы !! U ( - )!!,-

L то ( Ц = 1,2, то ).

Вариант L 1 ( p = 1 ) . Тогда задачу (7) следует переписать так:

tf

P 0 =

Из (10) следует, что Л к

а в усло- t0

min

m

Z l T с = 1

к = 1

!![ 1 1T g 1 ( - )!-! l , T g m ( - >]Il L '1 > =

вии максимума (11) имеет место:

= !![ l T0 g 1 ( - )! - ! l ,T« g m ( - )]II , I , 1 , .

t f                      1

J[ и к ( т )] 2 d Т = — . Здесь д к 0 ( т ) = ^ T g k СО - t ,                    Л к

Здесь

P 0

t f

=J

t 0

m

Z! Кк 0( т )r к=1

1 V

d т , а из (8)

tf m следует j E hk0 (т)йk (т)dТ = 1 при условии, что

1 0 k =1

max || ( т )|| „=— . Последнее означает, что здесь

1E[ t о, tf ]

оптимальные управления ограничены по норме, а именно: при ц = 2 ограничения будут накладываться на модуль вектора управлений, то есть m1

max E u2k ( т ) <— ; при ц = ^ - на каждую ком-

Т t о, tf] к=1

поненту вектора управлений в отдельности, то есть здесь max | uk (т) | <   , Vк = 1, m . Если же t о, tf ]

ц = 1, то ограничивается суммарная “скорость”’ m1

расходов управления: max E i u k ( T )| <_.

TE [to’tf] k=1

Вначале рассмотрим случай ц = 2 . Тогда

в

t f m

(7), (8): P o = j E h k 2o ( T )

t к = 1 t o L-

2 d т ,

m max E uk (т)

ТЕ [ t o , t f ] k = 1

, P o

Из условия максимума в (8)

m

E a k л k = P o . Здесь имеет место: Л k = P o , k =1

k = 1, m , и, стало быть, оптимальные управления (14) будут оптимальными и для задачи (4), (6) с функционалом || U ( )|| L ) .

t f

Если ц = 1 , то в (7), (8) P o = j max | Z^g k (т) | dT

1-k < m to m1

и max E | u k ( t) | - —. Из условия максимума

ТЕ [to,tf] k=1

(8) здесь имеет место:

tf m                        m1

maxjE|zkogk(т)|^k(t)|dT=1; E|uk(t)|et, uk (•) , k_!                                        k=!

t o k =1

что эквивалентно простейшей задаче оптимального распределения заданного ресурса [7] для каждого момента времени ТЕ [ t o , t f ] . Решение этой задачи в силу линейности ее целевой функции является очевидным.

Вводя функцию ko (t) = arg max 11Togk (t) |, 1-k < m получим в рассматриваемом случае следующую программу оптимального управления

( V k = 1, m ):

u ( T )

1     h o( T )

P o H h o ( t )|| 2

или u k (t) =

1     h k o( T )

P o  H h o ( t )|| 2

k = 1, m , Vte [ t o , t f ] .

Соответственно, в задаче (10)

t f 1

Л k = fl gk o(T)| dT и | Uk (t)| < —, t                             " k to а из условия максимума (11) получим uk(Т) = — signgko(t), Vte[to,tf]. лk

Из сравнения (13) и (14) видно, что u k ( т ) не является оптимальным управлением для задачи (4), (6). Степень неоптимальности управлений (14) в сравнении с (13) можно оценить, если подставить u k ( т ) в (5) вместо U ( т ) . Если она мала, то u k ( т ) можно использовать как начальное приближение для решения задачи (4), (6) с функционалом J = || U ( )||^ .

В случае Ц = 00 из (7), (8) получим

U i k ( Т ) = — sign h k o ( т ) , V k = 1, m , а из (10), (11) P o                          m

- (14). При этом lko = akCko, где E ak = 1, и k=1

~ A   rEign lk о g k ( Т )

Uk (Т) = ^Po      ko o,

k = k o ( T );

, Vte [ t o , t f ] . k ^ W,

Из сравнения этой программы с (14) видно, что здесь, как и в случае ц = 2 , управление (14) не является оптимальным для двухточечной граничной задачи (4), (6) с функционалом J = || u ( )||™ . -•-'co

Вариант L ^ ( p = ^ ). Предваряя рассмотрения еще одного решения задачи сведения оптимальной проблемы моментов к парциальным, отметим, что выше установлено: решения задач (10), (11) доставляют решение и для задачи (7), (8) только в случаях p, v = 2 ( q,Ц= 2 ) и p ,v = 1 ( q , ц=^ ). В иных рассмотренных вариантах постановок задач (7), (8), когда v ^ p , получаемые решения для парциальных задач (10), (11) можно рассматривать только как соответствующие приближения. То же самое справедливо в общем случае и для варианта p = ^ , в котором при v = ^ решение задачи (10) будет иметь вид:

л k

= mm

< i c = 1 L

max | ^ T g k ( t )| te [ t o , t f ]

= | C To g k ( T ,k )|, 1 ik r k <~

где m k ( t ) = C iTo g k ( t ) — функция, наименее уклоняющаяся от нуля [8], а Т ik Е [ t o , t f ] - точки

максимума = ( т ) | . Здесь из условия максимума

(11) при

f              1

J |ик (т)| dт = — ,                Л к имеет место:

tf j юк (т)u= (т)dт = 1. Таким образом, отсюда сле- дует, что здесь оптимальное управление будет 5 -импульсным, а именно:

u k ( т )

0,

А i k 5 ( т"т i k )’

v^ [ t о , t f 1\ I k ;

т = т i k e I k ,    (15)

где It = {т, }. ;—, и, соответственно, полный k 1 ik ’Ч =1,rk rk                 1

импульс управления будет равен V | Аi | = —, ______               i k =1 k л k а значения А- , Ц = 1,Г, , отыскиваются с уче-ik kk том граничных условий (9).

Если теперь в (7) принять I T с = = tt k , где

m

V ttk = 1, и lk = аk£k0 ( k = 1,m ), то в силу k = 1

свойств функций ю= (т) тогда выполняются сле дующие условия: Ро = «1Л 1 = ■■■ = tt m Л m . Отсю да получаем tt k =-Р0- , k = 1m , то есть Ро -л k среднее гармоническое {лk }k=fm • Соответственно, оптимальное управление (15) для подсистем (5) является таковым и для системы (4).

ЗАКЛЮЧЕНИЕ

Основной результат в настоящей статье заключается в следующем: проблема моментов (7),

(8) в Lp , p = 1,2,^, для задачи оптимального управления (4), (6) в общем случае сводится к решению проблем моментов для парциальных подсистем (5), (6) только тогда, когда имеет место V = p для показателя векторной нормы ||(-)||v . Если V ^ p, то решения парциальных задач оптимального управления (5), (9) с соответствующими функционалами типа нормы в т / 1 1 , X

L q ( — + — = 1 ) не доставляют решения задачи pq

(4), (6), хотя в том случае, когда степень их нео-птимальности является вполне допустимой, они могут быть приняты не только как соответствующее приближение в процедуре реализации принципа Сандерса, но и в качестве приближенно оптимального управления для исходной многомерной системы (4), (6).

Список литературы О сводимости оптимальной проблемы моментов к парциальным в задачах управления многомерными линейными системами

  • Цурков В.И. Динамические задачи большой размерности. М.: Наука, 1988. 288 с.
  • Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985. 296 с.
  • Luenberger, D.G. Canonical Form for Multivariable System/D.G. Luenberger//IEEE Trans. On Automatic Control. 1967. AC-12. P. 290-293.
  • Горелов Ю.Н., Данилов С.Б., Тропкина Е.А. Об одном подходе к приближенному решению задачи оптимального управления переориентацией космического аппарата//Обозрение прикл. и промышл. мат. 2011. Т.18, В.3. С.429-431.
  • Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.
  • Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.
  • Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 460 с.
  • Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи (Идеи и проблемы П.Л. Чебышева и А.А. Маркова и их дальнейшее развитие). М.: Наука, 1973. 552 с.
Статья научная