Синтез оптимальных управлений парциальными вращениями космического аппарата методом моментов
Автор: Горелов Юрий Николаевич, Морозова Марина Валериевна
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Механика и машиностроение
Статья в выпуске: 6-1 т.14, 2012 года.
Бесплатный доступ
Рассматриваются задачи оптимального управления тройным интегратором, с помощью которого моделируется угловое движение космического аппарата по одному из каналов управления его ориентацией с учетом перекрестных связей между ними. Задачи сводятся к оптимальной проблеме моментов и их решение на минимум функционалов типа нормы в пространстве (для ) находится с помощью принципа максимума Н.Н. Красовского. Получены программы оптимального управления для задач на минимум обобщенной энергии управления, на минимум максимального уровня управляющих воздействий и, соответственно, на минимум расходов управления или, что то же самое, на минимум полного импульса управляющих воздействий.
Тройной интегратор, оптимальное управление, функционал, проблема моментов
Короткий адрес: https://sciup.org/148201637
IDR: 148201637
Текст научной статьи Синтез оптимальных управлений парциальными вращениями космического аппарата методом моментов
Синтез программ оптимального управления пространственным угловым движением космического аппарата (КА) во многом связан с эффективностью решения задач управления его парциальными вращениями по отдельным каналам ориентации, то есть вращениями вокруг осей его связанной системы координат [1]. В этом случае угловое движение КА описывается с помощью простейших моделей в виде двойного или тройного интегратора в зависимости от типа исполнительных органов системы управления ориентацией КА, конечно, с учетом имеющихся как перекрестных связей между каналами управления ориентацией, так и иных возмущающих воздействий. Тройной интегратор, как модель объекта управления, обычно требуется применять в тех случаях, когда исполнительные органы системы управления ориентацией КА являются электромеханическими [2].
Итак, движение по одному из каналов управления ориентацией КА или, что то же самое, его вращение вокруг одной из осей связанной системы координат описывается следующей системой уравнений:
d У ( t ) d Ю ( t )
между каналами управления, 1 0 - начальный и t f – конечный моменты времени для маневра переориентации КА, который в общем случае определяется граничными условиями:
У ( 1 0 ) = У 0 ; Ю( 1 0 ) = Ю 0 ;
у ( t f ) = у f ; Ю ( t f ) = Ю f , (0.2)
где У о , Ю о , У f и Ю f - некоторые заданные константы. Последние таковы, что отвечающий им маневр управления переориентацией КА нетривиален. Например, если У 0 = 0 , 0 <У f <Л , Ю 0 = Ю f = 0 , то такой маневр связан с поворотом КА на заданный угол У f вокруг соответствующей связанной оси.
Угловое ускорение Б ( t ) в (0.1) представлено суммой относительного управляющего момента m ( t ) и каких-либо возмущающих воздействий f ( t ) , а именно:
е ( t ) = m ( t ) + f ( t ) , V t e [ 1 0 , t f ] , (0.3) где m ( t ) может удовлетворять ограничению: | m ( t ) | < m * < ^ . Система (0.1) - (0.3) описывает угловое движение КА и соответствующего маневра переориентации в виде модели двойного интегратора. Если управляющие моменты в (0.3) создаются с помощью электромеханических исполнительных органов, для которых функция m ( t ) является непрерывной, то для управляющего момента можно ввести следующую модель:
dm ( t ) z x
----— = u (t), (0.4) dt где u (t) - управляющий параметр (скорость изменения управляющего ускорения), который в общем случае может быть ограничен максимально допустимыми значениями. Присоединяя (0.4) к системе (0.1) и учитывая (0.3), получим модель тройного интегратора, описывающего вращение КА по одному из каналов управления его ориентацией. Очевидно, что в дополнение к (0.2), задающих маневр переориентации КА, следует также указать соответствующие граничные условия и для (0.4):
m ( 1 о ) = m о ; m ( t f ) = m f , (0.5) где m о , m / - некоторые константы, в общем случае отличные от нуля.
В соответствии с приведенным описанием вращений КА (0.1), (0.3), (0.4) и маневра его переориентации, задаваемого граничными условиями (0.2), (0.5), введем модель такого управляемого объекта в виде тройного интегратора:
dx 1 ( t ) dx 2 ( t )
, = X 2( t) ; a = X 3( t) + f(t); tt d x3(t)
—7— = u ( t ) , (0.6)
где X i ( t ) , X 2 ( t ) , X з ( t ) - фазовые переменные, отвечающие кинематическим характеристикам углового движения КА, f ( t ) - некоторая функция времени, а и ( t ) - управляющий параметр, который может удовлетворять ограничению:
| и ( t )| < и о , V t е [ t о , t f ] , (0.7)
где и о - его максимально допустимое значение.
Граничные условия для системы (0.6) перепишем с учетом (0.2) и (0.5):
X i ( t о ) = X 1о ; X 2 ( t о ) = X 2о ; X з ( t о ) = X зо ;(0.8)
X 1 ( t f ) = x 1 f ; x 2 ( t f ) = X 2 f ; X 3 ( t f ) = X 3 f ,(0.9)
где X ю, X 2о , X зо , X i f , X 2 f и X з f — некоторые константы, значения которых таковы, что маневр переориентации КА нетривиален, t о - начальный и t f – конечный фиксированные моменты времени, то есть t f — t о = T “ заданная длительность маневра.
1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ТРОЙНЫМ ИНТЕГРАТОРОМ
И ЕЕ СВЕДЕНИЕ К ПРОБЛЕМЕ МОМЕНТОВ
Уравнения состояния объекта управления (0.6) перепишем в векторно-матричном виде d X (t) J 7 X , 7 X 7-7 X
—— = Ax ( t ) + b и ( t ) + f ( t ) , (1.1)
dt где X(t) = col (X 1(t), X2(t), Xз(t)) – вектор- о 1 о столбец фазовых переменных, A = о о 1
ооо матрица динамики объекта управления, b = col (о, о, 1) – вектор-столбец эффективности управляющего воздействия и (t) Е R1, а f (t) = col (о, f (t), о). Граничные условия (0.8), (0.9) для объекта управления (1.1) также перепишем в векторном виде:
x ( t о ) = x о ; x ( t f ) = x f , (1.2)
где x о = col( X 1о , X 2о , X зо ) , X f = col( X 1 f , X 2 f , X з f ) .
Переходное отображение для системы (1.1)
задается формулой Коши:
x(t) = Ф(t, tо)xо + jФ(t, t)[bu(t) + f (t)]dт, (1.3) tо где Ф(t, tо) - переходная матрица:
1 t — t о |
2( t — t о ) 2 |
||
Ф ( t , t о ) = |
о 1 |
t — t о |
. (1.4) |
о о |
1 |
||
Если в (1.4) t = t f и t о дения Ф ( t f , т ) b получим |
= т , то для произве- |
Ф ( t f , т ) b =
2( t f —т ) 2 t f —т
(1.5)
Очевидно, что h ( т ) = Ф ( tf , т ) b = col[ A j ( t ), h 2 ( т ), h 3 ( т )] и с учетом (1.5):
h 1 ( т ) = -( t f —т ) ; h 2 ( т ) = t f —Т ;
h з ( т ) = 1 , Vte [ t о , t f ] . (1.6)
Обозначая c = xf — Ф(tf, tо)xо — g(tf ) , (1.7)
t где g (t) = j Ф (t, t) f (t) dт – вектор-функция с t о компонентами tt g 1(t) = j(t — t) f (t) dт; g2(t) = j f (t) d т;
t о tо g з( t) = о, (1.8)
формулу (1.3) при t = tf можно переписать в виде tf j Ф (tf, t) b и (т) dt = c. (1.9)
t о
С учетом (1.2), (1.4) и (1.8) компоненты С = col( C 1 , C 2 , C 3 ) будут равны
C 1 = x 1 f — x 10 — ( t f — t 0 ) x 20 —
1 2
- 2 ( t f — t 0 ) x 30 — g 1 ( t f ) ;
C 2 = x 2 f — x 20 — ( t f — t 0 ) x 30 — g 2 ( t f ) ;
C 3 = x 3 f — x 30 . (1.10)
Таким образом, двухточечная граничная задача (1.1), (1.2), как задача управления, в которой требуется перевести систему из состояния X 0 на момент времени t 0 в состояние X f к моменту времени t f с помощью какого-либо допустимого управления, сводится к решению интегрального уравнения (1.9) относительно допустимого управления и ( • ) = u [ t 0 , t f ] или, в конечном счете, к проблеме моментов [3-5]. Далее будут рассматриваться задачи оптимального управления для (1.1), (1.2) с функционалами типа нормы в пространствах L q [ t 0 , t f ] , 1 < q <^ , норма в которых определяется так [3]:
f
II U O^ = J I U ( T )l qd Т
q
, 1 < q < ^ . При
V t 0
q = ^ и ( • ) - элементы пространства измеримых существенно ограниченных на интервале [ t 0 , t f ] функций из L „ [ t 0 , t f ] , норма в котором определяется как существенный максимум
и ( • ) [3]: || и ( • ) || L = vrai max и ( t ) .
” t е [ t 0 , t f ]
Если и (•) Е Lq [t0, tf ], 1 < q < ^, и заданы hk (•)Е Lp[t0, tf J, k = 1,2,3,... (в общем слу- чае, k = 1,2,..., n, n <^ ), числа Ck (такие, что
Z Ck2 * 0), где + 1, то проблема момен- k pq
.
-
тов формулируется так [3 – 5]: для заданных эле ментов hk (•)G Lp[10, tf ] и чисел ck найти та
-
кой линейный ограниченный функционал * Г*
фЕ L p , где L p - сопряженное пространство к L p [ t 0 , t f ] , для которого выполняется следующая система (моментных) равенств:
ф ( h k ( • )) = C k , k = 1,2,3,... . (1.11)
Функционал в (1.11) имеет следующий вид tf
[3]: ф ( h ( • )) = J h ( т ) и ( т ) d т . Если для него вы- t 0
полняются равенства (1.11), то он является разрешающим для соответствующей проблемы моментов и его построение сводится к определению элемента и ( • ) Е L q [ t 0, t f ] для заданных h k ( • ) е L p [ t 0 , t f ] и C k ( k = 1,2,3,... ).
Известно [3, 4], что проблема моментов (1.11)
разрешима для любых чисел c k (из которых хотя бы одно отлично от нуля), если только функции h k ( • ) Е L p [ 1 0 , t f ] линейно независимы на интервале [ t 0 , t f ] , что имеет место для (1.6) в силу полной управляемости системы (1.1) или (0.6), то есть проблема моментов для тройного интегратора (1.1) всегда разрешима, если хотя бы одно из чисел (1.10) отлично от нуля.
Если проблема моментов (1.11) разрешима, то существует минимальный элемент h 0 ( • ) Е P , для которого
, 0 <Р 0 =||h 0( *)||Lp<Р (• Ж„ V h (•) Е P, где
f 33 1
P = j h ( • ): h ( • ) = Z l k h k ( • ), Z l k C k = 1 [ (1.12)
I k = 1 k = 1
и справедливо утверждение [3]: проблема моментов (1.11) разрешима тогда и только тогда, когда Р 0 > 0, и для разрешающего функционала имеет место: ф ( h (•)) = 1, Vh (•) Е P, в том числе h0(•)Е P, то есть также ф ( h 0( •)) = 1. Для нормы разрешающего функционала имеет место та кая оценка: || ф || * >---.
Lp Р 0
В свою очередь, если для решений (1.11) требуется дополнительно минимизировать J ( и ( • )) = || и ( • )|| L q , то рассматриваемая двухточечная граничная задача сводится оптимальной проблеме моментов [4], а норма оптимального разрешающего функционала ф 0 будет равна:
|| ф 0 ||г
Lp
Р 0 .
В силу существования изометрического изоморфизма [3], [4]
I: Lp[10, tf ] ^ Lq[10, tf ], имеет место: min || и (•) ||L = min || ф || L* = ——.
и ( • ) q ф p Р 0
На этом равенстве основан принцип максимума Н.Н. Красовского, как универсальный метод решения задач оптимального управления линейными системами [3, 4].
Принцип максимума [4]. Пусть h 0(т) = l T Ф (tf, т) b – решение задачи min||l T ф ( tf , •) b ||L =Р 0 , (1.13)
-
l T c = 1 p
где l = col(l 1,12,13,...) и С = col(c 1,C2,C3,...). Если задача tf max J h 0(т) и (т) d т (1.14)
| и ( • )|| Lq = 1- 1 0
Р 0
имеет единственное решение и * (•) , тогда u * (t), VtЕ[tQ, tf], - оптимальное управление и tf
J h 0( т ) и * ( т ) d т = !□.
t Q
Таким образом, решение задачи оптимального управления для линейной управляемой системы (1.1) с функционалом J ( и ( " )) = II и ( " ) II L q сводится к последовательному решению двух задач (1.13) и (1.14).
В процессе решения задачи (1.13) можно ввести вектор-функцию ф ( т ) = Ф T ( tf , т ) l , которое является решением уравнения, сопряженного к (1.1), а именно:
d ф ( t )
—;— = — A ф ( t ) . (1-15)
dt и удовлетворяет конечному условию ф T( tf-) c = lT c = 1. (1-16)
В связи с этим задачу (1.13) можно представить в виде min 11 фT(•)b ||l = 11 фT(•)b И, = pq, (1.17)
T p p ф (tf) c = 1
где ф q ( t ) – минимизирующая вектор-функция [4]. В (1.1) b = col(Q,Q, 1) , поэтому в (1.17) имеет место: ф ( t ) b = V з ( t ) , то есть V 3 ( • ) = h ( • ) Е P .
Далее будут рассматриваться задачи оптимального управления для тройного интегратора в рамках двухточечной граничной задачи (1.1), (1.2) с функционалами типа нормы J ( u ( • )) = 11 u ( • ) 11 Lq , q = 1,2, ^ . В связи с этим сформулируем эти задачи.
Задача 1. Для объекта управления (1.1), здесь и далее в виде тройного интегратора (0.6), и для заданных произвольных граничных условий (1.2) найти управление и (•)Е L2[tq, tf ], доставляющее минимум функционалу tf
J ( и ( • )) = (|| и ( • )|| l 2) 2 = J и 2 ( т ) d т . (1.18) t 0
Задача (1.1), (1.2), (1.18) является задачей оптимального управления на минимум обобщенной энергии управления [4, 6].
Задача 2. Для объекта управления (1.1) и для заданных произвольных граничных условий (1.2) найти управление и ( • ) Е L ^ [ t q , tf ] , доставляющее минимум функционалу
J ( и ( • )) = II и ( * )II L „ = vrai max | и ( t )| . (1.19) t Е [ t 0 . t f ]
Задача (1.1), (1.2), (1.19) является задачей оптимального управления на минимум макси- мально допустимых управляющих воздействий, то есть в этой задаче находится наименьшее значение параметра иq в (0.7).
Задача 3. Для объекта управления (1.1) и для заданных произвольных граничных условий (1.2) найти управление и (•) Е L1 [ tq , tf ], доставляющее минимум функционалу tf
J ( и ( • )) = || и ( • ) II l 1 = J | и ( т )| d т . (1.20) t 0
Задача (1.1), (1.2), (1.20) является задачей оптимального управления на минимум расходов управления (или в трактовке [6] – расходов “топлива”) или, что то же самое, полного импульса управляющих воздействий [3].
-
2. ЗАДАЧА НА МИНИМУМ ОБОБЩЕННОЙ ЭНЕРГИИ УПРАВЛЕНИЯ
Рассмотрим решение задачи оптимального управления (1.1), (1.2), (1.18), то есть задачи 1, когда и(•)Е L2[tq, tf ], а ограничения (0.7) не учитываются. Проблема моментов (1.11) здесь формулируется в пространстве L 2[ tq, tf ] и, стало быть, в соответствии с (1.13) вначале следует решить задачу min || h (•) ||L2 = min h (• )e P h (• )e P jfh 2( т ) d т
V t о
I
min l T c = 1
' J l T Ф (
V • Q
t f , т ) bb T Ф T( t f , т ) l d т
J
min l T c = 1
l T
J Ф ( t f
V t 0
, т ) bb Ф ( t f , т ) d т l J
= min [ l T Dl ] 2 = p Q , l T c = 1
где tf
D = W ( tf , t Q) = J Ф ( tf , т ) bb T Ф T( tf , т ) d т _ t 0
грамиан управляемости [4], который с учетом
-
(1.5) и T = t f — t Q будет равен
- T^
T 4
T 3
20
8
6
t 4
T 3
T 2
D =
8
3
2
T 3
T 2
—
T
L 6
2
(2.1)
Применяя метод множителей Лагранжа для определения вектора l 0 Е R , из условий минимума вспомогательной функции l T Dl + X ( c т l - 1) , где X - множитель Лагранжа, получим
X = - 2( c T D -1 c )-1 ; l о = ( c T D - 1 c > - 1 D - 1 c , а отсюда следует
p 0 = ( c T D - 1 c > 2 ;
h 0( T > = ( c T D - 1 c > - 1 c T D - 1 Ф ( tf , t > b .
Переходя далее к решению задачи (1.14), учтем, что для оптимального разрешающего функционала имеет место: ф о ( h о ( ’ >> = 1 . Поэтому оптимальное управление здесь находится из условий:
из одного состояния покоя в другое, соответственно, за время T . Пусть здесь 1 0 = 0 и t f = T , а в (0.8), (0.9) тогда следует принять:
x 10 = 0 ; x 1 f = у т ; x 20 = 0 ;
x 30 = 0 ; x 3 f = 0 .
x 2 f = 0 ;
(2.4)
Дополнительно предполагая, что в (0.6) f (t ) = 0 , когда отсутствуют возмущения, из (1.10) получим: С 1 = у т ; С 2 = 0 ; С 3 = 0 , и, стало быть, программа оптимального управления (2.3) в этом случае примет следующий вид:
и ( т > = тр-
( T -т ) 2 - ( T -t ) т + 1 т 2 6
у т =
tf
max Г h 0( т > u ( т > d т = 1. и ( ■ > ' ;
t 0
_ 360 f 2 т Т2\
= y r V T 6 T 1ут . (2.5)
Очевидно, что оптимальная программа (2.5) в силу симметрии граничных условий (2.4) (от-
f tf , 1 1
Г и ( t > d т 2
V t 0 7
p 0
T
носительно т = — ) так же будет симметричной
и из (2.5) тогда получим, что как при т = 0 , так и
которые выполняются, если и ( т > = Ц h 0 ( т ) , где
~ * ~ * \ 60 У т
при т = T : и (0> = max и ( т > = ~“3 , а при т T
Ц > 0 . Стало быть, тогда получим Ц = ^- , то p 2 0
есть оптимальное управление будет иметь вид
и * ( т > = c т D - 1 Ф ( t f , т > b , Vte [ t 0, t f ] . (2.2)
T
т = —
2 ,
соответственно, получим
~* f T I ™ ~*(,,Х 30ут
и 1 — 1 = min и ( т ) =-- т- □.
V 2 J т v 2 t 3
Очевидно, что здесь || и * ( ■ > || L 2 = ( c т D - 1 c > 2 •
Тем самым получено общее решение задачи оптимального управления для линейной системы (1.1), (1.2) с функционалом J ( и ( ■ >> = || и ( ■ > || l 2 .
Учитывая (1.5) и (2.1), программу оптимального управления (2.2) можно записать в явном виде:
3. ЗАДАЧА НА МИНИМУМ УРОВНЯ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЙ
и * ( t ) =
30( t f -t )2 f 12 c 1
T 3
т 2
V T
6 c 2
--+ c 3
T 3
A
-
36( t f - t >
T 2
f 1° c-
V T 2
16 c 2 3 T
I + c 3 +
В задаче оптимального управления (1.1), (1.2), (1.19) требуется найти минимально возможное значение для параметра u 0 в (0.7). В данном случае соответствующая проблема моментов формулируется в L 1 [ t 0 , t f ] .
В соответствии с принципом максимума Н.Н. Красовского (1.13), (1.14) вначале рассмотрим задачу (1.13), а именно:
tf
min Р ( • >|| L 1 = min Г | h ( t )| d т =
h ( ■ ) е P h ( ■ ) е Pt 0
+--
T
f '° '
V T-
4 c 2 T
I
+ c 3
(2.3)
tf
= min
T
c t 0
1 1 т Ф ( tf , т > b | d t =
Пример 1. Рассмотрим пример маневра по одному из каналов управления ориентацией КА для следующих условий, а именно: требуется осуществить разворот КА на угол у т ( 0 < у т < Л )
= min l т c = 1
tf
Г
t 0
| ^ т ( t > b | d т = р 0
С учетом того, что ф T ( т ) b = V 3 ( т ) , и для заданных чисел С 1 , С 2 , С 3 (1.10) эта задача сводится к решению задачи:
Стало быть, оптимальное управление в задаче (1.1), (1.2), (1.19) имеет вид
min
1 T c = 1
tf
J | v з ( т )| d т = р о
t 0
(3.1)
Очевидно, что здесь V 3 ( т ) = h ( т ) . Поскольку из решения сопряженного уравнения (1.15) следует
V з ( т ) = 2 ( t f — т ) V 1 ( t f ) +
+ ( t f -т ) V 2 ( t f ) + V з ( t f ) , постольку с учетом (1.16) перепишем (3.1) в виде
р 0 = min
1 1 c 1 + 1 2 c 2 + 1 3 c 3 = 1
t f 1
J 3< t f — т ) 1 1 +
t 0
+ ( t f — т ) 1 2 + 1 3 | d т . (3.2)
Если задача (3.2) решена, то есть найдены числа 1 10 , 1 20 , 1 30 , которые удовлетворяют условию: 1 10 c 1 + 1 20 С 1 + 1 30 c 1 1 , и, следовательно, также будут найдены минимальный элемент h 0 ( t ) и его норма р 0 , то тогда будет найдена, очевидно, и компонента минимизирующей век-тор-функции ф 0 ( t ) , которая совпадает с h 0 ( t ) , а именно:
v3( t ) = 3 t f — t ) 2 1 10 +
+ ( t f — t ) 1 20 + 1 30 , V t е [ t 0 , t f ] . (3.3)
В частности, согласно (1.16) здесь 1 10 = v 1 ( t f ) , 1 20 = v 2 ( t f ) и 1 30 = v 3 ( t f ) .
Итак, зная V 3 ( t ) и P 0 , можно перейти к следующему этапу решения задачи (1.1), (1.2), (1.19), непосредственно связанного с синтезом управления и ( ■ ) Е L ю [ 1 0 , t f ] , на котором согласно (1.14) требуется решить задачу:
max и ( ■ )
t f 1
h 0( т ) и ( т ) d т = 1 ; max | и ( т ) | = —.
у тЕ [ t 0 . t f ] Po
t 0
Отсюда видно, что минимальное возможное
значение параметра и 0 в (0.7) будет равно
и 0 =--, а максимум интеграла достигается
р 0
только в том случае, когда
и ( т ) = — sign h 0 ( т ) = — sign v 3 ( т ) р 0 р 0
VTЕ [ 1 0 , t f ] .
1 v 3 ( t ) 1
и ( t ) , . =_ sign V 3( t ), V t Е [ t 0, t J. (3.4)
P 0 ! V 3 ( t )| P 0 0 f
Таким образом, получена общая структура оптимального управления в задаче (1.1), (1.2), (1.19) с произвольно заданными граничными условиями. Отметим, что в рассмотренной задаче имеет место взаимно однозначное соответствие между значениями T = t f — 1 0 и и 0 , то есть последняя является взаимной к задаче на быстродействие для (0.6) – (0.9).
Синтез оптимальной программы управления (3.4) с помощью численных методов оптимизации с учетом вида V 3 ( t ) (3.3) достаточно эффективен, но еще более эффективный алгоритм синтеза указанной программы возможен при сведении этой процедуры к задаче безусловной оптимизации. В связи с этим далее получим необходимые соотношения для ее реализации с учетом того, что функция (3.3) знакопеременная и в общем случае имеет нули на интервале [ 1 0 , t f ] , а именно: V д ( 1 1 ) = 0 , V з( t 2 ) = 0 .
Итак, если 1 0 < 1 1 < 1 2 < t f , то отсюда получим относительно 1 ю и 1 20 следующие уравнения:
1z 2
2 ( t f t 1 ) 1 10 + ( t f t 1 ) 1 20 + 1 30 = 0 ;
i( t f
t 2 ) 1 10 + ( t f t 2 ) 1 20 + 1 30
= 0
.
Присоединяя к ним, согласно услови-
ям задачи (3.1), еще одно уравнение: С 1 1 10 + С 2 1 20 + С 3 1 30 = 1 , получим систему уравнений относительно 1 ю , 1 20 и 1 30 , решение которой имеет вид:
1 10 = г ; 1 20 =
С 0
С 0
( tf
V
t 1 + t 2
( t f — t 1 )( t f — t 2 )
2 c 0
(3.5)
где С 0 = С 0( С 1 , С 2 , С 3 , t 1 , t 2 ) =
С 1
— С 2
t f
V
—
t 1 + t 2
\
У
+-
С 3
( t f — t 1)( t f — t 2 )
Таким образом, с учетом (3.5) получена минимизирующая функция V 3 ( t ) (3.3), которая явно зависит от переменных t 1 и t 2 , то есть имеет место V 3 ( t ) = V 3 ( t ; 1 1 , 1 2 ) , и, соответственно, задача (3.2) сводится к следующей задаче безусловной оптимизации (конечно, в общем слу-
чае в предположении о неэффективности ограничений t 0 < t 1 и t 2 < t f ):
p 0 = min
1 1 c 1 + 1 2 c 2 + 1 3 c 3 = 1
tf
J| vl(t; ti, t2)| dT = t 0
= min t 0 < t 1< t 2 2 tf
t 1 t 2
J Vg(T)dT - J Vg(T)dT + t0 t1
tf
+ J Vg(T)dT t2
min tо < t i< t 2 < tf
| S 1 S 2 + S з| , (3.6)
bk где Sk = J v3(T)dT, k = 1, 2, 3,и,соответствен- ak но, (a 1, b 1) = (t 0, t 1) , (a 2, b 2) = (t 1, t 2) , (a 3, b 3) = (t 2, tf ). С учетом (3.3) для вычисления в (3.6) значений S k, k = 1, 2,3, получим следующую формулу:
bk
S k = J v3( T ) d T = ( b k - a k )
ak
1 / /2 + 2 1 10 t f +
+ 1 20 t f + 1 30 ) 2 ( 1 10 t f
+ 1 20 ) ( b k + a k ) +
1 , „2 2.
-
+ 6 1 10 ( b k + b k a k + a k ) J . (3.7)
Ввиду явной зависимости S k , k = 1, 2, 3 , от 1 1 и 1 2 применение формул (3.7) при численном решении задачи безусловной оптимизации (3.6) оказывается более эффективным в сравнении с непосредственным решением задачи (3.2). Но, не ограничиваясь этим, далее рассмотрим еще один вариант более эффективного подхода к решению задачи (3.6) и, естественно, задачи (3.2). В связи с этим получим требуемые для этого соотношения, для чего выражение (3.3) для функции ^ 3 ( t ) перепишем в следующем виде:
V*3(t) = Чm (t -Tm )2 -pm ,( l 20 t 1 + t 2
где T m = tf + = ,
-V * 3 ( T m ) -
координаты вершины параболы (3.8) (здесь предполагается, что функция ^ 3 ( t ) выпуклая, то есть a m > 0 , и, стало быть, P m > 0 , иначе - a m < 0 и P m < 0 ).
Соответственно, пусть t12 =Tm + — =Tm+A -, нули функции ^3(t) (3.8). Далее без ограничения общности примем 10 = 0, tf = T . Коэффициенты в (3.8) связаны с 1 ю, 120 и 130 такими соотношениями:
-
a m = 2 1 10 , 2 a m T m = 1w T + 1 20 ,
-
4 m T m -P m = ^ 1 10 T + 1 20 T + 1 30 . (3.9)
Разрешая (3.9) относительно 1 ю, 1 20 и 1 30 , получим
-
1 10 = 2 a m ; 1 20 = 2 a m ( T m - T ) ;
-
1 30 =a m ( T m - T ) 2 -P m . (3.10)
Очевидно, что коэффициенты в (3.8) с учетом (3.10) должны удовлетворять одному из условий задачи (3.6), а именно:
2 4 m с 1 + 2 a m ( T m - T ) с 2 +
+ [ 4 m ( T m - T ) 2 -P m ] C 3 = 1 . (3.11)
Далее с учетом (3.9) выражения (3.7) перепишем так:
Sk =a m (bk - ak ) lTm -A2m -
-tm (bk + ak) + 3(bk + bkak + ak) , k = 1,2,3,
Вычисляя по этим формулам: S 1 с учетом b 1 = T m - A m и a 1 = 0 ( b 1 > 0 ); S 2 с учетом b 2 =T m +A m и a 2 =T m -A m ( a 2 ^ 0 и b 2 < t ), и, наконец, S 3 с учетом b 3 = T и a 2 =T m +A m ( a 3 < T ). получим:
S1 = 1 a m (T m -A m )2 (T m + 2 A m ) ;
S 2 =- 4 4 m A m ;
S 3 = 1 4 m (T -T m -A m ) X x|a m (T-Tm - 2A m) + (T-tm )21. (3.12)
Вводя “сопряженный” параметр T m = T - T m , формулу для вычисления S 3 в (3.12) можно записать в виде
S 3 = 3 a m (~ m - 3~ m A m + 2 A 3 m ) .
В связи с этим отметим, что выражение для S 1 в (3.12) также приводится к такому же виду
(обусловленному симметричностью ветвей параболы (3.8) относительно Т = Т m ), но с точностью до “сопряжения”, то есть с заменой параметра ~ m на Т m :
S 1 = 3 « m ( T 3 m - 3 Т m A m + 2 A m ) .
Соответственно, условие (3.11) теперь можно переписать в виде а,[2с 1 -2~mс2 + (~m -Am)с3] = 1 .(3.13)
Для определения параметров в (3.8), доставляющих решение задачи (3.6), решим вспомогательную задачу оптимизации: с учетом (3.12) найти минимум функции F = S 1 — S 2 + S 3 (здесь в предположении, что а m > 0 ) при условии, что имеет место (3.13). Ее решение с помощью метода множителей Лагранжа, то есть будем отыскивать вначале минимум вспомогательной функции
F = S 1 — S 2 + S 3 + x [ 2 с 1 — 2~ m с 2 +
- T 3 — T ( T — т m ) Т m — T A m + - A m +— = 0 ; (3.16) 3 3 a m
4 A m — T — X c 3 = 0 . (3.17)
Отсюда, то есть из первого уравнения – (3.15) следует:
T 2 — 2 X ( c 2 — Tc 3) 2( T + X c 3)
^ T
~
X ( c 2 — Tc 3 )
-T—
+
~ \ —1
1 + X c 3
T 7
а из третьего уравнения – (3.17) получим:
1 ~
A m = ^( T + X c 3 ) . (3.18)
Следовательно, тогда получим
t 1,2 =T m + A m =
+ (~2 - А2——
V v m mm / 3
(3.14)
T2 — 2 X (c2 — Tc.)1 ~
----------~-------+ - ( T + X c 3) , (3.19)
2( T + ~ c 3)4
где X — множитель Лагранжа, и учитывая, что S k = S k ( Т m , а m , A m ) , k = 1,2,3 .
Вычислим производные (3.14):
= а m ( Т , — ~ m > + 2 X ( c 2 — ~ m c 3 ) ;
и, стало быть, решение задачи (3.6) с оптимизацией по t 1 и t 2 здесь сводится к процедуре одномерной оптимизации по X . Если найдено такое ~ ~* /~*\ **
X = X*, что 11 2(X ) = 112 ? доставляют решение задачи (3.6), то тогда сразу же находятся г-— d F
да m
1/3 \ а 2 8 .3 X
- (Tm + Тm) — TAm +"Am + 2 0 ;
3 3 a m
т
m
* ,*
t 2 + t 1
*
и A m
**
t 2 — t 1 *
------, а a m затем тогда
можно найти из (3.16):
~
Э F ~ „
—— = 2 А m (4 а m А m
"A m
— аmT — Xc3) = 0 .
a m
—X *
3 T 3 — T ( T — T m ) T m —
Учитывая, что T m + Т „ = T и Т m — ~ , = 2 т m — T , преобразуем эти выражения, а затем в силу необходимых условий минимума (3.14) приравняем их нулю:
a m T (2 т m — T ) + 2 X [ c 2 — ( T — т m ) c 3 ] = 0 ;
- T 3 — T ( T — Т , ) T , — T A m + ~ A m + 2 0 ;
3 3 a m
4amAm—amT — Xc3=0.
— T ( A m ) 2 + |( A m ) 3 .
Вообще говоря, система (3.15) – (3.17) допускает аналитическое решение, но из-за громоздкой записи оно здесь не приводится.
Пример 2. Получим решение задачи 2 при задании граничных условий (1.2) в виде (2.4), а также в предположении, что f ( t ) = 0 . Действительно, как и в примере 1, из (1.10) получим: c 1 = Y T ; c 2 = 0 ; c 3 = 0 , и, соответственно, здесь
~ X
Вводя переменную X =---, указанные соот- am
11 = 110 = — =---. Тогда из (3.10) получим c 1 Y t ношения можно переписать в следующем виде:
~_
T (2 т m — T ) + 2 X [ c 2 — ( T — Т m ) c 3 ] = 0 ; (3.15)
-
1 T A T
a m -~ , а из (3.18) и (3.19): T , = 37; A m =37 .
-
2 Y t 2 4
Далее по формулам (3.12) вычислим
T 3 T 3
S 1 = 5 3 =------ и 5 2 =-- , то есть норма
96 у T 96 У т
Г ^
min I max | h ( т )|
1 1 c 1 + 1 2 c 2 + 1 3 c 3 = 1 \ тЕ [ t 0 , t f ] у
минимального элемента будет равна р 0
T 3
32 у т
= max | h о ( т )| =р о . (4.1)
те [ t о , t j ]
и, соответственно, получим минимальное значение параметра u 0 в (0.7):
32 У т uо = . (3.20)
и,
По определению (1.12) h ( т ) = 2 1 ytf -т ) + 1 2 (t j -т ) + 1 3 соответственно, здесь минимальный элемент
С учетом (3.20) для программы (3.4) за время маневра расход или полный импульс управле-
ния, очевидно, будет равен R = и о T =
32 У т
T 2
будет равен h 0( т) = 2110( tf т) + 120 (tf т) + 130 , (4.2) где для заданных граничных условий (1.2) и соответствующих им чисел (1.10) выполняется условие:
Отметим также, что рассматриваемая задача является взаимной к задаче на быстродействие для (0.6) – (0.9), поэтому из (3.20) для заданного u 0 следует, что длительности маневра должно
c 1 1 1о + c 2 1 20 + c 3 1 зо _ 1 .
(4.3)
Поскольку h о ( т ) Е L ^ [ t о , t j ] , то минимальный элемент (4.2), как решение задачи (4.1), яв
-
-
выполняться условие
з 32 Ут
T 3 > —— u 0
В пределе
ляется многочленом, наименее уклоняющимся от нуля [5], то есть с точностью до множителя + р о он будет равен многочлену Чебышева первого рода T 2( z ) = 2 z 2 - 1 , где z е [ - 1, + 1] и
получим
7 =2
min
Г 4Уг) 3 ( u о )
– минимальная
дли-
z =— tf
— [2 т- ( t f + t 0 )] t 0
.
тельность маневра .
4. ЗАДАЧА НА МИНИМУМ ПОЛНОГО ИМПУЛЬСА УПРАВЛЯЮЩИХ
ВОЗДЕЙСТВИЙ
Рассмотрим теперь задачу оптимального управления (1.1), (1.2), (1.20), то есть задачу на минимум расходов управления или полного импульса управляющих воздействий
Без ограничения общности далее примем tо = 0, tj = T , а выражение (4.2) для минимального элемента hо (т) приведем к виду h о( т) = 2 110 т2 - (T110 + 12о) т +
+ 2 1 10 T + 1 20 T + 1 30 .
(4.4)
Многочлен T 2 ( z ) с учетом замены переменной z на ф приводится к такому виду:
tf
J ( и ) = j | и ( т ) | d т . В этом случае двухточечная t 0
\ 2 т
T1 I —
2 ( T
1 1 - 8 т У т '
-
8 т — + 1 .
T
(4.5)
Если обозначить ~ о = 5 о Р о , ^ о =± 1 равнять (4.4) и (4.5):
и при-
граничная задача сводится к оптимальной проблеме моментов в L тс [ t о , t f ] .
Поскольку || h ( • ) |L = vrai max | h ( т ) | , то " те [ t о , tf ]
здесь задача (1.13) имеет вид:
min || h(ОНL = h (• )е P
( 2т 1 h о ( т ) = ~ о T 2 1 -- 1 1 ,
то для коэффициентов многочленов при
одина-
ковых степенях ф получим следующую систему относительно параметров 1 ю, 120, 1 зо и Ро:
1 о
— T 2 1 , 0- р0 = 0
10 0 ;
1 1 .
8 T 2 1 10 + 8 T1 20 - ~ 0 = 0 ;
min I vrai max | h ( т ) |
1 1 С 1 + 1 2 c 2 + 1 3 c 3 = 1 \ тЕ[ t о , t f ]
2 T 1 1о + T 1 20 + 1 30
-Ро = 0.
Присоединяя к этой системе уравнение (4.3), найдем указанные параметры по правилу Крамера, а именно:
DD l =1. 1 =
10 D ’ 20 D ’
, DD
130 = -D-; Po = D,(4.6)
1 ~ 1 ^2 где D 1' = 8 T , D 2 =" 16 T ,
D 3 =
— T 3
128 ’
D P = T . Поскольку
D = — FT
128 ,
где
сравнении с T ). Отметим, что приложение “импульсов”, указанных в (4.8), вне точек экстремумов h 0 ( 7 ) на интервале [0, T ] не обеспечивает максимума первого интеграла в (4.7) при заданном ограничении в виде второго интеграла там же. Если ( е 0, Е t , Е m ) ^ 0 , то из (4.8) с учетом (4.4) в пределе получим такую программу оптимального 8 -импульсного управления (которое уже не будет элементом L 1 [0, T ] ):
и 8 ( 7 ) = 5 0 [ a 0 8 ( 7 + 0) —
F = 16 c 1 — 8 Tc 2 + T 2 c 3 , то из (4.6) получим
— am 8 (7 — 2 T) + aT 8(7 — T — 0)
(4.9)
-T-
1 10 ~ . l 20 ~ . 130 = ;
F FF
P 0
T 2
F ,
и, тем самым, получим решение задачи (4.1) в
виде минимального элемента (4.4):
h 0( 0 = p0
f87
I T2
87 ?
— +1
T
. Очевидно, что его
- t 2
норма будет равна p 0 = , „ , и, стало быть, име- I F I
ет место sign 5 0 = sign F . Экстремумы для
h 0 ( 7 ) находятся в точках:
* 1
7 1 = 0 , 7 2 = ^ T и
73 = T ; при этом h0(7*3) = 50P0 и h0 (72) = —50p0 .
Далее в соответствии с принципом максиму-
ма решим задачу (1.14), которая непосредствен-
но связана с синтезом программы оптимального управления для рассматриваемой здесь задачи, а именно:
max u ( - )
TT
Гh0(7)и(7)d7 = 1. [|и(7)|d7=—
0 ; 0 P 0 .
(4.7)
Учитывая, что в постановке задачи 3 – (1.1), (1.2) и (1.20) – ограничения на управляющий параметр не накладываются, из условий (4.7) тогда следует, что оптимальное управление здесь можно аппроксимировать “импульсным” управлением, которое имеет следующий вид:
a о
— signh0(0X
Е 0
u е ( 7 ) = ’
aT
— sign h C 1 ), Е Т
a j Signh0(2 T)
Е m
0,
7Е 1 0 = [0, E 0 ];
7e I f = [ T — E t , T] ;
(4.8)
7E I m = I Е m , +E m ];
7E [0, T ]\( 1 0 и I m и I t ),
где E 0 , e t и E m - достаточно малые числа (в
где 5 0 = sign h 0 (0) .
Интегрируя систему уравнений (0.6) с учетом (0.8), (0.9) и (4.9) (здесь для удобства принято f ( t ) = 0 , иначе необходимо внести соответствующие поправки согласно (1.10)), получим
x 3 f
x 2 f
= x 30 + 5 0 [ a 0 — a m + a T ] ;
= x 20
+ ( x 30 + 5 0 a 0 ) T
1 . . T — 2 5 0 amT ;
x 1 f = x 10 + x 20 T + n ( x 30 +
+ 5 0 a 0) T o5 0 amT , то есть с учетом (1.10) получим линейную систему относительно a0 , aT , am :
- a0T 2 — amT 2 = ci; a0T — amT = c2;
2 0 8 m 1 ; 0 2 m 2 ;
a 0 — am + aT = ~3 , где Ck = 5 0 c k, k = 1,2,3. Решение этой системы доставляет следующие значения импульсов в (4.9):
4 c 1 — Tc 2 8 c 1 — 4 Tc 2
a 0 = 5 0 — —2 —; a m = 5 0 — —2 —;
4 c 1 — 3 Tc 2 + T2c 3
a T = 5 0-------- —2 --------. (4.10)
Суммируя импульсы (4.10), получим с учетом
T 2
второго интеграла в (4.7): Pq =---- . Посколь-
5 0 F ку здесь должно быть sign 50 = sign F , то есть знак функции F определяет знак первого “импульса” в (4.9). Если в силу граничных условий (1.2) имеет место F = 0, то при и (7) = 0, то есть для свободного движения объекта управления (1.1), заданные граничные условия (1.2) будут выполняться автоматически. Тем самым решение задачи 3 (1.1), (1.2), (1.20) завершено.
В заключение отметим, что для условий примера 1 полный импульс управляющего воздействия, получаемый с учетом (4.7) и (4.10) будет
-
1 16 Y т
равен R = — =----— , то есть здесь он будет в
Р о T 2
два раза меньше, чем его значение, полученное в примере 2.
ЗАКЛЮЧЕНИЕ
Методом моментов в рамках принципа максимума Н.Н. Красовского получены общие решения задач оптимального управления тройным интегратором на минимум функционалов типа нормы в пространстве Lq (для q = 1,2, ^ ) с произвольными граничными условиями, а именно, получены решения задач на минимум обобщенной энергии управления, максимального уровня управляющих воздействий и на минимум расходов управления или, что то же самое, на минимум полного импульса управляющих воздействий. При этом предполагалось, что моделью тройного интегратора описывается угловое движение космического аппарата с электромехани- ческими исполнительными органами по одному из каналов управления его ориентацией, в том числе с учетом перекрестных связей между ними. Показано, что метод моментов эффективен при синтезе оптимальных управлений при решении прикладных задач по управлению переориентацией в пространстве космических аппаратов.
Список литературы Синтез оптимальных управлений парциальными вращениями космического аппарата методом моментов
- Горелов Ю.Н., Данилов С.Б., Тропкина Е.А. Об одном подходе к приближенному решению задачи оптимального управления переориентацией космического аппарата//Обозрение прикл. и промышл. мат. 2011. Т.18, В.3. С.429-431.
- Алексеев К.Б., Бебенин Г.Г. Управление космическими летательными аппаратами. М.: Машиностроение, 1974. 340 с.
- Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.
- Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.
- Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи (Идеи и проблемы П.Л. Чебышева и А.А. Маркова и их дальнейшее развитие). М.: Наука, 1973. 552 с.
- Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 764 с.