Эвентуальная оптимальная стабилизация управляемых неоднородных систем
Автор: Щенников Владимир Николаевич
Журнал: Инженерные технологии и системы @vestnik-mrsu
Рубрика: Математическая теория устойчивости и теория управления
Статья в выпуске: 2, 2012 года.
Бесплатный доступ
Решены задачи эвентуальной оптимальной стабилизации для линейных систем и оптимальной стабилизации в смысле В. В. Румянцева.
Короткий адрес: https://sciup.org/14719923
IDR: 14719923
Текст научной статьи Эвентуальная оптимальная стабилизация управляемых неоднородных систем
Решены задачи эвентуальной оптимальной стабилизации для линейных систем и оптимальной стабилизации в смысле В. В. Румянцева.
Рассматривается задача оптимальной стабилизации для линейной системы при постоянно действующих возмущениях, убывающих к нулю по экспоненциальному закону при t ^ да (t — время). При этом считается, что коэффициенты правой части управляемой системы зависят от параметра. Коэффициенты в системе предполагаются аналитическими функциями. Помимо указанной задачи здесь решается задача оптимальной стабилизации в смысле В. В. Румянцева [7] применительно также к управляемой линейной неоднородной системе. Следует отметить, что подобные задачи возникают в теории адаптивного управления (см., например, [1, § 9; 10, гл. 6]).
В данной работе задача оптимальной стабилизации сформулирована для случая, когда коэффициенты системы неточно заданы и кроме того х = 0 не является положением равновесия системы. Поэтому здесь речь идет об оптимальной стабилизации множества М - { х : х = 0 } относительно исходной управляемой системы. Таким образом, здесь рассматривается эвентуальная асимптотическая устойчивость множества М относительно исходной системы. Понятие эвентуальной асимптотической устойчивости было введено в работе [10]. В последующем вопросы эвентуальной (расчетной) устойчивости получили свое существенное развитие в работах С. В. Зубова (см., например, [2, гл. I и II]). Таким образом, в данной работе дается дальнейшее развитие теории стабилизации [1—5; 7 — 9].
Результаты настоящей работы имеют и методический интерес, так как решение задач «подводит» к рассмотрению управляемых параметрически возмущенных систем. Причем параметрические возмущения могут быть самой произвольной природы (см., например, [6]).
Рассмотрим систему х - А (е) х + В (е) м + v (t), (1) где х е Rn, и е RV, А (е) = (а^(е)) и В (е) = = (бд (е)) — соответственно (и х и) и (и х 1)
постоянные матрицы, у е С |J+ ^ J+ j и, кро ме того,
||v (t)|| <РМ Р2 ' ' \ t > ф, (2)
где (Р1 л Р2) > 0 — вещественные постоянные. Здесь a^j (е) и б,| (е) — аналитические функции переменного е в некоторой области D, принимающие вещественные значения при различных значениях параметра е, здесь dx х = —, г, 1 = 1, и.
dt
Для системы (1) рассмотрим задачу оптимальной стабилизации при условии, что минимизируется функционал
ОТ .
'-I ((
t 0
. Т
j + ( мт, м
dt
на решениях системы (1). Верхний индекс г означает транспонирование.
Теорема. Предположим, что при некотором ео е D rangK = |в(е0),А(е0)В(е0), ...,
А " '( е 0) В ( е0| = и.
Тогда можно найти р -окрестность точки е = е о, т. е. |е - е о < р , такую, что задача эвентуальной оптимальной стабилизации разрешима в р -окрестности параметра е о . При этом оптимальная функция Ляпунова V0(t, х, е - Е о ) и оптимальное управление разлагаются в степенные ряды по е-е о , равномерно сходящиеся в р -окрестности параметра е о .
Доказательство. Пусть ц = £ - £0- Тогда v ..кДк) ,^(0)
^i/ (б) = Г И ^г/ , ^г/ = ^ij (б0 ) ■ к=0
Ьц ( 6 ) = I И кЬ^, $ = Ьй ( s 0 ) , к = 0 (4)
г, / = 1, и.
С учетом соотношений (4) система (1) будет иметь вид где верхний символ s = 0, 1, 2 указывает на порядок формы относительно х е В”, т. е. У(2)(х) — квадратичная форма, y(1)(t, x) — линейная форма с коэффициентами, зависящими от времени t, которые являются в свою очередь непрерывно дифференцируемыми функциями, а y0(t) — скалярная непрерывно дифференцируемая функция. Будем искать решение системы (7) в виде
v
У ( t , х, и ) = Г цМ6 ) ( t , х ) + У ( 0 ) ( t ) , (8) к = 0
х = Л ( 0 ) х + В ( 0 ) м + v ( t ) + + fy ( л ( к ) х + В ( к ) м ).
к = 1
где y<k4t, х) = У ( к 2 ) ) ( х ) + У^ ( t, х ) , У^ ( х ) —
квадратичная форма;
У ( к ) ( ^ - х )
— линейная
Здесь ц играет роль малого параметра. Используя известную теорему Н. Н. Красовского об оптимальной стабилизации [4], по
форма относительно х е R" с указанными выше коэффициентами (позднее будет дана оценка на коэффициенты). Таким образом,
лучим
м ° ( t, х, ц ) = - - 1 grad ХУ^, х) , f ц кВ^ I , (6) 2 ( й )
B(k) _ вектор-столбец с индексом к . При этом оптимальная функция Ляпунова с учетом функционала (3) находится из системы [1]
У ( 2 ’ ( х ) = f f ц к у^ ( х ) , У ( 1 ) ( х ) = Гг ц ^ у (« х к =° V * к =0 V
х ^ t , х ) . Подставив (8) в уравнения (7) и приравнивая к нулю коэффициенты при одинаковых степенях параметра ц , получим систему уравнений, из которой найдем y(k)(t, x) и y(0)(t), к = 0, 1,2 ... . Эта система имеет вид:
I gradхy ( 2 ) ( х ) , f Ц А^М -
I к = ° )
- 1 grady ^ 2 ^ ( х ) , f ц кВ ^ к * ) + (хт, х) = °,
4 1 )
( grady^ ( х ) , Л ( 0 ) х ) -
- ^ ( grady^ ( х ) , В ( 0 ) ) + (хт , х ) = 0.
I grad^^ ( t, х ) , Г ц к А*^х | -
I к=0)
-
- 1 | grady ( 2 ) ( х ) , £ ц ^ В^ |х
-
2 ( к=0 )(7)
X I grad x У ( 1 ) ( t , х ) , Г Ц кВ^ "] +
V к=0
+ ( grady ( 2 ) ( х ) , у ( t ) ) + У ( 1 ) ( t , х ) = 0.
( grad xy ( к 2 ) ) ( х ) , а ( 0 ) х ) +
+ Г ( grad y ( к 2 ) 1 ) ( х ) , А ( и ) х ) -
-
1 а+р=к ( а
- - г Iz (grady(UU)(х),В ^ )|х
-
4 а,р>0 V и=0
ГГ ( grad y ( p 2 ) y ) ( х ) , В
(5=0 хv к = 1, 2, 3, ...
= 0,
У ( ° * + ( grad х У ( 1 ) ( к х ) , v ( t ) ) -
- 1 1 gradxУ^ ( t , х ) , f ц кВ ^ к * | = °. 4 1 )
Здесь y(t, x ) = y ( 2 ) ( x ) + y ( 1 ) ( t , x ) + y ( 0 ) (t),
(gradxУ(0)) (t, х) , А(0)х) -- j (grady(f)) (х), в(0) ) х x (grad*^ (t, x), В<°) +
+ ( gradV« ( x ) . , ( tф^Л^ = 0,
( gradxV(W ( t , x ) , H ( 0 ) x ) +
+ E (gradV^1-u) (t, x), H(u)x) - a+P-к a
-
- 1 S [ S ( gradV® „( x ) .B < " ) ) Ix
-
2 a , p> 0 V u= 0 J
x
S ( grad x VW s ( t, x ) , B ( s ) ) +
V^ =0 \ ч/J
+ ( gradV^ ( x ) , v ( t ) ) +
d y ( 1 )
+ — k— ( t,x ) - 0, к - 1, 2, 3, ... d t ’
V ( 0 ) + ( gradxV ( 1 ) ( t. x ) . v ( t ) ) -
" о ( x ) - - 1 ( grad y ( 0 ) ) ( x ) > s ( 0 ) )
при котором нулевое решение системы x = H(0)x + B(0)«0 (x) (14)
будет асимптотически устойчивым. Полная производная по времени t от функции У (2) ( x ) (к = 1, 2, ...) на решениях системы (14) будет иметь вид
Vm< x >U=W < x • .
H ^ 0 ^ x + B ^ 0 ^ « 0 ( x ) ).
Далее с учетом системы (10) (система (10) является системой, из которой собственно и определяются У ^ ^ ) ( x ) (к=1,2,...))и соотношения (15) получим систему рекуррентных соотношений
" ■' ( x ’I ( ,4 ) =- ( g^V® ( x •
H^x + B ^ 1 ^ M 0 ( x ) ),
[ to I
--1 grad x V^ ( t . x ) . E V kB ( k ) I - 0.
4 V к - 0 J
к - 0. 1. 2. ...
Здесь соотношения (9) — (13) есть уравнения относительно У^ ( x ) , У^ ( t , x ) и У (°-* ( t ) , а соотношения (10) — (12) являются уравнениями относительно У^ ( 1 , x ) , к = 1, 2, 3, ... .
Vg^^ = - ( grad V ( ( k 2 ) ) ( x ) , H ( 0 ) x ) -
- s ( gradVA2 ) i ) ( x ) , h ( " ) x ) +
"= 0 (16)
a+p= k a
+ 1 S I E ( gradV ( ( „ 2 -" ) ( x ) , B ( " ) )x
4 a , p> 0 V "= 0 J
Уф (x) и
x
E ( grad V ( ( 2 -^ ) ( x ) , b ( s ) )] . V s- 0 J
Итак, для того чтобы решить задачу оптимальной стабилизации, необходимо найти решение системы (9) — (13), т. е. найти оптимальную функцию Ляпунова У ( ° ) ( t , x ) , а из соотношения (6) — оптимальное управление. Уравнения (9) и (11) (случай к = 0) соответствуют уравнениям (6) — (7) работы [10, с. 75].
Итак, из уравнения (9) находится
-
У (( ° 2 )) ( x ) = x r C ( ° > x , затем с учетом системы (5) и управления
Из асимптотической устойчивости системы (14) следует, что система (16) имеет единственное решение для каждого к > 1.
Сходимость ряда У ( 2 ) ( x ) = E ^кУт ( x ) к = ° ( )
доказана в работе [10, § 8]. Итак, V ( 2 ) ( x ) существует и представляется в виде ряда по параметру. Найдем теперь У^ ( t, х ) =
= S иМ ! ( t, х ) . Из уравнения (11) следу- & = ° ^ ^
ет, что l«(x >1 <„)
Тогда
= - ( gradV^ ( x ) , v ( t ))■
V ( o ) ( t’x ) _
ГО
- J ( gradV^ ( x ( t , V ) ) ,
V ( т
d т .
Здесь x ( т , ^, t ) ,
( x ( T ^ , t )| - )
есть реше
ние системы (14), нулевое решение которой
асимптотически устойчиво и, кроме того, решения системы (14) удовлетворяют неравен
ству
II х ( т , ^ ,t )|| < « 1 е « 2 ( т ^, т > t, (18)
где « 1 и а 2 — вещественные постоянные числа.
Исходя из неравенств (18), (2) и того факта, что ^adV^ ( x )| 5 « з ||х|| при ||х|| < г , г — любое конечное вещественное число; « 3 > 0 — вещественная постоянная, следует, что абсолютно и равномерно относительно ||^|| < г сходится интеграл (17). Рассуждая аналогично, получим
||grad x V^ ( t , x )| < a ' /'v « *^^ < « 4° ^ , (19)
Вектор-функция x ( т , ^ , t ) удовлетворяет неравенству (18). Следовательно, с учетом неравенства (2) интегралы (20) абсолютно и равномерно сходятся относительно ^ ( ||^|| < г , г > 0 — любое конечное). Кроме того, имеют место неравенства, включая и (19),
IS^x^ 1 ) ( t , x )| < а 4 ^ ) е - “ ' ) ' - t ° ) < « 4Я (21) к = 1, 2, ... .
( к ) ( 6 ) „
В этих неравенствах « 4 и «у — положительные вещественные числа, t > ф . Таким образом, все функции y ( 1 ) ( t, х ) , к =1,2, ... определяются однозначно. Докажем, что ряд
У ( 1 ) ( t , х ) = £ цМ к') ( t , х ) (22)
к =° ' )
сходится при достаточно малых значениях параметра р на множестве ||х|| < г при t > t 0 , г > 0 — любое конечное. Для этого воспользуемся оценками
I^ ( к 1 ) ( t -x )| ^ ^ ( к ) Г, (23)
||gradV^ ( х)|| < 2Т2Йг, (24)
- ' и «
положительные веществен
||В ( р)|| < ^ Р к^ ( к ) , к = 0, 1, 2, ... . (25)
ные постоянные, t > t°. Следовательно, для к = 0 функция y^ (t, x) найдена. Далее из системы (12) найдем v/,9 (t, x), к =1,2,.... Из системы (12) для каждого к > 1 можно выделить полную производную от функции
у ( 4 ) ( t > х )
по времени t на решениях систе мы. Для каждого к > 1 справедливы соотно шения
Vy ( t ’ x )1 ( 14 ) = - ( grad VW ( x ) , v ( tО к = 1, 2, ... .
Отсюда
^ 6 ) ( t , х ) = " I ( sradV'^ ( х ( т >^ ) ) > V ( т ) ) ^ т , к = 1, 2, ... . (20)
Оценки (23) — (25) справедливы, так как:
-
а) имеет место равенство
ГО
ГО
VW ( t ’ x ) 5 - J ( 8rad ИЗ ( x ( t’ ^ ’ t ) )
’
t

< P'kf, при 11^1 < г, г > 0 — любое конечное и неравенство (18);
-
б) Ущ ( х )| < «( к )^2;
ГО
-
в) по условию теоремы ряд ^ р С В 6 ^
Ы0 является сходящимся в некоторой окрестности точки £0, а следовательно, существует ГО сходящийся ряд ^ pkN(k\ такой, что вы-к=0
полняется неравенство (25).
Рассмотрим далее ряд
-
У ( 1 ) ( ц ) = г Е ц^, (26)
к =0
который в силу условия (23) является мажорантным для ряда (22), т. е.
-
У ( 1 ) ( t , д ) = Г ц^1 ( t, д ). (27)
Следовательно, для того чтобы доказать равномерную сходимость ряда (27), нужно доказать сходимость ряда (26). С помощью соотношений
Ч ) ( 1 ) ( t , х )| =- ( grad y ( 0 ) ) ( х ) ’ V ( t ) )-
V ( 1 ) ( t , х )| = - ( gradVt ( 2 ) ( х ) ,
+ 1 [ ( grad V ( ( 0 2 ) ) ( х ) , В ( 1 ) ) +
V ( t ) ) +
+ ( grad V^ 1 ( х ) , В ( 1 ) ) ( grad V^ 1 ( t , х ) , В ( 0 ) )
^ ^^ ( t’ ^ ) ( 14 ) = " (^У^ ( * ) - V ( t 0 +
+ j ^ Е ( gfad ^Й ) ( х ) - ^ )( grad ry ( 0 ) ( t- х ) -
B(0))j и неравенств (23) — (25) определим зависимость между Р(о), P(i), . Из первого равенства (28) с учетом неравенств (2) и (24) имеем при t > to, ||х|| < г, 0 < г = const.
Из неравенств (29) и того, что ряд
ГО
V 9 k R^ сходится [10, §8, 9], следует схо- 6 = 0
димость ряда (26). Далее, если учесть основные свойства степенных рядов и то, что ряд го
Е ЦкР ( к \ сходится, получим сходящийся к = 0
го , ( к Л ряд Е 9 I Е R(k-l)^(l) I- А следовательно, к=0 (/=0 V ряд (26) сходится. Тогда по признаку Вей-ерштрасса о равномерной сходимости степенных рядов ряд (27) будет равномерно сходящимся на множестве ||х| < г, г > 0 — произвольное вещественное число. И, наконец, учитывая (19) и (21), функция V0(t) определяется из соотношения (13).
Таким образом, оптимальная функция Ляпунова V 0 ( t, х, р ) в достаточно малой р -окрестности точки S 0 для системы (5) определена, значит, по формуле (6) определяется и оптимальное управление. Теорема доказана.
Рассмотрим теперь случай, когда нулевое решение системы jc = А (s0) х (30)
асимптотически устойчиво, т. е. для системы (30) существует определенно-положительная квадратичная форма У^ (х)
такая, что
V$( х)|( 30 | = " х)
где !У(0) (х) является определенно-отрицательной квадратичной формой. В этом случае для системы хс = А (s) х
| V^ ( t, х )| < 2V2^B ( o ) P i r - В ( о ) Г,
|v(- 1 ( t , х )| < ^ 2Т2иВ ( 1 ) Р 1 +
+ 1 « 4 О)М о ) Е R ( 1 - 1 ) N ( 1 ) | г = ^г , (29)
-
2 / = 0 )
V У б ) ( t , х )| < 2 [ V^R ( k ) p 1 +
+ ^ «40)^0| Е R(i-i)N(i) |г = Rk)r’ в 5-окрестности точки S0(|s - S0 < 5) суще ствует функция Ляпунова в виде ряда
у ( 2 ) ( д ) = Е о ц ку (( ; ; ) ( д ) , (32)
где ^(5 ( х )
есть квадратичная форма, а
9 = s - S 0 играет роль малого параметра. Пусть минимизируется функционал
+го
J = J ж ( t, х, и ) dt t o
на решениях системы (1). Поставим теперь вопрос: существует ли в (33) такая функция ж (х, u,t), для которой известная функция Ляпунова (32), решающая вопрос об асимптотической устойчивости нулевого решения системы (31), была бы оптимальной функцией Ляпунова У0 (t,х) для системы (1)?
Функцию Ляпунова в этом случае для системы (1) выберем в виде
V (t, х, ц) = ^ рМЗ (х) + h=°
■lyv (t, х) + V°) (t), h=°
k.^
где выражение ^ р^т (х) является функ-h( цией Ляпунова для системы (31); V^' (t, х) — линейные формы относительно с ограниченными непрерывно дифференцируемыми коэффициентами; У0 (t) — скалярная непрерывно дифференцируемая функция.
Составим выражение
(
В [ У, t, х, р ] = I gradxУ ( t, х, р ) , £ р 6 ( Л / ^ х Х + к 6 = 0 х
+ В^и ) + v ( t ) j + W to ( t, х ) + uTu . где
W / 2 X ( р ,х ) + ( ит , и ) = ж ( t,х,и ) ,
W / 2 Х ( р , х ) = £ р М? ( х )
6=0 v 1
определенно-
положительная функция; W^ ( х ) ратичная форма, k = 0, 1, 2, ... .
квад-
Оптимальное управление определяется из уравнения (по теореме об оптимальной стабилизации [7])
I grad хУ ( t , х , р ) , f р 6 В^ I + М ° = 0. (35)
к 6=0
Тогда критерий качества (33) будет иметь вид:
?!
/ = J I - Е P6w(6) (х)+ у I gradxy (6 x, р), to к 6=04
1 I
£ р 6В ( б ) I + F ( х ) + \ ит , и ) pt. (36) 6 = 0 ) J
Здесь Р(х) есть определенно-положительная функция, которая определяется из уравнения Беллмана на оптимальном управлении, а функция У ( t , х , р ) имеет вид (34).
Теорема 2. Если нулевое решение системы (30) асимптотически устойчиво, то функция Ляпунова вида (32) будет оптимальной функцией Ляпунова для системы (1), а оптимальное управление определяется из уравнения (35).
Способ доказательства теоремы во многом схож с доказательством предыдущей теоремы. Отличие заключается в том, что здесь используется теорема об оптимальной стабилизации В. В. Румянцева [7].
Список литературы Эвентуальная оптимальная стабилизация управляемых неоднородных систем
- Альбрехт Э. Г. Лекции по теории стабилизации/Э. Г. Альбрехт, Г. С. Шелементьев. Свердловск: Уральск. ун-т, 1972. 273 с.
- Зубов С. В. Математические методы стабилизации динамических систем/С. В. Зубов, Н. В. Зубов. СПб.: Изд-во С.-Петерб. ун-та, 1996. 288 с.
- Зубов В. И. Лекции по теории управления/В. И. Зубов. СПб.: Лань, 2009. 496 с.
- Красовский Н. Н. Проблемы стабилизации управления движений/Н. Н. Красовский//Дополнение IV к книге Малкина И. Г. Теория устойчивости движения. М.: Наука, 1966. С. 475 514.
- Летов А. М. Динамика полета и управления/А. М. Летов. М.: Наука, 1969. 359 с.
- Пятницкий Е. С. О равномерной устойчивости при параметрических возмущениях/Е. С. Пятницкий//Дифференциальные уравнения. 1973. Т. 9, № 7. С. 1262 1274.
- Румянцев В. В. Устойчивость и стабилизация движения по отношению к части переменных/
- B. В. Румянцев, А. С. Озиранер. М.: Наука, 1987. 256 с.
- Салуквадзе М. Е. Аналитическое конструирование регуляторов. Постоянно действующие возмущения/М. Е. Салуквадзе//Автоматика и телемеханика. 1961. № 10. С. 1279 1287.
- Салуквадзе М. Е. Об аналитическом конструировании оптимального регулятора при постоянно действующих возмущениях/М. Е. Салуквадзе//Автоматика и телемеханика. 1962. № 6. C. 721 731.
- La Salle J. P. Rventual stability/J. P. La Salle, R. J. Rath//Proc. 2nd IFAC Congress Basel, 1963, Butterwoth, London. 1964. Vol. 2. P. 556 560.