Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры
Автор: Дыхта В.А., Сорокин С.П., Яковенко Г.Н.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Математика, управление, экономика
Статья в выпуске: 3 (11) т.3, 2011 года.
Бесплатный доступ
Для расширения сферы применимости методов теории управления, связанных с ре- шениями неравенств и уравнения Гамильтона-Якоби, вводится новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной систе- мы условий экстремальности и обладающих свойствами сильной и слабой монотонно- сти относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждаются также математические модели управляемых систем, в основе которых лежат группы и алгебры Ли. Рассматривается процедура, позволяющая при помощи «пробных» воздействий на систему выявить структурные свойства.
Короткий адрес: https://sciup.org/142185763
IDR: 142185763
Текст научной статьи Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры
-
I. Условия экстремальности в управляемых системах и задачах оптимального управления
Рассмотрим управляемую систему x = f (t,x,u) u(t) E U
на произвольном отрезке времени T = [t o ,t i ] и всевозможные процессы этой системы — пары функций (x,u) E AC(T,Rn) • L ^ (T,U ), удовлетворяющие (1) почти всюду на T .
Предполагая функцию f непрерывной и достаточно гладкой, определим функцию Понтряги- на:
H(t,x,p,u) = p • f (t,x,u)
и сопряженную систему p = -Hx(t,x,p,u), q = -Ht(t,x,p,u).
Экстремалью системы (1) назовем любой процесс (x,u), для которого существует решение (p(t),q(t)) = 0 системы (2), обеспечивающее условия максимума функции H по u E U :
H(t, x(t), p(t), u(t)) + q(t) = 0,
H(t, x(t), p(t), v) + q(t) 6 0
t∈T, при (t, v) E T • U.
В этом случае набор функций y = (x(t), u(t), p(t), q(t)) назовем биэкстремалью системы (1), а пару (p, q) — коэкстремалью. (По поводу этих понятий см. [1-4].)
Ясно, что оптимальное решение любой задачи динамической оптимизации в системе (1) (без поточечных фазовых и смешанных ограничений) следует искать среди биэкстремалей системы, удовлетворяющих дополнительно соответствующим краевым условиям. Но это уже будут биэкстремали задачи (соответственно экстремали и коэкстремали задачи). Отметим, что в подобной ситуации биэкстремали иногда называют каноническими экстремалями [5] и даже просто экстремалями [1, 2]. Компоненту q(t) сопряженной системы (2) при этом часто опускают, хотя в задачах с нефиксированными моментами времени её введение эффективно и почти неизбежно (хотя бы в неявной форме). Из (3) следует стандартное условие максимума функции H по u ∈ U, которым можно ограничиться в задачах управления на фиксированном отрезке T , что и делается далее. В этой ситуации условия экстремальности в системе (1) принимают вид канонической системы:
x = H p , p = -H x (4)
и условия максимума:
u G U * (t,x,p). (5)
Здесь
U*(t,x,p) = {u G U|u G Arg max H(t,x,p,u)} u∈U
— множество предэкстремальных управления (предстратегий). Обозначим через E множество троек функций (x,u,p), удовлетворяющих условиям (4), (5) на отрезке времени T .
Заметим, что при аналитическом исследовании конкретных задач оптимального управления с помощью принципа максимума Понтрягина (ПМП) имеют дело именно с системой (4), (5). Для дальнейшего важно иметь в виду связь системы условий экстремальности с решением уравнения Гамильтона–Якоби–Беллмана методом характеристик [6, 7] и его версиями при использовании неравенств Гамильтона–Якоби [3, 6, 8--10]. А именно, если в системе (1) рассматривается задача терминального управления со свободным правым концом, то есть при условиях
x(t o ) = x o , x(t 1 ) свободно, J(u) = l(x(t 1 )) ^ min, (6)
то имеет место равенство (для простоты считаем, что оптимальное управление существует)
min J (u) = min { l(x(t i )) | (x,u,p) G E ,x(t o ) = x o ,p(t i ) = — l(x(t i )) } , U = L ^ (T,U ). (7)
Его естественный аналог имеет место и для функции Беллмана семейства задач типа (1), (6) с варьируемой начальной позицией (t o ,x o ). Однако задач оптимального синтеза мы не касаемся.
-
II. Монотонные потенциалы канонической системы и их приложения
Перейдем к предлагаемому обобщению методов, основанных на использовании неравенств (и уравнений) Гамильтона-Якоби. Пусть F — множество функций S(t,x,p) : T х Rn х Rn ^ R непрерывных и гладких по (x,p) при фиксированных t G T и липшицевых по t при фиксированных (x,p) (тогда функции S суперпозиционно абсолютно непрерывны и даже липшицевы вдоль траекторий (x,p) канонической системы (4)). На таких функциях, которые условимся называть потенциалами, определим оператор r[S] = S полной производной по t в силу системы (4), то есть в краткой записи:
r[S ] = S t + S x H p
—
S p H x .
При фиксированной S G F правая часть есть функция (t,x,p,u) и можно определить функцию (или оператор)
r * [S] = maxr[S] = max S , (9)
если множество U компактно.
По аналогии с [8, 9, 11, 12] введем следующие понятия:
S сильно убывает (относительно системы (4) на множестве Ю : = T х Rn х R n ), если
r*[S](t,x,p) 6 СнаЮ или r[S](t,x,p,u) 6 СнаЮ х U;
S слабо возрастает, если
r * [S](t,x,p) > СнаЮ.
Заметим, что S — первый интеграл канонической системы, если r[S] = 0; он относится к сильно убывающим потенциалам. К ним относим и решения уравнения r * [S] = 0.
Поясним, что если S сильно убывает, то суперпозиция S (t, x(t), p(t)) монотонно не возрастает вдоль любого решения (x,p) системы (4) с графиком в Q. Предположим, что в системе (1) при любом выборе управления решение существует на T , а в системе (4) множество скоростей компактно и выпукло. Тогда если S слабо возрастает, то для любой точки (t * , x * , p * ) Е Q- существует хотя бы одно правостороннее решение системы (4), начинающееся в этой точке и имеющее график в Q, вдоль которого S(t, x(t), p(t)) не убывает. Введенное сочетание свойств монотонности потенциалов можно заменить на комбинацию «сильно возрастает — слабо убывает» путем замены оператора Г * на r * [S] = min uGu r[S] и смены знака неравенств на противоположный. Ясно, что эти формальные изменения соответствуют смене знака функции S Е F.
В частном случае — для функций, не зависящих от p , — потенциалы переходят в функции типа Ляпунова управляемой системы (1), если их трактовать достаточно широко, как в канонической теории оптимальности Гамильтона–Якоби [3, 9--12]. При этом неравенства (10), (12) трансформируются в стандартные неравенства Гамильтона–Якоби:
S t + H (t, x, S x )
6 0
> 0
на Q, на Q,
где
H (t,x,p) = max H (t,x,p,u) u ∈ U
-
— гамильтониан. (В этом контексте отметим, что мы называем систему (4) канонической, а не гамильтоновой, в которую она переходит при замене функции Понтрягина H на H, то есть при выборе управления из (5). Однако это требует нетипичной гладкости гамильтониана.)
Как и в случае стандартных потенциалов (не зависящих от p) сильно монотонные функции позволяют получать внешние оценки множества соединимых точек (множества достижимости) канонической системы и оценки снизу целевого функционала задачи оптимизации, следовательно, с их помощью можно получать достаточные условия оптимальности. Напротив, слабо монотонные потенциалы дают внутренние аппроксимации множества соединимых точек системы (4) и оценки сверху целевого функционала. Таким образом, они приспособлены для получения необходимых условий оптимальности, а также методов улучшения неоптимального управления по схеме работ [9, 11, 13], см. также ниже п. 4.
Ограничимся здесь одним из результатов.
Обозначим через R [ a,b ] множество точек, соединимых решениями системы (4) на отрезке [a,b] С T , то есть
R [ a,b ] = {q := (x(a), P(a); x(b), P(b)) l (x( - )> P0) - решение (4) на [a,b]}.
Теорема 1. Пусть X C F — произвольное множество сильно убывающих потенциалов. Тогда имеет место включение
R [ a,b ] C E [ a,b ] (X), где множество E [ a,b ] (X) состоит из векторов q = (x a ,p a ; Х ь ,р ь ), удовлетворяющих системе неравенств
S(Ь,х ь ,р ь ) - S(a,X a ,P a ) 6 0 V S Е X. (13)
Вспоминая равенство (7), сформируем следующую конечномерную задачу оптимизации, вспомогательную (терминальную) по отношению к задаче управления (1), (6):
l(x) ^ min; q Е E T (X),
где множество E t (X) соответствует [a,b] = T и учету условия x(t g ) = x g .
Следствие 1. а) min u GU J (u) > min qGE T (S) l(x) =: ^(X);
-
б) если для управления и Е U и соответствующей траектории X найдется такое множество X C F сильно убывающих потенциалов, что l(x(t i )) = ^(X), то и — оптимальное управление.
С учетом предваряющих пояснений эти утверждения почти очевидны. Отметим лишь, что при формировании множества E T (X) условия трансверсальности для котраекторий не обязательно считать выполненными (соответствующие примеры имеются в [3]).
Следствие 1 распространяет достаточные условия оптимальности с множеством сильно монотонных функций типа Ляпунова на случай потенциалов и формально охватывает их. Хотя к настоящему моменту времени не накоплен достаточный опыт работы по изложенной схеме, представляется, что альтернативные варианты могут не уступать ей в эффективности. Опишем их кратко.
-
1) Переход к стандартным потенциалам. Если множество X достаточно богато, то по его функционально независимым наборам из n потенциалов можно построить некоторое множество стандартных сильно монотонных потенциалов (путем ввостановления функции по заданному градиенту) и далее действовать по традиционной схеме. В этом случае оценочное множество (13) и ограничения терминальной задачи (14) будут подмножествами фазового пространства, что более естественно. Например, для управляемых L-систем, обладающих набором из n первых интегралов канонической системы (4), линейных относительно импульса p, этот путь может оказаться особенно эффектным, и не только для анализа ПМП, приведенного в [14].
-
2) Множество стандратных потенциалов, построенных по варианту 1), можно использовать в модифицированных условиях оптимальности Каратеодори и Кротова [9, 10], рассматривая соответствующий обобщенный лагранжиан задачи (см. [15] и конструкцию K -функций в [16]).
Для иллюстрации рассмотрим элементарный
Пример 1. задачи оптимального управления в одномерной L-системе:
x = (x — 1)u, u E [0,1], x(0) = 0, J = x 3 (1).
Условие ПМП таковы: H = p(x — 1)u, p = —pu, p(1) = —3x2(1), p(x — 1)u ^ max; u E [0,1] (15)
(то есть H u (x,p)u ^ max; u E [0,1]).
Во-первых, заметим, что H u = 0, то есть S 1 (x,p) = p(x — 1) — первый потенциал, диктуемый теорией L-систем. Он является частным решением неравенства сильной монотонности (11):
[(x — 1)S x — pS p ]u 6 0.
Но оно имеет, как легко убедиться, с учетом краевых условий еще два решения: S 2 (x) = x и S 3 (p) = — p.
Далее, естественное использование S 1 для упрощения ПМП, описанное в [14], предписывает заменить условие максимума из (15) на следующее: cu ^ max; u E [0,1], то есть u E sign c, где константа с зависит от искомой траектории (x,p) через равенство S 1 = с. Возникает необходимость перебора вариантов значений c при выполнении условий
-
— 3x 2 (1)(x(1) — 1) = с, x(1) 6 0 ( это дает S 2 ).
Отсюда с > 0 и возможны два случая:
-
(а) с = 0, тогда x(1) = 0, откуда р * = 0, x * = 0, u * = 0 — особая биэкстремаль задачи;
-
(б) с > 0, тогда u = 1, x(t) = 1 — e t — неособая экстремаль.
Поскольку задача невыпуклая, то это все, что дает ПМП. Так как оптимальное управление в задаче существует, то очевидно, что u — решение задачи. Однако интересно, что дают формальные методы без привлечения теоремы существования.
Покажем, что особое управление u * = 0 не оптимально (заметим, что все локальные условия оптимальности оказываются не эффективными в силу глубокого вырождения этой экстремали). Воспользуемся конструкцией улучшения управления из [9, 11]: так как S 2 слабо (и сильно) убывает, то для любой траектории x( - )
x(1) — J(u * ) = x(1) 6 0 и, следовательно, x 3 (1) — J(u * ) 6 0, что и требовалось.
Установим теперь оптимальность u = 1, пользуясь достаточными условиями следствия 1 с учетом замечания 1). Потенциал S 1 порождает (из равенства S x = р = c/(x — 1)) функцию
S (t,x) = ln(1 — x)£(t), где ((t) > 0 — произвольная гладкая функция. Для нее (см. (9))
с
r * [S ] = max S = ((4+ 1 = 0, u G U ((t)
если выбрать ((t) = ((0)e - t , ((0) > 0. При этой ( S (t,x) удволетворяет уравнению Гамильтона-Якоби и, следовательно, сильно убывает. Положив теперь в следствии 1 X = { S } — одноэлементное множество, убеждаемся, что xq1) является решением терминальной задачи (14). Это и означает оптимальность управления u.
-
III. Системы с алгебраической структурой
Определение 1 [14, 17]. Система с управлением u l (в (1) f (t,x,u) = +(x)u)
n xk = X +k (x)ul(t), k =i,n, (16)
l =1
называется L-системой, если для функций +k(x) выполнены условия det||+k (x)||=0, (17)
где обозначено
[X i ,X j ] = X C j X k , C k = const, i,j, k = 1,n, k =1
n k∂
^i dxk, l = 1,n, k=1
[X i ,X j ] — коммутатор операторов (19):
n
XX ] = X { X i + (x)
k =1
- X ^(x)} ..
Пример 2. Уравнение Ньютона ms = u(t) — es 2 , определяющее одномерное движение управляемой точки при наличии сопротивления пропорционального квадрату скорости, погружается в L-систему
(x \ / 1 2x x2 \ / u1 \ y = 0 2 2x u2 (21)
z У у 0 0 ey У \ и3 У при следующей специализации переменных:
x = ms, y = — 2se/m, u 1 = u(t), u 2 = 0, u 3 = — в/(т) 2 .
Для соответствующих системе (21) операторов (19)
X 1 = I-, X 2 = 2xX +2 ^, X 3 = x2 X + 2x^ + e y (22)
∂x ∂x ∂y ∂x ∂y ∂z выполняется условие (18) с постоянными C12 = 2, С2з = 1, С3з = 2 (здесь и далее приводятся только ненулевые структурные постоянные Cikj , удовлетворяющие условию i < j). Третье уравнение в (21) добавлено, чтобы матрица в (21) стала квадратной и для нее были бы справедливы условия (17), (18).
Условия (17), (18) удостоверяют, что операторы (19) могут быть приняты за базис алгебры Ли, которой соответствует просто транзитивная n-параметрическая группа:
x k = g k (x 0 , ..., x o , v 1 , ..., v n ), k = 1,n,
определенным образом построенная по базисным операторам (19) [14, 20]. Любая пара { u(t), T } , где u(t) — конкретное подставленное в (15) управление, определяет преобразование пространства R n (x): сдвиг вдоль решений x(t) начальных точек x g = x(0) в конечные x(T ). Показывается [19], что для каждой пары { u(t), T } найдется набор параметров v 1 . ..., v n , определяющий при помощи (23) соответствующее паре { u(t), T } преобразование сдвига вдоль решений системы. Показывается также [17, 19], что по функциям v k (x), задающим L-систему (15), строится система уравнений для нахождения генераторов n-параметрической группы симметрий системы (15). Опуская вычисления, приведем уравнения группы симметрий для системы (21):
__ x + T i ( e y — xz )
x = 1—T1Z , y = y + T2 - 2ln(1 - Tiz),
~ _ z ( e T2 — T 1 T 2 + T 3 )
z 1 — T 1 z .
Каждому набору параметров T i , T 2 . T 3 соответствует замена переменных в (21), не меняющая вид правых частей, и любое решение u(t), x(t). y(t). z(t) системы (21) группа переводит в решение u(t), x(t), y(t), z(t) (функции u(t), x(t), y(t), z(t) подставляются в правую часть уравнений группы).
-
IV. Классы эквивалентности для L-систем
Для L-систем справедлив следующий результат, который приведем без доказательства. Теорема 2 [14, 20]. Две L -системы: (15) и n zk = X SPk ИМ k = 1.n.
l =1
удовлетворяют условиям (17)--(19) с одними и теми же постоянными C i k j в (18) тогда и только тогда, когда они связаны диффеоморфизмом z = z(x).
Если системы (15), (24), связанные диффеоморфизмом x О z, считать эквивалентными, то каждому классу эквивалентности соответствуют постоянные C i k j :
' x k = E / =i V k (xW
^ {C } .
< | x О z zk = Pn=i Vk(z)u1
Соответствие — взаимно однозначно: по структурным постоянным C i k j вычисляется некотoрый базис X i . .... X n алгебры Ли [14, 20], по операторам X j определяется представитель (15) класса эквивалентности (25) с возможностью диффеоморфизмом перейти к другому представителю. Набор C i k j являет собой пример инвариантной математической модели динамической системы. По этому набору можно исследовать те свойства системы, которые сохраняются при заменах переменных: управляемость, структура оптимального управления и т.д. Aлгебраическая структура, определяемая C i k j , позволяет строить в соответствующем классе эквивалентности (25) представители специального вида: линейного, билинейного, двухуровневого, блочного и т.д.
Пример 3. Линейная стационарная (автономная) управляемая система (A = || а ^ | , B = || b k || — числовые матрицы)
x = Ax + Bu, x Е Rn. u E R.
погружается в класс L -систем:
x0 VP 0 W 1 A
5c ) у Ax E J у Bu )
(E — единичная матрица) добавлением к (26) верхнего уравнения. Проверка для (27) условия (18) приводит к постоянным в (18): C0k = —ak, l.k = 1.n (нумерация столбцов в (27) и соответствующих операторов в (19) начинается с номера 0). Постоянные ClQk = —alk, l.k = 1.n, определяют инвариантную модель { Cikj } соответствующую классу эквивалентности (25), которому принадлежит система (27), то есть в соответствии с теоремой 2 любая, в том числе и нелинейная, неособенная замена переменных в (27) приведет к L-системе (24) с таким же, как у (27), набором постоянных Cl№ = —ak, l,k = 1,n, в (18). Теорема 2 дает ответ и на вопрос: возможно ли конкретную нелинейную систему заменой переменных привести к линейному виду? Возможна тогда и только тогда, когда система является системой с постоянными C0k = -ak, l,k = 1,n.
У следующих трех механических систем соответствующие L-системы принадлежат одному и тому же классу эквивалентности (25), то есть постоянные C i k j в (3) у систем совпадают.
Пример 4. Одномерному линейному осциллятору x + x = 0
соответствует L-система (1) (x 2 = x)
с постоянными C i k j в (18):
x 1
de 2
x 3
1 x 3 - x 2
1 0 u
C 12 = 1,
C 13 = —1.
Пример 5. Тело с неподвижной точкой, с осью динамической симметрии — первой главной осью инерции (B = C ), с управляющим моментом M , направленным по третьей главной оси. Динамические уравнения Эйлера имеют вид
Р = 0, q = BBA Рг, r = abb pq + B m.
Переход на поверхность p = const, выбор масштабов для времени t ^ at и управления М ^ и = вМ приводят к уравнениям q = r, r = —q + и, которым соответствуют такие же, как в примере 3: L-система (29) и постоянные Cikj (30).
Пример 6. Точка движется в плоскости ( x 2 , x 3 ) под действием силы F , перпендикулярной скорости V . Aнализ показывает, что при таком движении скорость V не меняется по величине. Введение переменной x 1 — угла между осью x 2 и направлением скорости V — и выбор масштабов для x 2 , x 3 , F приводит к уравнениям

u cos x1
sin x 1
0 cos x 1
0 sin x 1
— sin x 1 cos x 1

Проверка условий (17), (18) показывает, что система (31) есть L -система с такими же, как в примерах 3, 4, постоянными (30).
Вследствие теоремы 2 заменой переменных можно добиться совпадения матриц Ц^ (x) ^ в правых частях систем (29) и (31), но то, что у систем по-разному специализированы управления u i , приводит к существенным различиям их свойств с точки зрения возможностей управления. Дополнительное требование — одинаковое расположение в пространстве R n у двух систем множеств U допустимых управлений — приводит к понятию более сильной зквивалентности, чем было определено ранее. Этот аспект в данной работе не затрагивается.
-
V. Идентификация алгебраической структуры
Инвариантная модель { C i k j } есть результат завершения следующего процесса: имеется реальная система с входными переменными — управлениями u = (и 1 , ..., u n ) и выходными переменными x = (x 1 , ..., x n ), системе сопоставляется математическая модель (15), специальные свойства (17)--(19) которой приводят к взаимно однозначному соответствию (25). L-система (15) в приведенном процессе играет промежуточную вспомогательную роль «производителя» структурных постоянных C i k j , и естественно поставить вопрос о нахождении чисел C i k j , экспериментируя с исходной реальной системой. К ответу на вопрос приводит следующая последовательность воздействий на систему. Для нахождения постоянных C α k β с фиксированными нижними индексами а и в в а-й канал подается единичное воздействие: и1 = 51 а . За малое время т система из начального состояния x 0 переходит в состояние x 1 . Затем единичное воздействие подается только в в-й канал: и1 = 8 в , за то же время т происходит переход x i ^ x 2 - В течение того же времени т подается вход и1 = —51а , и затем то же время т — вход и1 = —8 в . Состояние системы возвращается в окрестность начального:
x0 → x1 → x2 → x3 → x4 ≈ x0, но с рассогласованием. На последнем шаге подбирается такой постоянный вход U, чтобы система за время т = т2 осуществила переход xo ^ x4 за один шаг. Структурные постоянные равны
C ie = U i . (32)
Описанная процедура повторяется для всех пар индексов α, β. К результату (32) приводят прямые вычисления, основанные на системе (15). Представим начальный и конечный этапы:
x k = x k +тy a (x o ) + 2 т 2 P n =i <лы dsB x^ +о(т 2 ),
тк _ к , 2 Pn ( l д^в ml d^aa ) i 2\ _ x4 = xo + т 2=1=1 I r a dxl - г в dxl / + 0(т ) = x=x0
=xk+т 2 Pn=i Cae yk (xo)+о(т 2), использовано свойство (18) L-системы. С другой стороны:
n xk = xk + т X yk(xo)ul + о(т), l=1
что с учетом формулы (33), условия (17) и т = т 2 с точностью до о(т 2 ) определяет результат (32).
Замечание 1. Формула (32) асимптотически — при т ^ 0 — точна.
Замечание 2. Приведенная процедура носит инвариантный характер: в каких бы переменных x не измерялся выход, результат (32) один и тот же.
Замечание 3. Результат (32) не зависит от начального состояния x 0 , в окрестности которого проводится процедура.
Замечание 4. Пусть система имеет вид (15), выполняется условие (17): det || y k (x) ^ = 0, но не выполняется условие (18), то есть (15) не L-система. Определим постоянные C α i β так, чтобы в равенстве (33) совпали коэффициенты при τ 2 , а именно:
Ci ав =
n iX k,l=1
ϕ lα ∂∂ϕx kβl
-
ϕ l ∂ϕ kα ϕ β ∂x l
ψ ki
где || ^ k (x) П = ll ^ k (x) H 1 . Описанная процедура, примененная не к L-системе (15), приводит к постоянным, совпадающим с (34). Проверка показывает, что постоянные C α i β , определенные формулой (34), удовлетворяют условиям, которым должны удовлетворять структурные постоянные алгебры Ли [20]: антисимметрия по нижним индексам и тождество Якоби. Эта алгебра инвариантно аппроксимирует исходную систему в окрестности выбранного начального положения x 0 .
Работа выполнена при финансовой поддержке СО РАН (интеграционный проект СО РАН–УрО РАН № 85), РФФИ (гранты 11-01-00672-а, 10-01-00228) и АВЦП Развитие научного потенциала высшей школы 2009–2010 гг. (проект 2.1. 1/3604).
-
VI. Заключение
С целью расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона–Якоби, введен новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности, и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждена также возможность выявления структурных постоянных алгебры Ли, моделирующей управляемый процесс.
Список литературы Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры
- Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.А. Необходимое условие в оптимальном управлении. -М.: Наука, 1990. -319 с.
- Milyutin A.A., Osmolovskii N.P. Calculus of variations and optimal control//American Math. Society, Providence. Rhode, Island. 1998. -372 p.
- Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении//Итоги науки и техники. Совр. математика и ее приложения. -2006. -Т. 110. -С. 76-108.
- Антипина Н.В., Дыхта В.А. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума//Изв. вузов. Математика. -2002. -№ 12. -С. 11-21.
- Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. -М.: Наука, 1979. -429 с.
- Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. -Москва-Ижевск: Институт компьютерных исследований, 2003. -336 с.
- Bardi M., Capuzzo-Dolcetta I. Optimal Control and Viscosity Solutions of Hamilton-Jacobi-Bellman Equations. -Boston: Birkh auser, 1997. -570 p.
- Clarke F.H., Ledyaev Yu. S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. -New York: Springer-Verlag, 1998. -(Grad. Texts in Math.; V. 178).
- Дыхта В.А. Неравенства Гамильтона-Якоби в оптимальном управлении: гладкая двойственность и улучшение//Вестн. Тамбов. ун-та. Сер. Естественные и технические науки. -2010. -Т. 15, вып. 1. -С. 405-426.
- Dykhta V., Samsonyuk O. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems//European Journal of Control. -2011. -V. 17, N 1. -P. 55-69.
- Дыхта В.А. Некоторые приложения неравенств Гамильтона-Якоби в оптимальном управлении//Изв. ИГУ. Математика. -2009. -Т. 2. -С. 15-28.
- Дыхта В.А., Сорокин С.П. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами//Автоматика и телемеханика. -2011. -№ 6. -С. 48-63.
- Аргучинцев А.В., Дыхта В.А., Срочко В.А. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума//Изв. вузов. Математика. -2009. -№ 1. -С. 3-43.
- Яковенко Г.Н. Теория управления регулярными системами. -М.: БИНОМ. Лаборатория знаний, 2008. -264 c.
- Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. -М.: Наука, 1973. -448 c.
- Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. -М.: Наука, 1974. -479 c.
- Яковенко Г.Н. Симметрии по состоянию в системах с управлением//Прикладная механика и математика: межвед. сб. науч. трудов. -М.: МФТИ, 1992. -С. 155-178.
- Яковенко Г.Н. Математическое моделирование эволюционных процессов алгебрами Ли//Труды Международной конференции Математика. Экономика. Образование. Ряды Фурье и их приложения. Т. 10, вып. 1/под ред. Б.И. Голубова, И.С. Гудович, И.Я. Новикова. -Воронеж: Воронежский государственный университет, 2002. -С. 101-107.
- Яковенко Г.Н. Дифференциальные уравнения с фундаментальными решениями: Софус Ли и другие. -М.: Физматкнига, 2006. -112 с.
- Овсянников Л.В. Групповой анализ дифференциальных уравнений. -М.: Наука, 1978. -400 с.