Сравнительный анализ эффективности проекционного метода нелокального улучшения управления

Бесплатный доступ

В статье рассматривается проекционный метод нелокального улучшения и приводится результат численного эксперимента по анализу эффективности этого метода в нелинейной задаче оптимального управления.

Задача оптимального управления, нелокальное улучшение, вычислительный эксперимент, сравнительный анализ, проекционный метод, функция понтрягина, численный метод

Короткий адрес: https://sciup.org/14835129

IDR: 14835129

Текст научной статьи Сравнительный анализ эффективности проекционного метода нелокального улучшения управления

Приближенные методы решения задач оптимального управления продолжают развиваться по разным направлениям в работах многих исследователей (A.B. Аргучинцев, A.C. Булдаев, В.И. Гурман, В.А. Дыхта, В.И. Зубов, В.Б. Колмановский, В.Ф. Кротов, В.А. Срочко, А.И. Тятюшкин, Р.П. Федоренко, Ф.Л. Черноусько и другие). В частности, В. Ф. Кротов в работе [9] описал общий метод глобального улучшения управлений, близкий к так называемым нелокальным методам улучшения в дифференциальных системах, разрабатываемых в работах В. А. Срочко и А. С. Булдаева [2, 3, 4, 7].

Методы нелокального улучшения в отличие от локальных методов (например, метода условного градиента) не рассматривают операции слабого или игольчатого варьирования управления на каждой итерации с параметрическим поиском (который является довольно трудоемким) в достаточно малой окрестности улучшения. Основой методов нелокального улучшения в различных классах задач оптимального управления являются формулы приращения целевых функционалов без остаточных членов разложения. В результате последовательного решения задач улучшения управления генерируется релаксационная последовательность управлений, обладающая возможным свойством улучшать неоптимальные управления, удовлетворяющие принципу максимума, включая особые управления.

В статье проводится сравнительный анализ эффективности проекционного метода нелокального улучшения на тестовых задачах.

  • 1.    Постановка задачи

Рассматривается следующий класс задач оптимального управления:

x (t ) = f (x (t), u (t), t), x (t0 ) = x 0, u (t)g U, t g T = [t0,ti], t1

Ф(u) = ф(x(t)) +jF(x(t), u (t), t) dt ^ inf,(3)

t 0

где x ( t ) g R" - вектор состояния, u ( t ) g Rr - вектор управления. В качестве допустимых управлений рассматривается множество V кусочно-непрерывных на [ 1 0, t 1 ] функций со значениями в выпуклом компактном множестве U с Rr . Промежуток управления - [ 1 0, t 1 ] и начальное состояние x 0 заданы. Задача (1) - (3) является задачей оптимального управления со свободным правым концом.

Предполагаются выполненными следующие условия:

  • 1)    функция ф ( x ) непрерывно-дифференцируема на R , вектор-функция F ( x , u , t ) , f ( x , u , t ) и их производные Fx ( x , u , t ) , Fu ( x , u , t ) , fx ( x , u , t ) , f u ( x , u , t ) непрерывны по совокупности аргументов ( x , u , t ) на множестве R x U x T ;

  • 2)    функция f ( x , u , t ) удовлетворяет условию Липшица по x в

Rn х U х T с константой L 0

|| f ( x , u , t ) - f ( y , u , t )|| < Lx - y ||.

Эти условия гарантируют существование и единственность решения x ( t , v ) , t e [ t 0, t 1 ] системы (1) - (2) для любого допустимого управления v ( t ) , t e [ t o , t i ] .

Решать поставленную задачу (1) - (3) будем при помощи модифицированного проекционного метода нелокального улучшения управлений с дифференциально-алгебраической сопряженной системой [2, 3, 4].

Сначала рассмотрим саму дифференциально-алгебраическую сопряженную систему [3, 4]:

p (t ) = -Hx (Р (t),x0 (t), u0 (t), t)-r (t), p (t1 ) = -Фx (x0 (t1))- q,

H ( p ( t ) , x ( t ) , u 0 ( t ) , t ) - H ( p ( t ) , x 0 ( t ) , u 0 ( t ) , t ) =

H Hx (p (t), x0 (t), u0 (t), t) + r (t), Ax (t )) ,(6)

ф( x (t1))-ф( x0 (t )) = ^p( (x0 (t1))+q,Ax (t1)}, где H (p, x, u, t ) = pp, f (x, u, t )^-F (x, u, t) - хорошо известная функция Понтрягина, Hx (p, x, u, t), фx (x (t1)) - производные соответствующих функций по x. u0 (t) e V - допустимое начальное значение управление, x0 (t) - решение уравнения (1) для этого начального управления, Ax (t) = x (t1) - x0 (t1).

Величины r ( t ) и q всегда можно выразить из соответствующих алгебраических уравнений (6) и (7) (возможно и не единственным образом) [3, 4] и, таким образом, система (4) - (5) всегда может быть сведена к вспомогательной дифференциальной сопряженной системе.

Следует заметить, что если в задаче (1) - (3) f , F линейны по x , то из [3, 4] следует, что r ( t ) = 0 , а если ф линейна, то q = 0 . В нелинейном случае, если в некоторый момент времени t e T x 0 ( t ) = x ( t ) , то полагаем r ( t ) = 0 . Если при этом t = t 1 , то q = 0 .

Далее для допустимого управления u е V и фиксированного параметра a 0 рассмотрим проекционное отображение:

u a ( p , x , t ) = P u ( u ( t ) + a Hu ( p , x , u , t ) ) , t g [ t 0 , t 1 ] , где P U - оператор проектирования на множество U в евклидовой норме, H u ( p , x , u , t ) - производная функции Понтрягина по управлению.

Дифференциальный принцип максимума (ДПМ) в задаче (1) - (3) для управления u е V с помощью отображения u a представляется в виде:

u ( t ) = u a ( p ( t , u , v ) , x ( t , u ) , t ) , t g [ t 0 , t 1 ] ,                  (8)

где p ( t , u , v ) - сопряженная переменная. Для выполнения ДПМ достаточно проверить условие (8) хотя бы для одного a >  0.

Для заданных a > 0 и u0 е V определим отображение wa с помощью соотношения wa (p,x,t,5) = Pu (u0 (t) + a(Hu (p,x,u0 (t),t) + 5(t))), t g[t0,ti] .

Параметр проектирования a 0 рассматривается в качестве параметра возмущения . Уравнение (1) в данном случае примет вид:

x (t ) = f (x)(x (t), wa (p (t) , x (t), t, 5 (t)), t), x (10 ) = x0. (9) Итерационный процесс при фиксированном a > 0 и заданном u0 е V имеет вид uk+1 (t) = Pu (u0 (t) + aHu (pk (t),xk (t),uk,t) + 5(t)), t е [10,ti], где на начальной итерации (нулевой итерации) задается начальное приближение u0 е V. 5 (t) определяется из уравнения

H ( p ( t , u 0, uk ) , x ( t , uk ) , uk ( t ) , t ) -

- H ( p ( t , u 0, uk ) , x ( t , uk ) , u 0 ( t ) , t ) =

HHu ( p ( t , u 0, uk ) , x ( t , uk ) , u 0 ( t ) , t ) + 5 ( t ) , uk ( t ) - u 0 ( t )^, (10) xk ( t ) , pk ( t ) являются решениями системы (9) и дифференциальноалгебраической сопряженной системы (4) - (7) на k итерации, соответственно. В случае линейной по управлению задаче (1) - (3) 5 ( t ) = 0 , t е T . [3, 4].

Вычисляя 5 ( t ) , r ( t ) и q мы можем применить некоторые условия [5, 6]. Сначала опишем условия для нахождения 5 ( t ) :

  • 1.    Если все компоненты u k ( t ) = u 0 ( t ) , то алгебраическое уравнение (10) выполняется тождественно. В этом случае компоненты 5 ( t ) могут принимать произвольное значение, тогда, выбираем значения всех компонент 5 ( t ) , исходя из непрерывности, т.е. полагая равным значению 5 ( t ) в соседнем левом узле. При этом, если t = t 0 (начальный момент), то слева нет узла, а значит, выбираем любое значение, например 5 ( t 0 ) = 0 , для всех компонентов;

  • 2.    Если, хотя бы одна компонента вектора u k ( t ) * u 0 ( t ) , то именно для этой компоненты однозначно определяется соответствующая компонента 5 ( t ) из формулы (10), один из вариантов такого

определения:

Az HI ( p , X , u , t )       z . X Z X X

Sk ( t ) =——-----TT-- H^p^t , u °, uk ), x^t , uk ), u 0 ( t ) , t^ ,

A uk (t)           v x x                / где Au(t)H(p, x, u, t) = H(p (t, u0, uk), x(t, uk), uk (t), t)-

H(p(t,u0,uk),x(t,uk),u0 (t),t) и Auk (t) = uk (t)-u0 (t). Причем все остальные компоненты нужно положить равными по непрерывности значениям в левом соседнем узле. Но если при этом t = 10, то полагаем, что эти остальные элементы равны нулю.

Теперь покажем условия для определения r (t) и q. Но для начала перепишем дифференциально-алгебраическую сопряженную систему (4) - (7) в итерационном виде:

pk+1 (t) = -Hx (pk+1 (t),x0 (t),u0 (t),t)-r(t),(11)

pk+1 (t ) = -Фх (x 0 (t1))- q,

H ( pk ( t ) , xk ( t ) , u 0 ( t ) , t ) - H ( pk ( t ) , x 0 ( t ) , u 0 ( t ) , t ) =

H Hx (pk (t), x0 (t), u0 (t), t) + r (t), xk (t)- x0 (t )^,(13)

^(xk (t1))-^(x0 (t1 )) = (^x(x0(t1))+q,xk (t1)-x0 (t1)). (14)

где pk ( t ) = p ( t , u 0, uk ) , xk ( t ) = x ( t , uk )

Таким образом, вычисляя

r (t) и q из уравнений (11) - (14) необходимо учитывать следующие условия:

  • 1.    Если все компоненты xk ( t ) = x 0 ( t ) , то алгебраическое уравнение (13) выполняется тождественно. В этом случае компоненты r ( t ) могут принимать произвольное значение, тогда, выбираем значения всех компонент r ( t ) , исходя из непрерывности, т.е. полагая равным значению в соседнем правом узле. При этом, если t = t 1 (конечный момент), то справа нет узла, следовательно, выбираем любое значение, например r ( t 1 ) = 0 для всех компонентов. Также если в этот конечный момент выполняется xk ( t 1 ) = x 0 ( t 1 ) уравнение (14) обращается в тождество, поэтому задаем, например, q = 0 для всех компонентов;

  • 2.    Если, хотя бы одна компонента вектора xk ( t ) ^ x 0 ( t ) , соответствующая компонента r ( t ) однозначно определяется именно для этой компоненты из формулы (13), один из вариантов определения:

  • 2.    Вычислительный эксперимент

Az HI ( p, X, U, t)        z . X Z X X rk (t)=       a --Hx (p(t,u°,uk ),x(t,uk ),u0 (t),t),

Axk (t)              x v x ’           ’

где                              A x ( t ) H ( p , x , u , t ) = H ( pk ( t ) , xk ( t ) , u 0 ( t ) , t ) -

H ( pk ( t ) , x 0 ( t ) , u 0 ( t ) , t ) и A xk ( t ) = xk ( t ) - x 0 ( t ) . Причем все остальные компоненты нужно положить равными по непрерывности значениям в правом соседнем узле. Но если при этом t = t , , то полагаем, что эти остальные компоненты равны нулю. Аналогичное, соответствует для q из уравнения (14).

Для сравнительного анализа рассматриваемого метода проведем вычислительный эксперимент. Вначале опишем общие параметры.

Вычисленные значения управляемых, фазовых и сопряженных переменных будем запоминать в узлах равномерной сетки с шагом дискретизации At = 10-3 на отрезке [10, t1 ]. В промежутках между соседними узлами сетки значение управления принимаем постоянным и равным значению управления в левом узле. Численный расчет задачи проводим до первого улучшения. Далее строим новую задачу, и повторяем итерационный алгоритм. В качестве критерия остановки выбираем условие

ф(uk+1 )-Ф(uk) - ф(uk ) 'е, где ^ > 0 - заданная точность (в примере е = 10-4). Эффективность методов также зависит и от алгоритмов, используемых для решения вспомогательных задач, например, интегрирование дифференциальных систем. По этой причине, численное решение фазовых и сопряженных задач Коши будем осуществлять методом Рунге-Кутта-Вернера пятого или шестого порядка точности с помощью библиотеки IMSL языка Fortran PowerStation 4.0 [1]. При вычислении 5 (t), r (t) и q принимаем условия, описанные выше, только внеся некоторое изменение: мы фиксируем один из r (t) равным нулю и проводим дальнейшее вычисление по обычным правилам. В качестве результата выбираем наилучшее решение

Пример 1. Оптимальная ориентация летательного аппарата в пространстве [8] .

  • x 1 ( t ) = x 3 , <  x 2 ( t ) = X 4 , x 3 ( t ) = - x 4 + u 1 sin u 2 x 4 ( t ) = x 3 + u 1 cos u 2

x1 (0) = 10, x2 (0) = 0, x3 (0) = 10, x4 (0) = 0, t e[0, t1 ].

Ф ( u ) = t 1 + 1000 ^ x f ( t 1 ) ^ min.

i = 1

Проведем расчет с помощью проекционного метода нелокального улучшения и сравним с результатами, полученными в [8]. Для решения задачи введем необходимые конструкции.

Функция Понтрягина для заданной задачи записывается следующим образом:

H ( p , x , u , t ) = p 1 x 3 + p 2 x 4 +

+ p 3 ( u 1 sin u 2 - x 4 ) + p 4 ( x 3 + u 1 cos u 2 ) .

Градиенты:

H x , = 0 , H x 2 = 0, H x 3 = p 1 + p 4 , H x 4 = p 2 - p 3 ,

H u = p 3 sin u 2 + p 4 cos u 2 , H u = p 3 u 1 cos u 2 - p 4 u 1 sin u 2 .

Дифференциально-алгебраическая сопряженная система запишется в следующем виде:

p1 (t) = 0, p1 (t1) = -2000x1 (t1)- q1, p2 ( t) = 0, P2 ( t1 ) = -2000x2 ( t1 ) - q2, p3 ( t ) = -P1 - P4 , P3 ( t1 ) = -2000x3 ( t1 ) - q3, p3 ( t ) = — P2 + P3 , P3 ( t1 ) = -2000x3 ( t1 ) - q4.

В исходной задаче f , F линейны по x , значит r ( t ) = 0 , г = 1,4 . Для нахождения q используем формулу:

^W^ x lM  0

qk ' t)        xk (t,)-x0 (t,)        9x (x ' t1'),

полученную из (14),   вместе с правилами описанными выше.

Итерационный процесс при фиксированном a 0 и заданном и 0 е V

U+1 (t) = Pu (и0 (t)+ aHu (P (t),xk (t),uk,t)+x(t)), t e[ t 0, t1 ] , где x (t) находится по правилу выше. В качестве начального приближения выбиралось управление и0 (t) = 0.

В таблице 1 приводятся результаты, полученные рассматриваемым методом (ПМНУ) и методами из работы [8] ( Ф * обозначает наилучшее значение функционала).

Таблица 1. Сравнительный анализ эффективности

Метод

Ф

Кол-во задач Коши

1

10.285456

47422

2

10.288656

100048

ПМНУ

10.290443

33907

Проекционный метод для данной задачи показал меньшую трудоемкость по количеству решенных задач Коши, хотя и уступил по точности решения. На следующих рисунках представлен рассчитанный оптимальный процесс (итоговые управление и фазовые траектории):

Рисунок 1. Фазовая траектория х 1 ( t )

Рисунок 2 . Фазовая траектория x 2 ( t ) , x 3 ( t ) , x 4 ( t )

Рисунок 3. Управление u 2 ( t )

Итоговое управление u 1 ( t ) = 1 , t e [0, t 1 ] не представлено.

Пример 2. Оптимальное управление потоком хладагента в химическом реакторе [10, с. 405 - 407]

Рассматривается задача стабилизации химического реактора, представляющая собой аппарат с мешалкой и подведенным каналом поступления хладагента:

Ф( u )= J (x2 (t) + x 22 (t)) dt ^ inf, 0

x ( t ) = - 2 ( x 1 + 0.25 ) + ( x 2 + 0.5 ) e^2 - ( x 1 + 0.25 ) u , x 1 ( 0 ) = 0.05 , x 2 ( t ) = 0.5 - x 2 - ( x 2 + 0.5 ) ee^ x , x 2 ( 0 ) = 0 , x 1 ( 0.78 ) = 0 , x 2 ( 0.78 ) = 0 , u ( t ) e [ - 1,1 ] , t e [ 0,0.78 ] .

Функции x 1 ( t ) , x 2 ( t ) описывают соответственно отклонения температуры и концентрации. Управление u ( t ) характеризует поток хладагента, регулирующего необратимую экзотермическую реакцию.

В [10] Kirk D. E производит редукцию к задаче конечномерной оптимизации за счет дискретизации по функциям состояния и управления, замены производных конечными разностями по схеме Эйлера. Число моментов дискретизации не указано. В результате в [10] им были получены следующие результаты: x 1 ( 0.78 ) = - 6.167 х 10 - 6 , x 2 ( 0.78 ) = - 0.631 x 10 - 6 , Ф * ~ 0.00220 .

Приведем решаемую задачу к виду (1) - (3), т.е. со свободным правым концом, следуя методу штрафов, при достаточно большом фиксированном штрафном коэффициенте M 0 :

Ф M = M (x12 (0.78) + x22 (0.78)) + x3 (0.78) ^ inf, x (t) = -2 (x1 + 0.25) + (x2 + 0.5) e^2 -(x1 + 0.25) u, x1 (0) = 0.05, x2 (t) = 0.5 -x2 -(x2 + 0.5) ё^, x2 (0) = 0, x3 (t) = x12 + x2, x3 (0) = 0 x1 (0.78) = 0, x2 (0.78) = 0, u (t)e[-1,1], t e[0,0.78].

Функция Понтрягина для данной образом:

задачи записывается следующим

H ( p , x , u , t ) =

25 x 1

= p 1 - 2 ( x 1 + 0.25 ) + ( x 2 + 0.5 ) e x + 2 - ( x 1 + 0.25 ) u

+

25 x 1

+ P 2 0.5 x 2 ( x 2 + 0.5 ) e 1 + 2

+ p 3 [ x + x 2 ] .

Градиенты:

,        . 50 ( x 2 + 0.5 ) 1 x 2 7 X

Hx = ( P i - P 2) —---- "ГТ" e ' -( 2 + u ) P i + 2 P 3 x i -

(xi + 2)

,„ \ (       \ 1°° ( x 2 + °'5 ) (23 - x )

( H x i ) x ' =( P ' " P 2 )------(^------ e' + 2 P 3 -

H x , = ( P ' - P 2 ) - P 2 + 2 P 3 x 2 , ( H x 2 ), = 2 P 3 , H x 3 = 0 -

( H x 3 ) x = 0 - H u =- P i ( x + 0-25 ) -

Запишем получившуюся модифицированную сопряженную систему, вычислив r ( t ) и q по методу с условиями описанными выше:

,        х 50 (x2 + 0.5),

А = ( P 2 - P i ) —7—е ' +( 2 + u ) P i - ( x i + 2 )

. L       \50(x + 0.5)(23-x) 25x7) , ,

-

2p3xi - (Pi - p2)ex +2 + p3 y (t), (                 (xi + 2)

P' (0.78) = -2Mx' (0.78) - My (0.78),

25 x 1

p 2 =( p 2- Pi) exi+2 + P 2 - 2 P 3x2 - P 3 У (t), p2 (0.78) = -2Mx2 (0.78) - My (0.78), p3 = 0, p3 (0.78) = -i.

где

y (t) = x (t, v)- x (t, u)

Будем решать с помощью проекционного метода нелокального улучшения (ПМНУ)

u*+1 (t) = P„ (u* (t) + aHu (pk (t),xk (t),uk (t),t)), t e T, где функции x* (t), pk (t) находятся в результате интегрирования фазовой и модифицированной сопряженной системы на текущем приближении. 5 (t ) = 0 так как задача линейна по управлению. В качестве начального приближения выбиралось управление u0 (t) = 1.

Проведем расчет ПМНУ для разных значений параметра a 0 и штрафного коэффициента M >  0 . Наилучшее расчетное значение функционала Ф , вычисленное по методу ПМНУ, наблюдалось для параметров a = 0.13, M = 2 .

Значения a >  0 и

M >  0

Значение

Ф

x 1(0.78)

x 2(0.78)

a = 0.13, M = 2

0.00200330

- 9.62 х 10 - 4

1.24 х 10 - 3

Для сравнения проведем расчет также стандартным методом проекции градиента (МПГ) при M = 2 , u 0 ( t ) = 1 , где в схеме параметрической оптимизации применим метод золотого сечения с погрешностью 10 - 3. Получаем следующий результат x 1 (0.78) = 8.79 хЮ- 4, x 2 (0.78) = 7.17 хЮ- 4, Ф * » 0.00200 .

Рассчитывая же методом условного градиента (МУГ), с аналогичной погрешностью параметрической оптимизации, приходим к следующим результатам x 1 (0.78) = - 5.77 х 10 - 4 , x 2 (0.78) = 2.07 х 10 - 3, Ф * ~ 0.00200 .

Метод

Значение Ф

x 1(0.78)

x 2(0.78)

МПГ

0.00200084

8.79 х 10 4

7.17 х 10 4

МУГ

0.00199673

- 5.77 х 10 - 4

2.07 х 10 - 3

Для более удобного анализа приведем все решения в одной таблице:

Таблица 2. Сравнительный анализ эффективности

Метод

Значение ф

x 1 (0.78)

x 2 (0.78)

Число задач Коши

МПГ

0.002000

8.79 х 10 - 4

7.17 Х 10 - 4

101

МУГ

0.001997

- 5.77 х 10 - 4

2.07 х 10 - 3

96

ПМНУ

0.002003

- 9.62 х 10 - 4

1.24 х 10 - 3

90

Методом Kirk D. E

0.00220

- 6.16 х 10 6

- 0.63 х 10 - 6

--------

Скорость сходимости ПМНУ для различных значений M >  0 зависела от выбора значений параметра a >  0 . Например, для M = 2 сходимость наблюдалась при а е ( 0;0.4 ) , где при очень маленьких шагах скорость сходимости была медленной. Лучшая скорость по количеству решенных задач Коши наблюдалась для а е ( 0.10;0.14 ) . При увеличении штрафного параметра, приходилось уменьшать а . При этом скорость сходимости также падала.

На следующих рисунках представлен расчетный оптимальный процесс (итоговое управление u ( t ) и фазовые траектории x 1 ( t ) , x 2( t ) ):

Рисунок 4 . Фазовые траектории

Рисунок 5 . Управление

Заключение

В рамках рассматриваемых расчетных задач рассматриваемый проекционный метод нелокального улучшения управления в целом показал лучшую эффективность по количеству расчетных задач Коши по сравнению с градиентными процедурами и другими методами, при приемлемой точности решения. При этом, в отличие от градиентных методов, требующих трудоемкую настройку процедур локального варьирования управления, настройка сходимости нелокального проекционного метода осуществляется только выбором одного настроечного параметра a >  0 .

Список литературы Сравнительный анализ эффективности проекционного метода нелокального улучшения управления

  • Бартеньев О. В. Фортран для профессионалов. Математическая библиотека IMSL. Часть 3//О. В. Бартеньев. -Москва: Диалог-МИФИ, 2001.-368 с.
  • Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем/А. С. Булдаев. -Улан-Удэ: Издательство Бурятского госуниверситета, 2008. -260 с.
  • Булдаев А. С. Модификация метода проекций для улучшения нелинейных управленй/А. С. Булдаев, О. В. Моржин//Вестник Бурятского госуниверситета. -2010. -Вып. 9: Математика, информатика. -С. 10-17.
  • Булдаев А. С. Улучшения управлений в нелинейных системах на основе краевых задач/А. С. Булдаев, О. В. Моржин//Известия Иркутского госуниверситета. Серия «Математика». -2009. -Т. 2, № 1. -С. 94-106.
  • Булдаев А. С. Условия улучшения и оптимальности в задачах оптимизации нелинейных управляемых систем/А. С. Булдаев, Г. Анхбаяр//Вестник Бурятского госуниверситета. -2014. -Вып. 9(2): Математика, информатикаю. -С. 3 -9.
  • Бурлаков И. Д. Анализ эффективности метода нелокального улучшения в задачах оптимального управления/И. Д. Бурлаков//Вестник Бурятского госуниверситета. -2014. -Вып. 9(2): Математика, информатика. -С. 10-19.
  • Срочко В. А. Итерационные методы решения задач оптимального управления/В. А. Срочко. -Москва: Наука, 2000. -160 с.
  • Горнов А. Ю. Вычислительные технологии решения задач оптимального управления/А. Ю. Горнов -Новосибирск: Наука, 2005. -279 с.
  • Krotov V. F. Global methods in optimal control theory/V. F. Krotov. -New York: Marcel Dekker, 1996. -408 p.
  • Kirk D. Е. Optimal control theory. An introduction/D. E. Kirk. -New York: Dover Publ., 2004. -472 p.
Еще
Статья научная