Приближенный синтез управления на основе алгоритма глобального улучшения
Автор: Трушкова Екатерина Александровна
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 2, 2013 года.
Бесплатный доступ
Рассматривается проблема построения приближенного синтеза управления в задачах оптимального управления динамическими системами. Предложена процедура поиска приближенного синтеза с помощью соотношений глобального алгоритма Кротова улучшения управления.
Динамическая система, синтез управления, глобальный алгоритм улучшения
Короткий адрес: https://sciup.org/14835094
IDR: 14835094
Текст научной статьи Приближенный синтез управления на основе алгоритма глобального улучшения
Проблема приближенного синтеза управления для непрерывной задачи оптимального управления
-
x = f ( t , x , u ), t e [ tj , tF ], x ( tj ) — x I , u e U , F ( x ( tF ) ) ^ min (1)
заключается в построении последовательности функций {us (t,x)} , s—1,2,K такой, что для любых т e [tI, tF), xT e Rn справедливо
F ( x s _ , ( t F ; x t ) ) > F ( x s ( t F ; x t ) ) , s — 2.3. k .
где x s ( t ; x T ) - решение задачи Коши xc — f ( t , x , u s ( t , x ) ) , x( т ) — x T . При этом каждую функцию us ( t , x ) искомой последовательности, следуя [1], будем называть приближенным синтезом управления .
Известен метод последовательных приближений для поиска приближенного синтеза управления с использованием соотношений Беллмана [2, 3], который состоит в следующем.
0) Имеем начальный приближенный синтез u1 (t, x), т. е. такую функцию, для которой при любом xT е R" процесс (x1 (t; xT), u1 (t;xT)) является допустимым. Здесь через x1 (t; xT) обозначено решение задачи Коши x = f (t, x, u1 (t, x)), x (t1) = xT, а u1 (t; xT) = u1 (t, x1 (t; x
.
-
1) Ищем ф ( t , x T ) из соотношений Беллмана:
R ( t , x , u1 ( t , x ) ) @ ф ^ ( t , x ) f ( t , x , u1 ( t , x ) ) + Ф t ( t , x ) = 0, G ( x ) @ F ( x ) + ф ( t F , x ) = 0,
при x = x1 ( t ; x T ). Выразив x T = £ ( t , x ), находим ф 0( t , x ) = ф ( t , ^ ( t , x ) ) .
-
2) Строим новый приближенный синтез: u ( t , x ) = arg max R ( t , x , u ; ф 0 ) . ueU ' '
В результате итерационного повторения описанных шагов получаются последовательности u s ( t , x ) и ф s ( t , x ), если процесс построения этих последовательностей оказывается возможным [3]. Здесь функции ф s ( t , x ) строятся сложным образом, что связано в первую очередь с интегрированием исходной системы при управлениях, зависящих от фазовых координат. Избавиться от этой сложности, а также упростить соотношения Беллмана (2), (3) для поиска разрешающей функции позволяет глобальный алгоритм улучшения управления.
-
2) Строим приближенный синтез: u ( t , x ) = argmax R ( t , x , u; ф 0 ) , кото- ueU ' '
-
2. Линейная система с управляемыми коэффициентами Остановимся подробнее на случае непрерывной задачи
рый, в силу свойств метода глобального улучшения, гарантирует выполнение неравенства F ( x1 ( tF ; x т ) ) > F ( x11 ( tF ; x т ) ) для любого x т e R n . Здесь x11 ( t ; x т ) - решение задачи Коши x = f ( t , x , u ( t , x ) ) , x ( t1 ) = x т .
Таким образом, соотношения Беллмана для определения следующего приближения к синтезу управления существенно упрощаются и позволяют на некоторых классах задач отойти от приближенного задания искомой разрешающей функции ф ( t , x ) в виде интерполяционного полинома для функции нескольких переменных, как было независимо предложено в работах различных авторов (например, [1-3, 5]).
Однако найденное управление u ( t , x ) гарантирует улучшение начального программного управления лишь на одной итерации, т. к. выбор подходящего программного управления для следующей итерации оказывается в общем случае неочевидным.
.x = A ( t , u ( t ) ) x , t e [ t1 , tF ], x ( t1 ) = x1 , u e U c Rp , F ( x ( tF ) ) = nTx ( tF ) + xT ( tF ) p x ( tF ) ^ min, где матрица p неположительно определена. Сформулируем для этой задачи теорему об улучшении начального программного управления на одной итерации с помощью построенного управления в форме синтеза из соотношений глобального алгоритма улучшения.
Теорема. Пусть u1 ( t ) - некоторое допустимое управление задачи (5) ,
т
-
любое число из интервала [ t I , tF ) , x т
-
произвольный n-мерный век-
тор, Ф ( t )
-
фундаментальная матрица решений системы
x = A ( t, u1 ( t ) ) x, такая, что Ф ( т ) есть единичная матрица, а Т ( t )
-
фундаментальная матрица решений системы x = - A T ( t , u1 ( t ) ) x , такая, что T ( tF ) есть единичная матрица. Справедливо неравенство
где x I ( t )
-
F (x11 (tF) )< F (x1 (tF)), решение задачи Коши x = A(t,u1 (t))x, t е[т,tF], x(т) = xт,
x” ( t )
-
решение задачи Коши x = A ( t , u ( t , x ) ) x , t е [ т , tF ], x ( т ) = x т ,
u ( t , x ) = argmax ( - ( 2 xT ( ф 1 ( t ) ) Ф T ( tF ) p + П ) т T ( t ) A ( t , u ) x ) .
Доказательство. Выберем произвольным образом допустимое управление u1 (t), момент времени т и n -мерный вектор xT. Проведем одну итерацию метода глобального улучшения управления для задачи (5) с на- чальным управлением u1 (t) и начальным условием x(т) = xT. А именно, сначала найдем функцию ^(t, x) = ^T (t)x, где y(t) - решение задачи Коши t// = — AT (t,u1 (t))^, v(tF) = -n — 2px1 (tF), что следует из [4, 6]. Заме- тим, что x1 (tF) = Ф(tF)Ф '(т)xT, следовательно, можно записать
И t ) = -T ( t ) ( п + 2 р Ф ( t F ) Ф- ' ( т ) x t ) .
Тогда получим, что улучшение гарантирует функция
u ( t , x ; т , x T ) = arg max ( y T ( t ) A ( t , u ) x ) = ueU ' '
= argmax ( - ( n + 2 р Ф ( tF ) Ф- 1( т ) x T ) T T ( t ) A ( t , u ) x ) = u e U
= argmax ( - ( 2 x T ( ф- 1( т ) ) T Ф T ( t F ) p T + n T ) t t ( t ) A ( t , u ) x ) .
Для доказательства теоремы осталось показать, что и( т , x T ; т , x T ) = u ( т , x T ). Убедимся в этом простой подстановкой
u ( т , x T ) = arg max ( - ( 2 x T ( ф- 1( т ) ) Ф T ( tF ) p T + n T ) t t ( t ) A ( t , u ) x ) = = й ( т , x t ; t , x t ).
Теорема доказана.
3. Процесс поиска приближенного синтеза
Вышеизложенная теорема позволяет организовать вычислительный процесс поиска приближенного синтеза управления в заданной области изменения начальных условий x1 e X1 с R" . Будем предполагать, что поставленная задача поиска приближенного синтеза в заданной области решена, если известно приближенно оптимальное по функционалу управление в некоторой достаточно частой сетке узловых точек множества X1 . Очевидно, поставленная задача может быть решена как задача улучшения для каждого узла заданной сетки, что потребовало бы вычислений разрешающей функции для каждого узла на каждой итерации. С помощью вы-шедоказанной теоремы эти вычисления можно существенно сократить.
Для этого задается начальное управление u1 (t), для которого проводится одна итерация алгоритма глобального улучшения с целью получения управления в форме синтеза u(t,x). Обозначим это управление через u1 (t, x). В силу вышеоказанной теоремы управление u1 (t, x) улучшает начальное управление u1 (t) для любого x1 e X,, и, следовательно, на первой итерации процесса нахождение разрешающей функции удалось провести одновременно для всех узловых точек. Далее, разбив сетку узловых точек на достаточно крупные подмножества, можно выбрать в каждом подмножестве начальную точку x1 и построить для второй итера- ции программное управление uII(t), решая систему с начальным условием x(tI)=xI, замкнутую управлением uI(t,x). Теперь вторая итерация проводится отдельно в каждом подмножестве узловых точек для своего программного управления uII(t). Это позволяет на второй итерации процесса найти разрешающую функцию одновременно для всех узловых точек текущего подмножества. Для следующей итерации каждое текущее подмножество опять разбивается на части, после чего шаги алгоритма повторяются аналогичным образом. Отметим, что в каждом подмножестве текущая итерация проходит независимо и при программной реализации может проводиться параллельно, сокращая тем самым время работы компьютерной программы.
Заключение
Показана возможность применения соотношений глобального алгоритма Кротова улучшения управления к поиску приближенного синтеза управления для динамических систем. Для случая линейной по состоянию динамической системы (линейной системы с управляемыми коэффициентами) при квадратичном критерии качества найдено аналитическое выражение синтеза управления на итерации алгоритма. Представленный вычислительный процесс позволяет существенно сократить число операций для поиска разрешающей функции на каждой итерации.
Список литературы Приближенный синтез управления на основе алгоритма глобального улучшения
- Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. -М.: Машиностроение, 1969.
- Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. -М.: Наука, 1969.
- Зубов В.И. Лекции по теории управления. -М.: Наука, 1975.
- Трушкова Е. А. Алгоритмы глобального поиска оптимального управления//Автоматика и телемеханика. -2011. -№6,-С. 151-159.
- Букреев В.З. Об одном методе приближенного синтеза оптимального управления//Автоматика и телемеханика. -1968. -№ 11. С. 5-13.
- Кротов В.Ф., Булатов A.B., Батурина О.В. Оптимизация линейных систем с управляемыми коэффициентами//Автоматика и телемеханика. -2011,-№6,-С. 64-78.