Метод проекционных возмущений в задачах параметрической оптимизации динамических систем
Автор: Булдаев А.С.
Журнал: Вестник Бурятского государственного университета. Философия @vestnik-bsu
Рубрика: Математика
Статья в выпуске: 6, 2007 года.
Бесплатный доступ
Предлагается итерационный метод для решения системы уравнений в пространстве параметров, сконструированной на основе необходимого условия оптимальности с помощью операции проектирования. Для обоснования метода используются элементы теории возмущений.
Короткий адрес: https://sciup.org/148178178
IDR: 148178178
Текст научной статьи Метод проекционных возмущений в задачах параметрической оптимизации динамических систем
An iteration method for solving a system of equations in the space of parameters, which is constructed on the basis of necessary optimality condition with the use of the operation of projection, is proposed. In order to ground the method, elements ofthe theory of perturbations have been applied.
Рассматривается задача оптимизации управляющих параметров
Ф(м) = (х(/,)) + f F(x(t),u,l)dt -> min, (1) w' net/ xltHMUO, x(t0) = x°, 1еТ = \М]Л2) в которой x(t) -(x,(/),...,*„(/)) - вектор состояния, «(/) = («,,...,»„) - вектор управляющих параметров (управление) со значениями в выпуклом компактном множестве UeRm. Начальное состояние х° и промежуток управления Г заданы.
Введем следующий набор предположений для задачи (1), (2) (ДПМ-условия):
-
I) функция Ях') непрерывнодифференцируема на Rn, вектор-функция FVMtA), векторная функция /(х,и,/) и их производные 7\(х,и,0, F„(x,u,t')> /Ax»«d)> f„(x,u,t) непрерывны по совокупности аргументов (х/иу') на множестве R" xUxT;
-
2) функция /(х,нд) удовлетворяет условию Липшица по х в Rn xUxT с константой L > 0
]|/(х,«,/) - /(у, и, 0|[ ^ L ||х - у||.
ДПМ-условия гарантируют [1] существование и единственность решения x(/,v), teT системы (2) для любого допустимого управления v.
Образуем функцию Понтрягина с со пряженной переменной iy eR”
Hdy,x,u,t) = {/(x,u,/),y/) - F(x,uJ\
Введем стандартную сопряженную систему у0) = -ндяОЯЯиЛ t еТ ,
Для допустимого управления v е V обозначим ^(/,v), t еТ - решение системы (3) при и = v, х(/) = х(/, v).
Дифференциальный принцип максимума (ДПМ) для управления veU в задаче (1), (2) имеет вид v = arg max ( £ Н8 (iy(t, v), х(/, v), vj^dt, w ).
Обозначим Ри -оператор проектирования на множество U в евклидовой норме.
Условие (4) с помощью оператора проектирования Ру можно представить в эквивалентном виде v = Ри (v + a £ Н„ (iy(t, v), х(/, v), v, t)dO, а > 0.
Для выполнения ДПМ (4) достаточно проверить условие (5) хотя бы для одного а > 0. Наоборот, из ДПМ (4) следует условие (5) для всех а > 0.
Определим отображение И7™, а>0 с помощью соотношения
Wa
(и) -
Ру (и + a
J
Н„ (у/У, и),x
1 Работа выполнена при финансовой поддержке РФФИ (проекты 05-01-00659, 07-01-90101).
А.С. Булдаев. Метод проекционных возмущений в задачах параметрической оптимизации динамических систем ugU .
На основании условия Липшица для оператора Ру функция W“ непрерывна по и g U . Имеет место оценка
( ^H^t,u\x
Стандартные методы условного градиента и проекции градиента для задачи (1), (2) основываются соответственно на дифференциальном принципе максимума (4) и проекционном условии (5) и обеспечивают сходимость к нулю невязки ДПМ. Достоинством этих методов являются вычислительная устойчивость расчета фазовой и сопряженной систем, а также релаксация по целевой функции (1) на каждой итерации методов. Релаксация обеспечивается при малых значениях параметра, регулирующего область варьирования управления. Этот параметрический поиск может оказаться наиболее трудоемкой частью итерационного процесса.
В работе предлагается итерационный метод решения соотношения (5), не использующий операцию параметрического поиска улучшающего управления.
Рассмотрим параметр проектирования а > 0 в условии (5) в качестве параметра возмущения. Задачу (5) назовем возмущенной. Невозмущенная задача получается из возмущенной задачи (5) при <т - 0 и ее решением является любое допустимое управление v е U.
Итерационный процесс решения возмущенной задачи (5) имеет вид гы ^(^ + a^H^yvUyWdWb
Л>0. (6)
На начальной (нулевой) итерации задается начальное приближение v° е V.
Решение задачи (5) для любого параметра возмущения а > 0 удовлетворяет дифференциальному принципу максимума.
С помощью оператора Wa возмущенная задача (5) и итерационный процесс (6) представляются соответственно в форме v = ^(v), а>0,
£>о.
Невозмущенная задача получается из возмущенной задачи (5) при а = 0 с соответствующим невозмущенным оператором
Ж0 : v -> v , г- е U.
Условия сходимости итерационного процесса (6) в евклидовой норме для решения уравнения (5) могут быть определены на основе известного принципа сжимающих отображений.
Сформулируем аналог известной теоремы [2, с. 196-197].
Для оператора G : U —> U рассмотрим уравнение v = G(v), v е U (7)
и метод простой итерации
■ v^GO^), ^>0. (8)
Теорема 7. Пусть оператор G удовлетворяет условию Липшица в шаре 5(v0,7) = (ve U :||v-v0|| <7, v0 е U,I > 0} с константой 0 < М = AZ (v0,Z) < 1
|G(v)-G(m)||veS(v0,Z), ugB^,!), (9)
причем выполняется условие
|G(v0)-vJ<(l-M)Z. (10)
Тогда уравнение (7) имеет единственное решение v е В(уц,1) и метод простой итерации (8) сходится к v в норме |-| при любом начальном приближении v° е S(v0,7). Для погрешности метода справедлива оценка
|| v^ — v|| < Mk |[v° - v , k > 0 .
Доказательство теоремы полностью аналогично доказательству, приведенному в работе [2].
Отметим, что условие (10) вводится для обеспечения невыхода приближений итерационного процесса (8) за пределы множества B(v0,Z), на котором выполняется условие Липшица (9).
Используя операторное представление, получим условия сходимости процесса (6) на основе теоремы I.
Введем вспомогательный оператор Г" с помощью соотношения
Уа (^,x,v) - Ри (v + а \Н„Ш>(1\vaW, vgU, ч/gC^T"), xgC^Tu где 0(7) - пространство непрерывных на Т вектор-функций с нормой
Н^^И)!!-
Обозначим V, X соответствующие операторы у-»^(/,и), t&T и и^-х^м), t&T . Тогда оператор Wa можно представить в форме композиции
Wa (v) = V" (Т( г), ^(v), v), v е U.
Отметим однозначность оператора IF", а>0 ввиду свойств оператора проектирования ^,.
Предположим, что семейство фазовых траекторий исходной системы (2) ограничено
x(r,v)eT, teT,veU, (11) где X с: R" - выпуклое компактное множество.
Отметим, что достаточным условием ограниченности (11) является выполнение известной оценки [1, 3, 4]
|[/(х,д,/)]|<С(Н + 1), хеГ, ueU, teT. (12)
Дополнительно к ДПМ-условиям предположим, что функции f(x,u,t^, F(x,u,t), ^х) дважды непрерывно дифференцируемы по совокупности переменных х, и на множестве R" х U х Т.
В сделанных предположениях операторы X, Т удовлетворяют условию Липшица с константой С, > 0
^(vl-^I^CjIv-wll, veU, u^U, IW - ЧЧ< < C, flv - и(|, v е U, и е U.
На основании условия Липшица для оператора проектирования Ри и условий ограниченности (11), (13) получаем
|гй(р,х,н)-Еа(^у,у)||2 <|| (м-у) +
+« ^(ЯДХ/Хх^),»,/)-
-н^дОШОх,^ ||2 <
-
< j|u - v||2 + 2а( м - у, ^.(ДЛрОХх^ХиЛ -
-HXq^yUWftdi ) +
+“2| 1(яМ)..фЫ')--
-H^qO^y^Xd^dt ||2, u,veU, p,q,x,yeC(Ty
Предположим, что для вектор-функции Н выполняется условие
(“ - у, Н„ (р,х, и, t) - Н„ (q, у, v,z)} < -К |]и - v}|2, w,y е U, p,q^ Р, х,у е X, teT, где К = const > 0. В итоге нетрудно получить оценку
||к“(Т(М),2Г(у),н)-Г(Т(у),2Г(у),у)|<
-
<(l-2a^ + aW|w-v|, u,veU, где М - const > 0 .
Таким образом, в сделанных предположениях при достаточно малых а > 0 оператор W“ удовлетворяет условию Липшица с константой меньше единицы. Отметим, что оператор 1Г° невозмущенной задачи удовлетворяет условию Липшица с константой, равной единице, что согласуется с полученной оценкой при а = 0.
В результате на основе теоремы 1 получаем следующее утверждение о сходимости процесса (6).
Теорема 2. Пусть
-
1) семейство фазовых траекторий в задаче (1), (2) ограничено:
x(t,u) ^ X , t^T, usU, где X с R" - вы пуклое компактное множество;
-
2) функции f(x,u,t), F(x,u,l), <р(х) дважды непрерывно дифференцируемы по совокупности переменных х, и на множестве R” х U х Т;
-
3) для функции Н„ выполняется условие
(и - V,н„^р,x,UJ)~ Ни (q,у,v,t)} < -К|w - v||2, u,veU, p,qeP, x,yeX, teT, где К = const > 0, PczR" - выпуклое компактное множество, ограничивающее множество сопряженных траекторий: <р^,и)еР, teT, veU.
Тогда для достаточно малого параметра проектирования а > 0
-
1) задача (5) имеет единственное решение ve е U;
-
2) итерационный процесс (6) сходится в евклидовой норме к решению v° для любого начального приближения
Д.О. Трунин. Метод фазовой линеаризации в задачах оптимального управления с терминальными ограничениями ся в евклидовой норме к решению уа для любого начального приближения
Основное отличие метода проекционных возмущений от стандартных проекционных методов состоит в том, что параметр проектирования а > 0 фиксируется в итерационном процессе последовательных приближений управления. В методах проекции градиента этот параметр варьируется на каждой итерации с целью улучшения управления.
Отметим, что в случае сходимости метод проекционных возмущений обеспечивает приближение к управлению, удовлетворяющему ДПМ, для любого значения параметра а > 0.
Предложенный в работе метод возмущений не гарантирует релаксацию по целевому функционалу в отличие от градиентных методов, но компенсируют это свойство отсутствием операции параметрического поиска улучшающего управления, нело- кальностью приближений, обусловленных фиксированным значением параметра проектирования, простотой реализации и настройки на конкретную задачу. Указанные свойства являются существенными факторами повышения вычислительной эффективности решения задач оптимизации управляющих параметров.
Список литературы Метод проекционных возмущений в задачах параметрической оптимизации динамических систем
- Васильев Ф.П. Численные методы решения экстремальных задач. -М.: Наука, 1980. -518 с.
- Самарский А.А., Гулин А.В. Численные методы. -М.: Наука, 1989. -432 с.
- Васильев О.В. Лекции по методам оптимизации. -Иркутск: ИГУ, 1994. -342 с.
- Срочко В.А. Итерационные методы решения задач оптимального управления. -М.: Физматлит, 2000.-160 с.