Вариационное условие оптимальности в задаче управления гиперболическими уравнениями с динамическими граничными условиями

Автор: Аргучинцев Александр Валерьевич, Кедрин Виктор Сергеевич, Кедрина Мария Сергеевна

Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths

Рубрика: Управляемые системы и методы оптимизации

Статья в выпуске: 1, 2021 года.

Бесплатный доступ

В статье рассматривается задача оптимального управления линейной системой гиперболических уравнений первого порядка с квадратичным целевым функционалом и граничными условиями, определяемыми из управляемых билинейных дифференциальных уравнений. Задачи такого типа возникают при моделировании ряда процессов химической технологии, социальной демографии и динамики популяций. В силу билинейности обыкновенных дифференциальных уравнений для решения подобных задач обычно применяют общие методы оптимального управления. Осуществлена редукция к задаче оптимального управления системой обыкновенных дифференциальных уравнений. Редукция основана на неклассических формулах приращения целевого функционала второго порядка. Такой подход позволяет применять ряд эффективных методов оптимального управления для решения исходной задачи.

Еще

Гибридные системы, гиперболические уравнения, неклассические формулы приращения, редукция задач оптимального управления

Короткий адрес: https://sciup.org/148308976

IDR: 148308976   |   DOI: 0.18101/2304-5728-2021-1-13-23

Текст научной статьи Вариационное условие оптимальности в задаче управления гиперболическими уравнениями с динамическими граничными условиями

Аргучинцев А. В., Кедрин В. С., Кедрина М. С. Вариационное условие оптимальности в задаче управления гиперболическими уравнениями с динамическими граничными условиями // Вестник Бурятского государственного университета. Математика, информатика. 2021. № 1. С. 13-23.

При моделировании процессов химической ректификации, социальной демографии, математической биологии в ряде случаев возникает необходимость решения задач оптимального управления гиперболическими системами первого порядка с начально-краевыми условиями, определяемыми из управляемых систем обыкновенных дифференциальных уравнений [1-3]. При этом обыкновенные дифференциальные уравнения иногда имеют специфическую структуру: фазовые переменные входят линейно в правые части динамических систем, но с зависящими от управлений коэффициентами. В силу этой билинейности принцип максимума Л. С. Понтрягина не является достаточным условием оптимальности даже в случае линейных гиперболических систем и линейного целевого функционала. Поэтому обычно для решения подобных задач применяют общие методы нелинейной теории оптимального управления.

В работе [4] данный тип задач был исследован для одного частного варианта гиперболических систем и линейного целевого функционала. В отличие от классического варианта формулы приращения, берущего начало еще от работы Л. И. Розоноэра [5], было получено два вида точных (без остаточных членов) формул приращения для произвольной пары допустимых процессов. Данный результат позволил провести редукцию исходной задачи оптимального управления к задаче оптимального управления обыкновенными дифференциальными уравнениями.

В настоящей работе рассматривается случай гиперболических систем, характерных для задач моделирования динамики популяций с учетом их возрастной структуры [6]. Целью управления является минимизация нормы конечного состояния. В силу квадратичности целевого функционала пришлось применить формулы приращения второго порядка, обычно используемые при исследовании особых оптимальных процессов [7]. Установлена справедливость необходимого и достаточного условия оптималь -ности вариационного типа. Изложена схема редукции исходной задачи к задаче оптимального управления системой обыкновенных дифференциальных уравнений, основанная на полученном результате.

  • 1    Постановка задачи

Рассматривается задача оптимального управления системой линейных гиперболических уравнений первого порядка с линейной правой частью:

- + - = B ( t , 5 ) X + Г ( t , 5 ).                         (1)

д t дs

Здесь x ( t , s ) — n -мерная вектор-функция состояния процесса, B ( t , s ) — матрица коэффициентов, независимые переменные t и s принимают значения из отрезков T = [ t 0, t 1 ] и S = [ s 0, s 1 ] соответственно. Начальные условия фиксированы:

x ( t 0 , s ) = x 0( s ), s G S .                           (2)

Предполагается, что граничные условия при s = s 0 определяются из управляемой системы обыкновенных дифференциальных уравнений :

^ x d ts o ). = C ( u ( t ) , t ) x ( t , s 0 ) + q ( u ( t ) , t ) .                         (3)

В системе (3) u ( t ) — m -мерная вектор-функция управления из класса ограниченных и измеримых на отрезке T функций. Начальные условия для (3) определяются из требования выполнения условия согласования с (2):

x (t 0,s 0) = x 0( s 0).

Предполагаем, что управляющие функции почти всюду на отрезке T удовлетворяют условию типа включения:

u (t) g U с Em.(5)

Целью задачи оптимального управления является минимизация функционала:

J(u) =1 J| x(t i,s)- z(s f ds.

  • 2    S

Здесь под нормой понимается обычная евклидова норма в n -мерном пространстве, z ( s ) — заданная функция.

Задачи такого нестандартного типа возникают при моделировании ряда процессов химической технологии и динамики популяций. В частности, вектор-функция состояния может описывать плотность (во временном смысле) популяций n видов. Обе независимые переменные имеют размерность времени: t — время, в течение которого рассматривается процесс; s — возраст; s 0 = 0 . Тогда задача (1)-(6) может рассматриваться как задача управления процессом рождаемости с целью достижения в конечный момент времени t 1 заданной плотности z ( s ). (1)-(6) может интерпретироваться и как обратная задача восстановления функционального параметра u ( t ) в (3), при котором в момент t = 1 1 достигается наблюдаемая плотность популяции z ( s ). Популяции разных видов могут взаимодействовать между собой. Это взаимодействие определяется правой частью системы (1). В частности, (1) можно рассматривать как обобщение классической модели «хищник — жертва» на случай, учитывающий возрастное распределение особей.

Задача (1)-(6) исследуется при следующих предположениях на ее параметры.

  • 1.    Матричная функция B ( t , s ) и вектор-функция r ( t , s ) непрерывны на T х S .

  • 2.    Матричная функция C ( u , t ) и вектор-функция q ( u , t ) непрерывны на U х T.

  • 3.    Функции x 0( s ), z ( s ) непрерывны на отрезке S .

При сделанных предположениях решение задачи Коши (3), (4) существует и единственно в классе абсолютно непрерывных на T функций. Классического же решения начально-краевой задачи для гиперболической системы (1)-(4), вообще говоря, не существует. Это связано с тем, что для существования и единственности классического решения требуется не только выполнение дополнительных условий, обеспечивающих гладкость x 0( s ), x ( t , s 0) , но и выполнение условий согласования более высокого порядка по сравнению с (4). Эти условия неизбежно налагают дополнительные предположения на правые части гиперболической системы [8] и ведут к дополнительным предположениям на управляющие воздействия.

В нашем случае можно гарантировать, что решения x ( t , s ) начальнокраевой задачи (1)-(4) являются для каждого фиксированного допустимого уравнения непрерывными в прямоугольнике T х S функциями. При этом каждая компонента x ( t , s ) является непрерывно дифференцируемой функцией вдоль семейства характеристик гиперболической системы [9].

В дальнейшем дифференциальный оператор в левой части (1) будем обозначать следующим образом:

d 4( 1, ( 1 ( dx 11, dt (( dt ) ( dt ) ( dt ))

понимая под этим оператор дифференцирования вдоль характеристик системы (1).

  • 2    Неклассическая формула приращения целевого функционала

Задача (1)-(6) является линейно-квадратичной с выпуклой подынтегральной функцией в (6). Однако в данном случае классическое условие оптимальности типа принципа максимума Л. С. Понтрягина не является достаточным условием оптимальности. Причина этого заключается в билинейности правой части (3), то есть в наличии произведения вида C ( u , t ) x . Поэтому обычно подобные задачи решаются теми же стандартными способами (методы принципа максимума, градиентные методы, дискретизация и т.п.), которые применяются для общих нелинейных задач. При этом основные вычислительные затраты итерационных методов приходятся на неоднократные интегрирования начально-краевых задач для исходной и сопряженной гиперболических систем.

Основной идеей настоящей работы является редукция исходной задачи (1)—(6) к задаче оптимального управления системой обыкновенных диф- ференциальных уравнений, выполненная с помощью нестандартной формулы приращения целевого функционала второго порядка.

Рассмотрим два произвольных допустимых процесса {u, x = x(t, s, u)} и {u = u + Au, x = x(t, s, й) = x(t, s, u) + Ax}. Тогда приращение целевого функционала (6) можно записать в виде:

A J ( u ) = J ( u) - J ( u ) = 1 | [ | x ( t 1, s ) - z ( s ) ||2 - | x ( tps ) - z ( s ) ||2 ] ds.      (7)

2 S

Здесь по-прежнему под нормой понимается обычная евклидова норма в n -мерном пространстве.

Представим квадрат каждой из норм в виде скалярного произведения вектора самого на себя и воспользуемся свойством:

Ix||2 -Ix|2 = (x + Ax,x + Ax)-(x,x) = {Ax,Ax) + 2{x,Ax).

Здесь угловыми скобками обозначены скалярные произведения в n - мерном евклидовом пространстве.

Далее выполним следующие преобразования. Обозначим П = T х S. Введем соответственно на множествах T и П пока произвольные n -мерные вектор-функции p(t), w(t, s), n х n -мерную диагональную мат- ричную функцию Т(t, s) и n х n -мерную симметричную матричную функцию Р(t).

Добавим в формулу приращения (7) четыре нулевых слагаемых

T

х ( t , s ° ) - A _ с ( u ( t ), t ) x ( t , s ° ) - c ( u ( t ), t ) A x ( t , s ° ) -A q ( u ( t ), t ) \dt ; о t

- B ( t , s ) A x ( t , s ) ddtds ;

J/ P ( t ) A x ( t , s ° ), dA x ( t , s o) - A u-C ( u , t ), x ( t , s ° ) - C ( u , t ) A x ( t , s ° ) - A q ( u ( t ), t ) \dt; t\                      d t                                                                  I

- B ( t , s ) A x ( t , s ) ddtds .

Здесь A 5C ( u , t ) = C ( й, t ) - C ( u , t ) , A q ( й, t ) = q ( й, t ) - q ( u , t ).

Применим формулы интегрирования по частям и введем сопряженные задачи

dw dw x z x

-T- + — = - B ( t , s ) w , ( t , s ) еП , d t   d s

W ( t j , s ) = z ( s ) - x ( t j , s ), s е S ,                                      (8)

W ( t , s j ) = 0, t е T;

Р = -^ (t , 5 0 ) - C T ( u ( t ), t ) p , t e T , p ( td = 0;

SY SY

+      - 2 Y B ( t , 5 ), ( t , s ) en ,

∂t∂s

T ( t i , s ) = - E , s e S ,

T ( t , s i ) = 0, t e T ;

P = -T ( t , s 0 ) - C T ( u ( t ), t ) P-P C ( u ( t ), t ), P ( t i ) = 0.

Под нулями в соответствующих условиях (8) и (9) понимаются n -мерные вектора, все компоненты которых равны нулю. Под нулями в (10) и (11) понимаются n х n -матрицы, состоящие из нулевых элементов. E — единичная матрица.

Решения задач Коши для обыкновенных дифференциальных уравнений (9) и (11) в силу сделанных выше предположений являются абсолютно непрерывными на T функциями. В начально-краевых условиях для гиперболических систем (8) и (10) невозможно добиться выполнения условий согласования типа (4). Решения понимаются в указанном выше обобщенном смысле, но можно гарантировать их непрерывность только по отдельности в областях t s и t s . Прямая t = s задает возможную линию разрыва. Отметим также, что в силу диагональности матрицы T система матричных уравнений в (10) представляет собой систему из n скалярных уравнений. Задача (10) не содержит управляющих функций. Поэтому она может быть решена только один раз.

После всех проделанных преобразований формула приращения (7) примет вид:

AJ (и) = -R Р (t, u) + P( t, u)(x (t, s 0, u) - x (t, s 0, u)), t                                                         (12)

A uC ( u ( t ), t ) x ( t , s 0, u ) + A q ( u ( t ), t )) ddt .

Формула (12) справедлива для любой пары допустимых процессов. Она является точной, то есть не содержит остаточных членов. Но «платой» за это является присутствие в формуле значений вектор-функции состояния, подсчитываемых на новом управлении u = u + A u .

  • 3    Вариационное условие оптимальности и его применение

Полученная в конце предыдущего раздела формула приращения (12) лежит в основе соответствующего необходимого и достаточного условия оптимальности вариационного типа.

Зафиксируем произвольное допустимое управление u(t). Ему соответствуют решения сопряженных задач (9) и (11). Подставим соответствую- щие функции p(t) и Р(t) в формулу (12). Обозначим оставшееся произвольным управление u через 9 . Из (12) следует основной результат данной работы.

Теорема. Допустимое управление 9 * ( t ) доставляет глобальный минимум в задаче оптимального управления (1)-(6) тогда и только тогда, когда для любого допустимого управления u ( t ) оно доставляет глобальный минимум в задаче оптимального управления системой обыкновенных дифференциальных уравнений:

М ( 9 ) = — J ( Р ( t , u ) + P ( t , u )( y ( t , 9 ) - x ( t , 5 0, u )),

T

( C ( 9 ( t ), t ) - C ( u ( t ), t ) ) y ( t , 9 ) + q ( 9 ( t ), t ) - q ( u ( t ), t ) ^ 9t ^ min, (13) y = C( 9 (t ), t ) y + q( 9 (t ), t ), t e T ,

y ( 1 0 ) = x 0( 5 0 ), 9 ( t ) e U , t e T .

Сделаем несколько замечаний.

Во-первых, теорема справедлива для любого фиксированного управления u ( t ). Это связано с тем, что формула приращения (12) верна для любой пары допустимых процессов.

Во-вторых, теорема является необходимым и достаточным условием глобальной оптимальности. Это крайне важно для обратных задач математической физики. Отметим, что принцип максимума Л. С. Понтрягина в данной задаче не является глобальным условием оптимальности, несмотря на выпуклость целевого функционала и почти полную линейность динамической системы.

Практическая ценность результата заключается в том, что на его основе можно провести редукцию исходной задачи (1)-(6) к значительно более простой задаче (13).

Изложим схему редукции. Пусть u ( t ) - некоторое допустимое управление в задаче (1)-(6). Найдем соответствующее данному управлению состояние x = x ( t , 5 , u ). Составим сопряженные задачи (8)-(11). Задача (10) не зависит от управления. Задача (11) решается на основе (10) и известного u ( t ). Для вычисления функции p ( t , u ), фигурирующей в (13), нужно знать у (t , 5 0). Для этого, в свою очередь, нужно решить задачу (8). Но все эти интегрирования гиперболических и обыкновенных дифференциальных уравнений нужно проделать лишь только один раз. В результате приходим к задаче оптимального управления (13), в которой функции u ( t ), p ( t , u ), Р ( t , u ) и y = x ( t , 5 0, u ) известны. Данная задача представляет собой задачу оптимального управления линейной системой обыкновенных дифференциальных уравнений с квадратичным целевым функционалом. Для ее решения можно применять весь арсенал методов оптимального управления обыкновенными дифференциальными уравнениями [10-15].

В силу билинейности динамической системы в (13) особенно эффективным представляется использование специализированных методов, предложенных В. А. Срочко [16; 17].

Основным результатом работы является не просто вариационное условие оптимальности, а редукция исходной задачи к значительно более простой задаче оптимального управления обыкновенной динамической системой. Поэтому, в частности, можно говорить, что любое улучшение допустимого управления в задаче (13) приведет к улучшению соответствующего допустимого управления в исходной задаче. Применение формул приращения целевого функционала второго порядка дает возможность улучшать особые неоптимальные управления. По-видимому, предлагаемый подход может быть применен и к другим задачам подобной структуры. Отсутствие локальности в формулах приращения и необходимости оценок приращения состояния процесса относительно параметров, характеризующих малость варьирования управлений, открывает возможности для исследования целых классов гибридных задач оптимального управления, содержащих обыкновенные дифференциальные уравнения и уравнения с частными производными.

Список литературы Вариационное условие оптимальности в задаче управления гиперболическими уравнениями с динамическими граничными условиями

  • Аргучинцев А. В., Поплевко В. П. Оптимальное управление в задаче химической ректификации // Известия вузов. Математика. 2012. № 8. С. 53–57. Текст: непосредственный.
  • Demidenko N. Optimal Control of Thermal-engineering Processes in Tube Furnaces // Chem. Petrol. Eng. 2006. V. 186, no. 42. P. 128–130.
  • Petukhov A. Modeling of Threshold Effects in Social Systems Based on Nonlinear Dynamics // Cybernetics and Physics. 2019. V. 8, no. 4. P. 277–287.
  • Аргучинцев А. В., Поплевко В. П. Оптимальное управление начальными условиями канонической гиперболической системы первого порядка на основе нестандартных формул приращения // Известия вузов. Математика. 2008. № 1. С. 3–10. Текст: непосредственный.
  • Розоноэр Л. И. Принцип максимума Л. С. Понтрягина в теории оптималь- ных систем. I // Автоматика и телемеханика. 1959. Т. 20, № 10. С. 1320–1334. Текст: непосредственный.
  • Ризниченко Г. Ю., Рубин А. Б. Математические методы в биологии и эколо- гии. Биофизическая динамика репродуктивных процессов. Москва: Юрайт, 2019. Ч. 1. 210 с. Текст: непосредственный.
  • Габасов Р., Кириллова Ф. М. Особые оптимальные управления. Москва: URSS, 2018. 256 с. Текст: непосредственный.
  • Годунов С. К. Уравнения математической физики. Москва: Наука, 1979. 392 с. Текст: непосредственный.
  • Рождественский Б. Л., Яненко Н. Н. Системы квазилинейных уравнений и их приложения к газовой динамике. Москва: Наука, 1978. 686 с. Текст: непосредственный.
  • Васильев О. В. Лекции по методам оптимизации. Иркутск: Изд-во ИГУ, 1994. 340 c. Текст: непосредственный.
  • Срочко В. А. Итерационные методы решения задач оптимального управ- ления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.
  • Rao A. V. A Survey of Numerical Methods for Optimal Control // Advances in Astronautical Sciences. 2009. V. 135. P. 1–32.
  • Golfetto W. A., Silva Fernandes S. A Review of Gradient Algorithms for Numerical Computation of Optimal Trajectories // J. Aerosp. Technol. Manag. 2012. V. 4. P. 131–143.
  • Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с. Текст: непосредственный.
  • Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского государственного университета. Математика, информатика. 2020. № 1. С. 35–53. Текст: непосредственный.
  • Срочко В. А., Антоник В. Г. Условия оптимальности экстремальных управлений для билинейной и квадратичной задач // Известия высших учебных заведений. Математика. 2016. № 5. С. 86–92. Текст: непосредственный.
  • Cрочко В. А., Аксенюшкина Е. В. Параметризация некоторых задач управления линейными системами // Известия Иркутского государственного университета. Сер. Математика. 2019. Т. 30. С. 83–98. Текст: непосредственный.
Еще
Статья научная