Задача оптимального управления параболическим уравнением с запаздыванием на границе
Автор: Аргучинцев А.В., Поплевко В.П.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
Рассматривается задача оптимального управления процессом, описываемым классическим параболическим уравнением с динамическим граничным условием. Управляемое граничное условие на одном из концов области определяется из решения начальной задачи для обыкновенного дифференциального уравнения с постоянным запаздыванием. Допустимые управления принадлежат классу непрерывно дифференцируемых функций и удовлетворяют поточечным ограничениям. В силу гладкости управлений в исследуемой задаче затруднительно применение принципа максимума Л. С. Понтрягина и соответствующих методов. На основе использования неклассической «внутренней» вариации управления доказано необходимое условие оптимальности первого порядка. Схематически изложен итерационный метод решения задачи. На каждой итерации алгоритм обеспечивает улучшение управления и сходимость к выполнению доказанного необходимого условия оптимальности. Приведен иллюстративный пример, демонстрирующий эффективность предлагаемого метода.
Параболическое уравнение, динамическое краевое условие, обыкновенное дифференциальное уравнение с запаздыванием, оптималь- ное управление, гладкие управляющие воздействия, необходимое условие оптимальности, итерационный метод
Короткий адрес: https://sciup.org/148333170
IDR: 148333170 | УДК: 517.977 | DOI: 10.18101/2304-5728-2026-1-41-52
An Optimal Control by a Parabolic Equa- tion With Delay in a Boundary Condition
The optimal control problem for a process described by a parabolic equation with a dynamic boundary condition is considered. The controlled bound- ary condition is determined by the solution to an initial value problem for an ordinary differential equation with delay. Admissible controls belong to the class of continuously differentiable functions and are subject to pointwise constraints. Due to the smoothness of the control actions, the classical optimality condition in the form of Pontryagin’s maximum principle and the corresponding methods cannot be applied to this problem. Based on a non-classical variation that pre- serves the smoothness of controls, a first-order necessary optimality condition is derived. A numerical method for solving the problem is proposed. At each iter- ation, the method ensures an improvement of the controls and converges to the satisfaction of the proven necessary optimality condition. An illustrative example demonstrating the effectiveness of the proposed method is provided.
Текст научной статьи Задача оптимального управления параболическим уравнением с запаздыванием на границе
Задачи оптимального управления граничными условиями параболического уравнения возникают при моделировании ряда процессов теплопроводности, диффузии, фильтрации [1 , 2 , 3] . В частности, такие задачи описывают перенос примесей (при наличии эффекта диффузии) в атмосфере и гидросфере, ректификационные процессы химической технологии и др. [2] . В некоторых моделях существенно наличие эффекта запаздывания на границах рассматриваемой области.
Принципиальным отличием от классических постановок задач оптимального управления [4 , 5] является исследование задач в классе непрерывно дифференцируемых управляющих воздействий. В этом случае практически невозможно применение подходов, основанных на классическом принципе максимума Л. С. Понтрягина, для которого характерен класс разрывных управляющих функций. Затруднительным представляется также получение и конструктивное использование большинства условий оптимальности градиентного типа, ориентированных на разрывные по независимым переменным управления.
В данной работе задача исследуется для случая динамических управляемых граничных условий, определяемых обыкновенными дифференциальными уравнениями с постоянным запаздыванием. Для рассматриваемого варианта параболических уравнений с эффектом запаздывания модифицирована примененная ранее для других классов управляемых систем методика [6] .
-
1 Постановка задачи
В качестве объекта исследования рассмотрим классическое параболическое уравнение
X t - X ss = f (s,t), n = S x T, S = [s o ,s i ], T = [t o ,t i ], (1)
где фазовая переменная x(s,t) — скалярная функция состояния процесса.
Для данного уравнения начально-краевые условия задаются в следующем виде:
x(s,to) = x°(s), s G S; Xs(si,t) = q(t), xt(so,t = g(x(so,t),x(so,t - Y),u(t),t), t G T;
x(s o ,t) = x(t), t G [t o — Y,t o ], Y = const > 0; x o (s o ) = x(t o ).
Таким образом, граничное условие для функции состояния x(s,t) при s = s o не является фиксированным. Оно вычисляется из решения начальной задачи с постоянным запаздыванием γ .
Допустимыми управлениями являются скалярные непрерывно дифференцируемые на отрезке T функции u(t) , удовлетворяющие в каждой точке этого отрезка ограничению
u(t) G U С R\t G T, (3)
где U — отрезок из R 1 .
Поставим задачу минимизации критерия качества
I(u) = J ^(x(s,t 1 ),s) ds + J^ F(x,s,t) dsdt
S
Π на решениях начально-краевой задачи (1), (2) при допустимых непрерывно дифференцируемых скалярных управлениях, удовлетворяющих амплитудным ограничениям (3).
Введем следующие предположения на параметры рассматриваемой задачи оптимального управления:
-
1) скалярная функция f (s,t) , задающая неоднородность в параболическом уравнении (1) , непрерывна по переменным s и t ;
-
2) скалярные функции, определяющие начально-краевые условия x 0 (s) , q(t) , x(t) для параболического уравнения, непрерывны соответственно по переменным s и t на отрезках S и T ;
-
3) фигурирующие в критерии качества (4) скалярные функции F(x, s, t) и ^(х, s) непрерывны по своим аргументам и имеют непрерывные и ограниченные частные производные по x ;
-
4) скалярная функция g = g(x, £, u, t) непрерывна по совокупности своих аргументов и имеет непрерывные и ограниченные частные производные по х , £ и u . Здесь введено обозначение £(t) = x(s o ,t — y ) .
Достаточно нетрадиционный для задач оптимального управления класс гладких управляющих функций важен с точки зрения физических или технических приложений. С одной стороны, это усложняет исследование задачи с помощью стандартных инструментов. Классический принцип максимума Л. С. Понтрягина, основанные на принципе максимума методы, а также большинство градиентных процедур работают на множествах разрывных управляющих воздействий. С другой стороны, в рассматриваемой задаче нет необходимости перехода к обобщенным решениям начально-краевой задачи (1), (2). Классическое решение этой задачи существует в классе дифференцируемых по t и дважды дифференцируемых по s функций [7].
-
2 Формула приращения
Рассмотрим два произвольных допустимых процесса: базовый { u, x } и варьируемый { u = u + Au, x = x + Ax } . Обозначим Dx = x t — x ss . Тогда начально-краевая задача (1) , (2) в приращениях имеет вид:
DAx = 0,
Ax(s,t o ) = O, s G S; Ax s (s 1 ,t)=0, t G T,
Ax t (s o ,t) = Ag(x(s o ,t),^(t),u(t),t), Ax(s o ,t) = O, t G [t o — Y,t o ]. (5)
Исследуем приращение целевого функционала на двух выбранных допустимых процессах.
I(u) - I(u) = J
S
A^(x(s,t i ), s) ds + УУ
Π
AF(x, s, t) ds dt.
В формулу приращения добавим следующие нулевые слагаемые
УУ ^(s,t)DAx dsdt,
Π
У p(t)[Ax t (s o ,t) — Ag(x(s o ,t),^(t),u(t),t)] dt.
T
Дальнейшие преобразования основаны на применении классических формул интегрирования по частям.
I (U — I (u) = У A^(x(s,t 1 ),s) ds + JJ AF(x,s,t) dsdt+
+ ^\((s,ti)Ax(s,t)) — ^(s, t o )Ax(s, t o )] ds — J У ^ t Axdsdt —
-
— У [^(s i ,t)Ax s (s i ,t) — ^(s o ,t)Ax s (s o ,t) — ^(s i ,t)Ax(s i , t) +
T
+^ s (s o ,t)Ax(s o ,t)] dt — J y^ ss Ax dsdt + p(t i )Ax(s o ,t i ) —
Π
- p(to)Ax(s o , t o ) - У p t Ax(s o ,t) dt - Jp(t)Ag dt.
TT
Введем функцию
H(p( t ) ,x (s o ,t ) ,i ( t ) ,u ( t ) ,t ) = p( t ) • g( x (s o ,t),i ( t ) ,u ( t ) ,t' ).
Тогда
AH (p,x,i,u,t) = A u H (p,x,i,u,t) + A x H (p,x,i,u,t) + A e H (p, X,i,X,t), где
A u H(p,x,i,u,t) = H(p,x,i,u,t) - H(p,x,i,u,t), A x H (p ,x, ^ ,u,t ) = H (p ,x, ^ ,u,t ) - H (p ,x ,^, X , t) , A ^ H(p, X, i, X, t) = H(p, X, IX, t) - H(p, X, i, u, t).
Используем следующие разложения
A^(x(s,t i ),s) = д ^( х (£.,^ 1 ),£1 • Ax(s,t i ) + o ^ ( \ Ax(s,t i ) \ ),
∂x
AF(x, s, t) = —— x, s, ^ • Ax(s, t) + o f ( \ Ax(s, t) \ ). ∂x
Рассмотрим
AxH (p, x, i, X, t) = dH (p,x,i,u,t) • Ax(so, t) + oh (\Ax(so,t)\), ∂x здесь
dH(p,x,i,u,t) = A dH(p,x,i,u,t) + dH(p,x,i,u,t)
Теперь рассмотрим разложение
A ^ H(p,x,i,X,t) = dH(p^ut • Ai + o h ( \ Ai \ ).
Преобразуем выражение
9H (p,x,j,u,t) = Hi (p,x,j,u,t) Hi (p,x,j,u,t)
di u di + di '
где
dH(p,x,i,u,t) л dH(p,x,i,u,t) , dH(p,x,i,u,t)
-----di-----= A-----di----- +-----di -----■
Тогда получаем r dH(p,x,£,u,t) J----deл =
T
= taH t s t • M t - Y) d =
∂ξ
T t0
_ / dHW + Y),x(s G ,e + 7),€(^),u(0 + YM + y ) л / m
I * △ x(s G , ^) de+
∂ξ t0-γ t1-γ
+ [ aHpv+ihxS GG^ +Y:^^ .л„ de.
∂ξ t0
Здесь использовано следующее обозначение: в = t — у,
О G [t o — Y,t i — у] . Последующие преобразования связаны с возвратом к исходной переменной t .
Z dHW+22ix(s o ,£+Y^ ∂ξ
• Ax(s o ,t) dt.
t 0
Теперь подчиним ранее произвольные скалярные функции ^(s, t), p(t) следующей составной сопряженной задаче, включающей параболическое уравнение и обыкновенное дифференциальное уравнение специального вида:
^ t + ^ ss = F x (x,s,t) ^(s,t 1 ) = - ^ x (x(s,t 1 ),s), (6)
^(s o ,t)=c, ^ s (s i ,t)=0;
( — H x \ t ] — H i [ t + Y] — ^ s (s G it)! t G [t G ; t 1 — Y), I — H x [t] — ^ s ( s G ,t ) , t G [t 1 — Y; t 1 \.
p(t i ) = 0; p(t) = 0, t > t i . (7)
Для компактности записей здесь введены следующие обозначения:
H x [t] = H x (p(t),x(s o ,t),e(t),u(t),t),
H i [ t + Y] = H i (p( t + Y ),x(s G ,t + Y) ,e ( t ) ,u ( t + Y ) ,t + Y).
Тогда формула приращения запишется в виде:
где
i (e
-
I (u)= -
T
n =
A e H(p(t),x(s o ,t), ^(t), u(t), t) dt + n,
J ov ( | Ax(s,t i ) | )
S
ds +
jj ( o f ( | Ax(s,t) | ) dsdt-
Π
У [ o h ( | Ax(s o ,t) | ) + A u H x (p(t),x(s o ,t),^(t),u(t),t) • Ax(s o ,t) +
T
+A e H(P, x, ^, u , t) • A€(t) + A x H(P, x, ^, u , t) • A£(t)] dt.
В работе [8] получена следующая оценка:
У(Ax(s,t 1 )) 2 ds < K ((Au) 2 ),
S где
K ((Au) 2 )
= (- L 2i + - L2L(t i - t o ) 2 + - L 2i ε 1 ε 2 ε 2
)
(Au) 2 dsdt+
Π
+e 2 (s 1 — s 0 )(t 1
-
t 0 ) L 21
(A u ) 2 dt,
T где £1 > 0, £2 > 0; K > 0 L > 0, Li > 0 (L — константа Липшица, Li = LeL^-0).
-
3 Необходимое условие оптимальности
Исходная задача исследуется в классе гладких управляющих воздействий. Поэтому применение ставших уже классическими в оптимальном управлении игольчатых вариаций является некорректным. Используем методику [6] , основанную на неклассических вариациях, которые гарантируют гладкость управляющих функций. По-видимому, впервые для обработки эффекта запаздывания подобные вариации типа сдвига использовал Л. Е. Забелло в работе [9] . Однако он применил комбинацию этих вариаций с игольчатыми вариациями, оставаясь в классе кусочно-непрерывных управляющих воздействий.
Новое управление конструируем следующим образом:
u ee (t) = u(t + ев (t)). (10)
Здесь предполагается, что t ∈ T . В качестве параметров варьирования фигурируют е € [0,1] (величина малости вариации), а также функция в (t) , задающая правило «сдвига». Для сохранения гладкости управления функцию e(t) необходимо выбирать из класса непрерывно дифференцируемых на отрезке T функций. При этом дополнительное условие t o < t + e(t) < t i , t € T гарантирует, что независимый аргумент будет по-прежнему принадлежать отрезку T . Гладкость управляющих воздействий позволяет применить разложение по формуле Тейлора первого порядка:
Au = й(£)ев (t + о ( е )
В силу оценки (9) имеем i (e -1 (u) =
- ε
У H u • U • в(t) dt + о ( е ) .
T
Так как e(t) — произвольная функция, то получаем следующее необходимое условие оптимальности в рассматриваемой задаче.
Теорема. Пусть управляемый процесс { u(t),x(s,t) } оптимален в задаче (1) – (4) . Тогда в каждой точке отрезка T справедливо условие
w(t) = H u (p(t),x(t),£(t),u(t),t) • U(t) = 0, (12)
где p(t) — это решение сопряженной задачи (6) , (7) .
-
4 Метод улучшения
Основываясь на полученном условии оптимальности, можно предложить следующую общую схему метода улучшения управлений.
-
1. На нулевом шаге ( k = 0 ) рассмотрим начальное приближение u 0 = u 0 (t) , удовлетворяющее условиям задачи. Опишем одну итерацию метода, то есть переход от управления u k к u k +1 .
-
2. Найдем решения прямой x k , z k и сопряженной ψ k , p k задач при управляющем воздействии u k .
-
3. Вычислим значение целевого функционала I(ик ) и построим функцию
-
4. Если условие остановки не выполнено, то строим гладкую вариацию вида:
W k (t) = H u (p k ,xkЛ\ик,t) • U k .
Если условие оптимальности W k (t) = 0 выполнено, то метод завершает свою работу. На практике, конечно, проверяется выполнение более слабого условия вида \ w k (t) | < а , где положительный параметр а задается из условия точности счета.
u k k (t) = u k (t + E k в к (t)).
Существуют различные варианты выбора функции варьирования β k . В частности, практические расчеты показали эффективность построения функции в к (t) в следующей конструктивной форме:
e k ( t ) =
(t — t o )(t i — t)W k (t)
(t 1
—
t o )max | w k (t) | .
Невыполнение условия остановки метода (пункт 3) гарантирует, что знаменатель дроби отличен от нуля на каждой итерации. Здесь скалярный параметр ε k находим как решение следующей задачи на минимум заданной неявно функции одной переменной ε (при численной реализации эта задача решается приближенно):
Ek : I(ue) ^ min, где
E G [0,1], u e (t) = u(t + Ев к (t)).
Управление u k+1 (t) = ukk (t) является результатом выполнения k -й итерации.
В зависимости от возникших ситуаций может быть предложен один из следующих вариантов остановки итерационного процесса:
-
а) достижение управления, для которого выполняется с требуемой точностью доказанное в предыдущем разделе условие оптимальности, то есть выполняется условие вида max \ w k (t) | < а , где a > 0 — заданная точность;
-
б) неулучшение значения целевого функционала на соседних итерациях (в этом варианте можно попытаться более точно решать задачу одномерного поиска).
Метод обеспечивает генерацию релаксационной последовательности функций управления [6] :
I (u k +1 ) < I(uk ), k = 0,1...
5 Тестовый пример
В квадрате [0; 5] х [0; 5] рассмотрим следующую динамическую систему:
x t — x ss = e s sin t, s G [0; 5], t G [0; 5],
x(s, 0) = s + 0.1, xs(5,t)=0, xt(0,t) = x(0,t — 0.15) • u(t), x(0,t)= t + 0.1, t G [—0.15;0], u(t) G [0;3].
В качестве целевого функционала выберем квадрат отклонения от заданного состояния x(s) = x(s, t i ) , определяемого допустимым управлением u(t) = 2 + sin 2nt :
I(u) = 2 /(x(s, t 1 ) — x(s)) 2 ds ^ min .
S
Такой подход для тестирования гарантирует существование глобального минимума, равного нулю. Кроме того, известно хотя бы одно из оптимальных управлений ( u(t) ), доставляющее указанный глобальный минимум. Единственность оптимального управления в данной задаче гарантировать нельзя.
Вычисления осуществлялись в системе MATLAB при начальном управлении u 0 (t) = 1 + cos1.2t . Реализация метода потребовала 22 итерации ( k = 22 ). Достигнутое значение функционала вполне удовлетворительное: I(u k ) = 0.0003427 . Выход осуществлен по критерию неулучшения функционала, при этом max | w k (t) | = 0.01372 . Структура полученного на последнем шаге управления близка к u(t) .
Заключение
В статье рассмотрена задача оптимизации динамического процесса, описываемого параболическим уравнением с граничным условием специального вида и эффектом постоянного запаздывания. Управляемое граничное условие на одном из концов области изменения независимых переменных определяется из решения начальной задачи для одного дифференциального уравнения с запаздыванием. Скалярные управляющие воздействия принадлежат классу непрерывно дифференцируемых функций, удовлетворяющих поточечным ограничениям. На основе методики применения нестандартной внутренней вариации [6] , обеспечивающей выполнение амплитудных ограничений, доказано необходимое условие оптимальности первого порядка. Предложена итерационная процедура улучшения допустимых управлений. Наличие эффекта запаздывания потребовало модификации разработанного ранее математического аппарата исследования подобных задач. Для параболических уравнений данная постановка рассмотрена впервые. Для простоты изложения задача рассматривалась в классе скалярных управлений. Полученный результат легко обобщается на случай векторных управляющих воздействий.