Об одном подходе к поиску допустимых управлений в квадратичных системах с терминальными ограничениями-неравенствами

Бесплатный доступ

Предлагается процедура поиска допустимого управления в квадратичной по состоянию управляемой системе с терминальными ограничениями-неравенствами на основе решения специальной краевой задачи.

Оптимальное управление, квадратичная система, допустимые управления, терминальные ограничения

Короткий адрес: https://sciup.org/148180512

IDR: 148180512

Текст научной статьи Об одном подходе к поиску допустимых управлений в квадратичных системах с терминальными ограничениями-неравенствами

Рассматривается задача поиска допустимого управления xɺ(t) = f(x(t),u(t),t), x(t0)=x0, u(t)∈U ⊂Rm, t∈T=[t0,t1],                            (1)

Φ i ( u ) = ϕ i ( x ( t 1)) + Fi ( x ( t ), u ( t ), t ) dt 0 , i = 1, r ,                       (2)

T в которой x(t) = (x1(t),...,xn(t)) - вектор состояния, u(t) = (u1(t),...,um(t)) - вектор управления. В качестве доступных управлений рассматривается класс V кусочно-непрерывных функций на T со значениями в компактном множестве U . Функции f (x,u,t) , ϕi (x) , Fi(x,u,t) , i = 0, r квадратичны по x и непрерывны по u , t на множестве Rn × U × T. Начальное состояние x0 и интервал T заданы. Доступное управление u ∈V называется допустимым, если выполняются терминальные ограничения (2).

Поставим задачу поиска допустимого управления u V : найти управление v V с условием Φ i ( v ) ≤Φ i ( u ), i = 1, r .

Задача поиска допустимого управления (1), (2) представляет самостоятельный практический интерес при моделировании процессов с ограничениями, а также может рассматриваться в качестве вспомогательной задачи для поиска начального допустимого управления при решении задач оптимального управления с терминальными ограничениями-неравенствами.

Для каждого функционала Φ i ( u ) , i = 1, r введем функцию Понтрягина

Hi ( ψ , x , u , t ) =< ψ , f ( x , u , t )) - Fi ( x , u , t ) .

Обозначим pi(t,u,v) , t∈ T – решение модифицированной сопряженной системы pɺ(t) = -Hxi(p(t), x(t), w(t), t) - 12Hxix(p(t),x(t),w(t),t)y(t), p(t1)=-ϕix(x(t1))- 12ϕixx(x(t1)) y(t1)

при x ( t ) = x ( t , u ) , w ( t ) = u ( t ) , y ( t ) = x ( t , v ) - x ( t , u ) , t T .

В соответствии с работой [1] для управляемой системы (1) имеют место формулы приращения функционалов (2) для доступных управлений u V , v V , не содержащие остаточные члены разложений,

v Φ i ( u ) = - v ( t ) Hi ( pi ( t , u , v ), x ( t , v ), u ( t ), t ) dt , i = 1, r .                (3)

T

Для заданного u V введем отображение u с помощью соотношения

u* (p, x, t) = arg max min AwH' (pi, x, u(t), t), weU 1<' < r w p = (p e R",i = 1, r), x e R", t e T.

Метод поиска допустимого управления.

  • 1.    Найдем решение x ( t ), p ( t ) = ( p ' ( t ), i = 1, r ), t e T краевой задачи

x( t) = f (x (t), u * (p (t), x (t), t), t),      x (t0) = x0,(4)

p ' ( t ) = - H x ( p ( t ), x ( t , u ), u ( t ), t ) -

  • 1 ,''

  • - 2 Hxx ( p ( t ), x ( t , u ), u ( t ), t )( x ( t ) - x ( t , u ))

  • 2.    Сформируем управление

p' (t1) = -9x (x(t1, u)) -1

v(t) = u* (p(t), x(t), t), t e T.

Предположим, что решение краевой задачи (4), (5) (возможно, не единственное) существует на интервале T , причем получаемое управление v(t), t e T является кусочно-непрерывным.

Имеем x(t) = x(t, v), p' (t) = p' (t, u, v), t e T, i = 1, r . При этом

v(t) = argmaxmin(A„ H'(p'(t,u,v),x(t,v),u(t),t)), te T.           (6)

we U 1< ir w

Тогда получаем Av(t)H' (p1 (t,u, v), x(t, v),u(t), t) 0, t e T, i = 1, r. Отсюда и из соотношений (3) следует, что A v Ф' (u) 0, i = 1, r .

Для линейной по состоянию задачи (1), (2) (функции f (x,u,t), ^.(x), Ft(x,u,t), i = 1,r линейны по xe Rn) краевая задача (4), (5) сводится к (r +1) независимым задачам Коши.

В нелинейной по состоянию задаче (1), (2) для решения краевой задачи (4), (5) в пространстве состояний или эквивалентного условия улучшения (6) в пространстве управлений можно применить разработанный в [2] для квадратичных управляемых систем подход возмущений. Основу методов возмущений составляет выделение из (1), (2) линейной по состоянию невозмущенной задачи оптимального управления, для которой решение краевой задачи сводится к решению независимых задач Коши.

Трудоемкость метода нелокального улучшения в значительной мере зависит от трудоемкости решения вспомогательной задачи в каждый момент времени t e T min AwH' (p', x, u(t), t) ^ max,      x e Rn, p' e Rn, i = 1, r .                (7)

1<i<r w                            we U

Как показано в [2], в линейной по управлению задаче (1), (2) (функции f (x,u,t), фе(x), F(x,u,t), г = 1, r линейны по u e U), в случае существования точки v e U , для которой min A H (p', x, u (t), t) > 0, 1<

A wH' (p', x, u (t), t) ^ max, x e R", p' e R", 'e{1,..., r}.             (8)

wU

Таким образом, решение задачи (7) можно определить простым перебором решений задач (8). Для множества U , заданного линейными ограничениями, решение задачи (8) можно получить перебором угловых точек множества U .

В случае max min A„ H* (p', x, u(t), t) = 0 решением задачи (7) является точка w = u(t). we U 1< <r w

Предлагаемый подход на основе решения специальной краевой задачи характеризуется отсутствием типовой операции выпуклого или игольчатого варьирования управления по малому параметру, простотой настройки процедуры на конкретную задачу. Для линейной по состоянию управляемой системы с терминальными ограничениями краевая задача распадается на конечное число независимых задач Коши. В нелинейном случае структура рассматриваемой краевой задачи позволяет применить для ее эффективного решения широко известный в математике метод возмущений. Эти свойства являются существенными факторами повышения эффективности поиска допустимых управлений в задачах с ограничениями.

Статья научная