Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока

Бесплатный доступ

Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.

Короткий адрес: https://sciup.org/147158531

IDR: 147158531

Текст научной статьи Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока

Рассматривается линейная дифференциальная игра dx = A^xdt + B(t}du + C(t)v dt                           (1)

с импульсным управлением [1] первого игрока и и с фиксированным моментом окончания р. Здесь х е R8, и е Rs, ve R4, A(t), B(t),C(t) - непрерывные при t < р матрицы соответствующих размерностей. Задано линейное отображение л'.В8 —> Rn. Цель первого игрока заключается в том, чтобы в момент времени р осуществить равенство лх^ = 0.                                  (2)

Второй игрок, выбирая управление v, стремится не допустить выполнение равенства (2).

На каждом отрезке [f,r] допустимым программным управлением первого игрока является

Т функция м:[/,г]—>/?5 с ограниченной вариацией 11| du(r) || = sup ^|| и (г, ^-и (г, )||. Допустимое программное управление второго игрока является измеримым и ограниченным

Я(г(г))<1, t

Здесь посредством || • || и л() обозначены нормы в R5 и R4 соответственно.

Считается, что игроки обладают запасами //>0 и />0 ресурсов, которые тратятся на формирование управлений по следующему правилу: тт

^(г) = д(/)-J||c/m(f)||, /(т) = у0-J2(v(r))^r.(4)

//

При выбранных программных управлениях вектор х из состояния х(/) перемещается в состояние, определяемое обобщенной формулой Коши [1].

Обозначим через ф(/) фундаментальную матрицу системы (1) и перейдем к новой переменной

z(t)- я(/)х(/), л^~ лгф(р)фи0.(5)

Тогда получим,что

z(r) = z(/)+рУ(г)<Уи(г) + Ja/(f)v(f)Jf.(6)

ti

Здесь N^=n^B^\ М^=л^С^ - непрерывные матрицы, а первый интеграл понимается в смысле Римана-Стилтьеса.

В новых переменных условие встречи (2) принимает вид ^) = 0.(7)

В 1963 году Н.Н. Красовский [2] предложил метод решения дифференциальных игр, основанный на принципе поглощения областей достижимости. В этой работе рассмотрены игры с геометрическими, интегральными и импульсными ограничениями. Применение метода поглощения областей достижимости для игр с импульсными управлениями усложняется тем, что области достижимости, зависящие от запасов ресурсов, могут меняться разрывно. В работе [3] приведен Серия «Математика, физика, химия», выпуск 9                                       55

пример импульсной встречи двух точек, в котором первый игрок не сможет поддержать требуемого в методе включения областей достижимости.

В данной работе используется метод одномерного проектирования [4-6], который применительно к задачам импульсной встречи позволяет получить условие возможности поимки (7).

Наличие импульсного управления, приводящего к мгновенному изменению позиции, требует конкретизации понятия встречи (7).

Введем в рассмотрение вектограмму первого игрока

U^= |z g Rn ;z = N^u, |jw|| < 1|.

Считаем, что встреча произошла, если

z^e p^U^p).

Если выполнено это включение, то первый игрок путем мгновенного выбора части оставшегося запаса ресурсов может осуществить равенство (7).

  • 2.    ЗАДАЧА УКЛОНЕНИЯ

Обозначим через (,) скалярное произведение векторов в Rn. При каждых t < р и (p<=Rn обозначим ax(t,^) = max(VА(/)ы), a2^t,(p^ = max ^,A/(/)vV

Функция ах((,ф) является опорной функцией вектограммы (8), а функция а2(г,ф) является опорной функцией вектограммы второго игрока yQ)=^z е Rn ;z = M^v, Я(т) = 1|. Из непрерывности матриц N(t) и М^ следует непрерывность функций (10) [7].

Положим

(И)

Верна оценка [1]

m (/, (э) = max ах (г, <р\ t

Функция (11) является опорной функцией области достижимости U, первого игрока [5, 6],

где

U, = < z е Rn : z = рУ(г)(7м(г), J || <7w(г)|j = 1

Предположение 1. При любых 1 < р,ф*0 выполнено неравенство mU ,(р)> 0 .

Обозначим при / < р, у > 0

F(/, у, ^) = sup [ -2 V ’ ^/w (г) dr, \w(r)dr 0

Отметим, что в случае т(р,<р) = 0 целевой интеграл в (14) понимается как несобственный.

Теорема 1. Пусть начальное состояние t0,z0, р00 таково, что существует вектор ФеКп . для которого

|(^>^о )|>^0о^)(А) - ^(Wo^))-

Тогда возможно уклонение от встречи (9).

Доказательство. Из (14) и (15) следует, что существует функция w(r), удовлетворяющая ограничениям (14) с у = у о ,t = t0 такая, что

|(УР,2О )|>т(/0,^) р0

Возьмем набор точек

Ухоботов В.И., Зайцева О.В.

Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока tQ

и обозначим

  • -                   —Т---х fa2(r^)w(r)dr, / = 0,1,...Д-1.(18)

Тогда [5] верхняя грань числа Ао по всем наборам (17) равняется интегралу, стоящему в правой части формулы (16). Следовательно, при некотором наборе чисел (17) выполняется

|(^,z0 )|>w(z0,^)Cu0-Ло).(19)

Из определения функции а2 (10), применяя лемму о выборе А.Ф. Филиппова [8], найдем измеримую по t функцию v(t,(p)е R4 такую, что

^(V(C^)) = 1, (1Ф,М(_^^,ф)') = а2^,ф).(20)

Второй игрок строит свою стратегию следующим образом: берет найденные моменты времени /, (17) в качестве моментов коррекций и при t, l+l строит управление с помощью функции (20)

vXO = w(t)v(t^)sign^,z(t,)y(21)

Здесь принято, что sign 0 = 1. Покажем, что при любом допустимом поведении первого игрока реализовавшиеся в моменты времени t, положения z, = 2(1,) и запасы pt-p Q,) удовлетворяют неравенствам

|^,z,)|>m(/, ,ф^, -Д).

При i = 0 это неравенство выполнено. Пусть оно выполнено в момент времени t,. Тогда из пра вила перехода (6) и из формул (20) и (21) получим, что

|^’z/+i)|^

Ci

sign^^z^ jw(r)a2(r^)dr

|(^л(г)^ц(г))

Отсюда, используя неравенства (12), (22) и правило изменения ресурсов (4), получим, что

9+1

|^,z,+])|>m(/;,ф^,-А,)+ ^w^a2^r^dr -т^ ,ф^, - цм\

Подставим сюда формулу (18). Получим, что

|(^,г,+))|>т(^)(А+1-Д+1).

Отсюда и из условия монотонности mQt ,фУ>т^нХ,ф^ следует неравенство (22) при / + 1, если ц1+х > А1+1. Если же pJ+1 < АнХ, то неравенство (22) при i +1 очевидно.

Полагая в неравенстве (22) i = k , получим, что

К<Р,2(р))(>т(р,ф)р(р) = ах(р,ф)р(р).

Следовательно, включение (9) не выполнено.

Следствие 1. Для того чтобы первый игрок смог осуществить встречу (9), необходимо, чтобы начальные запасы ресурсов удовлетворяли неравенству ц0>аирЕ^у0,ф\ (ф,ф) = \.                    (23)

ф а (/) = шах — у—4; ф т\1,ф)

Как максимум непрерывных функций эта функция непрерывна при t < р [7].

р

Предположение 2. При любом t < р интеграл ja (r)dr< со.

При любых t <т < р, у>0, феКп обозначим

Г

p(t,r,y)-sup ^а(r)w(r)

г

p(t,r,y,

t

Здесь sup берется по всем измеримым функциям w: [z,г]—> [o,l], удовлетворяющим неравенству jw(r)dr

Из определения функции (25) следует, что р(<,р,у)> р(г,т,у*)+ р(т,р,у-у«), Кт<р, 0<у*<у.(28)

Из монотонности функции m (z, ^) и из формул (24) - (27) получим неравенство

P^t,T,Y,cp^

Из этого неравенства и из формулы (25) следует, что т (т, ф)                    тут ,ф)•

Теорема 2. Пусть начальное состояние таково, что |(^,z0)|

Тогда первый игрок сможет осуществить встречу (9).

Доказательство. Обозначим

BQ, z) = max          (ф,ф\ = 1.(32)

р т\Г,ф)

Тогда из (31) следует, что существует число s > 0 такое, что

В^,т^а- Р^,р,у^*8^р-1^<цо.(33)

Используя непрерывность функций т (t, ф} и а (?) можно показать, что для любого отрезка

-----7---7--- layrjdr < cU -z); t,reT, Кт<н8.              (34) тут ,ф)'

Отсюда следует, что можно построить последовательность чисел t0 < tx < t2 < •.. < t, —> p, для которых выполнено неравенство (34) при t = tt, т = tl+x. Учитывая неравенство (30), получим, что при любых у > 0, ф е Rn выполнено

Эти числа t, первый игрок берет в качестве моментов коррекции своего управления. Построим на отрезке [z( ,zj+! ] управление первого игрока.

Пусть в момент времени t( реализовавшееся состояние удовлетворяет неравенству

PktoP(36)

Тогда, используя обозначение (32), получим, что проблема моментов [1] р                        р

11| du (г) || -> min, z; + |у(г)<Ум (г) = 0

Ухоботов В.И.,

Игровая задача импульсной встречи со смешанным

Зайцева О.В.ограничением на управление второго игрока имеет решение м, (г), причем

Л|^и,(г)|(7, -/3(t,,p,y3-E(p-t,y

Первый игрок в качестве управления берет сужение функции и, (г) на отрезке [/,, f,+) ]. Тогда из правила перехода (6) получим, что для любого вектора феРп выполнено неравенство

Отсюда, используя неравенства (35) и (37), будем иметь

|(p,z,+1)|+i, 0(^+1 - P^P^-s^P-t?^ P^A^Y, -Y1+\)+£(tl+x -цУ.

Применив неравенство (28), получим неравенство (36) при z +1. Переходя в неравенстве (36) к пределу при t, -> р , получим, что | Up, z (р)) | < at Ур, ф^ц (р) для любого вектора ф&Кп . Стало быть, условие поимки (9) выполнено.

  • 4. ОДНОТИПНЫЕ ИГРЫ

Пусть mpppmQW\а2У,ф) = p\tWY Тогда функции (14) и (25) будут равны и примут вид р                р

Ос/) = 8иР [—T^w(r)<7r, fw(r)dr 0

Обозначим c*(z) = max( ф,гУс(ф) = 1. Тогда условия (15) и (31) примут вид б'О^о ) > '^о )(лА; -            сУ7(;)<туруМс.

Можно показать, что если в последнем неравенстве поставить знак равенства, то первый игрок сможет осуществить встречу (9).

Таким образом, найденное условие является необходимым и достаточным для осуществления встречи (9).

Пример. Рассмотрим игровую задачу о встрече в заданный момент времени р двух точек переменного состава с разнотипными законами выброса топлива [1,5]

xx=yx,dyx=du; x2=y2,y2=-v; xny,ERn.

Условие встречи означает совпадение геометрических координат хх (р') = х2 (р). Сделаем замену (5) и перейдем к новой переменной z = хх2 + (р~0(У1 - у2)- Тогда уравнение движения (6) и условие встречи (7) принимают вид

z(t) = zQ)+ ](р - r)du(r)+ f(p - г)т(г)<Уг, z(p) —0.

Считаем, что нормы ||• || и 20 совпадают и являются евклидовыми. Тогда из формул (10) и (11) получим, что т(?,(0 = (р ~0|М|’ CZ2(z,^) = (p - ОН^||. Поэтому функция (38) равна min(y ;р-1\ Условие возможной поимки примет вид

II ^ h (до - min(x; г - 70у^р - ?0).

Список литературы Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока

  • Красовский, Н.Н. Теория управления движением/Н.Н. Красовский. -М.: Наука, 1970. -420 с.
  • Красовский, Н.Н. Об одной задаче преследования/Н.Н. Красовский//Прикл. мат. и мех. -1963.-Т. 27.-Вып. 2.-С. 244-254.
  • Красовский, Н.Н. К задаче о преследовании в случае ограничений на импульсы управляющих сил/Н.Н. Красовский, В.Е. Третьяков//Дифференц. уравнения. -1966. -Т.2, № 5. -С. 587-599.
  • Ухоботов, В.И. Метод одномерного проектирования в линейной игре с интегральным ограничением и однотипные игры/В.И. Ухоботов//Изв. АН. Техн. кибернетика. -1994. -№ 3. -С. 192-199.
  • Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие/В.И. Ухоботов. -Челябинск: Челяб. гос. ун-т, 2005.-124 с.
  • Ухоботов, В.И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограничением на энергетику/В.И. Ухоботов//Рукопись деп. в ВИНИТИ № 3254 -В 87. -Челябинск: Челяб. гос. ун-т. -1987. -20 с.
  • Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи/Б.Н. Пшеничный. -М.: Наука, 1980.-320 с.
  • Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования/А.Ф. Филиппов//Вестник МГУ. Серия «Математика, механика». -1959. -№ 2. -С. 25-32.
  • Красовский, Н.Н. Позиционные дифференциальные игры/Н.Н. Красовский, А.И. Субботин. -М.: Наука, 1974. -456 с.
Еще
Статья научная