Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
Бесплатный доступ
Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.
Короткий адрес: https://sciup.org/147158531
IDR: 147158531
Текст научной статьи Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
Рассматривается линейная дифференциальная игра dx = A^xdt + B(t}du + C(t)v dt (1)
с импульсным управлением [1] первого игрока и и с фиксированным моментом окончания р. Здесь х е R8, и е Rs, ve R4, A(t), B(t),C(t) - непрерывные при t < р матрицы соответствующих размерностей. Задано линейное отображение л'.В8 —> Rn. Цель первого игрока заключается в том, чтобы в момент времени р осуществить равенство лх^ = 0. (2)
Второй игрок, выбирая управление v, стремится не допустить выполнение равенства (2).
На каждом отрезке [f,r] допустимым программным управлением первого игрока является
Т функция м:[/,г]—>/?5 с ограниченной вариацией 11| du(r) || = sup ^|| и (г, ^-и (г, )||. Допустимое программное управление второго игрока является измеримым и ограниченным
Я(г(г))<1, t
Здесь посредством || • || и л() обозначены нормы в R5 и R4 соответственно.
Считается, что игроки обладают запасами //>0 и />0 ресурсов, которые тратятся на формирование управлений по следующему правилу: тт
^(г) = д(/)-J||c/m(f)||, /(т) = у0-J2(v(r))^r.(4)
//
При выбранных программных управлениях вектор х из состояния х(/) перемещается в состояние, определяемое обобщенной формулой Коши [1].
Обозначим через ф(/) фундаментальную матрицу системы (1) и перейдем к новой переменной
z(t)- я(/)х(/), л^~ лгф(р)фи0.(5)
Тогда получим,что
z(r) = z(/)+рУ(г)<Уи(г) + Ja/(f)v(f)Jf.(6)
ti
Здесь N^=n^B^\ М^=л^С^ - непрерывные матрицы, а первый интеграл понимается в смысле Римана-Стилтьеса.
В новых переменных условие встречи (2) принимает вид ^) = 0.(7)
В 1963 году Н.Н. Красовский [2] предложил метод решения дифференциальных игр, основанный на принципе поглощения областей достижимости. В этой работе рассмотрены игры с геометрическими, интегральными и импульсными ограничениями. Применение метода поглощения областей достижимости для игр с импульсными управлениями усложняется тем, что области достижимости, зависящие от запасов ресурсов, могут меняться разрывно. В работе [3] приведен Серия «Математика, физика, химия», выпуск 9 55
пример импульсной встречи двух точек, в котором первый игрок не сможет поддержать требуемого в методе включения областей достижимости.
В данной работе используется метод одномерного проектирования [4-6], который применительно к задачам импульсной встречи позволяет получить условие возможности поимки (7).
Наличие импульсного управления, приводящего к мгновенному изменению позиции, требует конкретизации понятия встречи (7).
Введем в рассмотрение вектограмму первого игрока
U^= |z g Rn ;z = N^u, |jw|| < 1|.
Считаем, что встреча произошла, если
z^e p^U^p).
Если выполнено это включение, то первый игрок путем мгновенного выбора части оставшегося запаса ресурсов может осуществить равенство (7).
2. ЗАДАЧА УКЛОНЕНИЯ
Обозначим через (,) скалярное произведение векторов в Rn. При каждых t < р и (p<=Rn обозначим ax(t,^) = max(VА(/)ы), a2^t,(p^ = max ^,A/(/)vV
Функция ах((,ф) является опорной функцией вектограммы (8), а функция а2(г,ф) является опорной функцией вектограммы второго игрока yQ)=^z е Rn ;z = M^v, Я(т) = 1|. Из непрерывности матриц N(t) и М^ следует непрерывность функций (10) [7].
Положим
(И)
Верна оценка [1]
m (/, (э) = max ах (г, <р\ t
Функция (11) является опорной функцией области достижимости U, первого игрока [5, 6],
где
U, = < z е Rn : z = рУ(г)(7м(г), J || <7w(г)|j = 1
Предположение 1. При любых 1 < р,ф*0 выполнено неравенство mU ,(р)> 0 .
Обозначим при / < р, у > 0
F(/, у, ^) = sup [ -2 V ’ ^/w (г) dr, \w(r)dr
Отметим, что в случае т(р,<р) = 0 целевой интеграл в (14) понимается как несобственный.
Теорема 1. Пусть начальное состояние t0,z0, р0,у0 таково, что существует вектор ФеКп . для которого
|(^>^о )|>^0о^)(А) - ^(Wo^))-
Тогда возможно уклонение от встречи (9).
Доказательство. Из (14) и (15) следует, что существует функция w(r), удовлетворяющая ограничениям (14) с у = у о ,t = t0 такая, что
|(УР,2О )|>т(/0,^) р0
Возьмем набор точек
Ухоботов В.И., Зайцева О.В.
Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока tQ
и обозначим
- —Т---х fa2(r^)w(r)dr, / = 0,1,...Д-1.(18)
Тогда [5] верхняя грань числа Ао по всем наборам (17) равняется интегралу, стоящему в правой части формулы (16). Следовательно, при некотором наборе чисел (17) выполняется
|(^,z0 )|>w(z0,^)Cu0-Ло).(19)
Из определения функции а2 (10), применяя лемму о выборе А.Ф. Филиппова [8], найдем измеримую по t функцию v(t,(p)е R4 такую, что
^(V(C^)) = 1, (1Ф,М(_^^,ф)') = а2^,ф).(20)
Второй игрок строит свою стратегию следующим образом: берет найденные моменты времени /, (17) в качестве моментов коррекций и при t,
vXO = w(t)v(t^)sign^,z(t,)y(21)
Здесь принято, что sign 0 = 1. Покажем, что при любом допустимом поведении первого игрока реализовавшиеся в моменты времени t, положения z, = 2(1,) и запасы pt-p Q,) удовлетворяют неравенствам
|^,z,)|>m(/, ,ф^, -Д).
При i = 0 это неравенство выполнено. Пусть оно выполнено в момент времени t,. Тогда из пра вила перехода (6) и из формул (20) и (21) получим, что
|^’z/+i)|^
Ci
|(^л(г)^ц(г))
Отсюда, используя неравенства (12), (22) и правило изменения ресурсов (4), получим, что
9+1
|^,z,+])|>m(/;,ф^,-А,)+ ^w^a2^r^dr -т^ ,ф^, - цм\
Подставим сюда формулу (18). Получим, что
|(^,г,+))|>т(^)(А+1-Д+1).
Отсюда и из условия монотонности mQt ,фУ>т^нХ,ф^ следует неравенство (22) при / + 1, если ц1+х > А1+1. Если же pJ+1 < АнХ, то неравенство (22) при i +1 очевидно.
Полагая в неравенстве (22) i = k , получим, что
К<Р,2(р))(>т(р,ф)р(р) = ах(р,ф)р(р).
Следовательно, включение (9) не выполнено.
Следствие 1. Для того чтобы первый игрок смог осуществить встречу (9), необходимо, чтобы начальные запасы ресурсов удовлетворяли неравенству ц0>аирЕ^у0,ф\ (ф,ф) = \. (23)
ф а (/) = шах — у—4; ф т\1,ф)
Как максимум непрерывных функций эта функция непрерывна при t < р [7].
р
Предположение 2. При любом t < р интеграл ja (r)dr< со.
При любых t <т < р, у>0, феКп обозначим
Г
p(t,r,y)-sup ^а(r)w(r)
г
p(t,r,y,
t
Здесь sup берется по всем измеримым функциям w: [z,г]—> [o,l], удовлетворяющим неравенству jw(r)dr
Из определения функции (25) следует, что р(<,р,у)> р(г,т,у*)+ р(т,р,у-у«), Кт<р, 0<у*<у.(28)
Из монотонности функции m (z, ^) и из формул (24) - (27) получим неравенство
P^t,T,Y,cp^
Из этого неравенства и из формулы (25) следует, что т (т, ф) тут ,ф)•
Теорема 2. Пусть начальное состояние таково, что |(^,z0)|
Тогда первый игрок сможет осуществить встречу (9).
Доказательство. Обозначим
BQ, z) = max (ф,ф\ = 1.(32)
р т\Г,ф)
Тогда из (31) следует, что существует число s > 0 такое, что
В^,т^а- Р^,р,у^*8^р-1^<цо.(33)
Используя непрерывность функций т (t, ф} и а (?) можно показать, что для любого отрезка
-----7---7--- layrjdr < cU -z); t,reT, Кт<н8. (34) тут ,ф)'
Отсюда следует, что можно построить последовательность чисел t0 < tx < t2 < •.. < t, —> p, для которых выполнено неравенство (34) при t = tt, т = tl+x. Учитывая неравенство (30), получим, что при любых у > 0, ф е Rn выполнено
Эти числа t, первый игрок берет в качестве моментов коррекции своего управления. Построим на отрезке [z( ,zj+! ] управление первого игрока.
Пусть в момент времени t( реализовавшееся состояние удовлетворяет неравенству
PktoP(36)
Тогда, используя обозначение (32), получим, что проблема моментов [1] р р
11| du (г) || -> min, z; + |у(г)<Ум (г) = 0
Ухоботов В.И.,
Игровая задача импульсной встречи со смешанным
Зайцева О.В.ограничением на управление второго игрока имеет решение м, (г), причем
Л|^и,(г)|(7, -/3(t,,p,y3-E(p-t,y
Первый игрок в качестве управления берет сужение функции и, (г) на отрезке [/,, f,+) ]. Тогда из правила перехода (6) получим, что для любого вектора феРп выполнено неравенство

Отсюда, используя неравенства (35) и (37), будем иметь
|(p,z,+1)|
Применив неравенство (28), получим неравенство (36) при z +1. Переходя в неравенстве (36) к пределу при t, -> р , получим, что | Up, z (р)) | < at Ур, ф^ц (р) для любого вектора ф&Кп . Стало быть, условие поимки (9) выполнено.
4. ОДНОТИПНЫЕ ИГРЫ
Пусть mpppmQW\а2У,ф) = p\tWY Тогда функции (14) и (25) будут равны и примут вид р р
Ос/) = 8иР [—T^w(r)<7r, fw(r)dr
Обозначим c*(z) = max( ф,гУс(ф) = 1. Тогда условия (15) и (31) примут вид б'О^о ) > '^о )(лА; - сУ7(;)<туруМс.
Можно показать, что если в последнем неравенстве поставить знак равенства, то первый игрок сможет осуществить встречу (9).
Таким образом, найденное условие является необходимым и достаточным для осуществления встречи (9).
Пример. Рассмотрим игровую задачу о встрече в заданный момент времени р двух точек переменного состава с разнотипными законами выброса топлива [1,5]
xx=yx,dyx=du; x2=y2,y2=-v; xny,ERn.
Условие встречи означает совпадение геометрических координат хх (р') = х2 (р). Сделаем замену (5) и перейдем к новой переменной z = хх -х2 + (р~0(У1 - у2)- Тогда уравнение движения (6) и условие встречи (7) принимают вид
z(t) = zQ)+ ](р - r)du(r)+ f(p - г)т(г)<Уг, z(p) —0.
Считаем, что нормы ||• || и 20 совпадают и являются евклидовыми. Тогда из формул (10) и (11) получим, что т(?,(0 = (р ~0|М|’ CZ2(z,^) = (p - ОН^||. Поэтому функция (38) равна min(y ;р-1\ Условие возможной поимки примет вид
II ^ h (до - min(x; г - 70у^р - ?0).
Список литературы Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
- Красовский, Н.Н. Теория управления движением/Н.Н. Красовский. -М.: Наука, 1970. -420 с.
- Красовский, Н.Н. Об одной задаче преследования/Н.Н. Красовский//Прикл. мат. и мех. -1963.-Т. 27.-Вып. 2.-С. 244-254.
- Красовский, Н.Н. К задаче о преследовании в случае ограничений на импульсы управляющих сил/Н.Н. Красовский, В.Е. Третьяков//Дифференц. уравнения. -1966. -Т.2, № 5. -С. 587-599.
- Ухоботов, В.И. Метод одномерного проектирования в линейной игре с интегральным ограничением и однотипные игры/В.И. Ухоботов//Изв. АН. Техн. кибернетика. -1994. -№ 3. -С. 192-199.
- Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие/В.И. Ухоботов. -Челябинск: Челяб. гос. ун-т, 2005.-124 с.
- Ухоботов, В.И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограничением на энергетику/В.И. Ухоботов//Рукопись деп. в ВИНИТИ № 3254 -В 87. -Челябинск: Челяб. гос. ун-т. -1987. -20 с.
- Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи/Б.Н. Пшеничный. -М.: Наука, 1980.-320 с.
- Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования/А.Ф. Филиппов//Вестник МГУ. Серия «Математика, механика». -1959. -№ 2. -С. 25-32.
- Красовский, Н.Н. Позиционные дифференциальные игры/Н.Н. Красовский, А.И. Субботин. -М.: Наука, 1974. -456 с.