Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
Бесплатный доступ
Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.
Короткий адрес: https://sciup.org/147158531
IDR: 147158531
Текст научной статьи Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
Рассматривается линейная дифференциальная игра dx = A^xdt + B(t}du + C(t)v dt (1)
с импульсным управлением [1] первого игрока и и с фиксированным моментом окончания р. Здесь х е R8, и е Rs, ve R4, A(t), B(t),C(t) - непрерывные при t < р матрицы соответствующих размерностей. Задано линейное отображение л'.В8 —> Rn. Цель первого игрока заключается в том, чтобы в момент времени р осуществить равенство лх^ = 0. (2)
Второй игрок, выбирая управление v, стремится не допустить выполнение равенства (2).
На каждом отрезке [f,r] допустимым программным управлением первого игрока является
Т функция м:[/,г]—>/?5 с ограниченной вариацией 11| du(r) || = sup ^|| и (г, ^-и (г, )||. Допустимое программное управление второго игрока является измеримым и ограниченным
Я(г(г))<1, t Здесь посредством || • || и л() обозначены нормы в R5 и R4 соответственно. Считается, что игроки обладают запасами //>0 и />0 ресурсов, которые тратятся на формирование управлений по следующему правилу: тт ^(г) = д(/)-J||c/m(f)||, /(т) = у0-J2(v(r))^r.(4) // При выбранных программных управлениях вектор х из состояния х(/) перемещается в состояние, определяемое обобщенной формулой Коши [1]. Обозначим через ф(/) фундаментальную матрицу системы (1) и перейдем к новой переменной z(t)- я(/)х(/), л^~ лгф(р)фи0.(5) Тогда получим,что z(r) = z(/)+рУ(г)<Уи(г) + Ja/(f)v(f)Jf.(6) ti Здесь N^=n^B^\ М^=л^С^ - непрерывные матрицы, а первый интеграл понимается в смысле Римана-Стилтьеса. В новых переменных условие встречи (2) принимает вид ^) = 0.(7) В 1963 году Н.Н. Красовский [2] предложил метод решения дифференциальных игр, основанный на принципе поглощения областей достижимости. В этой работе рассмотрены игры с геометрическими, интегральными и импульсными ограничениями. Применение метода поглощения областей достижимости для игр с импульсными управлениями усложняется тем, что области достижимости, зависящие от запасов ресурсов, могут меняться разрывно. В работе [3] приведен Серия «Математика, физика, химия», выпуск 9 55 пример импульсной встречи двух точек, в котором первый игрок не сможет поддержать требуемого в методе включения областей достижимости. В данной работе используется метод одномерного проектирования [4-6], который применительно к задачам импульсной встречи позволяет получить условие возможности поимки (7). Наличие импульсного управления, приводящего к мгновенному изменению позиции, требует конкретизации понятия встречи (7). Введем в рассмотрение вектограмму первого игрока U^= |z g Rn ;z = N^u, |jw|| < 1|. Считаем, что встреча произошла, если z^e p^U^p). Если выполнено это включение, то первый игрок путем мгновенного выбора части оставшегося запаса ресурсов может осуществить равенство (7). 2. ЗАДАЧА УКЛОНЕНИЯ Обозначим через (,) скалярное произведение векторов в Rn. При каждых t < р и (p<=Rn обозначим ax(t,^) = max(VА(/)ы), a2^t,(p^ = max ^,A/(/)vV Функция ах((,ф) является опорной функцией вектограммы (8), а функция а2(г,ф) является опорной функцией вектограммы второго игрока yQ)=^z е Rn ;z = M^v, Я(т) = 1|. Из непрерывности матриц N(t) и М^ следует непрерывность функций (10) [7]. Положим (И) Верна оценка [1] m (/, (э) = max ах (г, <р\ t Функция (11) является опорной функцией области достижимости U, первого игрока [5, 6], где U, = < z е Rn : z = рУ(г)(7м(г), J || <7w(г)|j = 1 Предположение 1. При любых 1 < р,ф*0 выполнено неравенство mU ,(р)> 0 . Обозначим при / < р, у > 0 F(/, у, ^) = sup [ -2 V ’ ^/w (г) dr, \w(r)dr Отметим, что в случае т(р,<р) = 0 целевой интеграл в (14) понимается как несобственный. Теорема 1. Пусть начальное состояние t0,z0, р0,у0 таково, что существует вектор ФеКп . для которого |(^>^о )|>^0о^)(А) - ^(Wo^))- Тогда возможно уклонение от встречи (9). Доказательство. Из (14) и (15) следует, что существует функция w(r), удовлетворяющая ограничениям (14) с у = у о ,t = t0 такая, что |(УР,2О )|>т(/0,^) р0 Возьмем набор точек Ухоботов В.И., Зайцева О.В. Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока tQ и обозначим - —Т---х fa2(r^)w(r)dr, / = 0,1,...Д-1.(18) Тогда [5] верхняя грань числа Ао по всем наборам (17) равняется интегралу, стоящему в правой части формулы (16). Следовательно, при некотором наборе чисел (17) выполняется |(^,z0 )|>w(z0,^)Cu0-Ло).(19) Из определения функции а2 (10), применяя лемму о выборе А.Ф. Филиппова [8], найдем измеримую по t функцию v(t,(p)е R4 такую, что ^(V(C^)) = 1, (1Ф,М(_^^,ф)') = а2^,ф).(20) Второй игрок строит свою стратегию следующим образом: берет найденные моменты времени /, (17) в качестве моментов коррекций и при t, vXO = w(t)v(t^)sign^,z(t,)y(21) Здесь принято, что sign 0 = 1. Покажем, что при любом допустимом поведении первого игрока реализовавшиеся в моменты времени t, положения z, = 2(1,) и запасы pt-p Q,) удовлетворяют неравенствам |^,z,)|>m(/, ,ф^, -Д). При i = 0 это неравенство выполнено. Пусть оно выполнено в момент времени t,. Тогда из пра вила перехода (6) и из формул (20) и (21) получим, что |^’z/+i)|^ Ci |(^л(г)^ц(г)) Отсюда, используя неравенства (12), (22) и правило изменения ресурсов (4), получим, что 9+1 |^,z,+])|>m(/;,ф^,-А,)+ ^w^a2^r^dr -т^ ,ф^, - цм\ Подставим сюда формулу (18). Получим, что |(^,г,+))|>т(^)(А+1-Д+1). Отсюда и из условия монотонности mQt ,фУ>т^нХ,ф^ следует неравенство (22) при / + 1, если ц1+х > А1+1. Если же pJ+1 < АнХ, то неравенство (22) при i +1 очевидно. Полагая в неравенстве (22) i = k , получим, что К<Р,2(р))(>т(р,ф)р(р) = ах(р,ф)р(р). Следовательно, включение (9) не выполнено. Следствие 1. Для того чтобы первый игрок смог осуществить встречу (9), необходимо, чтобы начальные запасы ресурсов удовлетворяли неравенству ц0>аирЕ^у0,ф\ (ф,ф) = \. (23) ф а (/) = шах — у—4; ф т\1,ф) Как максимум непрерывных функций эта функция непрерывна при t < р [7]. р Предположение 2. При любом t < р интеграл ja (r)dr< со. При любых t <т < р, у>0, феКп обозначим Г p(t,r,y)-sup ^а(r)w(r) г p(t,r,y, t Здесь sup берется по всем измеримым функциям w: [z,г]—> [o,l], удовлетворяющим неравенству jw(r)dr Из определения функции (25) следует, что р(<,р,у)> р(г,т,у*)+ р(т,р,у-у«), Кт<р, 0<у*<у.(28) Из монотонности функции m (z, ^) и из формул (24) - (27) получим неравенство P^t,T,Y,cp^ Из этого неравенства и из формулы (25) следует, что т (т, ф) тут ,ф)• Теорема 2. Пусть начальное состояние таково, что |(^,z0)| Тогда первый игрок сможет осуществить встречу (9). Доказательство. Обозначим BQ, z) = max (ф,ф\ = 1.(32) р т\Г,ф) Тогда из (31) следует, что существует число s > 0 такое, что В^,т^а- Р^,р,у^*8^р-1^<цо.(33) Используя непрерывность функций т (t, ф} и а (?) можно показать, что для любого отрезка -----7---7--- layrjdr < cU -z); t,reT, Кт<н8. (34) тут ,ф)' Отсюда следует, что можно построить последовательность чисел t0 < tx < t2 < •.. < t, —> p, для которых выполнено неравенство (34) при t = tt, т = tl+x. Учитывая неравенство (30), получим, что при любых у > 0, ф е Rn выполнено Эти числа t, первый игрок берет в качестве моментов коррекции своего управления. Построим на отрезке [z( ,zj+! ] управление первого игрока. Пусть в момент времени t( реализовавшееся состояние удовлетворяет неравенству PktoP(36) Тогда, используя обозначение (32), получим, что проблема моментов [1] р р 11| du (г) || -> min, z; + |у(г)<Ум (г) = 0 Ухоботов В.И., Игровая задача импульсной встречи со смешанным Зайцева О.В.ограничением на управление второго игрока имеет решение м, (г), причем Л|^и,(г)|(7, -/3(t,,p,y3-E(p-t,y Первый игрок в качестве управления берет сужение функции и, (г) на отрезке [/,, f,+) ]. Тогда из правила перехода (6) получим, что для любого вектора феРп выполнено неравенство Отсюда, используя неравенства (35) и (37), будем иметь |(p,z,+1)| Применив неравенство (28), получим неравенство (36) при z +1. Переходя в неравенстве (36) к пределу при t, -> р , получим, что | Up, z (р)) | < at Ур, ф^ц (р) для любого вектора ф&Кп . Стало быть, условие поимки (9) выполнено. 4. ОДНОТИПНЫЕ ИГРЫ Пусть mpppmQW\а2У,ф) = p\tWY Тогда функции (14) и (25) будут равны и примут вид р р Ос/) = 8иР [—T^w(r)<7r, fw(r)dr Обозначим c*(z) = max( ф,гУс(ф) = 1. Тогда условия (15) и (31) примут вид б'О^о ) > '^о )(лА; - сУ7(;)<туруМс. Можно показать, что если в последнем неравенстве поставить знак равенства, то первый игрок сможет осуществить встречу (9). Таким образом, найденное условие является необходимым и достаточным для осуществления встречи (9). Пример. Рассмотрим игровую задачу о встрече в заданный момент времени р двух точек переменного состава с разнотипными законами выброса топлива [1,5] xx=yx,dyx=du; x2=y2,y2=-v; xny,ERn. Условие встречи означает совпадение геометрических координат хх (р') = х2 (р). Сделаем замену (5) и перейдем к новой переменной z = хх -х2 + (р~0(У1 - у2)- Тогда уравнение движения (6) и условие встречи (7) принимают вид z(t) = zQ)+ ](р - r)du(r)+ f(p - г)т(г)<Уг, z(p) —0. Считаем, что нормы ||• || и 20 совпадают и являются евклидовыми. Тогда из формул (10) и (11) получим, что т(?,(0 = (р ~0|М|’ CZ2(z,^) = (p - ОН^||. Поэтому функция (38) равна min(y ;р-1\ Условие возможной поимки примет вид II ^ h (до - min(x; г - 70у^р - ?0).
Список литературы Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока
- Красовский, Н.Н. Теория управления движением/Н.Н. Красовский. -М.: Наука, 1970. -420 с.
- Красовский, Н.Н. Об одной задаче преследования/Н.Н. Красовский//Прикл. мат. и мех. -1963.-Т. 27.-Вып. 2.-С. 244-254.
- Красовский, Н.Н. К задаче о преследовании в случае ограничений на импульсы управляющих сил/Н.Н. Красовский, В.Е. Третьяков//Дифференц. уравнения. -1966. -Т.2, № 5. -С. 587-599.
- Ухоботов, В.И. Метод одномерного проектирования в линейной игре с интегральным ограничением и однотипные игры/В.И. Ухоботов//Изв. АН. Техн. кибернетика. -1994. -№ 3. -С. 192-199.
- Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие/В.И. Ухоботов. -Челябинск: Челяб. гос. ун-т, 2005.-124 с.
- Ухоботов, В.И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограничением на энергетику/В.И. Ухоботов//Рукопись деп. в ВИНИТИ № 3254 -В 87. -Челябинск: Челяб. гос. ун-т. -1987. -20 с.
- Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи/Б.Н. Пшеничный. -М.: Наука, 1980.-320 с.
- Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования/А.Ф. Филиппов//Вестник МГУ. Серия «Математика, механика». -1959. -№ 2. -С. 25-32.
- Красовский, Н.Н. Позиционные дифференциальные игры/Н.Н. Красовский, А.И. Субботин. -М.: Наука, 1974. -456 с.