Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания
Автор: Двуреченский Павел Евгеньевич, Иванов Григорий Евгеньевич
Журнал: Труды Московского физико-технического института @trudy-mipt
Статья в выпуске: 4 (16) т.4, 2012 года.
Бесплатный доступ
Разработан метод вычисления квазиоптимальных стратегий в нелинейной диффе- ренциальной игре на нефиксированном отрезке времени с целевым множеством. В дву- мерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольни- ков. Проведены детальные оценки погрешностей алгоритма.
Дифференциальная игра, оптимальная стратегия
Короткий адрес: https://sciup.org/142185876
IDR: 142185876
Текст научной статьи Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания
Основы теории дифференциальных игр с нулевой суммой заложены в работах Р. Айзекса. [1], Л.С. Понтрягина. [2], Н.Н. Красовского [3] и др. В настоящее время разработаны различные алгоритмы, вычисляющие цену игры и оптимальные стратегии управления [4] - [6]. Для линейных дифференциальных игр с выпуклым целевым множеством современные методы используют алгоритмы вычисления игровых множеств достижимости через опорные функции этих множеств. Если дифференциальная игра нелинейна, то игровые множества, достижимости становятся невыпуклыми и аппарат опорных функций неприменим.
В настоящей работе предлагается алгоритм построения квазиоптимальной (или е- оптимальной) стратегии управления для нелинейной дифференциальной игры на нефиксированном отрезке времени с целевым множеством. Алгоритм использует конструкцию игровых множеств достижимости, похожую на. конструкцию, используемую в [7]. В двумерном случае эти множества, могут быть построены с помощью алгоритма, близкого к алгоритму построения суммы Минковского двух многоугольников с использованием конволюты [9] - [10]. Настоящая работа, продолжает работу [8], в которой этот подход применяется для построения е-оптимальной стратегии управления для игры на фиксированном интервале времени.
Чрезвычайно высокая вычислительная сложность алгоритмов, используемых в теории дифференциальных игр, делает актуальной задачу анализа, эффективности этих алгоритмов. Для анализа, эффективности алгоритмов важно оценить их погрешности. В настоящей работе получены оценки параметра е, определяющего близость е-оптимальной стратегии к оптимальной в зависимости от параметров дискретизации.
1. Постановка задачи
Рассмотрим динамическую систему, описываемую дифференциальным уравнением
x(t) = a(x(t), u(t)) + b(x(t), v(t)), (1)
где t E [0, P] - время, число P определяет максимальную продолжительность игры, x(t) E R” - фазовый вектор системы, управление первого игрока u(t) и второго игрока v(t) подчинены ограничениям
u(t) E Р, x(t) E Q. (2)
Предполагается, что заданы компактные множества Р С Rp, Q С Rp и непрерывные функции a : Rn хР ^ Rn и b : Rn xQ ^ Rn. Кроме того, вектограммы a(x, Р ) = {a(x, и) : и E Р },
b(ж,Q) = {Ь(ж, v) : v G Q} выпуклы при всех ж G R”. Пусть также задано компактное множество М С R”, которое будем называть целевым или терминальным.
Пусть задан отрезок [tg, ti] С [0, Р] и пусть для какой-то начальной позиции ж(ф) = жо G R” и каких-то измеримых управлений n : [ф,Ц] ^ Р, v : [ф,Ц] ^ Q абсолютно непрерывная функция ж : [ф,Ц] ^ R” почти всюду на отрезке [tg, ti] удовлетворяет уравнению (1). Если существует момент времени t G [to, ti] такой, что ж(t) G М, то будем говорить, что на отрезке [Д,Ц] имеет место поимка. Иначе, то есть если ж(t) G М при всех t G [to,ti], то будем говорить, что на отрезке [Д,Ц] имеет место уклонение. Цель первого игрока состоит в минимизации числа Ро G [0, Р] такого, что на отрезке [0, Ро] обеспечена поимка. Цель второго игрока — обеспечить уклонение на отрезке [0, Р] или, если это невозможно, максимизировать время Ро G [0,Р] такое, что на отрезке [0, Ро] обеспечено уклонение.
Расстоянием от точки ж G R” до множества Y С R” называется величина
р(ж,У) = inf ||ж - у^ . (3)
y e v
Будем говорить, что на отрезке [tg, ti] С [0, Р] имеет место е-поимка, если существует такой момент времени t G [tg, ti], что р(ж(Ц,М) < е.
Будем предполагать, что функции а : R” х Р ^ R” и b : R” х Q ^ R” удовлетворяют следующим условиям Липшица:
||а(жі, ni) - а(ж2, П2)| 6 ^£||жі -Ж2І + L“|ni - «2||
(4) ;
; (5)
V ж1, ж2 G R”, n1, n2 G Р
||b(Ж1,V1) - Ь(ж2, V2)| 6 L^|ж1 - Ж2І + L^ |vi - V2|
V ж1,ж2 G R”, v1,v2 G Q
||а(ж,п)|| 6 Са V ж G R”, n GP; |b(ж,v)| 6 Съ V ж G R”, v G Q.
Обозначим
С = Са + Съ, L = L^ + L£.
2. Стратегии и законы управления
Пусть задан отрезок [Д,Ц] С [0, Р]. Множеством Ы[ф,Ц] допустимых реализаций управления первого игрока называется множество всех измеримых функций n : [tо,t1] ^ Р. Множеством У[tо,t1] допустимых реализаций управления второго игрока называется множество всех измеримых функций v : [tо,t1] ^ Q.
Позиционной стратегией первого игрока называется произвольная функция nstr : R” ^ Р. Пусть Т = {тЦ^о - разбиение отрезка
[t0,t1] С [0,Р] : t0 = то < т1 < ••• < ti = t1. Пгipa. (nstr,T). составленная из позици онной стратегии первого игрока nstr и разбиения Т отрезка [tо,t1], называется законом управления первого игрока на отрезке [Д,Ц]. Движением, соответствующим начальному состоянию ж(tо) = жо, закону у правления (nstr,T) и допустимой реализации управления v G У[tо,t1]. будем называть абсолютію непрерывную функцию ж : [tо, ti] ^ R”. определяемую из пошагового уравнения cr(t) = а(ж(t), nstr (ж(ті))) + b(ж(t), v(t)), (9)
которое должно выполняться при почти всех t G [тдТі+і] и всех г G 0,1 - 1. При этом начальная позиция для отрезка [то,ті] равна жо, а начальная позиция ж(т,) для отрезка [тг,Тг+1] совпадает с копенной позицией ж(т,) отрезка [ т і - і ,т і ].
В силу принятых предположений при заданных начальной позиции ж(to) = жо, разбиении Т, позиционной стратегии первого игрока ustr и допустимой реализации управления v € У [to, ti] движение ж(-) существует и единственно. Обозначим его следующим образом:
$mot(t, t0, жо, Т, ustr, v) = x(t) V t € [t0,ti]. (10)
Аналогично определяются позиционная стратегия второго игрока vstr и движение жmot(t, t0, жо, Т, u, vstr), соответствующее начальной позиции x(t0) = жо, разбиению Т, допустимой реализации управления первого игрока u € U [to, ti] и стратегии второго игрока vstr.
Будем говорить, что закон управления (ustr, Т ) гарантирует Е-поимку на отрезке [to, ti] для начального состояния жо, если для любой реализации управления v € У[to,ti] существует момент времени t € [Д,П] такой, что выполняется
6 ^mot(t, t0, жо, Т, ustT,v),M ) < е. (11)
Закон управления (vstr^) гарантирует уклонение на отрезке [to,ti] для начального состояния жо- если для любой реализации управления u € U[to,ti] выполняется жmot(t, t0,ж0,Т,u, vstr) € M V t E [t0,ti]. (12)
Пусть задано число е > 0 и законы управления (ustr,^), (vstr ,Т„ ) первого и второго игроков на отрезке [0,У]. Пара законов ((ustr,^), (vstr,^,)) называется Е-оптимальной, если для любого начального положения жо € R” такого, что у(жо,М ) > е, выполняется альтернатива:
1) существует момент времени Уо € [0, У] такой, что закон управления (ustr, Ти) гарантирует Е-поимку на отрезке [0,Уо], а закон управления (vstr,!,) гарантирует уклонение на отрезке [0, Уо]. либо
2) закон управления (vstr,!,) гарантирует уклонение на отрезке [0,У]
3. Алгоритм вычисления стратегии управления
Зафиксируем натуральное число I и рассмотрим равномерное разбиение Т = {тД{=о отрезка [0,У], где т і = гт, г € 0,1. Шаг т = У/I разбиения Т будем также называть параметром дискретизации по времени.
Для любого множества S С R” определим множества
AS = {ж € Rn : 3 u € Р : ж + та(ж, u) € S}, (13)
BS = {ж € Rn : V v € Q : ж + тЬ(ж, v) € S }. (14)
Таким образом, определены операторы A и B, которые будем называть одношаговыми операторами достиэюимости.
Суммой и разностью Минковского множеств X С R” и У С R” называются соответственно множества
X + У = {ж + у :ж € X, у €У}, X -У = {ж € Rn :ж + У СХ}. (15)
Для любого числа R > 0 через Вд обозначим замкнутый шар с центром в нуле и радиусом R; Вд = {ж € Rn : 11*11 6R}
Пусть X - класс аппроксимируюш,их міюжсств. то ость подмножеств R”. с которыми работают алгоритмы и которые с достаточной точностью аппроксимируют игровые множества достижимости (о них речь пойдет ниже). Примером класса X может служить класс многоугольников в R2.
Предположим, что построены алгоритмы, которые для каждого множества S € X с некоторыми погрешностями вычисляют множества AS, BS. Учитывая эти погрешности, будем предполагать, что реально для каждого множества S Е У вычисляются множества AS, BS класса У, удовлетворяющие условиям
A(S - B£A ) с AS с A(S + B£A ), (16)
B(S - B£B ) с BS с B(S + B£B ), (17)
где числа Е д, Е в определяют погрешности этих алгоритмов. В случае, если класс У состоит из многоугольников в R2 с длиной сторон, не превосходящей Һ, в качестве алгоритмов вычисления множеств AS, BS для S Е У могут быть использованы алгоритмы, построенные в [8]. При этом оценки их погрешностей Ед = 4Һ + L: ^ Caт 2, Е в = 4Һ + ^С ь т 2 останутся справедливыми для рассматриваемой здесь задачи.
Предположим, что построен алгоритм, который для любых множества S С У и вектора ж Е AS позволяет определить вектор й = й(ж, S) Е Р такой, что ж + та(ж,й) Е S + В£и. (18)
Также предположим, что построен алгоритм, который для любых множества S С У и вектора ж Е Rn \ (BS) позволяет определить вектор г = г(ж, S) Е Q такой, что ж + тЬ(ж,и) Е (Rn \ S) + B£i. (19)
Здесь числа Еи и е о определяют погрешности соответствующих алгоритмов. Для класса У, состоящего из многоугольников в R2 с длиной сторон, не превосходящей Һ, такие алгоритмы также построены в [8].
Зафиксируем некоторые векторы й* Е Р, г* Е Q и положим й(ж, S) = й* при ж Е AS, v(ж,S) = г* при ж Е BS . Тем самым определены функции й : Rn х У ^ Р, г : Rn х У ^ Q.(20)
Обозначим
ДО = т2 (LC + U^Ca), ,\ = т2 ^ PL^ ,(21)
Ди = Ди + ЕВ + (l+тLь)Еи, До = ДО + ЕД + (1 + тLa)Еo.(22)
Пусть имеются алгоритмы, которые для любого множества S Е У вычисляют множества DUS Е У. DVS Е У такие, что
S - B Д . С DuS С S - Вдц, S + BД„ С DoS С S + BД„ +£в,(23)
где число Е в определяет погрешность этих алгоритмов. Будем также предполагать монотонность по включению операторов DU и Do, то есть
DuSi С DuS2, DoSi С DoS2 V Si, S2 Е У : Si С S2.(24)
Зафиксируем положительное число е.
Определим множества М0 Е У, М0 Е У так, что
М + B£-£M СМ0^ СМ + B£,(25)
М + ВтС С М^ СМ + BtC+£m .(26)
Здесь число Е м Е (0, е) определяет погрешность начальной аппроксимации.
Двигаясь в сторону увеличения индекса г и используя описанные выше алгоритмы, вычислим наборы игровых мноэюеств достиэюимости {Мги}1=0, {М^ }{=0:
МД1 = (АІЗDиМ^U) иМи, г Е 0,1 - 1,(27)
МД1 = (BADoМ?) U МО, г Е 0,1 - 1.(28)
Отметим, что из этих определений следуют включения
М" С М^, М^ С МД1 V г G 0,7 - 1.(29)
Используя функции (20) и игровые множества достижимости, определим позиционные стратегии управления. Для любого вектора ж G R” \ MQ" положим
г(ж) = тах{г G 0,I — 1 : ж G М"},(30)
а для любого ж G Rn \ М' обозначим
j(ж) = max{j G 0,I — 1 : ж G М^+1}.(31)
Теперь для любого ж G R” определим
и81г(ж) |
( и*, = 1 .. , B D"M"(,)) , |
ж ж |
G G |
Мд", Rn \ М", |
(32) |
г81г(ж) |
Г о*, = Ф(ж, .4», М;Д . |
ж ж |
G G |
М' , Rn \М'. |
(33) |
Определим числа
Ад = Аи + А- + 2(ед + eg + Ed ),(34)
eq = т(С + Съ) + 2ем + Аи + ed + (тСъ + Ао(1 — 1))e(S т)L •(35)
Теорема 3.1. Пусть г G 0Д, жд G М'", стратегия nstr определена соотношением (32). Тогда закон управления (nstr,T) гарантирует е-поимку на отрезке [0, т:] для начального состояния ж(0) = жд.
Теорема 3.2. Пусть г G 0,1 — 1, жд G М' стратегия vstr определена соотношением (33). Тогда закон управления (vstr,T) гарантирует уклонение на отрезке [0,т,+1] для начального состояния ж(0) = жд.
Теорема 3.3. Пусть е > Ед, число т выбрано так, что тЕ^ < ^. Тогда
М? СМ V г € 0,1 — 1. (36)
Теорема 3.4. Пусть стратегии и8Д vstr определены соотношениями (32), (33). Пусть число е > тС + 2 е м выбрано так, что выполняется условие (36). Тогда пара законов управления ((и8ДТи), (vstr, Т")) является е-оптимальной.
-
4. Доказательство теорем 3.1-3.4
Лемма 4.1. Для любых мномсества S С R” и числа 5 > 0 операторы (13), (14) удовлетворяют соотношениям
AS + Bs С A(S + B(i+tL5)5),(37)
BS + B5 CB(S + B(i+tL^)5).(38)
Доказательство. Пусть ж G AS + B§. Тогда сущеетвует вектор у G AS такой, что \\у — ж\ 6 5. В силу равенства. (13) существует вектор и G Р такой, что у + та(у,и)G
Отсюда в силу соотношения (4) получаем включение ж + та(ж,и) G S + B (1+ tl ^ ) з-
Следовательно, ж G A(S + B(i+t^^)^), что доказывает включение (37). Включение (38) доказывается аналогично.□
Лемма 4.2. Пусти tL ^ < 1. Тогда для любих мноэюества S С Rn и числа 5 > 0 оператор (14) удовлетворяет включению
BS - В ^/д - т^) С B(S - В5 ).
Доказательство. Пусть х Е BS — B 5/ (1 - tL ^ ). Тогда для любых v Е Q, z Е B 5/ (1 - tL ^ ) имеем х + z + тЬ(х + z,v) Е S. Зафиксируем произвольные v ЕQ,у Е B§. Рассмотрим отображение F (z) = тЬ(х, v)+y — Tb(x+z, v). Так как tL ^ < 1, то это отображение является сжимающим. Следовательно, существует его неподвижная точка zo = тb(x,v) + у — тЬ(х + zo,v). При этом ||zo| = ||тb(x,v) + у — тЬ(х + zo,v)| < 5 + tL ^ ||zo|, откуда получаем, что zo Е Вб/(1-ть^ )• Таким образом, получаем, что х + тЬ(х, v) + у = х + zo + тЬ(х + zo, v) Е S. Отсюда, в силу произвольности выбора v Е Q и у Е Bs, следует, что х Е B(S — В д). □
Для любых to Е [0, Р],Н Е [to, ^], хо Е Rn,u Е Ы [to, t1], v Е У [to, t1] обозначим
x(t, t0,x0,u,v) = x(t) V t Е [to,t1], где х : [to, ti] ^ Rn - решение задачи Коши:
х(і) = a(x(t), u(t)) + b(x(t), v(t)), с начальным условием x(to) = xo•
Проводя рассуждения, близкие к доказательству леммы 5.1 из [7], получаем следующую лемму.
Лемма 4.3. Пусти задачи числа т Е (0, ^), to Е [0,Р — т], вектор xo Е Rn и функции и Е Ы [to, to + т ], v Е У [to, to + т ]. Пусти to+т хи = xo + a(xo, u(t))dt,(39)
to хі = x(to + т,to,xo,u,v).(40)
Тогда существует вектор vo Е Q такой, что вектор xuv = хи + тЬ(хи, vo)(41)
удовлетворяет неравенству Іхиу — хі| < AU,(42)
где число AU определено равенством (21).
Аналогичная лемма верна для векторов х^,хуи, определенных аналогично.
Лемма 4.4. Пусти xo Е M'U+1 \ М'и, стратегия ustr определяется соотношением (32), г Е 0,1 - 1. v ЕУ [0, т ]. хі =хито1(т, 0, xo, Т, ustr,v). Тогда хі Е Ми.
Доказательство. Определим функцию u Е Ы [0, т] формулой
u(t) = ustr(x0) V t Е [0, т]. (43)
Тогда справедливо равенство (40), где to = 0. Из включения xo Е МгД1 \ М“ и равенства (27) получаем xo Е ABduM'u. В силу равенства. (30) 11 включений (29) имеем г(xo) = г. Отсюда и из соотношений (18), (32) следует включение x0+тa(x0, ustr(x0)) Е BduM'u+ВЕи. Поэтому согласно равенству (43) получаем, что вектор хи, определяемый формулой (39), удовлетворяет включению хи ЕBDиМ'и + В£и. (44)
В силу леммы 4.3 существует вектор во Е Q такой, что для вектора хи- — хи + тЬ(хи,во) справедливо неравенство (42). Согласно включениям (17) и (38) имеем BDUM^ + В С B(DuM“ + В£в ) + В С B(DuM" + В£в + В^ (і+ tL ^ Y Отсюда, из определения (14) оператора B и (41), (44) получаем
^U- — хи + тЬ(хи, во) Е DuMf + B£B + B£ u (1+ tL ^ ).
Далее, учитывая (42), (22), (23), получаем хі Е DuM™ + В£в + В .- + В до С MU - В£в+£„(i+tL^)+ao + В£в+£Ц(і+^)+до С Md
□
Проводя рассуждения, аналогичные доказателвству леммы 4.4, получаем следующую лемму.
Лемма 4.5. Пусть хо Е M ™+2 \ M ™+і, j Е 0, I — 2 в ли j — I — 1, хо Е Rn \ M— Пусть стратегия вstr определяется соотпошсписм (33). и Е U [0,т]. хі — xmot(т, 0, хо, Т, и, вstr). Тогда хі Е M-
Лемма 4.6. Пусть хо Е M^ \ M“, стратегия ustr определяется соотношением (32), г Е 0,I — 1, в Е У[0,Tj+1]. Тогда сущеетвует индекс j Е 0, г + 1 такой, что xUnot (т, , 0, хо, Т, ustr , в) ЕМ™.
Доказательство. Будем доказывать утверждение по индукции. При г — 0 утверждение верно по лемме 4.4. Зафиксируем т Е 0, I — 1. По предположению индукции утверждение верно для всех г Е 0,т — 1. Нужно доказать, что о но будет верным и для г — т. Пусть хо Е Mf +1 \ Mf, в Е У [0,тт+1]. Требуется доказать, что
3 j Е 0, т + 1 : хт^т,, 0, хо,Т, ustr, в) Е Md. (45)
хт^т/г+ь 0, хо, Т, ustr, в) Е Md, и соотношение (45) выполнено при j — к + 1. □
Лемма 4.7. Пусть г Е 0, I — 1, хо / Md+і- Пусть стратегия вstr определяется соотношением (33). Тогда для любой функции и Е U [0, т] выполнено соотношение xmot(т, O,xo,Т,u,вstr) Е M-
Доказательство. Из условия хо / M^+і и включений (29) следует, что либо существует такой номер j Е г, I — 2, что хо Е M6+2 \ M6+U либо хо / MJ (в этом случае положим j — I — 1). Тогда по лемме 4.5 получаем, что xmot(т, 0, хо, Т, и, в^г) Е M™ V и Е U[0, т].
Это в совокупности с (29) дает доказываемое утверждение. □
Лемма 4.8. Для любого S С Rn выполнены включения
S С В(S + ВтСь),(46)
BS С S + ВтСь.(47)
Доказательство. Докажем включение (46). Пусть у Е S . Из соотношения (7) следует, что для любого и Е Q справедливо включение у + тЬ(у, и) Е S + Вт с ь- Отсюда по определению (14) оператора В следует, что у Е В (S + Втсь )•
Докажем включение (47). Пусть у Е BS . По определению (14) оператора В это означает, что для любого и Е Q выполнено включение у + тЬ(у,и) Е S . Отсюда и из соотношения (7) получаем у Е S + Втсь-□
Проводя рассуждения, близкие к доказательству леммы 5.9 из [7], получаем следующую лемму.
Лемма 4.9. Для любого S С Rn выполнено включение
BDUS - В тс ь С S.
Для любого индекса г Е 0,7 — 1 определим число г = (тСь + (1 — г — 1)Ао)е(/-і-1)т£. (48)
Лемма 4.10. Пусть выполнены неравенства тВ^ < |, е > Ео, г де Ео определено равенством (35). Тогда для любого j Е 0,1 — 1 выполнено включение
М " + Вг. СBDUМ-^. (49)
Доказательство. Будем доказывать утверждение по индукции. Из включений (25), (26) получаем следующую цепочку включений:
М0 + В е - тС -2 е м СМ + В тС +ем + В е - тС -2 е м = М + Ве—ем С М01. Отсюда, используя соотношения (23), получим включения
М0 + В е - тС -2 е м -Д.-ео С (М0 + В е - тС -2 е м) - В Ди■ С М^ — В д ,^ С D М .
Используя (46) для S = М0 + Ве-т С -2ем-Ди-ео- тС ь, получаем включение
М^ + В е - тС -2 е мД- тС ь С В(М0 + В е - тС -2 е мД ) С BDuМ'0. (50)
Из равенств (35) и (48) следует, что г0 + т(С + Сь) + 2 е м + Аи + е п = е0 6 е. Отсюда и из включения (50) получаем, что доказываемое включение (49) справедливо при j = 0.
Пусть теперь включение (49) справедливо при j = г Е 0,1 — 2, то есть
М ^ + Втч СBDUМ Д (51)
Требуется доказать, что включение (49) выполняется и при j = г + 1. Используя (51), с учетом леммы 4.2 и включения (17) получаем
М ^ + Втч- е в Кі - тЬ^^ С BDuМr — В е в К1 - т^ ^ С В^иМ? — В е в ) С ВDUМ Д
Отсюда с учетом (23) имеем
ПиМ, + ВГі-Д„-ео-ев/(1-тЬ^) С Мг + Вг^-ев/(І-тК^ С ВИиМі , то есть DuМі + ВРі С ВПиМД где
Р г = гг — Аи — е в — е в /(1 — тВ ь ).
Учитывая включение (16), получаем
A(D u М' “ + B . -ЕА ) с A(BDUM' ^ — B e a ) с АВЕиМД (53)
Из включений (16) и (37) следует, что т
AD u М ^ + В(р^-2еА)/(1+т£^) с A(D u М г + B e a ) + В ( р ; - 2 е а) / (1+ tL 5) с A(D u М г + Bp^-EA)•
Из включений (53), (27) получаем ADuМ г + B(Pi-2eA)/(1+TL^) с ABD y M i 1 с М^+р Введя обозначение
•г = 'іе TLa — Аг — Ed — 2ед — ев/(1 — тіңД(54)
из равенства (52) получаем неравенство 'г < (р г — 2е д )/(1 + тЕ ^ ). Следовательно, ADuМ г + В£і с М^р Используя соотношения (23), из последнего включения получаем
ADuмг + B д с М^ — -Вд . с Dn М^.(55)
Введем обозначение
• г = (т г — Аи — E d — е в )/(1 + тЬ ь )•(об)
Используя соотношения (17), (38) и (55), получаем включения
BADyМ + В = с В(ADгMi + Вев) + B д-вв)/(i+tL^ с BD^^.(57)
Так как • г < гд то из включений (24), (29), (51) получаем
М? + Вт. с МІ + BTl с BD^ с BD^^.(58)
Из соотношений (27), (57) и (58) имеем
М+ + B^ = ((BAD u М ? ) U М” ) + B =. = (BAD u М ” + B =) U (М ^ + B =) с BD^. (59)
Из (48) следует неравенство •+ < riе-тL — Ад. В силу равенств (34), (54), (56) и неравенства. тЬ ^ < 2 справедливо неравенство riе-тL — Ад < тг. Позтому •+ < тг. Отсюда и из соотношений (59) получаем, что включение (49) выполнено для j = г + 1. □
Доказательство теоремы 3.1. Если жд € Мд1, то утверждение теоремы следует из соотношений (25). Если жд / М^, то в силу включения жд € М“ получаем неравенство г > 0 п существование такого номера m € 0, г — 1. что жд € М^+i \ М^. Пусть задана, функция в € У[0,тт+1]. Тогда по лемме 4.6 (где положим г = т) существует такой номер j € 0, m + 1. что ж^Хт, 0,жд,Т,и8Ь:,в) € Мд. (60)
Это означает, что гарантируется е-поимка на отрезке [0,Tm+i] с [0,тг]. □
Доказательство теоремы 3.2. Зафиксируем произвольную функцию u € U [0,тг+1]. Обозначим ж(і) = xiiot(t, 0, жд, Т, u, vstr), t € [0, тг+i]. Применяя лемму 4.7, по индукции получаем, что ж(т ^ ) € Мі, - ^ п ри j € 0, г. Отсюда и из включений (29) следует, что ж(т ^ ) € Мд для любого j € 0,г. Предположим, что утверждение теоремы неверно. Тогда существует такой момент времени t € [0,тг+1], что ж(t) € М. Выберем индекс j € 0,г из условия |t — т ^ | < т. Тогда в силу (1). (6). (7) справедливо неравенство ||ж(т^) — ж(t) ^ < тС. Отетода и из включений (26) следует, что ж(т)-) ЕМ + Вт с с М^ ^. Противоречие. □
Доказательство теоремы 3.3. Пусть выполнено неравенство е > Ед. Зафиксируем произвольное г € 0,1 — 1. По лемме 4.10 выполнено включение М г + Втч с BDuM i l. Из равенств (48) следует неравенство гг > тСь- Поэтому М ^ + Вт с ь с BDuM i 1. Отсюда получаем, что М г с BDuMг■ — Вт с ь, и с учетом леммы 4.9 справедливо включение М г с М“. □
Доказательство теоремы 3.4. Пусть задан вектор жо G R” такой, что р(жо,М) > е. Тогда в силу (25) имеем жо / Мд. Если жо G МДр то существует номер г G 0, I — 2 такой, что жо G МД1 \ М“. Так как жо G МДг, то по теореме 3.1 закон управления (ustr, Т) гарантирует е-поимку на отрезке [0, т+г] для начально го состояния ж(0) = жо. Так как жо G Ми и, согласно соотношению (36), М^ С МД то жо G МУ и по теореме 3.2 закон управления (vstr,T) гарантирует уклонение на отрезке [0, т+1] для начального состояния ж(0) = жо. Таким образом, выполняется первы!І пункт альтернативы в определении е-оптимальной пары стратегий.
Пусть теперь жо G МДр Тогда согласно (36) имеем жо G МДр Отсюда по теореме 3.2 закон управления (vstr, Т ) гарантирует уклонение на отрезке [0, Р] для начального состояния ж(0) = жо, то есть реализуется второй пункт альтерпатпвы. □
5. Примеры классов аппроксимирующих множеств
Покажем, что теоремы 3.1-3.4 могут быть использованы для получения оценок погрешностей алгоритма, изложенного в работе [7]. Поскольку при доказательстве теорем 3.1-3.4 не использовался конкретный вид нормы, то, в частности, так же как и в работе [7], в качестве нормы в R” можно раосмотреть max-нор му: ||ж|| = maxjGi^ |ж«|. При этом шаром Вд будет куб с центром в ііуле и с ребрами длиной 2R. Пусть C - кубическая сетка в R” с шагом Һ. Каждому сеточному множеству S С C сопоставим телесное множество 8 (S ) С Rn, равное объединению кубов в R” с ребрам и длины Һ и центрами в точках множества S. Будем рассматривать класс аппроксимирующих множеств Д = {8 (S) : S - ограниченное подмножество C}. Используя обозначения [7], введем для любого S G Д множества
AS = 8(FU(S П C)), ВS = 8 (F(S П C)).
Легко получить (в обозначениях [7]), что ед = тКи5 + (1 + тЬи)Һ/2, е в = тК'5 + (1 + тҒ у )Һ/2. Для погрешностей расчета управлений выполняются оценки еи = (1 + тҒи)Һ/2,еу = (1 + tL v )Һ/2. При е в = 3Һ/2 выпо.тпепятотея включения (23) для операторов
D u S = 8 (S П C — BC, ), DvS = 8 (S П C + В^ +ев ).
Для е м = Һ выполняются включения (25), (26) для множеств МДМ' определенных следующим образом:
Мо и = 8 ((М + Be-h/2) П C), М = 8 ((М + ВтС+ һ/ 2) П C).
Подставляя эти оценки в формулу (35), получим, что при стремлении т, Һ, 5 к нулю погрешность ео по порядку величины совпадает с результатом работы [7]. Из полученной оценки, так же как и в [7], следует, что для получения достаточно малой погрешности необходимо выбирать достаточно малыми параметры Һ, т, 5, причем так, чтобы отношение Һ/т было достаточно малым.
Для класса аппроксимирующих множеств Д состоящего из многоугольников в R2 с длиной сторон, не превосходящей Һ, при реализации операторов А, В можно исплользо-вать алгоритмы, построенные в [8]. При этом в случае евклидовой нормы для погрешностей е м , е в ,еи,еу,е д ,е в вспомогательных алгоритмов, использующих конволюту, будут справедливы следующие оценки:
ем = Һ,
ев = max < , I, в (8Аи ’ 8А' J ’
ед = 4Һ + т 28 Са, е в = 4Һ + т 2ЦСЬ,
е и = V (ед + Һ/2)2 + Һ2/4, е, = х в ■ ^ 2 2 + һ 2 ,.
Работа выполнена при поддержке РФФИ, грант 10-01-00139 и ФЦП «Научные и научнопедагогические кадры инновационной России».
Список литературы Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания
- Айзекс Р. Дифференциальные игры. -М.: Мир, 1967.
- Понтрягин Л.С. Линейные дифференциальные игры преследования//Матем. сборник. -1980. -Т. 112, № 3. -С. 307-330.
- Красовский Н. Н. Управление динамической системой. -М.: Наука, 1985.
- Алгоритмы и программы решения линейных дифференциальных игр/ред. А.И. Субботин, В.С. Пацко. -Свердловск: УНЦ АН СССР, 1984.
- Patsko V.S., Botkin N.D., Kein V.M., Turova V.L., Zarkh M.A. Control of an aircraft landing in windshear//Journal of Optimization Theory and Applications. -1994. -V. 83, N 2. -P. 237-267.
- Patsko V.S., Turova V.L. Numerical solution of two-dimensional differential games: Preprint/IMM UrO RAN. Ekaterinburg, 1995. -78 p.
- Иванов Г.Е. Алгоритм решения нелинейной игровой задачи быстродействия//Фундаментальные и задачи проблемы современной математики: сб. науч. трудов/М.: МФТИ. -2011. -С. 49-76.
- Двуреченский П.Е., Иванов Г.Е. Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с использованием конволюты//Труды МФТИ. -2011. -Т. 3, № 1. -С. 61-67.
- Wein R. Exact and efficient construction of planar Minkowski sums using the convolution method//Proc. 14th European Symposium on Algorithms (ESA), LNCS. -2006. -V. 4186. -P. 829-840.
- Flato E. Robust and efficient construction of planar Minkowski sums//Master's thesis. School of Computer Science. Tel-Aviv University. -2000.