Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания

Автор: Двуреченский Павел Евгеньевич, Иванов Григорий Евгеньевич

Журнал: Труды Московского физико-технического института @trudy-mipt

Статья в выпуске: 4 (16) т.4, 2012 года.

Бесплатный доступ

Разработан метод вычисления квазиоптимальных стратегий в нелинейной диффе- ренциальной игре на нефиксированном отрезке времени с целевым множеством. В дву- мерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольни- ков. Проведены детальные оценки погрешностей алгоритма.

Дифференциальная игра, оптимальная стратегия

Короткий адрес: https://sciup.org/142185876

IDR: 142185876

An algorithm for constructing of optimal strategy in a nonlinear differential game with a non-fixed completion time

We develop a method to compute quasioptimal strategies in a nonlinear differential game on a non-fixed time interval with a goal set. In two-dimensional case the play-attainable sets are calculated by an algorithm, similar to one for convolution of Minkowskis sum of two polyhedra. We provide detail error estimations of the algorithm.

Текст научной статьи Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания

Основы теории дифференциальных игр с нулевой суммой заложены в работах Р. Айзекса. [1], Л.С. Понтрягина. [2], Н.Н. Красовского [3] и др. В настоящее время разработаны различные алгоритмы, вычисляющие цену игры и оптимальные стратегии управления [4] - [6]. Для линейных дифференциальных игр с выпуклым целевым множеством современные методы используют алгоритмы вычисления игровых множеств достижимости через опорные функции этих множеств. Если дифференциальная игра нелинейна, то игровые множества, достижимости становятся невыпуклыми и аппарат опорных функций неприменим.

В настоящей работе предлагается алгоритм построения квазиоптимальной (или е- оптимальной) стратегии управления для нелинейной дифференциальной игры на нефиксированном отрезке времени с целевым множеством. Алгоритм использует конструкцию игровых множеств достижимости, похожую на. конструкцию, используемую в [7]. В двумерном случае эти множества, могут быть построены с помощью алгоритма, близкого к алгоритму построения суммы Минковского двух многоугольников с использованием конволюты [9] - [10]. Настоящая работа, продолжает работу [8], в которой этот подход применяется для построения е-оптимальной стратегии управления для игры на фиксированном интервале времени.

Чрезвычайно высокая вычислительная сложность алгоритмов, используемых в теории дифференциальных игр, делает актуальной задачу анализа, эффективности этих алгоритмов. Для анализа, эффективности алгоритмов важно оценить их погрешности. В настоящей работе получены оценки параметра е, определяющего близость е-оптимальной стратегии к оптимальной в зависимости от параметров дискретизации.

1.    Постановка задачи

Рассмотрим динамическую систему, описываемую дифференциальным уравнением

x(t) = a(x(t), u(t)) + b(x(t), v(t)),                                    (1)

где t E [0, P] - время, число P определяет максимальную продолжительность игры, x(t) E R” - фазовый вектор системы, управление первого игрока u(t) и второго игрока v(t) подчинены ограничениям

u(t) E Р, x(t) E Q.                                        (2)

Предполагается, что заданы компактные множества Р С Rp, Q С Rp и непрерывные функции a : Rn хР ^ Rn и b : Rn xQ ^ Rn. Кроме того, вектограммы a(x, Р ) = {a(x, и) : и E Р },

b(ж,Q) = {Ь(ж, v) : v G Q} выпуклы при всех ж G R”. Пусть также задано компактное множество М С R”, которое будем называть целевым или терминальным.

Пусть задан отрезок [tg, ti] С [0, Р] и пусть для какой-то начальной позиции ж(ф) = жо G R” и каких-то измеримых управлений n : [ф,Ц] ^ Р, v : [ф,Ц] ^ Q абсолютно непрерывная функция ж : [ф,Ц] ^ R” почти всюду на отрезке [tg, ti] удовлетворяет уравнению (1). Если существует момент времени t G [to, ti] такой, что ж(t) G М, то будем говорить, что на отрезке [Д,Ц] имеет место поимка. Иначе, то есть если ж(t) G М при всех t G [to,ti], то будем говорить, что на отрезке [Д,Ц] имеет место уклонение. Цель первого игрока состоит в минимизации числа Ро G [0, Р] такого, что на отрезке [0, Ро] обеспечена поимка. Цель второго игрока — обеспечить уклонение на отрезке [0, Р] или, если это невозможно, максимизировать время Ро G [0,Р] такое, что на отрезке [0, Ро] обеспечено уклонение.

Расстоянием от точки ж G R” до множества Y С R” называется величина

р(ж,У) = inf ||ж - у^ .                                      (3)

y e v

Будем говорить, что на отрезке [tg, ti] С [0, Р] имеет место е-поимка, если существует такой момент времени t G [tg, ti], что р(ж(Ц,М) < е.

Будем предполагать, что функции а : R” х Р ^ R” и b : R” х Q ^ R” удовлетворяют следующим условиям Липшица:

||а(жі, ni) - а(ж2, П2)| 6 ^£||жі -Ж2І + L“|ni - «2||

(4) ;

;                  (5)

V ж1, ж2 G R”, n1, n2 G Р

||b(Ж1,V1) - Ь(ж2, V2)| 6 L^|ж1 - Ж2І + L^ |vi - V2|

V ж1,ж2 G R”, v1,v2 G Q

||а(ж,п)|| 6 Са V ж G R”, n GP; |b(ж,v)| 6 Съ V ж G R”, v G Q.

Обозначим

С = Са + Съ, L = L^ + L£.

2.    Стратегии и законы управления

Пусть задан отрезок [Д,Ц] С [0, Р]. Множеством Ы[ф,Ц] допустимых реализаций управления первого игрока называется множество всех измеримых функций n : [tо,t1] ^ Р. Множеством У[tо,t1] допустимых реализаций управления второго игрока называется множество всех измеримых функций v : [tо,t1] ^ Q.

Позиционной стратегией первого игрока называется произвольная функция nstr   : R”   ^ Р. Пусть   Т =   {тЦ^о - разбиение отрезка

[t0,t1] С [0,Р] : t0 = то < т1 < ••• < ti = t1. Пгipa. (nstr,T). составленная из позици онной стратегии первого игрока nstr и разбиения Т отрезка [tо,t1], называется законом управления первого игрока на отрезке [Д,Ц]. Движением, соответствующим начальному состоянию ж(tо) = жо, закону у правления (nstr,T) и допустимой реализации управления v G У[tо,t1]. будем называть абсолютію непрерывную функцию ж : [tо, ti] ^ R”. определяемую из пошагового уравнения cr(t) = а(ж(t), nstr (ж(ті))) + b(ж(t), v(t)),                                (9)

которое должно выполняться при почти всех t G [тдТі+і] и всех г G 0,1 - 1. При этом начальная позиция для отрезка [то,ті] равна жо, а начальная позиция ж(т,) для отрезка [тг,Тг+1] совпадает с копенной позицией ж(т,) отрезка [ т і - і і ].

В силу принятых предположений при заданных начальной позиции ж(to) = жо, разбиении Т, позиционной стратегии первого игрока ustr и допустимой реализации управления v € У [to, ti] движение ж(-) существует и единственно. Обозначим его следующим образом:

$mot(t, t0, жо, Т, ustr, v) = x(t) V t € [t0,ti]. (10)

Аналогично определяются позиционная стратегия второго игрока vstr и движение жmot(t, t0, жо, Т, u, vstr), соответствующее начальной позиции x(t0) = жо, разбиению Т, допустимой реализации управления первого игрока u U [to, ti] и стратегии второго игрока vstr.

Будем говорить, что закон управления (ustr, Т ) гарантирует Е-поимку на отрезке [to, ti] для начального состояния жо, если для любой реализации управления v € У[to,ti] существует момент времени t € [Д,П] такой, что выполняется

6 ^mot(t, t0, жо, Т, ustT,v),M ) <  е. (11)

Закон управления (vstr^) гарантирует уклонение на отрезке [to,ti] для начального состояния жо- если для любой реализации управления u € U[to,ti] выполняется жmot(t, t0,ж0,Т,u, vstr) € M V t E [t0,ti]. (12)

Пусть задано число е >  0 и законы управления (ustr,^), (vstr ,Т„ ) первого и второго игроков на отрезке [0,У]. Пара законов ((ustr,^), (vstr,^,)) называется Е-оптимальной, если для любого начального положения жо € R” такого, что у(жо,М ) >  е, выполняется альтернатива:

  • 1)    существует момент времени Уо € [0, У] такой, что закон управления (ustr, Ти) гарантирует Е-поимку на отрезке [0,Уо], а закон управления (vstr,!,) гарантирует уклонение на отрезке [0, Уо]. либо

  • 2)    закон управления (vstr,!,) гарантирует уклонение на отрезке [0,У]

  • 3.    Алгоритм вычисления стратегии управления

Зафиксируем натуральное число I и рассмотрим равномерное разбиение Т = {тД{=о отрезка [0,У], где т і = гт, г € 0,1. Шаг т = У/I разбиения Т будем также называть параметром дискретизации по времени.

Для любого множества S С R” определим множества

AS = {ж € Rn : 3 u € Р : ж + та(ж, u) € S},                   (13)

BS = {ж € Rn : V v € Q : ж + тЬ(ж, v) € S }.                   (14)

Таким образом, определены операторы A и B, которые будем называть одношаговыми операторами достиэюимости.

Суммой и разностью Минковского множеств X С R” и У С R” называются соответственно множества

X + У = {ж + у :ж € X, у €У},    X -У = {ж € Rn :ж + У СХ}.      (15)

Для любого числа R > 0 через Вд обозначим замкнутый шар с центром в нуле и радиусом R; Вд = {ж € Rn : 11*11 6R}

Пусть X - класс аппроксимируюш,их міюжсств. то ость подмножеств R”. с которыми работают алгоритмы и которые с достаточной точностью аппроксимируют игровые множества достижимости (о них речь пойдет ниже). Примером класса X может служить класс многоугольников в R2.

Предположим, что построены алгоритмы, которые для каждого множества S € X с некоторыми погрешностями вычисляют множества AS, BS. Учитывая эти погрешности, будем предполагать, что реально для каждого множества S Е У вычисляются множества AS, BS класса У, удовлетворяющие условиям

A(S - B£A ) с AS с A(S + B£A ),                       (16)

B(S - B£B ) с BS с B(S + B£B ),                       (17)

где числа Е д, Е в определяют погрешности этих алгоритмов. В случае, если класс У состоит из многоугольников в R2 с длиной сторон, не превосходящей Һ, в качестве алгоритмов вычисления множеств AS, BS для S Е У могут быть использованы алгоритмы, построенные в [8]. При этом оценки их погрешностей Ед = 4Һ + L: ^ Caт 2, Е в = 4Һ + ь т 2 останутся справедливыми для рассматриваемой здесь задачи.

Предположим, что построен алгоритм, который для любых множества S С У и вектора ж Е AS позволяет определить вектор й = й(ж, S) Е Р такой, что ж + та(ж,й) Е S + В£и.                               (18)

Также предположим, что построен алгоритм, который для любых множества S С У и вектора ж Е Rn \ (BS) позволяет определить вектор г = г(ж, S) Е Q такой, что ж + тЬ(ж,и) Е (Rn \ S) + B£i.                             (19)

Здесь числа Еи и е о определяют погрешности соответствующих алгоритмов. Для класса У, состоящего из многоугольников в R2 с длиной сторон, не превосходящей Һ, такие алгоритмы также построены в [8].

Зафиксируем некоторые векторы й* Е Р, г* Е Q и положим й(ж, S) = й* при ж Е AS, v(ж,S) = г* при ж Е BS . Тем самым определены функции й : Rn х У ^ Р,    г : Rn х У ^ Q.(20)

Обозначим

ДО = т2 (LC + U^Ca),   ,\ = т2 ^ PL^ ,(21)

Ди = Ди + ЕВ + (l+тLь)Еи,    До = ДО + ЕД + (1 + тLa)Еo.(22)

Пусть имеются алгоритмы, которые для любого множества S Е У вычисляют множества DUS Е У. DVS Е У такие, что

S - B Д . С DuS С S - Вдц,    S + BД„ С DoS С S + BД„ +£в,(23)

где число Е в определяет погрешность этих алгоритмов. Будем также предполагать монотонность по включению операторов DU и Do, то есть

DuSi С DuS2,     DoSi С DoS2    V Si, S2 Е У : Si С S2.(24)

Зафиксируем положительное число е.

Определим множества М0 Е У, М0 Е У так, что

М + B£-£M СМ0^ СМ + B£,(25)

М + ВтС С М^ СМ + BtC+£m .(26)

Здесь число Е м Е (0, е) определяет погрешность начальной аппроксимации.

Двигаясь в сторону увеличения индекса г и используя описанные выше алгоритмы, вычислим наборы игровых мноэюеств достиэюимости ги}1=0, {М^ }{=0:

МД1 = (АІЗDиМ^U) иМи,    г Е 0,1 - 1,(27)

МД1 = (BADoМ?) U МО,    г Е 0,1 - 1.(28)

Отметим, что из этих определений следуют включения

М" С М^,    М^ С МД1   V г G 0,7 - 1.(29)

Используя функции (20) и игровые множества достижимости, определим позиционные стратегии управления. Для любого вектора ж G R” \ MQ" положим

г(ж) = тах{г G 0,I — 1 : ж G М"},(30)

а для любого ж G Rn \ М' обозначим

j(ж) = max{j G 0,I — 1 : ж G М^+1}.(31)

Теперь для любого ж G R” определим

и81г(ж)

( и*,

= 1 .. , B D"M"(,)) ,

ж

ж

G

G

Мд",

Rn \ М",

(32)

г81г(ж)

Г о*,

= Ф(ж, .4», М .

ж

ж

G

G

М' , Rn \М'.

(33)

Определим числа

Ад = Аи + А- + 2(ед + eg + Ed ),(34)

eq = т(С + Съ) + 2ем + Аи + ed + (тСъ + Ао(1 — 1))e(S т)L •(35)

Теорема 3.1. Пусть г G 0Д, жд G М'", стратегия nstr определена соотношением (32). Тогда закон управления (nstr,T) гарантирует е-поимку на отрезке [0, т:] для начального состояния ж(0) = жд.

Теорема 3.2. Пусть г G 0,1 — 1, жд G М' стратегия vstr определена соотношением (33). Тогда закон управления (vstr,T) гарантирует уклонение на отрезке [0,т,+1] для начального состояния ж(0) = жд.

Теорема 3.3. Пусть е >  Ед, число т выбрано так, что тЕ^ < ^. Тогда

М? СМ V г € 0,1 — 1.                          (36)

Теорема 3.4. Пусть стратегии и8Д vstr определены соотношениями (32), (33). Пусть число е > тС + 2 е м выбрано так, что выполняется условие (36). Тогда пара законов управления ((и8ДТи), (vstr, Т")) является е-оптимальной.

  • 4.    Доказательство теорем 3.1-3.4

Лемма 4.1. Для любых мномсества S С R” и числа 5 > 0 операторы (13), (14) удовлетворяют соотношениям

AS + Bs С A(S + B(i+tL5)5),(37)

BS + B5 CB(S + B(i+tL^)5).(38)

Доказательство. Пусть ж G AS + B§. Тогда сущеетвует вектор у G AS такой, что \\у — ж\ 6 5. В силу равенства. (13) существует вектор и G Р такой, что у + та(у,и)G

Отсюда в силу соотношения (4) получаем включение ж + та(ж,и) G S + B (1+ tl ^ ) з-

Следовательно, ж G A(S + B(i+t^^)^), что доказывает включение (37). Включение (38) доказывается аналогично.□

Лемма 4.2. Пусти tL ^ <  1. Тогда для любих мноэюества S С Rn и числа 5 >  0 оператор (14) удовлетворяет включению

BS - В ^/д - т^) С B(S - В5 ).

Доказательство. Пусть х Е BS B 5/ (1 - tL ^ ). Тогда для любых v Е Q, z Е B 5/ (1 - tL ^ ) имеем х + z + тЬ(х + z,v) Е S. Зафиксируем произвольные v ЕQ,у Е B§. Рассмотрим отображение F (z) = тЬ(х, v)+y — Tb(x+z, v). Так как tL ^ <  1, то это отображение является сжимающим. Следовательно, существует его неподвижная точка zo = тb(x,v) + у тЬ(х + zo,v). При этом ||zo| = ||тb(x,v) + у — тЬ(х + zo,v)| <  5 + tL ^ ||zo|, откуда получаем, что zo Е Вб/(1-ть^ )• Таким образом, получаем, что х + тЬ(х, v) + у = х + zo + тЬ(х + zo, v) Е S. Отсюда, в силу произвольности выбора v Е Q и у Е Bs, следует, что х Е B(S В д).    □

Для любых to Е [0, Р],Н Е [to, ^], хо Е Rn,u Е Ы [to, t1], v Е У [to, t1] обозначим

x(t, t0,x0,u,v) = x(t) V t Е [to,t1], где х : [to, ti] ^ Rn - решение задачи Коши:

х(і) = a(x(t), u(t)) + b(x(t), v(t)), с начальным условием x(to) = xo•

Проводя рассуждения, близкие к доказательству леммы 5.1 из [7], получаем следующую лемму.

Лемма 4.3. Пусти задачи числа т Е (0, ^), to Е [0,Р — т], вектор xo Е Rn и функции и Е Ы [to, to + т ], v Е У [to, to + т ]. Пусти to+т хи = xo +      a(xo, u(t))dt,(39)

to хі = x(to + т,to,xo,u,v).(40)

Тогда существует вектор vo Е Q такой, что вектор xuv = хи + тЬ(хи, vo)(41)

удовлетворяет неравенству Іхиу — хі| < AU,(42)

где число AU определено равенством (21).

Аналогичная лемма верна для векторов х^,хуи, определенных аналогично.

Лемма 4.4. Пусти xo Е M'U+1 \ М'и, стратегия ustr определяется соотношением (32), г Е 0,1 - 1. v ЕУ [0, т ]. хі =хито1(т, 0, xo, Т, ustr,v). Тогда хі Е Ми.

Доказательство. Определим функцию u Е Ы [0, т] формулой

u(t) = ustr(x0) V t Е [0, т].                                    (43)

Тогда справедливо равенство (40), где to = 0. Из включения xo Е МгД1 \ М“ и равенства (27) получаем xo Е ABduM'u. В силу равенства. (30) 11 включений (29) имеем г(xo) = г. Отсюда и из соотношений (18), (32) следует включение x0+тa(x0, ustr(x0)) Е BduM'u+ВЕи. Поэтому согласно равенству (43) получаем, что вектор хи, определяемый формулой (39), удовлетворяет включению хи ЕBDиМ'и + В£и. (44)

В силу леммы 4.3 существует вектор во Е Q такой, что для вектора хи- — хи + тЬ(хи,во) справедливо неравенство (42). Согласно включениям (17) и (38) имеем BDUM^ + В С B(DuM“ + В£в ) + В С B(DuM" + В£в + В^ (і+ tL ^ Y Отсюда, из определения (14) оператора B и (41), (44) получаем

^U- — хи + тЬ(хи, во) Е DuMf + B£B + B£ u (1+ tL ^ ).

Далее, учитывая (42), (22), (23), получаем хі Е DuM™ + В£в + В .- + В до С MU - В£в+£„(i+tL^)+ao + В£в+£Ц(і+^)+до С Md

Проводя рассуждения, аналогичные доказателвству леммы 4.4, получаем следующую лемму.

Лемма 4.5. Пусть хо Е M ™+2 \ M ™+і, j Е 0, I — 2 в ли j — I — 1, хо Е Rn \ M— Пусть стратегия вstr определяется соотпошсписм (33). и Е U [0,т]. хі — xmot(т, 0, хо, Т, и, вstr). Тогда хі Е M-

Лемма 4.6. Пусть хо Е M^ \ M“, стратегия ustr определяется соотношением (32), г Е 0,I — 1, в Е У[0,Tj+1]. Тогда сущеетвует индекс j Е 0, г + 1 такой, что xUnot (т, , 0, хо, Т, ustr , в) ЕМ™.

Доказательство. Будем доказывать утверждение по индукции. При г — 0 утверждение верно по лемме 4.4. Зафиксируем т Е 0, I — 1. По предположению индукции утверждение верно для всех г Е 0,т — 1. Нужно доказать, что о но будет верным и для г — т. Пусть хо Е Mf +1 \ Mf, в Е У [0,тт+1]. Требуется доказать, что

3 j Е 0, т + 1 : хт^т,, 0, хо,Т, ustr, в) Е Md.                     (45)

хт^т/г+ь 0, хо, Т, ustr, в) Е Md, и соотношение (45) выполнено при j — к + 1.                                         □

Лемма 4.7. Пусть г Е 0, I — 1, хо / Md+і- Пусть стратегия вstr определяется соотношением (33). Тогда для любой функции и Е U [0, т] выполнено соотношение xmot(т, O,xo,Т,u,вstr) Е M-

Доказательство. Из условия хо / M^+і и включений (29) следует, что либо существует такой номер j Е г, I — 2, что хо Е M6+2 \ M6+U либо хо / MJ (в этом случае положим j — I — 1). Тогда по лемме 4.5 получаем, что xmot(т, 0, хо, Т, и, в^г) Е M™ V и Е U[0, т].

Это в совокупности с (29) дает доказываемое утверждение.                          □

Лемма 4.8. Для любого S С Rn выполнены включения

S С В(S + ВтСь),(46)

BS С S + ВтСь.(47)

Доказательство. Докажем включение (46). Пусть у Е S . Из соотношения (7) следует, что для любого и Е Q справедливо включение у + тЬ(у, и) Е S + Вт с ь- Отсюда по определению (14) оператора В следует, что у Е В (S + Втсь )•

Докажем включение (47). Пусть у Е BS . По определению (14) оператора В это означает, что для любого и Е Q выполнено включение у + тЬ(у,и) Е S . Отсюда и из соотношения (7) получаем у Е S + Втсь-□

Проводя рассуждения, близкие к доказательству леммы 5.9 из [7], получаем следующую лемму.

Лемма 4.9. Для любого S С Rn выполнено включение

BDUS - В тс ь С S.

Для любого индекса г Е 0,7 — 1 определим число г = (тСь + (1 — г — 1)Ао)е(/-і-1)т£.                          (48)

Лемма 4.10. Пусть выполнены неравенства тВ^ <  |, е Ео, г де Ео определено равенством (35). Тогда для любого j Е 0,1 — 1 выполнено включение

М " + Вг. СBDUМ-^.                             (49)

Доказательство. Будем доказывать утверждение по индукции. Из включений (25),    (26) получаем следующую цепочку включений:

М0 + В е - тС -2 е м СМ + В тС +ем + В е - тС -2 е м = М + Веем С М01. Отсюда, используя соотношения (23), получим включения

М0 + В е - тС -2 е м -Д.-ео С (М0 + В е - тС -2 е м) - В Ди■   С М^ — В д ,^ С D М .

Используя (46) для S = М0 + Ве-т С -2ем-Ди-ео- тС ь, получаем включение

М^ + В е - тС -2 е мД- тС ь С В(М0 + В е - тС -2 е мД ) С BDuМ'0.     (50)

Из равенств (35) и (48) следует, что г0 + т(С + Сь) + 2 е м + Аи + е п = е0 6 е. Отсюда и из включения (50) получаем, что доказываемое включение (49) справедливо при j = 0.

Пусть теперь включение (49) справедливо при j = г Е 0,1 — 2, то есть

М ^ + Втч СBDUМ Д                        (51)

Требуется доказать, что включение (49) выполняется и при j = г + 1. Используя (51), с учетом леммы 4.2 и включения (17) получаем

М ^ + Втч- е в Кі - тЬ^^ С BDuМr В е в К1 - т^ ^ С В^иМ? В е в ) С ВDUМ Д

Отсюда с учетом (23) имеем

ПиМ, + ВГі-Д„-ео-ев/(1-тЬ^) С Мг + Вг^-ев/(І-тК^ С ВИиМі , то есть DuМі + ВРі С ВПиМД где

Р г = гг — Аи е в е в /(1 — тВ ь ).

Учитывая включение (16), получаем

A(D u М' + B . -ЕА ) с A(BDUM' ^ B e a ) с АВЕиМД            (53)

Из включений (16) и (37) следует, что т

AD u М ^ + В(р^-2еА)/(1+т£^) с A(D u М г + B e a ) + В ( р ; - 2 е а) / (1+ tL 5) с A(D u М г + Bp^-EA)•

Из включений (53), (27) получаем ADuМ г + B(Pi-2eA)/(1+TL^) с ABD y M i 1 с М^+р Введя обозначение

•г = 'іе TLa — Аг — Ed — 2ед — ев/(1 — тіңД(54)

из равенства (52) получаем неравенство 'г <  г д )/(1 + тЕ ^ ). Следовательно, ADuМ г + В£і с М^р Используя соотношения (23), из последнего включения получаем

ADuмг + B д с М^ — -Вд . с Dn М^.(55)

Введем обозначение

г = г — Аи E d е в )/(1 + тЬ ь )•(об)

Используя соотношения (17), (38) и (55), получаем включения

BADyМ + В = с В(ADгMi + Вев) + B   д-вв)/(i+tL^ с BD^^.(57)

Так как г гд то из включений (24), (29), (51) получаем

М? + Вт. с МІ + BTl с BD^ с BD^^.(58)

Из соотношений (27), (57) и (58) имеем

М+ + B^ = ((BAD u М ? ) U М” ) + B =. = (BAD u М + B =) U ^ + B =) с BD^. (59)

Из (48) следует неравенство •+ < riе-тL — Ад. В силу равенств (34), (54), (56) и неравенства. тЬ ^ <  2 справедливо неравенство riе-тL — Ад <  тг. Позтому •+ тг. Отсюда и из соотношений (59) получаем, что включение (49) выполнено для j = г + 1.              □

Доказательство теоремы 3.1. Если жд € Мд1, то утверждение теоремы следует из соотношений (25). Если жд / М^, то в силу включения жд € М“ получаем неравенство г > 0 п существование такого номера m € 0, г — 1. что жд € М^+i \ М^. Пусть задана, функция в € У[0,тт+1]. Тогда по лемме 4.6 (где положим г = т) существует такой номер j € 0, m + 1. что ж^Хт, 0,жд,Т,и8Ь:,в) € Мд.                            (60)

Это означает, что гарантируется е-поимка на отрезке [0,Tm+i] с [0,тг].                   □

Доказательство теоремы 3.2. Зафиксируем произвольную функцию u € U [0,тг+1]. Обозначим ж(і) = xiiot(t, 0, жд, Т, u, vstr), t € [0, тг+i]. Применяя лемму 4.7, по индукции получаем, что ж(т ^ ) € Мі, - ^ п ри j € 0, г. Отсюда и из включений (29) следует, что ж(т ^ ) € Мд для любого j € 0,г. Предположим, что утверждение теоремы неверно. Тогда существует такой момент времени t € [0,тг+1], что ж(t) € М. Выберем индекс j € 0,г из условия |t — т ^ | <  т. Тогда в силу (1). (6). (7) справедливо неравенство ||ж(т^) — ж(t) ^ <  тС. Отетода и из включений (26) следует, что ж(т)-) ЕМ + Вт с с М^ ^. Противоречие.               □

Доказательство теоремы 3.3. Пусть выполнено неравенство е > Ед. Зафиксируем произвольное г € 0,1 — 1. По лемме 4.10 выполнено включение М г + Втч с BDuM i l. Из равенств (48) следует неравенство гг тСь- Поэтому М ^ + Вт с ь с BDuM i 1. Отсюда получаем, что М г с BDuMг■ Вт с ь, и с учетом леммы 4.9 справедливо включение М г с М“. □

Доказательство теоремы 3.4. Пусть задан вектор жо G R” такой, что р(жо,М) >  е. Тогда в силу (25) имеем жо / Мд. Если жо G МДр то существует номер г G 0, I — 2 такой, что жо G МД1 \ М“. Так как жо G МДг, то по теореме 3.1 закон управления (ustr, Т) гарантирует е-поимку на отрезке [0, т+г] для начально го состояния ж(0) = жо. Так как жо G Ми и, согласно соотношению (36), М^ С МД то жо G МУ и по теореме 3.2 закон управления (vstr,T) гарантирует уклонение на отрезке [0, т+1] для начального состояния ж(0) = жо. Таким образом, выполняется первы!І пункт альтернативы в определении е-оптимальной пары стратегий.

Пусть теперь жо G МДр Тогда согласно (36) имеем жо G МДр Отсюда по теореме 3.2 закон управления (vstr, Т ) гарантирует уклонение на отрезке [0, Р] для начального состояния ж(0) = жо, то есть реализуется второй пункт альтерпатпвы. □

5.    Примеры классов аппроксимирующих множеств

Покажем, что теоремы 3.1-3.4 могут быть использованы для получения оценок погрешностей алгоритма, изложенного в работе [7]. Поскольку при доказательстве теорем 3.1-3.4 не использовался конкретный вид нормы, то, в частности, так же как и в работе [7], в качестве нормы в R” можно раосмотреть max-нор му: ||ж|| = maxjGi^ |ж«|. При этом шаром Вд будет куб с центром в ііуле и с ребрами длиной 2R. Пусть C - кубическая сетка в R” с шагом Һ. Каждому сеточному множеству S С C сопоставим телесное множество 8 (S ) С Rn, равное объединению кубов в R” с ребрам и длины Һ и центрами в точках множества S. Будем рассматривать класс аппроксимирующих множеств Д = {8 (S) : S - ограниченное подмножество C}. Используя обозначения [7], введем для любого S G Д множества

AS = 8(FU(S П C)),    ВS = 8 (F(S П C)).

Легко получить (в обозначениях [7]), что ед = тКи5 + (1 + тЬи)Һ/2, е в = тК'5 + (1 + тҒ у )Һ/2. Для погрешностей расчета управлений выполняются оценки еи = (1 + тҒи)Һ/2,еу = (1 + tL v )Һ/2. При е в = 3Һ/2 выпо.тпепятотея включения (23) для операторов

D u S = 8 (S П C BC, ),    DvS = 8 (S П C + В^ +ев ).

Для е м = Һ выполняются включения (25), (26) для множеств МДМ' определенных следующим образом:

Мо и = 8 ((М + Be-h/2) П C),    М = 8 ((М + ВтС+ һ/ 2) П C).

Подставляя эти оценки в формулу (35), получим, что при стремлении т, Һ, 5 к нулю погрешность ео по порядку величины совпадает с результатом работы [7]. Из полученной оценки, так же как и в [7], следует, что для получения достаточно малой погрешности необходимо выбирать достаточно малыми параметры Һ, т, 5, причем так, чтобы отношение Һ/т было достаточно малым.

Для класса аппроксимирующих множеств Д состоящего из многоугольников в R2 с длиной сторон, не превосходящей Һ, при реализации операторов А, В можно исплользо-вать алгоритмы, построенные в [8]. При этом в случае евклидовой нормы для погрешностей е м , е в иу д в вспомогательных алгоритмов, использующих конволюту, будут справедливы следующие оценки:

ем = Һ,

ев = max <     , I, в        (8Аи ’ 8А' J ’

ед = 4Һ + т 28 Са,    е в = 4Һ + т 2ЦСЬ,

е и = V (ед + Һ/2)2 + Һ2/4,     е, = х в ■ ^ 2 2 + һ 2 ,.

Работа выполнена при поддержке РФФИ, грант 10-01-00139 и ФЦП «Научные и научнопедагогические кадры инновационной России».

Список литературы Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания

  • Айзекс Р. Дифференциальные игры. -М.: Мир, 1967.
  • Понтрягин Л.С. Линейные дифференциальные игры преследования//Матем. сборник. -1980. -Т. 112, № 3. -С. 307-330.
  • Красовский Н. Н. Управление динамической системой. -М.: Наука, 1985.
  • Алгоритмы и программы решения линейных дифференциальных игр/ред. А.И. Субботин, В.С. Пацко. -Свердловск: УНЦ АН СССР, 1984.
  • Patsko V.S., Botkin N.D., Kein V.M., Turova V.L., Zarkh M.A. Control of an aircraft landing in windshear//Journal of Optimization Theory and Applications. -1994. -V. 83, N 2. -P. 237-267.
  • Patsko V.S., Turova V.L. Numerical solution of two-dimensional differential games: Preprint/IMM UrO RAN. Ekaterinburg, 1995. -78 p.
  • Иванов Г.Е. Алгоритм решения нелинейной игровой задачи быстродействия//Фундаментальные и задачи проблемы современной математики: сб. науч. трудов/М.: МФТИ. -2011. -С. 49-76.
  • Двуреченский П.Е., Иванов Г.Е. Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с использованием конволюты//Труды МФТИ. -2011. -Т. 3, № 1. -С. 61-67.
  • Wein R. Exact and efficient construction of planar Minkowski sums using the convolution method//Proc. 14th European Symposium on Algorithms (ESA), LNCS. -2006. -V. 4186. -P. 829-840.
  • Flato E. Robust and efficient construction of planar Minkowski sums//Master's thesis. School of Computer Science. Tel-Aviv University. -2000.
Еще