Научные статьи \ Математика. Естественные науки \ Математика \ Анализ

Простейшая дифференциальная игра на плоскости с четырьмя участниками

Автор: Ширяев Виктор Дмитриевич, Шагилова Елена Викторовна

Журнал: Инженерные технологии и системы @vestnik-mrsu

Рубрика: Информатика, вычислительная техника и управление

Статья в выпуске: 1, 2019 года.

Бесплатный доступ

Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли. Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход. Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С -ядро и вектор Шепли. В явном виде выписаны компоненты вектора Ше-пли, показана принадлежность вектора Шепли С -ядру, а также непустота С -ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С -ядра. Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.

Еще

Простое движение, характеристическая функция, дележ, оптимальная траектория, устойчивость решения, с-ядро, вектор шепли

Короткий адрес: https://sciup.org/147220606

IDR: 147220606 | УДК: 517.977 | DOI: 10.15507/2658-4123.029.201901.040-050

Текст научной статьи Простейшая дифференциальная игра на плоскости с четырьмя участниками

Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.

Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как коопера- тивные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.

В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц Гv (z0, T -10) из начального состояния z0 и продолжительностью T-10. Уравнения движения имеют вид:

z = U 1 + u 2 + u 3 + u 4 , (1)

z ( t о ) = z о . ⁽²⁾

В равенстве (1) z = z ( x ; y ) , u_t = ( u^¹ ; u^ , | ^ J|< 1, i e N = { 1,2,3,4 } .

Функция выигрыша игрока i определяется следующим образом:

к;,. (z («)) = J h(z (t)) dt, t0

где z ( t ) = z ( t, t 0 , u 1 , u 2 , u 3 , u 4 ) -решение системы (1)-(2) при допустимых управлениях u 1 , u ₂, u 3 , u 4 , h i ( Z ( t )) = a i x ( t ) + b i y ( t ) + c i , a i , b i , c i = const ; a i , b , c i > 0, a i ² + b i + c i ² * 0, i e N .

Обзор литературы

Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абра-

Том 29, № 1. 2019

мянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой⁵при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр⁶[6-8]. В качестве принципа оптимальности в основном рассматривается С -ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.

Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9-11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14-16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во време- ни, что крайне важно для практических приложений.

Материалы и методы

В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С -ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.

Результаты исследования

Введем следующие обозначения:

и ( j ) = У u i j ) , u⁵ = u s j ) + u ( j Is, 5 I j 5 N \ 5

i е 5

SiSi i е 5

cs = Ус,, 5 с N.

Si i е 5

i е 5

Вычислим значение характеристической функции:

1) max ^ j h ( z ( t )) d T

z ² s (| 5 - N \ 5 ) ² ( T - 1 0 ) ² ‘⁶⁵ • ⁰

npu\S\ > N \ 5 ,

V ( 5 ;T - 1 0 , z 0 ) =.

2) m i n ^ j h, ( z ( t )) dT

z ² < (| N \ 5 - Я ) ² ( Г - 1 0 ) ² ' ⁶ ⁵ t ⁰

npu\5 < N \ 5 ,

3) ( T - 1 0 ) ^ c npu\5 = N \ 5 .

' ⁶ ⁵

Для нахождения v ( S ; T - 1 ₀, z ₀ ) воспользуемся принципом максимума [17]. Для рассматриваемой задачи 4

Сопряженное уравнение примет вид:

‘

P = [ h i ( z ⁽ ^t )) + h ( z ( t )) + h ( z ( t )) + ^h 4 ( z ( t )) ] _x .

Т. к. рассматривается задача со свободным правым концом и, следовательно, p ( T ) = 0, то

Тогда

H=aN (t—T) uN + bN (t—T)—

^— a N x 0 ^— ^bN У 0 .

—

Итак, следует найти max Hj =

max 2 ( a N u N + Ь^²);

достигается при

,(1) „(2) N,uN max H,

N	4 a	N uu N - ⁴ ^bN
Следо X ⁽ t ) y ( t ) Анало S u 1 = - 5 = { i, S S u 1 = 0, u 2 = S u 1 = - -
	a N + b N ' a ^N + b N ательно, _---— ⁽ t t 0 ^{) +} X 0 , V a N ⁺ ^bN r^-----y- ⁽ t t 0^{) +} y 0^.V a N ⁺ ^bN гично находим, что 2a₅ s 2 b_s

	¹ a s + b s ’ 7¹ j, l } , i ^ j ^ l, i, = 0, где 5 = { i , j } , i 2 a_S S		a s + ^bS’ j , l e N; * j , i , j e 2 b_S

	a_S ²	⁺ bs’ i	i a s, + b .2

Тогда

если S = { i , j , l } , i * j * l, i , j , l e N ;

-(5) , . -S , -x x (t) = u 1 (t -t ) +

-(s) / x -s y (t ) = u 2 (t -1) +

4 a_N

4 a N + b N

4 b N

⁽ t ^- t 0 ^{) +} x 0 ,

V a N + b N

⁽ t - t 0 ) + y 0 ,

4 V aN + bN

I+

t _G[ t_Q,T ] , t _G [ t , T ] .

И, следовательно,

T v (N ;T — t, z (t )) = J hN (z (t ))dT = t

⁺ asx о ⁺ ⁴ / bSbNкi ( t ^- t о )⁺ bsy о ⁺ cs d T = V aN + bN J

= 4 a S a N ⁺ b S b^N ( t - 1 0 ) + asx 0 + bsy о + Cs 1 ( T - 1 ) =

4 a_N ²

_ ^a N + b N

⁽ ^t - t 0 ^{) +} a N x 0 +

+ 4 aSaN ⁺ bsbi

■ ( t - t 0 ) + asx 0 + bsy 0 + cs ( T - t ) ,

+14 bN ( aN+bN

= J [ 4 S a N + b N ( t

( t - t 0 ) + ^bN y 0 + c N d T =

^- t 0 ) ⁺ a N x 0 ⁺ ^bN y 0 ⁺ c N ] d T =

= 2V a N + b N ( T - 1 )( T + 1 - 2 1 0 ) +

^{+ (} a N x 0 ⁺ ^bN y 0 ⁺ c N ⁾⁽ T - t ) ;

v ( S ;T - t , z ( t ) ) = j h s ( z ( t ) ) d T = t

• 2 a ² / -\ . a_ca„

. ^s t - 1 + 4 r-aNL

_ ^ s + b_s aa_N + b

2 b S ²

+a^x +t t s 0 a^ss

+ 4 b ^s b ^N ( t - 1 ) + ь +

= J [ 2 V a s + b s ( t — t ) + t

+ 4 ( ( a , a + b s b )/J aN + b 2 ) (

если

-J

a s x 0 ⁺ b s y 0 ⁺ c s ] d T =

= N a s + b s ( T - 1 ) ( T + 1 - 2 1 ) +

⁺ a s x 0 ⁺ b s y 0 ⁺ c s ] ( ^T ^- t ) ,

5 = { i , j } , i ^ j , i , j e N ;

⁺ a s x 0

4 a S + b S

4 aS ⁺ ^bS

4 a N + b N

+ b s y 0 + C s ] d T = J [- 2 4 a S + b S ( t — t ) + t

(( a S a N ⁺ b S b N )/ V a N ⁺ b N ) ( t ^- t 0 ) ⁺ a s X 0 + b s y 0 + C s ] d T =

- - 4a S + b S ( T - 1 ) ( T + 1 - 2 t ) +

⁺ a s x 0 ⁺ b s y 0 ⁺ c s ] ( T - t ) ,

если S = { i , } , i e N . Таким образом,

v ( N ; T - 1 , z ( t ) ) =

- V a N ⁺ ^bN ( ^T — t ) ( ^T ⁺ t — ² ^t 0 ) ⁺ + ( a N x о + b N y о + c N )( T ^- t ) ;

v ( { i , j , l } ; T - t , z ( t ) ) = + v ( { j , l , k } ; T - 1 , z ( t ) ) <

= V a 2 + b j ( T — t ) ( T + t — 2 t ) + < ³ ^v(

₄ a j a N ⁺ V N v ^({ i ^, ^У

N; T — t, z ( t ) ) , l } ; T - 1 , Z ( t ) ) + , k } ; T - 1, Z ( t ) ) + k } ; T - 1, z ( t ) ) < n ; t - 1, Z ( t ) ) , ^j ^} ; T - t , z ⁽ t ) ) + l } ; T - 1 , Z ( t ) ) + k } ; T - 1 , z ( t ) ) + l , k } ; T - 1 , Z ( t ) ) < ( N; T - 1 , Z ( t ) ) , i ^ j ^ k ^ l , t g [ 1 ₀ T ] . праведливость этих нера-

z ( t ) ) + v ( { i , j , k } ; T — t , z ( t ) ) + t , z ( t ) ) + v ( { j , l , k } ;T — t , z ( t ) ) —

a N + b N ⁽ 0 ) + v ( { j ,

⁺ ax 0 ⁺ M 0 ⁺ c ji ] ( T - t ) ; + v ( { i ,

v ( ^{ i , j ^} ; T — t , z ⁽ t ) ) = < ₂ v (

= [⁴ ( ( a j a N ⁺ bb ) 1 a ^aN ⁺ b N ) ( t — t 0 ) ⁺ v ( { i ,

⁺ a ij x 0 ⁺ j 0 ⁺ c j ] ( T ^- t ) ; + v ( { i

v ( { i } ;T - t , Z ( t ) ) = + v ( { i

=- a^ + b i ( T - 1 ) ( T + 1 -2 1 ) + + 2 v ( { j,

аа_м + bb,, < ³ v

^{+ 4} у— у ( t t 0 ) ⁺ a i x 0 ⁺ ^biy 0 ⁺ c i ⁽ ^T t ) ,

_ ^nN + b N J i , j , k , l g N ,

i ^ j ^ l , i , j , l e N . Покажем с

венств.

Рассмотрим С -ядро ⁽ С ⁽ T-t о , z ₀)) дан

ной игры. ^v ^({ i , j , ^l ^} ^T t

Теорема ¹ + v ( { i, l , k } . _T -

C v ( T - t , z ( t ) ) ^0 , t g [ t o , T ] . - 3 v ( n . t — 1 , Z

⁽ ^t ) ) = ( a2g i ⁺ ^b i 2 l ⁺ a 2g k ⁺ ^b i 2 k ⁺

Доказательство 22 22

+i a>i+ bb + +^Dnk ( T — t ) T + t — 2t +

Необходимым и достаточным усло- ' ^j ji /

^вием непусто™ С -ядра в игре четырех (( _Qiji + _Qijk + a _Zk + _Qjik ) _Qn

лиц является выполнение следующих +⁴ у—- +

неравенств⁷: aN^N ⁺ ^b N

V j. + v ₈k + v «k + v_flk ^ 3 v ( N ) , ++^Ь Ь ‘ ⁺ b jk + ^b -^lk + b jlk ⁾ ^b N 1 ( t — t o ) +

v i ⁺ v jk ⁺ v k ^ ² ^v ( ^N ) , , aN" + b N Д Д

, т ⁺⁽ a ijl ⁺ a ijk ⁺ a ilk ⁺ a jlk ) x ° ⁺⁽ ^b jl ⁺ ^b ijk ⁺ ^b lk ⁺ ^b jlk ) y ⁰ ⁺

v j ₊ V i ₊ v k ₊ ² v j,k < ³ ^v ⁽ N ) , . . , , _M , ⁺ ⁽ c ijl ⁺ c ijk ⁺ c ilk ⁺ c jlk )) ⁽ ^T ^— t ⁾ ^—

i , j , l , k g N , i * j * k * l . .-------

D —6 aw + Ьы ( T — t )( T + 1 — 2 t _n) —

В нашем случае эти неравенства ^NN ⁰

примут вид: ^— ³ ⁽ ^a N x ° + ^Ь " У ° + c N )⁽ ^T ^— t ) =

⁼ a^ + ь +j a ²+ ь + a^ + ь + a^/ + ь ^^

v V, ^j , ; ^ls z ⁺ jl jkk yk lk ik ^jik jlk

+ v ( { / , j , k } ; T — t , z ( t ) ) + x ( T - t ) ( T + t -2 t ) ⁺ ¹2 aNN + b N ( T - t ) ( t - t 0 ) -

+ v ( { z , l, k } ; T — t, z ( t ) ) + -6 aNN + b N ⁽ ^T ^— t ⁾⁽ ^T + t ^— ² t o ⁾⁼

⁷ Ширяев В. Д. С -ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.

22 22 22

= ((^ a ijl + bj! + j + bijk +1 alk + bit +

+^ a 2jik + b jik -⁶ ^ ^a N + b N ) ⁽ ^T - t ) ( T + t - 2 t ) ^ 0.

ф_Х _v ) = ⁽4 w1)! -- a^ ₍ t _ t )₍ t ₊ 1 _ ^ -_t) ₊

₊ ₄ | aa v ⁺ ^bb N

I 2 2

7 a^a + ⁺ ^b N

⁽ t-t 0 ) ⁺ ^a i x 0 ⁺ b_iy 0 ⁺ c i l x

Аналогично доказывается, что v ({i, j, i}; t -1, z (t)) +

+ v ( { j , i , k } ; t - 1 , z ( t ) ) +

+ v ( { i , k } ; T - t , z ( t ) ) -

- 2 v ( N ; T - t, z ( t ) ) =

= (7 a j ⁺ b j ⁺ 7 a j ⁺ b jk -

- 4 V a N + b N )( T - 1 ) ( T + t - 2 t ) < 0;

v ( ^{ i , j ^} ; T ^- t , z ( t ) ) +

+ v ( { i , l } ; T - t , z ( t ) ) +

+ v ( { i , k } ; T - t, z ( t ) ) +

+ 2 v ( { j, l, k } ; T - t, z ( t ) ) -

- 3 v ( N ; T - t, Z ( t ) ) =

= (2 7a№ + bjik - 6 7aN + bN )x

x( T -1)(T + t - 21 )< 0, t e[t0T], t e[t,T], i, j,k,l e N, i ^ j ^ k ^ l.

x( T -1 )-0]+(4-2)4(2-1^x f/( aj+ ail + aik ) aN , I bj + bil + bik ) bN 1.

X I 41 ।------------- + j( t t г i ) +

-7 7 V«N + bN VaN + bN)

⁺( a j ⁺ a il ⁺ a ik ) x 0 ⁺( ^b j ⁺ b il ⁺ ^b ik ) У 0 ⁺ c j ⁺ c il ⁺ c ik )^x x ( T - 1 ₀ ) + (N a j + b ² + ^ a l ² + b l + V a_k ² + b_k ² )( T - 1 ) x x ( T + 1 - 2 1 ) -f 4 a jlk a " ⁺ ^bjkbN ( t - 1 ₀ ) +

I 22

7 V a N ⁺ ^b N

+ajlkx0+ bjlky0+ cjlk)(T-t)]+(4 3)4(3

^x -( N ^a j ⁺ b jl ⁺ a j^+b^ ⁺ V ^a 2 k ⁺ b ik ) ⁽ ^T ^- t ⁾⁽ ^T ⁺ t ^- ² t ) ^{+ f} ⁽ a jl ⁺ a jk ⁺ a lk ) a N ⁽ bn ⁺ ^b jk ⁺ ^b ilk ) ^b N _f

+ 4 + (tt

V a N ⁺ b N NnN ⁺ b N

⁺ ⁽ ^a jl ⁺ ^a jk ⁺ ^a ilk ) x 0 ⁺ ⁽ ^b ljl ⁺ ^b ljk ⁺ b ilk ) y 0 ⁺

⁺ ⁽ c jl ⁺ c jk ⁺ c ilk ⁾⁾ ⁽ ^T ^- t ) ^-

4(ajl + ajk + alk ) aN + (bjl + bjk + blk ) bN (--t ) + 2 2 2 2

7 ^a N ⁺ ^b N aN_N ⁺ ^b N

( ^a jl ⁺ ^a jk ⁺ ^a lk ) x 0 ⁺( ^b jl ⁺ ^b jk ⁺ ^b lk ) У 0 ⁺ c jl ⁺ c jk ⁺ c lk )^x

(4 - 4)!(4 - 1)!

x(T -1)]+(4)-

:-² \ a N ⁺ b j N ⁽ ^T ^- t ⁾⁽ ^T ⁺ t ^- ² t ₀) ^{+ + (} ^a N x 0 ⁺ ^b N ^y 0 ⁺ c N ⁾ ⁽ ^T ^- t ) ^-

^- N a ²jik ⁺ ^b ²jik ⁽ ^T ^- t ⁾⁽ ^T ⁺ t ^- ^{2 ,)} ^-

Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:

Ф,( v (5 ;T -t, Z (t ))) = x (n-1)!(5 -1)!

= 5 ^ n n ! ^X

( i e 5 )

x[ v ( 5 ; T - 1 , Z ( t ) ) - v ( 5 \ { i } ;T - 1 , Z ( t ) ) ] . (3)

Подставляя значения v ( S ; T - 1 , z ( t ) ) в выражение (3), получим:

4 ^a jlk ^a N ⁺ ^b jlk ^b N

■⁽ t ^- t 0 ⁾ ⁺ a jlk x 0 ⁺ b jik y 0 ⁺ c jlk ) ⁽ ^T ^- t ⁾ ^] =

= 112 ^[ ^(- ³ V a , ^{2 +} ^b , ^{2 +} N a j+ b j ⁺

⁺ aa +bbi ⁺ V ^a k ⁺ ^b k ⁺ ^a 2 ⁺ b jl ⁺ a ² k ⁺ b ^k ⁺

⁺V ^a iik ⁺ b ik ⁺ V ^a jk ⁺ b jk ) ⁽ ^T ^- t ⁾⁽ ^T ⁺ t ^- ^{2 z)} ⁺

⁺ 6 V ^a N ⁺ ^b N ⁽ ^T ^- t ⁾⁽ ^T ⁺ t ^- ² t o ) ⁺

₊ ^f ₃₆ aa N ⁺ ^bb N

I 22

7 V a N ⁺ ^b N

⁽ t ^- t 0 ⁾⁽ ^T ^- t ) ^-

ajlkaN + bjlkbN ■ 12---.=—

⁽ t ^- t 0 ⁾⁽ ^T ^- t ) ⁺

Vol. 29, no. 1. 2019 -

■ ’ ( a i x о + by о + cxT - t ) ] ,

i , j , l , k e N , i * j * k * l , t e [ 1 ₀, T ], t e [ t , T ].

В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].

Перейдем к формальному определению принципа динамической устойчивости в игре Г v ( z ₀, T - 1 ₀ ) .

Пусть z ( • ) - условно-оптимальная траектория в игре Г _v ( z ₀ , T - 1 ₀ ) , Г v ( z ( t ) , T - 1 о ) , t о < t < T ^- текущие игры с решениями W v ( z ( t ) , T - t ) c c E v ( z ( t ) , T - t ) , где

E v ( z ( t ) , T ^- t ) = { ^ = ( £. £ 2 ,-, ^ n ) ^e e Rⁿ 1 5 i > v ( { i } , Z ( t ) , T — t ) , i e N , ^ 5 i = v ( N , Z ( t ) , T — t ) | .

i e N

Предположим, что W v ( z ( t ) ,T - 1 ) * 0 для всех 1 ₀< t < T .

Определение 1 [6; 7; 11]

Дележ ^ ^e W v ( z o , T ^- t ₀ ) будем называть устойчивым в игре Г „ ( z ₀, T - 1 ₀ ) , если существует интегрируемая на [ 1 ₀, T ] вектор-функция β ( t ) и такая дифференцируемая на [ 1 ₀, T ] вектор-функция £ ( t ), что дележ ξ представим в виде:

S = S ⁽ t ) , SAt ) = J РЛ^Т ) hi ( z ⁽ ^t ) ) d^T, t 0

и для всех t e [ 1 ₀, T ] существует такое подмножество W V ( z ( t ) , T - 1 ) множества W v ( z ( t ) , T - t ) , что

^ ( t ) + W V ( z ( t ) , T - t ) ^ W v ( z 0 , T - 1 0 ) .

Определение 2

Решение W v ( z ₀, T - 1 ₀ ) называется устойчивым, если устойчивы все входящие в него дележи. В таком сл у чае условно-оптимальная траектория z ( • ) называется оптимальной.

Данный способ реализации дележа зависит от выбора функции в ( т ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени t е [ 1 ₀, T ] игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.

В качестве решения W v ( z ₀, T - 1 ₀ ) рассмотрим С -ядро игры Г „ ( z ₀, T - 1 ₀ ) , которое обозначим через C v ( z ₀, T - 1 ₀ ) . Как было показано выше, C v ( z ( t ) , T - 1 ) *0 , 1 ₀ < t < T, где z ( • ) -условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С -ядра C v ( z ₀, T - 1 ₀ ) в кооперативной дифференциальной игре с интегральными выигрышами.

Теорема 2

Для того чтобы С -ядро C v ( z ₀, T - 1 ₀ ) кооперативной дифференциальной игры Г _v ( z ₀, T - 1 ₀ ) с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа ^ е C v ( z ₀, T - 1 ₀ ) имело место представление

т; _ t0

где вектор-функция в ( t ) в каждый момент t е [ 1 ₀, T ] удовлетворяет условиям:

1) v ( S ; z o ,T - 1 о ) + v ( N \ S ; Z ( t ) T - 1 ) -
T
-v(N;z⁽t⁾^,^T — t)<^Jpi⁽T'h^z⁽t))dT<

i ^e ^S 1 0

< v ( N ; Z 0 , T - 1 0 ) + v ( N \ S ; z o , T - 1 о ) -
- v ( S ; z ( t ) ,T - 1 ) при всех S c N ;

2) Ef А ⁽ ^т ) Ц z ^(т ) ) d ^T ⁼ Ef h i ( z ^(t ) ) d ^T .

i _e Nt о i _e Nt о

Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].

Исследуем теперь динамическую устойчивость вектора Шепли.

Теорема 3

В рассматриваемой игре вектор Шепли динамически устойчив.

Доказательство

Взяв β_i ( τ ) равным

1 ( t - т ) (( - 3 V а , ² + b i + J a ² + b +

+ V a l + b l + V a k + b k + j + b j +

⁺ j ⁺ b k ⁺ a k + b l k - 3 ja 2 k ⁺ j ) ⁺

⁺V a N ⁺ b N ( t о - ^т ⁾ ⁺ ^jlk j N jk N ( t - t о ) ^-

V aN + bN

, ад., + bb | ,

^- ³ I _{2 2} ~ ( t - t 0 ) - a i x 0 - b i y 0 - c i /

V a N ⁺ ^b N )

/ ( 4 ⁽ a i a N + b i b N )/4a N + b N ) + h i ⁽ Z о ) ,

получим, что

T фi (T — to, Zо ) = J Pi (T) hi (Z (T))dT.

t ₀

Теорема доказана

Обсуждение и заключение

В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С -ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.

Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.

Поступила 09.05.2018; принята к публикации 01.10.2018; опубликована онлайн 28.03.2019

Все авторы прочитали и одобрили окончательный вариант рукописи.

Сomputer science, computer engineering and management 49

Список литературы Простейшая дифференциальная игра на плоскости с четырьмя участниками

Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50-57.
Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52-53.
Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М.: Наука, 1991. 96 с.
Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5-15. URL: http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11. С. 54-59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1977. № 4. С. 46-52.
Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60-64. URL: http://www.sworld.com.ua/konfer39/97.pdf
Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs // Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513-520.
Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1979. № 1. С. 52-59.
Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33-38.
Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия. 1993. № 4. С. 40-16.
Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб.: Изд-во СПбГУ, 2008. 326 с.
Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651-666.
DOI: 10.1023/B:JOTA.0000025714.04164.e4
Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econo-metrica. 1987. Vol. 55, Issue 6. P. 1331-1348.
DOI: 10.2307/1913559
Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13-34.
DOI: 10.1007/BF01254381
Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans // The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473-492. URL: http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М.: Наука, 1969. 384 с.

Еще

Простейшая дифференциальная игра на плоскости с четырьмя участниками

Текст научной статьи Простейшая дифференциальная игра на плоскости с четырьмя участниками

2) Ef А ( т ) Ц z (т ) ) d T = Ef h i ( z (t ) ) d T .

Список литературы Простейшая дифференциальная игра на плоскости с четырьмя участниками

2) Ef А ⁽ ^т ) Ц z ^(т ) ) d ^T ⁼ Ef h i ( z ^(t ) ) d ^T .