Простейшая дифференциальная игра на плоскости с четырьмя участниками

Автор: Ширяев Виктор Дмитриевич, Шагилова Елена Викторовна

Журнал: Инженерные технологии и системы @vestnik-mrsu

Рубрика: Информатика, вычислительная техника и управление

Статья в выпуске: 1, 2019 года.

Бесплатный доступ

Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли. Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход. Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С -ядро и вектор Шепли. В явном виде выписаны компоненты вектора Ше-пли, показана принадлежность вектора Шепли С -ядру, а также непустота С -ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С -ядра. Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.

Еще

Простое движение, характеристическая функция, дележ, оптимальная траектория, устойчивость решения, с-ядро, вектор шепли

Короткий адрес: https://sciup.org/147220606

IDR: 147220606   |   DOI: 10.15507/2658-4123.029.201901.040-050

Текст научной статьи Простейшая дифференциальная игра на плоскости с четырьмя участниками

Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.

Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как коопера- тивные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.

В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц Гv (z0, T -10) из начального состояния z0 и продолжительностью T-10. Уравнения движения имеют вид:

z = U 1 + u 2 + u 3 + u 4 ,       (1)

z ( t о ) = z о .             (2)

В равенстве (1) z = z ( x ; y ) , ut = ( u^1 ; u^ , | ^ J|< 1, i e N = { 1,2,3,4 } .

Функция выигрыша игрока i определяется следующим образом:

T

к;,. (z («)) = J h(z (t)) dt, t0

где z ( t ) = z ( t, t 0 , u 1 , u 2 , u 3 , u 4 ) -решение системы (1)-(2) при допустимых управлениях u 1 , u 2, u 3 , u 4 , h i ( Z ( t )) = a i x ( t ) + b i y ( t ) + c i , a i , b i , c i = const ; a i , b , c i 0, a i 2 + b i + c i 2 * 0, i e N .

Обзор литературы

Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абра-

Том 29, № 1. 2019

мянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6-8]. В качестве принципа оптимальности в основном рассматривается С -ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.

Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9-11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14-16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во време- ни, что крайне важно для практических приложений.

Материалы и методы

В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С -ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.

Результаты исследования

Введем следующие обозначения:

и ( j ) = У u i j ) , u5 = u s j ) + u ( j Is, 5             I j 5        N \ 5

i е 5

SiSi i е 5

cs = Ус,, 5 с N.

Si i е 5

i е 5

Вычислим значение характеристической функции:

1) max     ^ j h ( z ( t )) d T

z 2 s (| 5 - N \ 5 ) 2 ( T - 1 0 ) 2 65 0

npu\S\ N \ 5 ,

V ( 5 ;T - 1 0 , z 0 ) =.

2)    m i n     ^ j h, ( z ( t )) dT

z 2 < (| N \ 5 - Я ) 2 ( Г - 1 0 ) 2 ' 6 5 t 0

npu\5 N \ 5 ,

3) ( T - 1 0 ) ^ c npu\5 = N \ 5 .

' 6 5

Для нахождения v ( S ; T - 1 0, z 0 ) воспользуемся принципом максимума [17]. Для рассматриваемой задачи 4

Сопряженное уравнение примет вид:

P = [ h i ( z ( t )) + h ( z ( t )) + h ( z ( t )) + h 4 ( z ( t )) ] x .

Т. к. рассматривается задача со свободным правым концом и, следовательно, p ( T ) = 0, то

Тогда

H=aN (t—T) uN + bN (t—T)—

a N x 0 bN У 0 .

Итак, следует найти max Hj =

max 2 ( a N u N + Ь^2);

достигается при

,(1) „(2) N,uN max H,

N

4 a

N      uu N -    4 bN

Следо

X ( t ) y ( t )

Анало

S

u 1 = -

5 = { i,

S S

u 1 = 0, u 2 =

S

u 1 = - -

a N + b N '       a ^N + b N

ательно,

_---— ( t t 0 ) + X 0 ,

V a N + bN

r^-----y- ( t t 0) + y 0. V a N + bN

гично находим, что

2a5         s       2 bs

1 a s + b s ’        71

j, l } , i ^ j ^ l, i,

= 0, где 5 = { i , j } , i 2 aS       S

a s + bS’ j , l e N;

* j , i , j e

2 bS

aS 2

+ bs’        i

i a s, + b .2

N;

Тогда

если S = { i , j , l } , i * j * l, i , j , l e N ;

-(5) , .   -S , -x x (t) = u 1 (t -t ) +

-(s) / x -s y (t ) = u 2 (t -1) +

4 aN

4 a N + b N

4 b N

( t - t 0 ) + x 0 ,

T

aa

V a N + b N

( t - t 0 ) + y 0 ,

4 V aN + bN

I+

t G[ tQ,T ] , t G [ t , T ] .

И, следовательно,

T v (N ;T — t, z (t )) = J hN (z (t ))dT = t

+ asx о + 4 / bSbNкi ( t - t о )+ bsy о + cs d T = V aN + bN              J

= 4 a S a N + b S bN ( t - 1 0 ) + asx 0 + bsy о + Cs 1 ( T - 1 ) =

+

T

=J

4 aN 2

_ ^a N + b N

( t - t 0 ) + a N x 0 +

+ 4 aSaN + bsbi

■ ( t - t 0 ) + asx 0 + bsy 0 + cs ( T - t ) ,

+14 bN   ( aN+bN

T

= J [ 4 S a N + b N ( t

t

( t - t 0 ) + bN y 0 + c N d T =

- t 0 ) + a N x 0 + bN y 0 + c N ] d T =

= 2V a N + b N ( T - 1 )( T + 1 - 2 1 0 ) +

+ ( a N x 0 + bN y 0 + c N )( T - t ) ;

v ( S ;T - t , z ( t ) ) = j h s ( z ( t ) ) d T = t

T

  • •    2 a 2 /    -\ . aca„

. s t - 1 + 4 r-aNL

_ ^ s + bs         aaN + b

2 b S 2

+a^x +t t s 0 a^ss

  • + 4 b s b N ( t - 1 ) + ь +

+

+

T

= J [ 2 V a s + b s ( t t ) + t

+ 4 ( ( a , a + b s b )/J aN + b 2 ) (

+

если

T

-J

t

a s x 0 + b s y 0 + c s ] d T =

= N a s + b s ( T - 1 ) ( T + 1 - 2 1 ) +

+

+ a s x 0 + b s y 0 + c s ] ( T - t ) ,

5 = { i , j } , i ^ j , i , j e N ;

+ a s x 0

4 a S + b S

4 aS + bS

4 a N + b N

4 a N + b N

T

+ b s y 0 + C s ] d T = J [- 2 4 a S + b S ( t t ) + t

(( a S a N + b S b N )/ V a N + b N ) ( t - t 0 ) + a s X 0 + b s y 0 + C s ] d T =

- - 4a S + b S ( T - 1 ) ( T + 1 - 2 t ) +

+ a s x 0 + b s y 0 + c s ] ( T - t ) ,

если S = { i , } , i e N . Таким образом,

v ( N ; T - 1 , z ( t ) ) =

- V a N + bN ( T t ) ( T + t 2 t 0 ) + + ( a N x о + b N y о + c N )( T - t ) ;

v ( { i , j , l } ; T - t , z ( t ) ) =                        + v ( { j , l , k } ; T - 1 , z ( t ) ) <

= V a 2 + b j ( T t ) ( T + t 2 t ) +                 < 3 v(

4 a j a N + V N                          v ({ i , У

N; T t, z ( t ) ) , l } ; T - 1 , Z ( t ) ) + , k } ; T - 1, Z ( t ) ) + k } ; T - 1, z ( t ) ) < n ; t - 1, Z ( t ) ) , j } ; T - t , z ( t ) ) + l } ; T - 1 , Z ( t ) ) + k } ; T - 1 , z ( t ) ) + l , k } ; T - 1 , Z ( t ) ) < ( N; T - 1 , Z ( t ) ) , i ^ j ^ k ^ l , t g [ 1 0 T ] . праведливость этих нера-

z ( t ) ) + v ( { i , j , k } ; T t , z ( t ) ) + t , z ( t ) ) + v ( { j , l , k } ;T t , z ( t ) )

a N + b N (    0 )                      + v ( { j ,

+ ax 0 + M 0 + c ji ] ( T - t ) ;                  + v ( { i ,

v ( { i , j } ; T t , z ( t ) ) =                          < 2 v (

= [4 ( ( a j a N + bb ) 1 a aN + b N ) ( t t 0 ) +              v ( { i ,

+ a ij x 0 + j 0 + c j ] ( T - t ) ;                     + v ( { i

v ( { i } ;T - t , Z ( t ) ) =                                + v ( { i

=- a^ + b i ( T - 1 ) ( T + 1 -2 1 ) +                 + 2 v ( { j,

аам + bb,,                                       < 3 v

+ 4 у— у ( t t 0 ) + a i x 0 + biy 0 + c i ( T t ) ,

_ ^nN + b N                         J             i , j , k , l g N ,

i ^ j ^ l , i , j , l e N .                   Покажем с

венств.

Рассмотрим С -ядро ( С ( T-t о , z 0)) дан

ной игры.                                            v ({ i , j , l } T t

Теорема 1                                    + v ( { i, l , k } . T -

C v ( T - t , z ( t ) ) ^0 , t g [ t o , T ] .            - 3 v ( n . t 1 , Z

( t ) ) = ( a2g i + b i 2 l + a 2g k + b i 2 k +

Доказательство                   22  22

+i a>i+ bb + +Dnk ( T t ) T + t 2t +

Необходимым и достаточным усло-                ' j ji           /

вием непусто™ С -ядра в игре четырех               (( Qiji + Qijk + a Zk + Qjik ) Qn

лиц является выполнение следующих         +4     у—-    +

неравенств7:                                                 aNN + b N

V j. + v 8k + v «k + vflk ^ 3 v ( N ) ,                    ++Ь Ь + b jk + b -lk + b jlk ) b N 1 ( t t o ) +

v i + v jk + v k ^ 2 v ( N ) ,               ,             aN" + b N      Д Д

,        т                    +( a ijl + a ijk + a ilk + a jlk ) x ° +( b jl + b ijk + b lk + b jlk ) y 0 +

v j + V i + v k + 2 v j,k 3 v ( N ) , . . , ,     M                     ,                            + ( c ijl + c ijk + c ilk + c jlk )) ( T t )

i , j , l , k g N , i * j * k * l .                          .-------

D                                                —6 aw + Ьы ( T — t )( T + 1 — 2 t n) —

В нашем случае эти неравенства             NN          0

примут вид:                                          3 ( a N x ° + Ь " У ° + c N )( T t ) =

= a^ + ь +j a 2+ ь + a^ + ь + a^/ + ь ^^

v V, j ,    ;       ls z        +                            jl             jkk yk      lk ik      jik    jlk

+ v ( { / , j , k } ; T t , z ( t ) ) +                x ( T - t ) ( T + t -2 t ) + 12 aNN + b N ( T - t ) ( t - t 0 ) -

+ v ( { z , l, k } ; T t, z ( t ) ) +                        -6 aNN + b N ( T t )( T + t 2 t o )=

7 Ширяев В. Д. С -ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.

22 22 22

= ((^ a ijl + bj! + j + bijk +1 alk + bit +

+^ a 2jik + b jik -6 ^ a N + b N ) ( T - t ) ( T + t - 2 t ) ^ 0.

фХ v ) = (4 w1)! -- a^ ( t _ t )( t + 1 _ ^ -t) +

+ 4 | aa v + bb N

I 2         2

7 aa + + b N

( t-t 0 ) + a i x 0 + biy 0 + c i l x

Аналогично доказывается, что v ({i, j, i}; t -1, z (t)) +

+ v ( { j , i , k } ; t - 1 , z ( t ) ) +

+ v ( { i , k } ; T - t , z ( t ) ) -

- 2 v ( N ; T - t, z ( t ) ) =

= (7 a j + b j + 7 a j + b jk -

  • - 4 V a N + b N )( T - 1 ) ( T + t - 2 t ) < 0;

v ( { i , j } ; T - t , z ( t ) ) +

+ v ( { i , l } ; T - t , z ( t ) ) +

+ v ( { i , k } ; T - t, z ( t ) ) +

+ 2 v ( { j, l, k } ; T - t, z ( t ) ) -

- 3 v ( N ; T - t, Z ( t ) ) =

= (2 7a№ + bjik - 6 7aN + bN )x

x( T -1)(T + t - 21 )< 0, t e[t0T], t e[t,T], i, j,k,l e N, i ^ j ^ k ^ l.

x( T -1 )-0]+(4-2)4(2-1^x f/( aj+ ail + aik ) aN , I bj + bil + bik ) bN 1.

X I 41          ।------------- + j( t t г i ) +

-7 7   V«N + bN        VaN + bN)

+( a j + a il + a ik ) x 0 +( b j + b il + b ik ) У 0 + c j + c il + c ik )x x ( T - 1 0 ) + (N a j + b 2 + ^ a l 2 + b l + V ak 2 + bk 2 )( T - 1 ) x x ( T + 1 - 2 1 ) -f 4 a jlk a " + bjkbN ( t - 1 0 ) +

I 22

7     V a N + b N

+ajlkx0+ bjlky0+ cjlk)(T-t)]+(4 3)4(3

x -( N a j + b jl + a j^+b^ + V a 2 k + b ik ) ( T - t )( T + t - 2 t ) + f ( a jl + a jk + a lk ) a N  ( bn + b jk + b ilk ) b N f

+ 4                   +                  (tt

V a N + b N          NnN + b N

+ ( a jl + a jk + a ilk ) x 0 + ( b ljl + b ljk + b ilk ) y 0 +

+ ( c jl + c jk + c ilk )) ( T - t ) -

4(ajl + ajk + alk ) aN + (bjl + bjk + blk ) bN (--t ) + 2      2                    2      2

7 a N + b N         aNN + b N

( a jl + a jk + a lk ) x 0 +( b jl + b jk + b lk ) У 0 + c jl + c jk + c lk )x

(4 - 4)!(4 - 1)!

x(T -1)]+(4)-

:-2 \ a N + b j N ( T - t )( T + t - 2 t 0) + + ( a N x 0 + b N y 0 + c N ) ( T - t ) -

- N a 2jik + b 2jik ( T - t )( T + t - 2 ,) -

Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:

Ф,( v (5 ;T -t, Z (t ))) = x (n-1)!(5 -1)!

= 5 ^ n     n ! X

( i e 5 )

x[ v ( 5 ; T - 1 , Z ( t ) ) - v ( 5 \ { i } ;T - 1 , Z ( t ) ) ] . (3)

Подставляя значения v ( S ; T - 1 , z ( t ) ) в выражение (3), получим:

-

4 a jlk a N + b jlk b N

( t - t 0 ) + a jlk x 0 + b jik y 0 + c jlk ) ( T - t ) ] =

= 112 [ (- 3 V a , 2 + b , 2 + N a j+ b j +

+ aa +bbi + V a k + b k + a 2 + b jl + a 2 k + b ^k +

+V a iik + b ik + V a jk + b jk ) ( T - t )( T + t - 2 z) +

+ 6 V a N + b N ( T - t )( T + t - 2 t o ) +

+ f 36 aa N + bb N

I 22

7 V a N + b N

( t - t 0 )( T - t ) -

ajlkaN + bjlkbN ■ 12---.=—

( t - t 0 )( T - t ) +

Vol. 29, no. 1. 2019 -

( a i x о + by о + cxT - t ) ] ,

  • i ,    j , l , k e N , i * j * k * l , t e [ 1 0, T ], t e [ t , T ].

В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].

Перейдем к формальному определению принципа динамической устойчивости в игре Г v ( z 0, T - 1 0 ) .

Пусть z ( ) - условно-оптимальная траектория в игре Г v ( z 0 , T - 1 0 ) , Г v ( z ( t ) , T - 1 о ) , t о t T - текущие игры с решениями W v ( z ( t ) , T - t ) c c E v ( z ( t ) , T - t ) , где

E v ( z ( t ) , T - t ) = { ^ = ( £. £ 2 ,-, ^ n ) e e Rn 1 5 i v ( { i } , Z ( t ) , T t ) , i e N , ^ 5 i = v ( N , Z ( t ) , T t ) | .

i e N

Предположим, что W v ( z ( t ) ,T - 1 ) * 0 для всех 1 0 t T .

Определение 1 [6; 7; 11]

Дележ ^ e W v ( z o , T - t 0 ) будем называть устойчивым в игре Г ( z 0, T - 1 0 ) , если существует интегрируемая на [ 1 0, T ] вектор-функция β ( t ) и такая дифференцируемая на [ 1 0, T ] вектор-функция £ ( t ), что дележ ξ представим в виде:

t

S = S ( t ) , SAt ) = J РЛТ ) hi ( z ( t ) ) dT, t 0

и для всех t e [ 1 0, T ] существует такое подмножество W V ( z ( t ) , T - 1 ) множества W v ( z ( t ) , T - t ) , что

^ ( t ) + W V ( z ( t ) , T - t ) ^ W v ( z 0 , T - 1 0 ) .

Определение 2

Решение W v ( z 0, T - 1 0 ) называется устойчивым, если устойчивы все входящие в него дележи. В таком сл у чае условно-оптимальная траектория z ( ) называется оптимальной.

Данный способ реализации дележа зависит от выбора функции в ( т ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени t е [ 1 0, T ] игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.

В качестве решения W v ( z 0, T - 1 0 ) рассмотрим С -ядро игры Г ( z 0, T - 1 0 ) , которое обозначим через C v ( z 0, T - 1 0 ) . Как было показано выше, C v ( z ( t ) , T - 1 ) *0 , 1 0 t T, где z ( ) -условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С -ядра C v ( z 0, T - 1 0 ) в кооперативной дифференциальной игре с интегральными выигрышами.

Теорема 2

Для того чтобы С -ядро C v ( z 0, T - 1 0 ) кооперативной дифференциальной игры Г v ( z 0, T - 1 0 ) с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа ^ е C v ( z 0, T - 1 0 ) имело место представление

т;           _ t0

где вектор-функция в ( t ) в каждый момент t е [ 1 0, T ] удовлетворяет условиям:

  • 1)    v ( S ; z o ,T - 1 о ) + v ( N \ S ; Z ( t ) T - 1 ) -

  • T

    -v(N;z(t),Tt)<^Jpi(T'h^z(t))dT<

i e S 1 0

  • < v ( N ; Z 0 , T - 1 0 ) + v ( N \ S ; z o , T - 1 о ) -

  • - v ( S ; z ( t ) ,T - 1 ) при всех S c N ;

tt

  • 2)    Ef А ( т ) Ц z ) ) d T = Ef h i ( z (t ) ) d T .

i e Nt о                              i e Nt о

Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].

Исследуем теперь динамическую устойчивость вектора Шепли.

Теорема 3

В рассматриваемой игре вектор Шепли динамически устойчив.

Доказательство

Взяв βi ( τ ) равным

1 ( t - т ) (( - 3 V а , 2 + b i + J a 2 + b +

+ V a l + b l + V a k + b k + j + b j +

+ j + b k + a k + b l k - 3 ja 2 k + j ) +

+V a N + b N ( t о - т ) + jlk j N   jk N ( t - t о ) -

V aN + bN

, ад., + bb                           | ,

  • - 3 I 2    2 ~ ( t - t 0 ) - a i x 0 - b i y 0 - c i /

V a N + b N                       )

  • / ( 4 ( a i a N + b i b N )/4a N + b N ) + h i ( Z о ) ,

получим, что

T фi (T — to, Zо ) = J Pi (T) hi (Z (T))dT.

t 0

Теорема доказана

Обсуждение и заключение

В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С -ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.

Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.

Поступила 09.05.2018; принята к публикации 01.10.2018; опубликована онлайн 28.03.2019

Все авторы прочитали и одобрили окончательный вариант рукописи.

Сomputer science, computer engineering and management                                      49

Список литературы Простейшая дифференциальная игра на плоскости с четырьмя участниками

  • Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50-57.
  • Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52-53.
  • Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М.: Наука, 1991. 96 с.
  • Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5-15. URL: http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
  • Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11. С. 54-59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
  • Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1977. № 4. С. 46-52.
  • Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60-64. URL: http://www.sworld.com.ua/konfer39/97.pdf
  • Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs // Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513-520.
  • Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1979. № 1. С. 52-59.
  • Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33-38.
  • Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия. 1993. № 4. С. 40-16.
  • Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб.: Изд-во СПбГУ, 2008. 326 с.
  • Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651-666.
  • DOI: 10.1023/B:JOTA.0000025714.04164.e4
  • Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econo-metrica. 1987. Vol. 55, Issue 6. P. 1331-1348.
  • DOI: 10.2307/1913559
  • Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13-34.
  • DOI: 10.1007/BF01254381
  • Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans // The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473-492. URL: http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
  • Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М.: Наука, 1969. 384 с.
Еще
Статья научная