Простейшая дифференциальная игра на плоскости с четырьмя участниками
Автор: Ширяев Виктор Дмитриевич, Шагилова Елена Викторовна
Журнал: Инженерные технологии и системы @vestnik-mrsu
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 1, 2019 года.
Бесплатный доступ
Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли. Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход. Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С -ядро и вектор Шепли. В явном виде выписаны компоненты вектора Ше-пли, показана принадлежность вектора Шепли С -ядру, а также непустота С -ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С -ядра. Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.
Простое движение, характеристическая функция, дележ, оптимальная траектория, устойчивость решения, с-ядро, вектор шепли
Короткий адрес: https://sciup.org/147220606
IDR: 147220606 | DOI: 10.15507/2658-4123.029.201901.040-050
Текст научной статьи Простейшая дифференциальная игра на плоскости с четырьмя участниками
Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.
Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как коопера- тивные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.
В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц Гv (z0, T -10) из начального состояния z0 и продолжительностью T-10. Уравнения движения имеют вид:
z = U 1 + u 2 + u 3 + u 4 , (1)
z ( t о ) = z о . (2)
В равенстве (1) z = z ( x ; y ) , ut = ( u^1 ; u^ , | ^ J|< 1, i e N = { 1,2,3,4 } .
Функция выигрыша игрока i определяется следующим образом:
T
к;,. (z («)) = J h(z (t)) dt, t0
где z ( t ) = z ( t, t 0 , u 1 , u 2 , u 3 , u 4 ) -решение системы (1)-(2) при допустимых управлениях u 1 , u 2, u 3 , u 4 , h i ( Z ( t )) = a i x ( t ) + b i y ( t ) + c i , a i , b i , c i = const ; a i , b , c i > 0, a i 2 + b i + c i 2 * 0, i e N .
Обзор литературы
Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абра-
Том 29, № 1. 2019
мянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6-8]. В качестве принципа оптимальности в основном рассматривается С -ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.
Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9-11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14-16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во време- ни, что крайне важно для практических приложений.
Материалы и методы
В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С -ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.
Результаты исследования
Введем следующие обозначения:
и ( j ) = У u i j ) , u5 = u s j ) + u ( j Is, 5 I j 5 N \ 5
i е 5
SiSi i е 5
cs = Ус,, 5 с N.
Si i е 5
i е 5
Вычислим значение характеристической функции:
1) max ^ j h ( z ( t )) d T z 2 s (| 5 - N \ 5 ) 2 ( T - 1 0 ) 2 ‘65 • 0 npu\S\ > N \ 5 , |
|
V ( 5 ;T - 1 0 , z 0 ) =. |
2) m i n ^ j h, ( z ( t )) dT z 2 < (| N \ 5 - Я ) 2 ( Г - 1 0 ) 2 ' 6 5 t 0 npu\5 < N \ 5 , 3) ( T - 1 0 ) ^ c npu\5 = N \ 5 . ' 6 5 |
Для нахождения v ( S ; T - 1 0, z 0 ) воспользуемся принципом максимума [17]. Для рассматриваемой задачи 4
Сопряженное уравнение примет вид:
‘
P = [ h i ( z ( t )) + h ( z ( t )) + h ( z ( t )) + h 4 ( z ( t )) ] x .
Т. к. рассматривается задача со свободным правым концом и, следовательно, p ( T ) = 0, то
Тогда
H=aN (t—T) uN + bN (t—T)—
— a N x 0 — bN У 0 .
—
Итак, следует найти max Hj =
max 2 ( a N u N + Ь^2);
достигается при
,(1) „(2) N,uN max H,
N |
4 a |
N uu N - 4 bN |
|
Следо X ( t ) y ( t ) Анало S u 1 = - 5 = { i, S S u 1 = 0, u 2 = S u 1 = - - |
|||
a N + b N ' a ^N + b N ательно, _---— ( t t 0 ) + X 0 , V a N + bN r^-----y- ( t t 0) + y 0. V a N + bN гично находим, что 2a5 s 2 bs |
|||
1 a s + b s ’ 71 j, l } , i ^ j ^ l, i, = 0, где 5 = { i , j } , i 2 aS S |
a s + bS’ j , l e N; * j , i , j e 2 bS |
||
aS 2 |
+ bs’ i |
i a s, + b .2 |
N;
Тогда
если S = { i , j , l } , i * j * l, i , j , l e N ;
-(5) , . -S , -x x (t) = u 1 (t -t ) +
-(s) / x -s y (t ) = u 2 (t -1) +
4 aN
4 a N + b N
4 b N
( t - t 0 ) + x 0 ,
T
aa
V a N + b N
( t - t 0 ) + y 0 ,
4 V aN + bN
I+
t G[ tQ,T ] , t G [ t , T ] .
И, следовательно,
T v (N ;T — t, z (t )) = J hN (z (t ))dT = t
+ asx о + 4 / bSbNкi ( t - t о )+ bsy о + cs d T = V aN + bN J
= 4 a S a N + b S bN ( t - 1 0 ) + asx 0 + bsy о + Cs 1 ( T - 1 ) =
+
T
=J
4 aN 2
_ ^a N + b N
( t - t 0 ) + a N x 0 +
+ 4 aSaN + bsbi
■ ( t - t 0 ) + asx 0 + bsy 0 + cs ( T - t ) ,
+14 bN ( aN+bN
T
= J [ 4 S a N + b N ( t
t
( t - t 0 ) + bN y 0 + c N d T =
- t 0 ) + a N x 0 + bN y 0 + c N ] d T =
= 2V a N + b N ( T - 1 )( T + 1 - 2 1 0 ) +
+ ( a N x 0 + bN y 0 + c N )( T - t ) ;
v ( S ;T - t , z ( t ) ) = j h s ( z ( t ) ) d T = t
T
-
• 2 a 2 / -\ . aca„
. s t - 1 + 4 r-aNL
_ ^ s + bs aaN + b
2 b S 2
+a^x +t t s 0 a^ss
-
+ 4 b s b N ( t - 1 ) + ь +
+
+
T
= J [ 2 V a s + b s ( t — t ) + t
+ 4 ( ( a , a + b s b )/J aN + b 2 ) (
+
если
T
-J
t
a s x 0 + b s y 0 + c s ] d T =
= N a s + b s ( T - 1 ) ( T + 1 - 2 1 ) +
+
+ a s x 0 + b s y 0 + c s ] ( T - t ) ,
5 = { i , j } , i ^ j , i , j e N ;
+ a s x 0
4 a S + b S
4 aS + bS
4 a N + b N
4 a N + b N
T
+ b s y 0 + C s ] d T = J [- 2 4 a S + b S ( t — t ) + t
(( a S a N + b S b N )/ V a N + b N ) ( t - t 0 ) + a s X 0 + b s y 0 + C s ] d T =
- - 4a S + b S ( T - 1 ) ( T + 1 - 2 t ) +
+ a s x 0 + b s y 0 + c s ] ( T - t ) ,
если S = { i , } , i e N . Таким образом,
v ( N ; T - 1 , z ( t ) ) =
- V a N + bN ( T — t ) ( T + t — 2 t 0 ) + + ( a N x о + b N y о + c N )( T - t ) ;
v ( { i , j , l } ; T - t , z ( t ) ) = + v ( { j , l , k } ; T - 1 , z ( t ) ) < |
|
= V a 2 + b j ( T — t ) ( T + t — 2 t ) + < 3 v( 4 a j a N + V N v ({ i , У |
N; T — t, z ( t ) ) , l } ; T - 1 , Z ( t ) ) + , k } ; T - 1, Z ( t ) ) + k } ; T - 1, z ( t ) ) < n ; t - 1, Z ( t ) ) , j } ; T - t , z ( t ) ) + l } ; T - 1 , Z ( t ) ) + k } ; T - 1 , z ( t ) ) + l , k } ; T - 1 , Z ( t ) ) < ( N; T - 1 , Z ( t ) ) , i ^ j ^ k ^ l , t g [ 1 0 T ] . праведливость этих нера- z ( t ) ) + v ( { i , j , k } ; T — t , z ( t ) ) + t , z ( t ) ) + v ( { j , l , k } ;T — t , z ( t ) ) — |
a N + b N ( 0 ) + v ( { j , + ax 0 + M 0 + c ji ] ( T - t ) ; + v ( { i , v ( { i , j } ; T — t , z ( t ) ) = < 2 v ( |
|
= [4 ( ( a j a N + bb ) 1 a aN + b N ) ( t — t 0 ) + v ( { i , + a ij x 0 + j 0 + c j ] ( T - t ) ; + v ( { i v ( { i } ;T - t , Z ( t ) ) = + v ( { i =- a^ + b i ( T - 1 ) ( T + 1 -2 1 ) + + 2 v ( { j, аам + bb,, < 3 v + 4 у— у ( t t 0 ) + a i x 0 + biy 0 + c i ( T t ) , _ ^nN + b N J i , j , k , l g N , i ^ j ^ l , i , j , l e N . Покажем с венств. Рассмотрим С -ядро ( С ( T-t о , z 0)) дан ной игры. v ({ i , j , l } T t Теорема 1 + v ( { i, l , k } . T - C v ( T - t , z ( t ) ) ^0 , t g [ t o , T ] . - 3 v ( n . t — 1 , Z |
|
( t ) ) = ( a2g i + b i 2 l + a 2g k + b i 2 k + |
|
Доказательство 22 22 +i a>i+ bb + +Dnk ( T — t ) T + t — 2t + Необходимым и достаточным усло- ' j ji / вием непусто™ С -ядра в игре четырех (( Qiji + Qijk + a Zk + Qjik ) Qn лиц является выполнение следующих +4 у—- + неравенств7: aNN + b N V j. + v 8k + v «k + vflk ^ 3 v ( N ) , ++Ь Ь ‘ + b jk + b -lk + b jlk ) b N 1 ( t — t o ) + v i + v jk + v k ^ 2 v ( N ) , , aN" + b N Д Д , т +( a ijl + a ijk + a ilk + a jlk ) x ° +( b jl + b ijk + b lk + b jlk ) y 0 + v j + V i + v k + 2 v j,k < 3 v ( N ) , . . , , M , + ( c ijl + c ijk + c ilk + c jlk )) ( T — t ) — i , j , l , k g N , i * j * k * l . .------- D —6 aw + Ьы ( T — t )( T + 1 — 2 t n) — В нашем случае эти неравенства NN 0 примут вид: — 3 ( a N x ° + Ь " У ° + c N )( T — t ) = |
|
= a^ + ь +j a 2+ ь + a^ + ь + a^/ + ь ^^ v V, j , ; ls z + jl jkk yk lk ik jik jlk + v ( { / , j , k } ; T — t , z ( t ) ) + x ( T - t ) ( T + t -2 t ) + 12 aNN + b N ( T - t ) ( t - t 0 ) - + v ( { z , l, k } ; T — t, z ( t ) ) + -6 aNN + b N ( T — t )( T + t — 2 t o )= |
7 Ширяев В. Д. С -ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.
22 22 22
= ((^ a ijl + bj! + j + bijk +1 alk + bit +
+^ a 2jik + b jik -6 ^ a N + b N ) ( T - t ) ( T + t - 2 t ) ^ 0.
фХ v ) = (4 w1)! -- a^ ( t _ t )( t + 1 _ ^ -t) +
+ 4 | aa v + bb N
I 2 2
7 aa + + b N
( t-t 0 ) + a i x 0 + biy 0 + c i l x
Аналогично доказывается, что v ({i, j, i}; t -1, z (t)) +
+ v ( { j , i , k } ; t - 1 , z ( t ) ) +
+ v ( { i , k } ; T - t , z ( t ) ) -
- 2 v ( N ; T - t, z ( t ) ) =
= (7 a j + b j + 7 a j + b jk -
-
- 4 V a N + b N )( T - 1 ) ( T + t - 2 t ) < 0;
v ( { i , j } ; T - t , z ( t ) ) +
+ v ( { i , l } ; T - t , z ( t ) ) +
+ v ( { i , k } ; T - t, z ( t ) ) +
+ 2 v ( { j, l, k } ; T - t, z ( t ) ) -
- 3 v ( N ; T - t, Z ( t ) ) =
= (2 7a№ + bjik - 6 7aN + bN )x
x( T -1)(T + t - 21 )< 0, t e[t0T], t e[t,T], i, j,k,l e N, i ^ j ^ k ^ l.
x( T -1 )-0]+(4-2)4(2-1^x f/( aj+ ail + aik ) aN , I bj + bil + bik ) bN 1.
X I 41 ।------------- + j( t t г i ) +
-7 7 V«N + bN VaN + bN)
+( a j + a il + a ik ) x 0 +( b j + b il + b ik ) У 0 + c j + c il + c ik )x x ( T - 1 0 ) + (N a j + b 2 + ^ a l 2 + b l + V ak 2 + bk 2 )( T - 1 ) x x ( T + 1 - 2 1 ) -f 4 a jlk a " + bjkbN ( t - 1 0 ) +
I 22
7 V a N + b N
+ajlkx0+ bjlky0+ cjlk)(T-t)]+(4 3)4(3
x -( N a j + b jl + a j^+b^ + V a 2 k + b ik ) ( T - t )( T + t - 2 t ) + f ( a jl + a jk + a lk ) a N ( bn + b jk + b ilk ) b N f
+ 4 + (tt
V a N + b N NnN + b N
+ ( a jl + a jk + a ilk ) x 0 + ( b ljl + b ljk + b ilk ) y 0 +
+ ( c jl + c jk + c ilk )) ( T - t ) -
4(ajl + ajk + alk ) aN + (bjl + bjk + blk ) bN (--t ) + 2 2 2 2
7 a N + b N aNN + b N
( a jl + a jk + a lk ) x 0 +( b jl + b jk + b lk ) У 0 + c jl + c jk + c lk )x
(4 - 4)!(4 - 1)!
x(T -1)]+(4)-
:-2 \ a N + b j N ( T - t )( T + t - 2 t 0) + + ( a N x 0 + b N y 0 + c N ) ( T - t ) -
- N a 2jik + b 2jik ( T - t )( T + t - 2 ,) -
Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:
Ф,( v (5 ;T -t, Z (t ))) = x (n-1)!(5 -1)!
= 5 ^ n n ! X
( i e 5 )
x[ v ( 5 ; T - 1 , Z ( t ) ) - v ( 5 \ { i } ;T - 1 , Z ( t ) ) ] . (3)
Подставляя значения v ( S ; T - 1 , z ( t ) ) в выражение (3), получим:
-
4 a jlk a N + b jlk b N
■( t - t 0 ) + a jlk x 0 + b jik y 0 + c jlk ) ( T - t ) ] =
= 112 [ (- 3 V a , 2 + b , 2 + N a j+ b j +
+ aa +bbi + V a k + b k + a 2 + b jl + a 2 k + b ^k +
+V a iik + b ik + V a jk + b jk ) ( T - t )( T + t - 2 z) +
+ 6 V a N + b N ( T - t )( T + t - 2 t o ) +
+ f 36 aa N + bb N
I 22
7 V a N + b N
( t - t 0 )( T - t ) -
ajlkaN + bjlkbN ■ 12---.=—
( t - t 0 )( T - t ) +
Vol. 29, no. 1. 2019 -
■ ’ ( a i x о + by о + cxT - t ) ] ,
-
i , j , l , k e N , i * j * k * l , t e [ 1 0, T ], t e [ t , T ].
В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].
Перейдем к формальному определению принципа динамической устойчивости в игре Г v ( z 0, T - 1 0 ) .
Пусть z ( • ) - условно-оптимальная траектория в игре Г v ( z 0 , T - 1 0 ) , Г v ( z ( t ) , T - 1 о ) , t о < t < T - текущие игры с решениями W v ( z ( t ) , T - t ) c c E v ( z ( t ) , T - t ) , где
E v ( z ( t ) , T - t ) = { ^ = ( £. £ 2 ,-, ^ n ) e e Rn 1 5 i > v ( { i } , Z ( t ) , T — t ) , i e N , ^ 5 i = v ( N , Z ( t ) , T — t ) | .
i e N
Предположим, что W v ( z ( t ) ,T - 1 ) * 0 для всех 1 0< t < T .
Определение 1 [6; 7; 11]
Дележ ^ e W v ( z o , T - t 0 ) будем называть устойчивым в игре Г „ ( z 0, T - 1 0 ) , если существует интегрируемая на [ 1 0, T ] вектор-функция β ( t ) и такая дифференцируемая на [ 1 0, T ] вектор-функция £ ( t ), что дележ ξ представим в виде:
t
S = S ( t ) , SAt ) = J РЛТ ) hi ( z ( t ) ) dT, t 0
и для всех t e [ 1 0, T ] существует такое подмножество W V ( z ( t ) , T - 1 ) множества W v ( z ( t ) , T - t ) , что
^ ( t ) + W V ( z ( t ) , T - t ) ^ W v ( z 0 , T - 1 0 ) .
Определение 2
Решение W v ( z 0, T - 1 0 ) называется устойчивым, если устойчивы все входящие в него дележи. В таком сл у чае условно-оптимальная траектория z ( • ) называется оптимальной.
Данный способ реализации дележа зависит от выбора функции в ( т ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени t е [ 1 0, T ] игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.
В качестве решения W v ( z 0, T - 1 0 ) рассмотрим С -ядро игры Г „ ( z 0, T - 1 0 ) , которое обозначим через C v ( z 0, T - 1 0 ) . Как было показано выше, C v ( z ( t ) , T - 1 ) *0 , 1 0 < t < T, где z ( • ) -условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С -ядра C v ( z 0, T - 1 0 ) в кооперативной дифференциальной игре с интегральными выигрышами.
Теорема 2
Для того чтобы С -ядро C v ( z 0, T - 1 0 ) кооперативной дифференциальной игры Г v ( z 0, T - 1 0 ) с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа ^ е C v ( z 0, T - 1 0 ) имело место представление
т; _ t0
где вектор-функция в ( t ) в каждый момент t е [ 1 0, T ] удовлетворяет условиям:
-
1) v ( S ; z o ,T - 1 о ) + v ( N \ S ; Z ( t ) T - 1 ) -
- T
-v(N;z(t),T — t)<^Jpi(T'h^z(t))dT<
i e S 1 0
-
< v ( N ; Z 0 , T - 1 0 ) + v ( N \ S ; z o , T - 1 о ) -
-
- v ( S ; z ( t ) ,T - 1 ) при всех S c N ;
tt
-
2) Ef А ( т ) Ц z (т ) ) d T = Ef h i ( z (t ) ) d T .
i e Nt о i e Nt о
Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].
Исследуем теперь динамическую устойчивость вектора Шепли.
Теорема 3
В рассматриваемой игре вектор Шепли динамически устойчив.
Доказательство
Взяв βi ( τ ) равным
1 ( t - т ) (( - 3 V а , 2 + b i + J a 2 + b +
+ V a l + b l + V a k + b k + j + b j +
+ j + b k + a k + b l k - 3 ja 2 k + j ) +
+V a N + b N ( t о - т ) + jlk j N jk N ( t - t о ) -
V aN + bN
, ад., + bb | ,
-
- 3 I 2 2 ~ ( t - t 0 ) - a i x 0 - b i y 0 - c i /
V a N + b N )
-
/ ( 4 ( a i a N + b i b N )/4a N + b N ) + h i ( Z о ) ,
получим, что
T фi (T — to, Zо ) = J Pi (T) hi (Z (T))dT.
t 0
Теорема доказана
Обсуждение и заключение
В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С -ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.
Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.
Поступила 09.05.2018; принята к публикации 01.10.2018; опубликована онлайн 28.03.2019
Все авторы прочитали и одобрили окончательный вариант рукописи.
Сomputer science, computer engineering and management 49
Список литературы Простейшая дифференциальная игра на плоскости с четырьмя участниками
- Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50-57.
- Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52-53.
- Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М.: Наука, 1991. 96 с.
- Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5-15. URL: http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
- Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11. С. 54-59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
- Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1977. № 4. С. 46-52.
- Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60-64. URL: http://www.sworld.com.ua/konfer39/97.pdf
- Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs // Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513-520.
- Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1979. № 1. С. 52-59.
- Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33-38.
- Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия. 1993. № 4. С. 40-16.
- Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб.: Изд-во СПбГУ, 2008. 326 с.
- Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651-666.
- DOI: 10.1023/B:JOTA.0000025714.04164.e4
- Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econo-metrica. 1987. Vol. 55, Issue 6. P. 1331-1348.
- DOI: 10.2307/1913559
- Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13-34.
- DOI: 10.1007/BF01254381
- Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans // The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473-492. URL: http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
- Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М.: Наука, 1969. 384 с.