Простейшая дифференциальная игра на плоскости с четырьмя участниками
Автор: Ширяев Виктор Дмитриевич, Шагилова Елена Викторовна
Журнал: Инженерные технологии и системы @vestnik-mrsu
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 1, 2019 года.
Бесплатный доступ
Введение. В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки перемещаются на плоскости и совершают простое движение. Рассматриваемая игра сводится к кооперативной дифференциальной игре. Показывается динамическая устойчивость таких принципов оптимальности, как С-ядро и вектор Шепли. Материалы и методы. Для анализа и решения кооперативной дифференциальной игры применяются стандартные процедуры кооперативной теории игр. Условно-оптимальные траектории, вдоль которых осуществляется движение игроков, находятся с использованием принципа максимума Понтрягина. При построении характеристической функции используется минимаксный подход. Результаты исследования. В явном виде выписаны оптимальные управления (стратегии) игроков, а также условно-оптимальные траектории их движения при различных способах образования коалиций. Характеристическая функция построена в соответствии с принятым принципом максимина, а в качестве решения рассматриваются С -ядро и вектор Шепли. В явном виде выписаны компоненты вектора Ше-пли, показана принадлежность вектора Шепли С -ядру, а также непустота С -ядра при движении игроков вдоль оптимальной траектории. Используя результаты статической кооперативной теории игр при исследовании дифференциальных игр, исследователи сталкиваются с проблемами, которые связаны со спецификой дифференциальных уравнений движения. В качестве первоочередной здесь выступает проблема динамической устойчивости рассматриваемых принципов оптимальности. В работе показывается динамическая устойчивость вектора Шепли и С -ядра. Обсуждение и заключение. Результаты, полученные в ходе проведенного исследования, показывают целесообразность анализа динамической устойчивости рассматриваемых принципов оптимальности.
Простое движение, характеристическая функция, дележ, оптимальная траектория, устойчивость решения, с-ядро, вектор шепли
Короткий адрес: https://sciup.org/147220606
IDR: 147220606 | УДК: 517.977 | DOI: 10.15507/2658-4123.029.201901.040-050
A simplest differential game on a plane with four participants
Introduction. The article presents a simplest differential game with four participants. The players move on a plane and can do simple movements. The game under considering comes down to a cooperative differential game. The dynamic stability of such optimality principles as the S-kernel and Shapley vector is shown. Materials and Methods. The standard procedures of the cooperative game theory are applied to the analysis and decision of a cooperative differential game. The conditional and optimum trajectories, along which the players move, are found using the Pontryagin's maximum principle. When constructing the characteristic function, the minimax approach is used. Results. The optimum strategy of the players, conditional and optimum trajectories of their movements at various ways of formation of coalitions are written out explicitly. The characteristic function is constructed according to the accepted max-min principle; the S-kernel and Shapley vector are considered as a decision. The components of the Shap-ley vector are written out explicitly; the fact that the Shapley vector is an element of the S-kernel and nonemptiness of the S-kernel, when the players are moving along an optimum trajectory, are shown. Using the results of the static cooperative game theory for researching differential games, we face the problems, which are connected with specifics of the differential equations of the movement. As a priority, the problem of the dynamic stability of the optimality principles under consideration is identified. In the work, the dynamic stability of the Shapley vector and S-kernel is shown. Discussion and Conclusion. The results of the research show that the analysis of the dynamic stability of the optimality principles considered is relevant.
Текст научной статьи Простейшая дифференциальная игра на плоскости с четырьмя участниками
Процессы преследования являются типичными примерами дифференциальных игр. Различные методы поведения сторон в конфликтных ситуациях со многими участниками и в играх с неполной информацией моделируются прежде всего на примерах простого преследования. Несмотря на внешнюю простоту постановки, многие задачи простого преследования сами по себе являются серьезными математическими проблемами.
Одним из подходов к изучению таких дифференциальных игр является использование кооперативной теории, когда они рассматриваются как коопера- тивные дифференциальные игры. С учетом того, что движения игроков описываются дифференциальными уравнениями, возникает вопрос об устойчивости (состоятельности во времени) рассматриваемых принципов оптимальности. Отказ от данной концепции содержит в себе возможность отклонения от первоначально выбранного оптимального поведения в состояниях, в которых появляется новое оптимальное решение, не являющееся таковым в первоначальном смысле, что приводит к нарушению устойчивости процесса в целом.
В статье рассматривается простейшая дифференциальная игра с четырьмя участниками. Игроки совершают простое движение1 [1; 2], т. е. перемещаются на плоскости с ограниченной или постоянной по величине скоростью, при этом направление движения может меняться произвольным образом. Исследуется неантагонистическая кооперативная дифференциальная игра четырех лиц Гv (z0, T -10) из начального состояния z0 и продолжительностью T-10. Уравнения движения имеют вид:
z = U 1 + u 2 + u 3 + u 4 , (1)
z ( t о ) = z о . (2)
В равенстве (1) z = z ( x ; y ) , ut = ( u^1 ; u^ , | ^ J|< 1, i e N = { 1,2,3,4 } .
Функция выигрыша игрока i определяется следующим образом:
T
к;,. (z («)) = J h(z (t)) dt, t0
где z ( t ) = z ( t, t 0 , u 1 , u 2 , u 3 , u 4 ) -решение системы (1)-(2) при допустимых управлениях u 1 , u 2, u 3 , u 4 , h i ( Z ( t )) = a i x ( t ) + b i y ( t ) + c i , a i , b i , c i = const ; a i , b , c i > 0, a i 2 + b i + c i 2 * 0, i e N .
Обзор литературы
Задачи простого преследования рассматривались в ряде работ2; 3 [1–5]. Так, в исследованиях Л. А. Петросяна, В. Д. Ширяева и Р. Р. Бикмурзиной4 [1; 2] решение задачи было найдено в предположении о том, что очередность встреч выбирается в начальный момент времени (программно), а игроки движутся по прямым линиям. В статье Т. Г. Абра-
Том 29, № 1. 2019
мянц, В. П. Маслова и Е. Я. Рубиновича [4] рассмотрены возможности выбора очередности встреч как программно, так и позиционно, а в работе И. И. Шевченко [5] приведено решение поставленной задачи с использованием подхода Р. Айзекса. В исследовании В. Д. Ширяева, Н. М. Куляшовой и О. О. Виноградовой5 при решении задачи в основном использовались геометрические методы. При изучении таких игр часто используется методология кооперативной теории игр6 [6-8]. В качестве принципа оптимальности в основном рассматривается С -ядро. Однако вопрос исследования выбранного принципа оптимальности осложняется тем, что в таких задачах необходимо учитывать его динамическую устойчивость.
Впервые понятие динамической устойчивости решений в дифференциальных играх как с интегральными, так и с терминальными выигрышами ввел Л. А. Петросян [6; 9-11]; он же предложил и пути преодоления динамической неустойчивости принципов оптимальности [8; 10–13]. Несколько позже в западных странах независимо от вышеназванных исследований возник интерес к указанным вопросам, и проблема получила название «time-consistency problem» (проблема состоятельности во времени) [14-16]. Однако в большинстве случаев подобный интерес ограничивался лишь констатацией проблемы, и в упомянутых работах не рассматривались вопросы, связанные с решением вопроса несостоятельности во време- ни, что крайне важно для практических приложений.
Материалы и методы
В статье при переходе к рассмотрению исследуемой дифференциальной игры с простым движением как кооперативной дифференциальной игры при построении характеристической функции был предложен общепринятый принцип максимина. Для нахождения оптимальных траекторий и оптимальных управлений (стратегий) игроков использовался принцип максимума Понтрягина. При исследовании С -ядра на устойчивость использовался явный вид условий непустоты игры четырех лиц.
Результаты исследования
Введем следующие обозначения:
и ( j ) = У u i j ) , u5 = u s j ) + u ( j Is, 5 I j 5 N \ 5
i е 5
SiSi i е 5
cs = Ус,, 5 с N.
Si i е 5
i е 5
Вычислим значение характеристической функции:
|
1) max ^ j h ( z ( t )) d T z 2 s (| 5 - N \ 5 ) 2 ( T - 1 0 ) 2 ‘65 • 0 npu\S\ > N \ 5 , |
|
|
V ( 5 ;T - 1 0 , z 0 ) =. |
2) m i n ^ j h, ( z ( t )) dT z 2 < (| N \ 5 - Я ) 2 ( Г - 1 0 ) 2 ' 6 5 t 0 npu\5 < N \ 5 , 3) ( T - 1 0 ) ^ c npu\5 = N \ 5 . ' 6 5 |
Для нахождения v ( S ; T - 1 0, z 0 ) воспользуемся принципом максимума [17]. Для рассматриваемой задачи 4
Сопряженное уравнение примет вид:
‘
P = [ h i ( z ( t )) + h ( z ( t )) + h ( z ( t )) + h 4 ( z ( t )) ] x .
Т. к. рассматривается задача со свободным правым концом и, следовательно, p ( T ) = 0, то
Тогда
H=aN (t—T) uN + bN (t—T)—
— a N x 0 — bN У 0 .
—
Итак, следует найти max Hj =
max 2 ( a N u N + Ь^2);
достигается при
,(1) „(2) N,uN max H,
|
N |
4 a |
N uu N - 4 bN |
|
|
Следо X ( t ) y ( t ) Анало S u 1 = - 5 = { i, S S u 1 = 0, u 2 = S u 1 = - - |
|||
|
a N + b N ' a ^N + b N ательно, _---— ( t t 0 ) + X 0 , V a N + bN r^-----y- ( t t 0) + y 0. V a N + bN гично находим, что 2a5 s 2 bs |
|||
|
1 a s + b s ’ 71 j, l } , i ^ j ^ l, i, = 0, где 5 = { i , j } , i 2 aS S |
a s + bS’ j , l e N; * j , i , j e 2 bS |
||
|
aS 2 |
+ bs’ i |
i a s, + b .2 |
|
N;
Тогда
если S = { i , j , l } , i * j * l, i , j , l e N ;
-(5) , . -S , -x x (t) = u 1 (t -t ) +
-(s) / x -s y (t ) = u 2 (t -1) +
4 aN
4 a N + b N
4 b N
( t - t 0 ) + x 0 ,
T
aa
V a N + b N
( t - t 0 ) + y 0 ,
4 V aN + bN
I+
t G[ tQ,T ] , t G [ t , T ] .
И, следовательно,
T v (N ;T — t, z (t )) = J hN (z (t ))dT = t
+ asx о + 4 / bSbNкi ( t - t о )+ bsy о + cs d T = V aN + bN J
= 4 a S a N + b S bN ( t - 1 0 ) + asx 0 + bsy о + Cs 1 ( T - 1 ) =
+
T
=J
4 aN 2
_ ^a N + b N
( t - t 0 ) + a N x 0 +
+ 4 aSaN + bsbi
■ ( t - t 0 ) + asx 0 + bsy 0 + cs ( T - t ) ,
+14 bN ( aN+bN
T
= J [ 4 S a N + b N ( t
t
( t - t 0 ) + bN y 0 + c N d T =
- t 0 ) + a N x 0 + bN y 0 + c N ] d T =
= 2V a N + b N ( T - 1 )( T + 1 - 2 1 0 ) +
+ ( a N x 0 + bN y 0 + c N )( T - t ) ;
v ( S ;T - t , z ( t ) ) = j h s ( z ( t ) ) d T = t
T
-
• 2 a 2 / -\ . aca„
. s t - 1 + 4 r-aNL
_ ^ s + bs aaN + b
2 b S 2
+a^x +t t s 0 a^ss
-
+ 4 b s b N ( t - 1 ) + ь +
+
+
T
= J [ 2 V a s + b s ( t — t ) + t
+ 4 ( ( a , a + b s b )/J aN + b 2 ) (
+
если
T
-J
t
a s x 0 + b s y 0 + c s ] d T =
= N a s + b s ( T - 1 ) ( T + 1 - 2 1 ) +
+
+ a s x 0 + b s y 0 + c s ] ( T - t ) ,
5 = { i , j } , i ^ j , i , j e N ;
+ a s x 0
4 a S + b S
4 aS + bS
4 a N + b N
4 a N + b N
T
+ b s y 0 + C s ] d T = J [- 2 4 a S + b S ( t — t ) + t
(( a S a N + b S b N )/ V a N + b N ) ( t - t 0 ) + a s X 0 + b s y 0 + C s ] d T =
- - 4a S + b S ( T - 1 ) ( T + 1 - 2 t ) +
+ a s x 0 + b s y 0 + c s ] ( T - t ) ,
если S = { i , } , i e N . Таким образом,
v ( N ; T - 1 , z ( t ) ) =
- V a N + bN ( T — t ) ( T + t — 2 t 0 ) + + ( a N x о + b N y о + c N )( T - t ) ;
|
v ( { i , j , l } ; T - t , z ( t ) ) = + v ( { j , l , k } ; T - 1 , z ( t ) ) < |
|
|
= V a 2 + b j ( T — t ) ( T + t — 2 t ) + < 3 v( 4 a j a N + V N v ({ i , У |
N; T — t, z ( t ) ) , l } ; T - 1 , Z ( t ) ) + , k } ; T - 1, Z ( t ) ) + k } ; T - 1, z ( t ) ) < n ; t - 1, Z ( t ) ) , j } ; T - t , z ( t ) ) + l } ; T - 1 , Z ( t ) ) + k } ; T - 1 , z ( t ) ) + l , k } ; T - 1 , Z ( t ) ) < ( N; T - 1 , Z ( t ) ) , i ^ j ^ k ^ l , t g [ 1 0 T ] . праведливость этих нера- z ( t ) ) + v ( { i , j , k } ; T — t , z ( t ) ) + t , z ( t ) ) + v ( { j , l , k } ;T — t , z ( t ) ) — |
|
a N + b N ( 0 ) + v ( { j , + ax 0 + M 0 + c ji ] ( T - t ) ; + v ( { i , v ( { i , j } ; T — t , z ( t ) ) = < 2 v ( |
|
|
= [4 ( ( a j a N + bb ) 1 a aN + b N ) ( t — t 0 ) + v ( { i , + a ij x 0 + j 0 + c j ] ( T - t ) ; + v ( { i v ( { i } ;T - t , Z ( t ) ) = + v ( { i =- a^ + b i ( T - 1 ) ( T + 1 -2 1 ) + + 2 v ( { j, аам + bb,, < 3 v + 4 у— у ( t t 0 ) + a i x 0 + biy 0 + c i ( T t ) , _ ^nN + b N J i , j , k , l g N , i ^ j ^ l , i , j , l e N . Покажем с венств. Рассмотрим С -ядро ( С ( T-t о , z 0)) дан ной игры. v ({ i , j , l } T t Теорема 1 + v ( { i, l , k } . T - C v ( T - t , z ( t ) ) ^0 , t g [ t o , T ] . - 3 v ( n . t — 1 , Z |
|
|
( t ) ) = ( a2g i + b i 2 l + a 2g k + b i 2 k + |
|
|
Доказательство 22 22 +i a>i+ bb + +Dnk ( T — t ) T + t — 2t + Необходимым и достаточным усло- ' j ji / вием непусто™ С -ядра в игре четырех (( Qiji + Qijk + a Zk + Qjik ) Qn лиц является выполнение следующих +4 у—- + неравенств7: aNN + b N V j. + v 8k + v «k + vflk ^ 3 v ( N ) , ++Ь Ь ‘ + b jk + b -lk + b jlk ) b N 1 ( t — t o ) + v i + v jk + v k ^ 2 v ( N ) , , aN" + b N Д Д , т +( a ijl + a ijk + a ilk + a jlk ) x ° +( b jl + b ijk + b lk + b jlk ) y 0 + v j + V i + v k + 2 v j,k < 3 v ( N ) , . . , , M , + ( c ijl + c ijk + c ilk + c jlk )) ( T — t ) — i , j , l , k g N , i * j * k * l . .------- D —6 aw + Ьы ( T — t )( T + 1 — 2 t n) — В нашем случае эти неравенства NN 0 примут вид: — 3 ( a N x ° + Ь " У ° + c N )( T — t ) = |
|
|
= a^ + ь +j a 2+ ь + a^ + ь + a^/ + ь ^^ v V, j , ; ls z + jl jkk yk lk ik jik jlk + v ( { / , j , k } ; T — t , z ( t ) ) + x ( T - t ) ( T + t -2 t ) + 12 aNN + b N ( T - t ) ( t - t 0 ) - + v ( { z , l, k } ; T — t, z ( t ) ) + -6 aNN + b N ( T — t )( T + t — 2 t o )= |
|
7 Ширяев В. Д. С -ядро в играх четырех лиц // Сборник научных трудов SWorld. 2013. T. 4, № 4. С. 79–85.
22 22 22
= ((^ a ijl + bj! + j + bijk +1 alk + bit +
+^ a 2jik + b jik -6 ^ a N + b N ) ( T - t ) ( T + t - 2 t ) ^ 0.
фХ v ) = (4 w1)! -- a^ ( t _ t )( t + 1 _ ^ -t) +
+ 4 | aa v + bb N
I 2 2
7 aa + + b N
( t-t 0 ) + a i x 0 + biy 0 + c i l x
Аналогично доказывается, что v ({i, j, i}; t -1, z (t)) +
+ v ( { j , i , k } ; t - 1 , z ( t ) ) +
+ v ( { i , k } ; T - t , z ( t ) ) -
- 2 v ( N ; T - t, z ( t ) ) =
= (7 a j + b j + 7 a j + b jk -
-
- 4 V a N + b N )( T - 1 ) ( T + t - 2 t ) < 0;
v ( { i , j } ; T - t , z ( t ) ) +
+ v ( { i , l } ; T - t , z ( t ) ) +
+ v ( { i , k } ; T - t, z ( t ) ) +
+ 2 v ( { j, l, k } ; T - t, z ( t ) ) -
- 3 v ( N ; T - t, Z ( t ) ) =
= (2 7a№ + bjik - 6 7aN + bN )x
x( T -1)(T + t - 21 )< 0, t e[t0T], t e[t,T], i, j,k,l e N, i ^ j ^ k ^ l.
x( T -1 )-0]+(4-2)4(2-1^x f/( aj+ ail + aik ) aN , I bj + bil + bik ) bN 1.
X I 41 ।------------- + j( t t г i ) +
-7 7 V«N + bN VaN + bN)
+( a j + a il + a ik ) x 0 +( b j + b il + b ik ) У 0 + c j + c il + c ik )x x ( T - 1 0 ) + (N a j + b 2 + ^ a l 2 + b l + V ak 2 + bk 2 )( T - 1 ) x x ( T + 1 - 2 1 ) -f 4 a jlk a " + bjkbN ( t - 1 0 ) +
I 22
7 V a N + b N
+ajlkx0+ bjlky0+ cjlk)(T-t)]+(4 3)4(3
x -( N a j + b jl + a j^+b^ + V a 2 k + b ik ) ( T - t )( T + t - 2 t ) + f ( a jl + a jk + a lk ) a N ( bn + b jk + b ilk ) b N f
+ 4 + (tt
V a N + b N NnN + b N
+ ( a jl + a jk + a ilk ) x 0 + ( b ljl + b ljk + b ilk ) y 0 +
+ ( c jl + c jk + c ilk )) ( T - t ) -
4(ajl + ajk + alk ) aN + (bjl + bjk + blk ) bN (--t ) + 2 2 2 2
7 a N + b N aNN + b N
( a jl + a jk + a lk ) x 0 +( b jl + b jk + b lk ) У 0 + c jl + c jk + c lk )x
(4 - 4)!(4 - 1)!
x(T -1)]+(4)-
:-2 \ a N + b j N ( T - t )( T + t - 2 t 0) + + ( a N x 0 + b N y 0 + c N ) ( T - t ) -
- N a 2jik + b 2jik ( T - t )( T + t - 2 ,) -
Рассмотрим теперь вектор Шепли. Формулы для нахождения компонентов вектора Шепли примут вид:
Ф,( v (5 ;T -t, Z (t ))) = x (n-1)!(5 -1)!
= 5 ^ n n ! X
( i e 5 )
x[ v ( 5 ; T - 1 , Z ( t ) ) - v ( 5 \ { i } ;T - 1 , Z ( t ) ) ] . (3)
Подставляя значения v ( S ; T - 1 , z ( t ) ) в выражение (3), получим:
-
4 a jlk a N + b jlk b N
■( t - t 0 ) + a jlk x 0 + b jik y 0 + c jlk ) ( T - t ) ] =
= 112 [ (- 3 V a , 2 + b , 2 + N a j+ b j +
+ aa +bbi + V a k + b k + a 2 + b jl + a 2 k + b ^k +
+V a iik + b ik + V a jk + b jk ) ( T - t )( T + t - 2 z) +
+ 6 V a N + b N ( T - t )( T + t - 2 t o ) +
+ f 36 aa N + bb N
I 22
7 V a N + b N
( t - t 0 )( T - t ) -
ajlkaN + bjlkbN ■ 12---.=—
( t - t 0 )( T - t ) +
Vol. 29, no. 1. 2019 -
■ ’ ( a i x о + by о + cxT - t ) ] ,
-
i , j , l , k e N , i * j * k * l , t e [ 1 0, T ], t e [ t , T ].
В случае кооперативной дифференциальной игры характеристическая функция зависит от времени, поэтому решение кооперативной дифференциальной игры изменяется в каждый момент времени. В связи с этим естественным является вопрос о динамической устойчивости рассматриваемых принципов оптимальности [6; 9–11].
Перейдем к формальному определению принципа динамической устойчивости в игре Г v ( z 0, T - 1 0 ) .
Пусть z ( • ) - условно-оптимальная траектория в игре Г v ( z 0 , T - 1 0 ) , Г v ( z ( t ) , T - 1 о ) , t о < t < T - текущие игры с решениями W v ( z ( t ) , T - t ) c c E v ( z ( t ) , T - t ) , где
E v ( z ( t ) , T - t ) = { ^ = ( £. £ 2 ,-, ^ n ) e e Rn 1 5 i > v ( { i } , Z ( t ) , T — t ) , i e N , ^ 5 i = v ( N , Z ( t ) , T — t ) | .
i e N
Предположим, что W v ( z ( t ) ,T - 1 ) * 0 для всех 1 0< t < T .
Определение 1 [6; 7; 11]
Дележ ^ e W v ( z o , T - t 0 ) будем называть устойчивым в игре Г „ ( z 0, T - 1 0 ) , если существует интегрируемая на [ 1 0, T ] вектор-функция β ( t ) и такая дифференцируемая на [ 1 0, T ] вектор-функция £ ( t ), что дележ ξ представим в виде:
t
S = S ( t ) , SAt ) = J РЛТ ) hi ( z ( t ) ) dT, t 0
и для всех t e [ 1 0, T ] существует такое подмножество W V ( z ( t ) , T - 1 ) множества W v ( z ( t ) , T - t ) , что
^ ( t ) + W V ( z ( t ) , T - t ) ^ W v ( z 0 , T - 1 0 ) .
Определение 2
Решение W v ( z 0, T - 1 0 ) называется устойчивым, если устойчивы все входящие в него дележи. В таком сл у чае условно-оптимальная траектория z ( • ) называется оптимальной.
Данный способ реализации дележа зависит от выбора функции в ( т ) и, следовательно, является неоднозначным. Однако он обладает важным свойством: в каждый момент времени t е [ 1 0, T ] игроки ориентируются на один и тот же принцип оптимальности, придерживаются выбранного оптимального управления и поэтому не имеют оснований для нарушения ранее принятого соглашения.
В качестве решения W v ( z 0, T - 1 0 ) рассмотрим С -ядро игры Г „ ( z 0, T - 1 0 ) , которое обозначим через C v ( z 0, T - 1 0 ) . Как было показано выше, C v ( z ( t ) , T - 1 ) *0 , 1 0 < t < T, где z ( • ) -условно оптимальная траектория. Выведем необходимое условие динамической устойчивости С -ядра C v ( z 0, T - 1 0 ) в кооперативной дифференциальной игре с интегральными выигрышами.
Теорема 2
Для того чтобы С -ядро C v ( z 0, T - 1 0 ) кооперативной дифференциальной игры Г v ( z 0, T - 1 0 ) с интегральными выигрышами было динамически устойчивым, необходимо, чтобы для каждого дележа ^ е C v ( z 0, T - 1 0 ) имело место представление
т; _ t0
где вектор-функция в ( t ) в каждый момент t е [ 1 0, T ] удовлетворяет условиям:
-
1) v ( S ; z o ,T - 1 о ) + v ( N \ S ; Z ( t ) T - 1 ) -
- T
-v(N;z(t),T — t)<^Jpi(T'h^z(t))dT<
i e S 1 0
-
< v ( N ; Z 0 , T - 1 0 ) + v ( N \ S ; z o , T - 1 о ) -
-
- v ( S ; z ( t ) ,T - 1 ) при всех S c N ;
tt
-
2) Ef А ( т ) Ц z (т ) ) d T = Ef h i ( z (t ) ) d T .
i e Nt о i e Nt о
Доказательство теоремы аналогично доказательству из работ Л. А. Петросяна, Н. Н. Данилова и Д. В. Кузютина [9; 12].
Исследуем теперь динамическую устойчивость вектора Шепли.
Теорема 3
В рассматриваемой игре вектор Шепли динамически устойчив.
Доказательство
Взяв βi ( τ ) равным
1 ( t - т ) (( - 3 V а , 2 + b i + J a 2 + b +
+ V a l + b l + V a k + b k + j + b j +
+ j + b k + a k + b l k - 3 ja 2 k + j ) +
+V a N + b N ( t о - т ) + jlk j N jk N ( t - t о ) -
V aN + bN
, ад., + bb | ,
-
- 3 I 2 2 ~ ( t - t 0 ) - a i x 0 - b i y 0 - c i /
V a N + b N )
-
/ ( 4 ( a i a N + b i b N )/4a N + b N ) + h i ( Z о ) ,
получим, что
T фi (T — to, Zо ) = J Pi (T) hi (Z (T))dT.
t 0
Теорема доказана
Обсуждение и заключение
В работе в явном виде найдены оптимальные стратегии и траектории движения игроков. В качестве принципов оптимальности рассмотрены С -ядро и вектор Шепли. Выбранные принципы оптимальности оказались динамически устойчивыми, и, следовательно, у игроков нет оснований для завершения игры. Исследованная задача показала реализуемость идеи устойчивости рассматриваемых принципов оптимальности.
Попытки применить динамически неустойчивые принципы оптимальности при решении практических задач приводят, как правило, к грубым ошибкам, в результате которых «оптимальные» решения оказываются нереализованными. Именно динамическая неустойчивость была причиной невыполнения многих долгосрочных проектов и нарушения многосторонних договоренностей.
Поступила 09.05.2018; принята к публикации 01.10.2018; опубликована онлайн 28.03.2019
Все авторы прочитали и одобрили окончательный вариант рукописи.
Сomputer science, computer engineering and management 49
Список литературы Простейшая дифференциальная игра на плоскости с четырьмя участниками
- Петросян Л. А., Ширяев В. Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник Ленинградского университета. Сер. 1: Математика, механика и астрономия. 1980. № 13. С. 50-57.
- Ширяев В. Д. О задачах простого преследования с четырьмя участниками // Математическое моделирование сложных систем. СПб., 1999. С. 52-53.
- Петросян Л. А., Рихсиев Б. Б. Преследование на плоскости. М.: Наука, 1991. 96 с.
- Абрамянц Т. Г., Маслов Е. П., Рубинович Е. Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. 1980. № 8. С. 5-15. URL: http://www.mathnet.ru/links/18b651a96ec80bd34126bef353968bc9/at7146.pdf
- Шевченко И. И. О поочередном преследовании // Автоматика и телемеханика. 1981. № 11. С. 54-59. URL: http://www.mathnet.ru/links/56042ca7de6dcc2aca19b4094cf18822/at6041.pdf
- Петросян Л. А. Устойчивость решений дифференциальных игр со многими участниками // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1977. № 4. С. 46-52.
- Ширяев В. Д., Бикмурзина Р. Р. Динамическая устойчивость решения в простой дифференциальной игре четырех лиц // Научные труды SWorld. 2015. Т. 7, вып. 2 (39). С. 60-64. URL: http://www.sworld.com.ua/konfer39/97.pdf
- Petrosjan L. A. Strongly time consistent optimality principles in the games with discount payoffs // Lecture Notes in Control and Information Sciences. 1994. No. 197. P. 513-520.
- Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестник Ленинградского университета. Сер. 1: Математика. Механика. Астрономия. 1979. № 1. С. 52-59.
- Петросян Л. А. Построение сильно динамически устойчивых решений в кооперативных дифференциальных играх // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика и астрономия. 1992. № 4. С. 33-38.
- Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестник Санкт-Петербургского университета. Сер. 1: Математика, механика, астрономия. 1993. № 4. С. 40-16.
- Петросян Л. А., Кузютин Д. В. Устойчивые решения позиционных игр. СПб.: Изд-во СПбГУ, 2008. 326 с.
- Yeung D. W. K., Petrosyan L. A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications. 2004. Vol. 120, Issue 3. P. 651-666.
- DOI: 10.1023/B:JOTA.0000025714.04164.e4
- Kreps D. M., Ramey G. Structural consistency, consistency, and sequential rationality // Econo-metrica. 1987. Vol. 55, Issue 6. P. 1331-1348.
- DOI: 10.2307/1913559
- Peleg B., Tijs S. The consistency principle for games in strategic form // International Journal of Game Theory. 1996. Vol. 25, Issue 1. P. 13-34.
- DOI: 10.1007/BF01254381
- Kydland F. E., Prescott E. C. Rules rather than discretion: the inconsistency of optimal plans // The Journal of Political Economy. 1977. Vol. 85, no. 3. P. 473-492. URL: http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.603.6853&rep=rep1&type=pdf
- Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. 2-е изд. М.: Наука, 1969. 384 с.