Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз
Автор: Жуковский В.И., Кудрявцев К.Н., Самсонов С.П., Высокос М.И., Бельских Ю.А.
Рубрика: Математика
Статья в выпуске: 2 т.10, 2018 года.
Бесплатный доступ
Исследованию позитивных и негативных свойств «царствующей» в экономике концепции равновесия по Нэшу (как решения бескоалиционной игры) посвящен непрекращающийся поток публикаций. В основном они связаны с неединственностью, и, как следствие, отсутствием эквивалентности, взаимозаменяемости, внешней устойчивости, а также неустойчивостью к одновременному отклонению от таких решений двух и более игроков. Игра «дилемма заключенных» выявила также свойство «улучшаемости». Подробному анализу таких «отрицательных» свойств для дифференциальных позиционных игр посвящена книга В.И. Жуковского и Т.Н. Тынянского «Равновесные управления многокритериальных динамических задач»,1984. Вывод, к которому приводят авторы этой книги: либо использовать те ситуации равновесия по Нэшу, которые одновременно свободны от некоторых из указанных недостатков, либо вводить новые решения бескоалиционной игры, которые, обладая достоинствами ситуации равновесия по Нэшу, позволяли бы избавиться от отдельных ее недостатков. Одной из таких возможностей для дифференциальных игр, связанной с концепцией угроз и контругроз, и посвящена настоящая статья. Используемые в ней понятия угроз и контругроз основываются на известной в классической теории игр концепции угроз и контругроз. Теоретическим основанием этой концепции стали работы Э.И. Вилкаса 1973 года. Термин «активное равновесие» предложил Э.Р. Смольяков в 1983 г., понятие равновесия угроз и контругроз в дифференциальных играх было использовано впервые, по-видимому, в 1974 г. Э.М. Вайсбордом, затем подхвачено первым автором настоящей статьи в упомянутой выше книге 1984 г., но применялась и применяется эта концепция в дифференциальных играх, по нашему мнению, недостаточно широко. Этот факт и «вызвал к жизни» настоящую работу. В ней выявляется класс дифференциальных игр двух лиц, в которых отсутствует привычная ситуация равновесия по Нэшу, но наличествует равновесие угроз и контругроз.
Бескоалиционные игры, равновесие по нэшу, активное равновесие, равновесие угроз и контругроз
Короткий адрес: https://sciup.org/147158977
IDR: 147158977 | DOI: 10.14529/mmph180201
Текст научной статьи Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз
Математика
S^ x = A ( t ) x + u 1 + u 2, x ( t 0) = x 0. (1)
Здесь фазовый n -вектор x e Rn ; момент окончания игры У = const > 0, а само это время продолжительности игры t e [0, У ]; управляющее взаимодействие i -го игрока u i e R n ( i = 1,2); n x n -матрица A ( t ), будем предполагать непрерывность на [0, У ] элементов матрицы A ( t ) и обозначать этот факт A ( • ) e Cn x n [0, У ]; пара ( t , x ) e [0, У ] x R n - текущая позиция игры Г , ( 1 0, x 0) - начальная позиция.
Стратегию i -го игрока U i будем отождествлять с n -вектор-функцией u i ( t , x ) (обозначим U i ^ u i ( t , x )), тогда множество стратегий i -го игрока
U i = { U i * u i ( t , x ), u i ( t , x ) = Q i ( t ) x | V Q i ( • ) e C nxn [0, ^ ] ) ; таким образом, выбор своей стратегии i -м игроком сводится к выбору n x n -матрицы Q i (t) ( i = 1,2).
Игра с течением времени развертывается следующим образом. Игроки, не объединяясь в коалиции, выбирают каждый свою стратегию U i ^ Q i ( t ) x ; в результате образуется ситуация игры U = ( U 1 , U 2) e U = U 1 x U 2 . Затем находят решение x ( t ), 1 0 < t < У , системы (1) при u i = Q i ( t ) x ( i = 1,2), т. е.
x ( t ) = [ A ( t ) + Q 1 ( t ) + Q 2 ( t )] x ( t ), x ( 1 0 ) = x 0 . (2)
Система линейных однородных дифференциальных уравнений (2) с непрерывными на [ 1 0, У ] коэффициентами имеет непрерывное продолжимое на [ 1 0, У ] решение x ( t ). Потом игроки строят реализации выбранных ими стратегий u i [ t ] = Q i ( t ) x ( t ) ( i = 1,2) и соответствующую реализацию ситуации u [ t ] = ( u 1 [ t ], u 2[ t ]), которую образуют два непрерывных на [ 1 0, У ] вектора ( u 1 [ t ], u 2[ t ]).
Функцию выигрыша i -го игрока тогда образует определенный на непрерывных тройках ( x ( t ), u 1 [ t ], u 2[ t ] 1 1 e [ 1 0, У ]) квадратный функционал
У
J i (U 1 , U 2 , 1 0 , x 0 ) = x ‘ ( У ) C i x ( У ) + J ( u ‘ [ t ] D^V t ] + u 2 [ t ] D i 2 u 2[ t ]) dt ( i = 1,2), (3)
t 0
где, не уменьшая общности, считаем постоянные n x n -матрицы С, D j ( i , j = 1,2) симметричными; штрих сверху означает операцию транспонирования ( x ‘ - n -вектор-строка), значение функционала (3) называется выигрышем i -го игрока. Полагаем, что игроки заинтересованы выбрать в игре Г свою стратегию таким образом, чтобы увеличить свой выигрыш.
Цель настоящей статьи - выявить достаточно общий класс линейно-квадратичных дифференциальных позиционных игр двух лиц в нормальной форме вида Г , в котором отсутствует равновесие по Нэшу, но одновременно существует равновесие угроз и контругроз.
Прежде всего приведем для игры Г четыре базовых определения: максимума по Парето, равновесия по Нэшу, активного равновесия и равновесия угроз и контругроз.
Для этого игре Г поставим в соответствие двухкритериальную динамическую задачу
Г v = (s, U , { J i (U , 1 0 , x 0 ) } i = 1;2).
Здесь динамическая система S совпадает с (1), множество альтернатив U совпадает с множеством ситуаций { U } игры Г , два критерия J i (U , 1 0, x 0) ( i = 1,2) определены в (3).
Цель ЛПР (лица, принимающего решения) в задаче Г v - выбор такой альтернативы (ситуации) U P e U , при которой оба векторных критерия (3) принимали бы одновременно возможно большие значения. Общепринятым здесь является понятие максимума по Парето.
Определение 1.1. Альтернатива (ситуация) UP = (UP, UP) e U называется максимальной по Парето в Гv , если при VU e U и V(10,x0)e [0, У) x Rn , x0 Ф 0n несовместна система неравенств Ji (U, 10, x0) > Ji (UP, 10, x0) (i = 1,2), из которых хотя бы одно строгое, при этом JP = (Ji(Up,t0,x0), J2(UP,t0,x0)) называется максимумом по Парето.
Отметим здесь два обстоятельства, которые сразу следуют из определения 1.1.
Свойство 1.1. Справедлива импликация:
J (U , t 0 , x o ) > J i (U P , t 0 , x o ) ^ J j (U , t 0 , X o ) < J j (U P , t 0 , x o ) ( i , j = 1,2; j * i ).
Свойство 1.2. Если для a = const > 0
max { J i( U , t 0, x 0) + a J 2( U , t 0, x 0) } = Idem { U ^ U P } ,
UeU 1 J то ситуация UP - максимальна по Парето в Гv ; напомним, что Idem{и ^ UP} означает выра- жение в фигурных скобках из (4), где U заменено на UP .
Перейдем к понятиям равновесных решений игры Г , где J = ( J 1 , J 2).
Определение 1.2. Пара (Ue, Je = J(Ue, 10, x0)) e U x R2 называется равновесием по Нэшу иг ры Г,если max J (U, Ue, t0, x0) = J (Ue = (Ue, Ue), t0, x0) = Je, и1eU1
max J 2 ( U i e , U 2 , 1 0 , x 0 ) = J 2 ( U e = ( U e , U 2 e ), 1 0 , x 0 ) = J 2e
. U 2 e U 2
при любых V ( 1 0, x 0) e [0, ^ ) x Rn , x 0 * 0 n (0 n - нулевой n -вектор).
Более громоздко выглядит понятие равновесия угроз и контругроз.
Пусть U = ( U 1 , U 2) некоторая фиксированная ситуация игры Г . Будем считать, что у первого игрока имеется угроза на ситуацию U , если у него существует стратегия U t e U 1 , что
-
J i( U 1 , U 2 , 1 0 , x 0 ) > J i( U 1 , U 2 , 1 0 , x 0 ). (5)
Наличие угрозы не означает ее обязательное применение, а лишь « animus denuntiandi »1. Применение угрозы «выгодно» первому игроку, так как при этом, согласно (5), его выигрыш увеличивается по сравнению с выигрышем в ситуации U .
В ответ на угрозу первого игрока U 1 t у второго имеется «неполная» контругроза , если у него существует стратегия U 2с e U 2 , при которой
-
J i( U i , U 22 , 1 0 , x 0 ) - J i( U 1 , U 2 , 1 0 , x 0 ), (6)
и у второго имеется «полная» контругроза , если существует такая стратегия U 2 e U 2 , что одновременно с неравенством (6) выполняется
-
J 2( U 1 , U 2 , 1 0 , x 0 ) > J 2( U i , U 2 , 1 0 , x 0 ). (7)
При наличии «неполной» контругрозы второй игрок за счет выбора своей стратегии U 2 с приводит, согласно (6), выигрыш первого (угрожающего) игрока к значению, не превосходящему его первоначальный выигрыш в ситуации U (но может и уменьшиться!). Все происходит как по девизу Наполеона I « Order, con re-order, disorder »2. Таким образом, наличие «неполной» контругрозы «сводит к нулю» применение угрозы. В дополнение к этому, «полная» контругроза «толкает» второго к применению U с , ибо в (полученной в результате угрозы и контругрозы) ситуации ( U 1 , U 2 c ) выигрыш второго увеличится по сравнению с выигрышем в ситуации ( U 1 , U 2 ) , сложившейся при реализации угрозы.
Аналогично определяется угроза второго игрока на ситуацию U и ответная контругроза («полная» или «неполная») первого.
Естественно, если в ответ на каждую угрозу на U любого игрока у другого имеется контругроза («полная» или «неполная»), то игроку не имеет смысла применять угрозу, ибо в результате
Математика реакции (контругрозы) на эту угрозу другого игрока его выигрыш не увеличится (но может и уменьшиться!). Этим еще раз подтверждается знаменитый закон римского права «Aequum est ne-minem cum alterius detrimento et injuria fieri locupletiorem»1.
Определение 1.3. Ситуация U P = (U 1 , U P ) e U называется активно равновесной в игре Г , если при любой начальной позиции ( t 0 , x 0 ) e [0, ^ ) х Rn , x 0 ^ 0 n
-
1) UP максимальна по Парето в Γ ν ,
-
2) в ответ на каждую угрозу U i e U i любого игрока у оставшегося имеется неполная контругроза.
Определение 1.4. Пара (U P , J P ) e U х R 2 называется равновесием угроз и контругроз в игре Г , если при любой начальной позиции ( t 0, x 0) e [0, ^ ) х Rn , x 0 ^ 0 n
-
1 ) UP – максимальна по Парето в игре Γ,
-
2 ) в ответ на каждую угрозу любого игрока у оставшегося имеется полная контругроза, здесь J P = ( J P , J 2P ), J P = J ( U P , 1 0, x 0) ( i = 1,2).
Из определений 1.3 и 1.4 следует, что любое равновесие угроз и контругроз является одновременно активным равновесием, а равновесие по Нэшу (в силу определения 1.2) не допускает угроз, причем только «самые хорошие» из них (одновременно максимальные по Парето) будут активно равновесными.
Как уже упоминалось в аннотации, приведенные здесь понятия угроз и контругроз основываются на известной [1] в классической теории игр концепции угроз и контругроз. На ее основе в [1, с. 109] определяются устойчивые коалиционные структуры, впервые, по-видимому, рассмотренные для дифференциальных коалиционных игр в [2]. Концепция «угроз и контругроз» для дифференциальных игр введена Э.М. Вайсбордом в 1974 г. в статье [3], развита В.И. Жуковским в [4, 5]. Теоретическим аспектам посвящены работы Вилкаса [6, 7]. Свой способ классификации решений бескоалиционной игры, включающий как составную часть равновесие угроз и контругроз, предложил Э.Р. Смольяков [8] в 1983 г., им же был введен термин «активное равновесие»; развитие этого направления в [9, 10]. Понятие активного равновесия для позиционных, дифференциальных, бескоалиционных игр активно использовалось в [11]. Способ доказательства существования активной равновесности был предложен первым автором настоящей статьи в [11] и затем успешно применен при установлении факта существования такого решения в дифференциальных позиционных играх, описываемых уравнениями с частными производными [12, 13], стохастическими [14], в банаховом пространстве [15], уравнениями с постоянным запаздыванием [16], при использовании программных стратегий [9].
Активно равновесным ситуациям и равновесиям угроз и контругроз присущи все «положительные» свойства ситуации равновесия по Нэшу [17, c. 49]:
-
– во-первых, они устойчивы к отклонению отдельного игрока;
-
– во-вторых, удовлетворяют свойству индивидуальной рациональности;
-
– в-третьих, совпадают с седловой точкой в случае антагонистической игры.
Одновременно с тем эти неулучшаемые равновесия свободны от следующих недостатков [17, с. 58]:
-
– существуют в ряде случаев, когда равновесие по Нэшу отсутствует (например, как в настоящей статье);
-
– в отличие от равновесия по Нэшу неулучшаемы и внутренне устойчивы;
-
– наличие в игре равновесия по Нэшу влечет существование некоторых видов неулучшаемых равновесий, выигрыши всех игроков при которых не меньше, чем при равновесии по Нэшу;
-
– наконец, лишь «самые хорошие» ситуации равновесия по Нэшу (которые одновременно максимальны по Парето) являются равновесиями угроз и контругроз. Однако лишь частные виды игр обладают такими «самыми хорошими» решениями.
-
2. Максимальные по Парето ситуации и выигрыши
Заметим, что указанные свойства имеют место и для позиционных дифференциальных бескоалиционных игр, а в [17] использована математическая формализация стратегий игроков и порожденных ими движений динамической системы, предложенная Н.Н. Красовским в [18].
Далее D < 0 ( > 0) означает, что квадратичная форма x'Dx определенно отрицательна (соответственно, положительна).
Прежде всего приведем вспомогательное утверждение (лемму 2.1)
Рассмотрим двухкритериальную статическую задачу
Г2 = (X = R , { fi(u ) = u1 Di 1 u1 + u 2 Di 2 u 2}. ) , \ 1 J i=1,2/ в которой ЛПР (лицо, принимающее решение u = (u1, u2) е R2n ) выбирает альтернативу (ситуацию) u с целью достичь одновременно возможно больших значений обеих компонент векторного критерия f (и) = (f1(u), f,(и)). Аналогом определения 1.1 здесь будет:
альтернатива ир максимальна по Парето в Г 2 , если при V и е R 2 n несовместна система неравенств f ( и ) > f ( uP ) ( i = 1,2), из которых хотя бы одно строгое.
Ниже используем аналог свойства 1.2.
Лемма 2.1. Если в задаче Г симметричные матрицы D j , C i и числа Л ii , Л у ( i , j = 1,2; i * j )
такие, что
D ii > 0( i = 1,2), D 12 < 0, D 21 < 0,
Л 11 Л 22
< Л 2 ^ 21 ,
то существует а = const > 0, при котором квадратичная форма f (и ,а) = f1( и) + а f2( и) = u1 D1(a) и1 + и 2 D 2(a) и 2 становится определенно отрицательной; здесь D1(a) = D11 + aD21 , D2(a) = D12 + aD22 , кроме того Лii - наибольший корень характеристического уравнения А(Л) = det[Dii - ЛЕn ] = 0 (i = 1,2); - Ay (i * j) так же наибольший (по абсолютной величине наименьший) корень
-
3 ( Х ) = det || D ij - A E n || = 0, E n - единичная n х n -матрица.
Доказательство. В силу симметричности всех четырех используемых в Г 2 матриц Dii , D j ( i , j = 1,2; i * j ) корни обоих характеристических уравнений А ( Л ) = 0 и 3 ( Х ) = 0 вещественны, причем корни А ( Л ) = 0 положительны, а 3 ( Х ) = 0 - отрицательны. Обозначим наибольший из n корней уравнения det[ Dii -Л Еn ] = 0 через Л ii , а наибольший из корней уравнения 3 (A) = 0 через
-
- A j , тогда из [19, с. 281] следует, что при V и е Rn будет
и'Du <ЛiiUiUi (i = 1,2), и 2 D12 и 2 <-Л2 и 2 и 2 , U1d21u1 < -^21 u1u1 . Поэтому f (и,a) = f1(и) + af2(и) = u1 D1(a)и1 + и2D2(a)и2 = u1[D11 + aD21]и1 + и2[D12 + aD22]и2 < (Л11 - aA21) и1и1 + (-Л12 + aA22 )и2и2 .
Поэтому f ( и,a) < 0 V и е R 2 n , если
Лн - aA^ < 0, - Л2 + aЛ22 < 0.
Таким образом, при
^ ii < a < ^ ^ ^ f ( и , a ) < 0 V и = ( и 1 , и 2) е R 2 n . (9)
^ 21 Л 22
Заметим, что, во-первых, (9) имеет место, если Л 11 Л 22 < Л 21 Л 1 2 , во-вторых, можно считать a = 2 [Л 11 / ^ 21 + ^ 12 /Л 22 ] .
Лемма 2.2. Решениям x(t) системы .x = K(t)x, x(10) = x0, где K(•) е Cnхn [0,У] присуще свой- ство x0 * 0n ^ x(t) * 0n Vtе [10,^].
Математика
Здесь 0 n - ноль-вектор из R n .
Доказательство от противного: пусть Я t 1 е [ t 0, У ] такой, что x ( t 1 ) = 0 n . Тогда бы в момент t 1 через позицию ( t 1 ,0 n ) «проходило» бы два решения системы x = K ( t ) x : именно тривиальное x (1)( t ) = 0 n и нетривиальное x (2)( t 1 ), «порожденное» ненулевым начальным условием x 0 Ф 0 n , что противоречит теореме единственности решения линейного дифференциального уравнения.
Утверждение 2.1. Если в дифференциальной игре Г
D 11 > 0, D 22 > 0, D 12 < 0 , D 21 < 0 , C i < 0 ( i = 1, 2) , Л 11 Л 22 < ^ 12 A 21 , то максимальная по Парето ситуация U P = ( U P , U P ) в двухкритериальной задаче Г v будет U P = ( U 1 P , и 2 ) - ( U P ( t , x ), u 2 ( t , x )) = uP ( t , x ) = ( Qf ( t ) x , Q P ( t ) x ) = ( - D - 1 ( a ) 0 P ( t ) x , - D 21 ( a ) 0 P ( t ) x ), где симметричная непрерывная на [0, ^ ] n х n -матрица: ϑ
0 P ( t ) = [ X - 1 ( t )] ' { C - 1 ( a ) + J X - 1 ( r )[ D 1 - 1 ( a ) + D 21 ( a )] [ X - 1 ( t )] ' d T } - 1 X - 1 ( t ) t
1 Л]
a = --1
2 A 2
D 1 ( a ) = D 11 + a D 21, D 2( a ) = D 12 + a D 22 , С ( a ) = С 1 + a C 2,
+ Ek;
1 Л 22 _
Л ii - наибольший корень характеристического уравнения det[ D ii -Л Еn ] = 0 ( i = 1,2) ^ ,
-
-A y = I 1 ( U t , U 2P , 1 0, x 0) - V 1 ( 1 0, x 0) - наибольший корень характеристического уравнения det[ D ij - A E n ] = 0, ( i , j = 1,2; i Ф j );
En - единичная n х n -матрица, X ( t ) - фундаментальная матрица решений векторного уравнения x = A ( t ) x , X ( У ) = E n .
Доказательство. Найдем максимальную по Парето ситуацию UP , применяя лемму 2.1 (конкретно, используя (4)) и метод динамического программирования (МДП) из [20, с. 112]. Сам МДП, с учетом свойства 1.2, здесь сведется к осуществлению двух этапов. Если для задачи Гv удалось найти число a > 0, непрерывно дифференцируемую скалярную функцию V(t, x), а так- же две n -вектор-функции ui (t, x, V) (i = 1,2) такие, что
V ( ^ , x ) = x'Cx V x е Rn ( C = C 1 + a C 2).
ЭТАП I.
С помощью скалярной функции
∂V
W ( t , x , U]U 2, V ) =--+
' 1 2 z d t
∂ V
∂ x
′
( A ( t ) x + u 1 + u 2) + u ‘ D 1 ( a ) u 1 + u 2 D 2( a ) u 2
∂V найти две n -вектор функции ui (t, x, V) (i = 1,2), исходя из (— = gradx V) ∂x
max W(t, x, u1, u2, V) = Idem {ui ^ ui (t, x, V)}, u1 U 2
при любых t е [0,^], x е Rn , V е R . Достаточные условия существования u(t, x, V) в (15) сводят- ся к
(3—) u ( t,xy ) =3" + 2 D i ( a ) u i ( t , x , V ) = 0 n ( i = 1,2), (16)
dui dx
Ui (t, x, V) = -1 D 1a) (i = 1,2),(18)
и тогда
′′
W (t, x, u (t, x, V), V) = W [ t, x, V ] = dV + dV a (t) x - - IdVI [ Di-1(a) + D^(a)] dV. d t L dx J 4 V дx J
ЭТАП II. Найдем решение вида V = VP (t, x) = x‘0Px, 0P = [0P (t)]‘ дифференциального уравнения с частными производными
W [ t , x , V ] = 0
и граничным условием ( C = C 1 + a C 2),
V ( У , x ) = x'Cx V x e R n ,
-
т. е. для V t e [0, У ], V x e R n имеет место
W [ t , x , V ( t , x ) = x ‘0 P ( t ) x ] = 0, V( У ,x ) = x'Cx V x e R n .
Оба эти требования выполнены, если n х n -матрица 0 P ( t ) удовлетворяет матричному дифференциальному уравнению типа Риккати (0 n х n - нулевая n х n -матрица)
(Э P ( t ) + 0 P ( t ) A ( t ) + A '( t ) 0 P ( t ) -0 P ( t )[ D - - 1( a ) + D -x ( a )] 0 P ( t ) = 0 n х n ,
0P (У) = C = C + aC2 .
Решение 0P (t) полученного матричного уравнения типа Риккати имеет [20, с. 65] вид (12), здесь учтена импликация Ci < 0 (i = 1,2) ^ C1 + aC2 < 0. Наконец, из (18) и V(t,x) = x'0P (t)x ^ ^(t’ x) = 20P (t)x приходим к справедливости (11). Таким образом, макси-∂x мальная по Парето ситуация UP в задаче Гv имеет вид (11)-(13).
Перейдем к построению максимальных по Парето выигрышей J P = ( J 1 ( U P , 1 0, x 0), J 2 ( U P , 1 0, x 0)) = ( J P , J 2 ) опять-таки с помощью идей МДП.
Утверждение 2.2. Пусть выполнены требования (10) (из утверждения 2.1) и для дифференциальной игры Г удалось найти две скалярные непрерывно дифференцируемые функции вида V i ( t , x ) = x ‘0 i ( t ) x ( i = 1,2) и такие, что
-
1) V i ( У ,x ) = x'Cx V x e Rn ;
-
2) система из двух уравнений с частными производными
d V i + Г d V i Y d t V d x V
( N ( t ) x + x ‘0 P ( t ) M i ( t ) 0 P ( t ) x ) = 0, V i ( У , x ) = x'Cx
∀ x ∈ Rn
( i = 1,2),
имеет решение вида V i ( t , x ) = x ‘0 i ( t ) x , [ 0 i ( t )] ‘ = 0 i ( t ) ( i = 1,2).
Тогда при любой начальной позиции ( 1 0, x 0) e [0, У ) х R n , x 0 ^ 0 n имеет место J P = J i (U P , 1 0 , x 0 ) = x 0 0 P ( 1 0 ) x 0 ( i = 1,2).
В (20) непрерывные n х n -матрицы
N ( t ) = A ( t ) - ( D 1 - 1 ( a ) + D 21 ( a )) 0 P ( t ),
M i ( t ) = 0 P ( t )[ D 1 - 1 ( a ) D i1 D 1 - 1 ( a ) + D 2 1 ( a ) D i 2 D 2 1 ( a )] 0 P ( t ) ( i = 1,2), n х n -матрицы D i ( a ), 0 P ( t ) приведены в (12), (13), а симметричная n х n -матрица ϑ
0 i ( t ) = [ У - 1( t )] ' { C i - J Y( T ) 0 P ( T ) M i ( T ) 0 P ( T ) Y ( t ) d T } Y - 1( t ), ( i = 1,2). t
Наконец, У ( t ) - фундаментальная матрица решения однородной системы y = N i ( t ) y , У ( У ) = En .
Доказательство. Составим две скалярные функции
Математика дК
W i [ t , x , V i ] = -V + d t
f d V )( dx )
( N ( t ) x + [ u P ( t , x )] D i 1 u P ( t , x ) + [ u P ( t , x )] D i 2 u P ( t , x )) a ( i = 1,2),
причем up ( t , x ) - n -вектор функции, определенные в (11).
Ищем решение V i ( t , x ) ( i = 1,2) системы из двух уравнений с частными производными
W [ t , x , V ] = 0, V ( y , x ) = x'Cx V x e Rn ( i = 1,2) (24)
в виде квадратичной формы V i ( t , x ) = x ‘0 i ( t ) x , [ 0 i ( t )] ‘ = 0 i ( t ) ( i = 1,2).
Установим два факта.
Во-первых. Решению системы (23), (24) присуще свойство
V ( t 0 , x o ) = J i (U P , t 0 , x o ) ( i = 1,2), (25)
где ситуация U P = ( U P , U P ) имеет вид (11). В самом деле, если U P - ситуация из (11)-(13), то, согласно (23) и (24), решение xP ( t ) системы x = N ( t ) x , x ( t 0) = x 0, с учетом (23) и (24) при x = xP ( t ) будет
0 = W [ t , xP ( t ), V ( t , xP ( t ))] =
d V ( t , xP ( t )) d t
' d V ( t , x P ( t ))
x dx ;
N ( t ) xP ( t ) +
+£[ u P ( t , xP ( t ))] ' D i, u P ( t , xP ( t )) = W [ t ] v t e [ 1 0 , ^ ].
j '=1
Интегрируя обе части этого тождества в пределах от 10 до У, с учетом граничных условий из (24), приходим к
У У Jv^ * P /*w
0 = j W [ t ] dt = j dV i ( t’x ( t )) t 0 t 0 ^
У 2
dt + j ^ [ u j ( t , xP ( t ))] ' Du P ( t , xP ( t )) dt = VP ( У , xP ( У )) - V i ( 1 0 , x 0 ) +
1 0 j = 1
У 2 У 2
+ j ^ [ u P ( t , xP ( t ))] ' D ij- u P ( t , xP ( t )) dt = x ‘ ( У ) C i x ( У ) + j ^ [ u P ( t , xP ( t ))] ' Du P ( t , xP ( t )) dt - V ( 1 0 , x 0 ) =
1 0 j = 1 1 0 j = 1
= J i (U P , 1 0 , x 0 ) - V ( 1 0 , x 0 ) (i = 1,2).
Откуда сразу следует справедливость равенств (25).
Во-вторых, установим, что решение Vt ( t , x ) ( i = 1,2) системы (24) имеет вид
V ( t , x ) = x ‘0 j ( t ) x , где симметричная n x n -матрица 0 i ( t ) представима в виде (22). В самом деле, подставив V i = x ‘0 i ( t ) x в (24), получаем справедливость (24), если только 0 i ( t ) ( i = 1,2) является решением матричного линейного неоднородного дифференциального уравнения
0 i +0 i N + N 0 i +0 P ( t ) M i ( t ) 0 P ( t ) = 0 n x n , 0 i ( У ) = C i ( i = 1,2). (26)
Нетрудно подстановкой 0 i ( t ) из (22) убедиться, что симметричная n x n -матрица 0 i ( t ) из (22) в самом деле является решением (26), что и завершает доказательство утверждения 2.2.
-
3. Леммы о мажорантах
Перейдем к утверждениям, которые,
-
- во-первых, позволяют сразу судить об отсутствии в дифференциальных играх вида Г равновесия по Нэшу,
-
- во-вторых, реализуют для Г концепцию равновесия угроз и контругроз.
Причем эти сведения получаются только на основании специальной знакоопределенности квадратичных форм, используемых в интегральных слагаемых функций выигрыша (3).
Не оговаривая особо, далее предполагаем выполненными ограничения (10), и поэтому существует максимальная по Парето в Г ^ ситуация
UP = ( U P , U P ) - uP ( t , x ) = ( u P ( t , x ), u P ( t , x )) = ( Q P ( t ) x , Q 2 P ( t ) x ) = ( - D 1 - 1 0 P ( t ) x , - D 2 1 0 P ( t ) x ).
Лемма 3.1. Пусть в (3) при i = 1 матрица 5 11 > 0, тогда для максимальной по Парето в Г ^ ситуации U P существует постоянная ^ (1)( U P , t 0, х 0) > 0 такая, что при VP > в 1 (U P , t 0, х 0) > 0 и стратегии первого игрока U t ^ в х будет
1 1( U 1 , U 2 , t 0 , х 0 ) > 1 1( U 1 , U 2 , t 0 , х 0 ) (27)
для любых начальных позиций ( t 0, х 0) е [0, У ) х [ Rn \{0 n }].
Доказательство. В утверждении 2.2 установлено существование функции Беллмана V 1 ( t , х ) = х '0 1 ( t ) х , для которой
1 1 ( U P , t 0 , х 0 ) = V 1 ( t 0 , х 0 ) = х 0 0 1 ( t 0 ) х 0 , (28)
где непрерывная на [0, У ) матрица 0 1 ( t ) имеет вид (22) ( i = 1).
Рассмотрим теперь стратегию первого игрока Ut ^ ut (t, х) = P х, а величину числового параметра в > 0 определим ниже. Вследствие симметричности матрицы 51 1 и дополнительно 511 > 0 имеет место u‘511u1 > ДЦиЦ2 = X1 u'и1 Vu1 е Rn, (29)
где ||-|| - евклидова норма и X > 0 - наименьший корень характеристического уравнения det[ 5 11 - X En ] = 0 [21, с. 89].
Далее будем использовать n х n -матрицу 0 P ( t ), t е [0, У ] из (12) и (13), а из (11) стратегию U 2 ^ Q 2 ( t ) х второго игрока и неравенство (29).
Рассмотрим теперь скалярную функцию
W1 [t, х] = W1 (t, х, ut (t, х) = P х, и2P (t, х) = Qр (t)х, V1 (t, х) = х‘01 (t)х) = дV(t,х) гдV(t,х)Vr х t, х P, м
=--+ [---------] [A(t)х + u (t, х) + u^ (t, х)] + дt дх ' 1 ' Z
+[ ut (t, х)]‘ 51 1 ut (t, х) + [ uP (t, х)]‘ 512 u p (t, х) > х' d0^- х + 2 х '0J (t)[ A (t) + PE + QP (t)] х + х '^P1 E х + х'[ QP (t)]]‘ 512Q2P (t) х = dt 1 n 2 1 n 2 12 2
= х' | d 0^ + 0 1 ( t )[ A ( t ) + P E n + Q P ( t )] + [ A '( t ) + P E n + [ Q P ( t )] ‘ ] 0 1 ( t ) + /Ji' E n + [ dt
+ [ Q P ( t )]] ' 5 12 Q P ( t )
x = хМ ( t , P ) х .
Стоящая здесь в фигурных скобках n х n -матрица М ( t , P ) симметрична и имеет следующий вид (с учетом enen=n )
М 1 ( t , P ) = X 1 P 2 E n + 2 P0 1 ( t ) + K ( t ), здесь n х n -матрица
K ( t ) = 0 1 ( t ) + 2 0 [ A ( t ) + Q P ( t )] + [ Q P ( t )] ' 5 12 Q P ( t ).
Элементы матрицы M ( t , P ) непрерывны по t е [0, У ] и, следовательно, равномерно ограничены на компакте [0, У ], множитель P 2 входит только в диагональные элементы матрицы М ( t , P ); напомним, что X 1 > 0 является наименьшим корнем характеристического уравнения det [ 5 1 1 - X En ] = 0, а En - единичная n х n -матрица. Поэтому постоянную P = P (1) ( U 1 P , 1 0, х 0) > 0 можно выбрать настолько большой, чтобы все ведущие миноры матрицы М ( t , P ) стали положительными V t е [0, У ] и V P > P^ X1(U 1 ). Согласно критерию Сильвестра и лемме 2.2 [5, с. 88] квадратичная форма х'М ( t , P ) х будет определенно положительной для всех t е [0, У ] и постоянных
Математика в> в^Ф1 P,t0,xо) (так как знак x'M(t,в)x определяется знаком квадратичной формы в^] nx'x ).
Фиксируем постоянную в (1) > в ( 1)( U 1 P , t 0, x 0) и тогда
Wt , x ] = x' M 1 ( t , в (1)) x > 0 V x e [0, f ], V x e Rn \{0 n }.
Обозначим через x(t) решение (при t e [0, f]) векторного уравнения x = A (t) x + в(1) x + Q2 (t) x, x0 = x (10).
Так как [ x 0 * 0 n ] ^ [ x ( t ) * 0 n V t e [ t 0, f ]], то, согласно (29), будет
W [ t , x(t )] > 0 V t e [ 1 0, f ].
Отсюда, интегрируя обе части последнего неравенства в пределах от 1 0 до f и учитывая граничное условие 0 1 ( f ) = C i , u t [t ] = в® x ( t ), получаем
0 < [ W [ t , x ( t )] dt = [ ( d V1(t , x ) + [ d V 1( t , x ) ] ' [ A ( t ) x + в (1) Enx + Q p ( t ) x ] l dt +
1 0i I d t Э x n -2 - 1 x = x ( t )
[
+ j { x'^ "Dn^^1 x + [ Q 2P ( t ) x ] ‘ D 12 Q 2P ( t ) x } _ dt = x = x ( t )
t 0
[ | d V 1( t x(t» I dt + [ { [^ t ]] ‘ D 11 u t [ t ] + [ u p [ t ]] ‘ D 12 u p [ t ]
I d t I t0 t0
[
= x ( f ) C 1 x f ) + J { [ u t [ t ]] ‘ D 1 1 u t [ t ] + [ u 2p [ t ]] ‘ D 12 u p [ t ] } dt — V 1 ( 1 0, x 0) = t 0
= 1 1( U 1 , U 2 , t 0 , x 0 ) — V 1( t 0 , x 0) .
Отсюда и из 1 1 ( U 1 P , U 2P , 1 0, x 0) = V 1 ( 1 0, x 0) сразу следует справедливость леммы 3.1.
Замечание 3.1. Рассмотрим внутреннюю оптимизационную задачу в игре Г : найти max 1 1 ( U 1 , U 2 , 1 0, x 0) при ограничении (1), фиксированной стратегии U 2P e U 2 второго игрока и U 1 e U 1
любых (10,x0)e[0,f)x[Rn \{0n}]. Фактически лемма 3.1 утверждает, что при D11 >0 и x0 *0n эта задача максимизации не имеет решения. В самом деле, какую бы стратегию U1 e U1 первый игрок не выбрал, всегда существует стратегия U1 e U1 этого игрока такая, что
11(U 1 ,U P ) > I , ( U 1 , U 2 P ) V ( 1 0 , x 0 ) e [0, f ) x [ R n \{0 n }].
Такой результат позволяет сразу «отметать» (при выборе решения игры Г ) те концепции принятия равновесных решений игровых задач вида Г , в условиях которых фигурирует максимизация функции выигрыша первого игрока (например, не применять при D 11 > 0 концепцию равновесия по Нэшу в качестве принципа выбора решения в игре Г ).
Таким образом, в дифференциальной игре Г ситуация равновесия по Нэшу U e e U не существует. Одновременно с тем, стратегия первого игрока U t ^ в x , V e > в (1) = e (1)( U P , 1 0, x 0) реализует, согласно (5), угрозу первого игрока на максимальную по Парето ситуацию U P . В следующих леммах считаем начальную позицию ( 1 0, x 0) «замороженной» и совпадающей с той, которая фигурирует в лемме 3.1, а в «угрожающей» стратегии первого игрока U t ^ в x также считаем скалярную постоянную в = в (1) • Напомним, что, не оговаривая особо, считаем выполненными ограничения (10).
Лемма 3.2. Справедлива импликация
D12 < 0 ^ 3 в (2) = e (2)( U P , U ): V e ^ в (2), 1 1( U 1 , U в ’ t 0 , x 0 ) < 1 1( U ’ t 0 , x 0 ) ,
т. е. стратегия U p ^- P x реализует в игре Г неполную контругрозу на ситуацию U P е U .
Доказательство проведем, как и в лемме 3.1, в два этапа. На первом построим функцию Беллмана V ( t , x ) = x /01 ( t ) x , такую, что
I1(U1 , U2 ,t0, x0) = V1( t0, x 0,P на втором установим, что 3P(2) = P(2)(U1t,UP) = const такая, что имеет место импликация (30), (31).
ЭТАП I. Рассмотрим скалярную функцию («диктуемую» МДП)
W^t , x , V1] = W1(t , x , u t (t , x ) = в (1) x , u P ( t , x ) = - D 21( a ) 0 P ( t ) x , V1) =
= d V L + [ d V _] ’ [ a ( t ) + ZK E n - D 2 1 ( a ) 0 P ( t )] x + [ u t ( t , x )] ' D 1 u t ( t , x ) + ∂ t ∂ x
+ [ u P ( t , x )] ‘ D 12 u P ( t , x ) "V + [ a ( t ) + /К E n - D 2 1 ( a ) 0 P ( t )] x + ∂ t ∂ x
+ x ‘ [( в (1))2 D 11 + 0 P ( t ) D ^( a ) D 12 D 21( a ) 0 P ( t )] ‘ x .
Тогда W1[t , x , V1(t , x ) = x 0 ^ ( t ) x ] = 0, если 0 1 ( t ) будет решением матричного линейного неоднородного дифференциального уравнения
0 1 +0 У [ A ( t ) + в (1) E n — D 2 1( a ) 0 P ( t )] + [ A ‘ ( t ) + P (1) E n —0 P ( t ) D ■ '. a >| 0 . +
+ ( в (1))2 D 11 +0 P ( t ) D - D 12 D 2 1 0 P ( t ) = 0 n x n , 0 1 ( У ) = C 1 .
Решение этого уравнения 01 (t) существует, единственно и продолжимо на [10, У]. Пусть n- вектор x1 (t), tе [10, У] является решением однородного линейного дифференциального векторного уравнения x = [ A (t) + в(1) En — D 24a)0P (t)] x, x (10) = x 0.
Тогда с учетом (33)
W 1 [ t , x y ( t ), V 1 ( t , x y ( t )) = ( x y ( t )) ‘0 1 ( t ) x y ( t )] =
= dK1( t , x ( t )) + [ u y ( t , x y ( t ))] ‘ d щУ ( t , x y ( t )) + [ u P ( t , x y ( t ))] ‘ D12u P ( t , x y ( t )) = 0. d t 111 1 12
Интегрируя обе части этого равенства в пределах от 1 0 до У , получаем (с учетом U 1 = U t ) ϑ
V 1 ( У , x y ( У )) - V ( 1 0 , x 0 ) + J [( u y [ t ]) ‘ D 11 u y [ t ] + [ u P [ t ]] ‘ D 12 u P [ t ]] dt = t 0
= 1 1( U 1 , U 2 , t 0 , x 0 ) - V 1( t 0 , x 0 ) = 0 , что и доказывает справедливость (32).
ЭТАП II. Здесь учтем, что из симметричности D 12 < 0 ^ 3Л 12 = const > 0 такого, что u 2 D 12 u 2 -—Л 12 u 2 u 2 =— Л 12 I| u 21| V u 2 е R , (34)
где —Л 12 наибольший корень характеристического уравнения det [ D 12 — X En ] = 0.
С учетом (33) вернемся к скалярной функции W K t , x , V1) , где учтем (34) и V1(t , x ) = x'0 1 ( t ) x :
W 1 [ t , x ] = Wr1 [ t , x , u t ( t , x ), u 2 = e x , V1 = x'0 1 ( t ) x ] = ′
= —1 + ^ V 1 I ( A ( t ) + e (1) E n + P E n ) x + ( в (1))2 x'D 11 x + о t ^ о x )
+ P 2 x ‘ D 12 x < -Л 12 P2 x ‘ x + 2 x ‘0 1 ( t )[ A ( t ) + P^ 1 En + p En ] x +
Математика
+в )2 x'D 1 1 x = x'L ( t , в ) x , L ( t , в ) = L ‘ ( t , в ), где L ( t , в ) Л . в E n + Wy ( t ) + S 1 ( t ).
Элементы матрицы L ( t , в ) непрерывны на компакте [0, J ] и, следовательно, равномерно ограничены, множитель в 2 входит только в диагональные элементы матрицы L ( t , в ). Тогда существует достаточно большое положительное число в (2), такое, чтобы при в - в (2) все ведущие миноры матрицы L ( t , в ) нечетного порядка были отрицательны и четного - положительны. Согласно [22, с. 88], при в - в (2) квадратичная форма x'L ( t , в ) x становится определенно отрицательной.
Воспользуемся снова уже введенной выше скалярной функцией Wi [t, x], где заменим x на xc (t) - решение однородного векторного дифференциального уравнения xc c = [ A (t) + в(1) + в] xc, xc (10) = x0.
В силу леммы 2.2 x c ( t ) ^ 0 n при V t e [ 1 0, J ], и поэтому для в - в (2) будет
W 1 [ t , x c ( t )] = ( x c ( t )) ‘ L ( t , в ) x c ( t ) < 0 V t e [ 1 0, J ].
Интегрируем в пределах от 1 0 до J обе части полученного строгого неравенства, с учетом и 1 ( t , x ) = в (1) x , V 1 ( J , x ) = x' C 1 x , x = x c ( t ) приходим к
0 < J W1 [t,xc (t)]dt = J {dV1(t’xc(t)) + [dV1(t’xc(t))]‘[A(t) + (в(1) + в)En ]xc (t) + ∂t∂ t 0
+ [ u ^ ( t , ( x c ( t ))] ‘ D 1 1 u 1 ( t , ( x c ( t )) + в 2 ( x c ( t )) ‘ D 12 x c ( t )} dt =
= J dV ( t , x ( t )) dt + J [(^ t ]) ‘ D 11 Mt [ t ] + в 2( x c ( t )) ‘ D 12 x c ( t )] dt =
10 dt
= V1 (J, xc (J)) - V1( t0, x0) + J [(u1 [ t ])‘ DU [ t ] + в2 (xc (t))‘ D12 xc (t)] dt = t 0
= 1 1( U 1 , U 2 , t 0 , x 0 ) — V 1( t 0 , x 0 ).
Отсюда и из (32) сразу получаем справедливость (31).
Аналогично доказательству лемм 3.1 и 3.2 устанавливается справедливость следующих утверждений (леммы 3.3 и 3.4). В них, напомним, считаем «замороженными» начальную позицию ( 1 0, x 0), n х n -непрерывную матрицу 0 P ( t ), стратегию U 2 ^ в (2) x неполной угрозы, фигурирующих в леммах 3.1 и 3.2 и выполнены ограничения (10).
Лемма 3.3. Имеет место импликация D 22 > 0 ^ Э в (3) = в ( 3)( иР , U i , 1 0, x ) = const > 0 такая, что при Vв - в (3), и стратегии U 2 ^ в x будет
I 2( U 1 , U 2 , t 0 , x 0 ) > I 2( U 1 , U 2 , t 0 , x 0 ), (35)
т. е. стратегия второго игрока U 2 ^ ( в = тах{ в ( 2), в (3)}) x завершает полную контругрозу (совместно с Ucc ^ в (2) x ) на угрозу первого на U P .
Доказательство начнем с применения неполной контругрозы U С первого игрока на U P , такой, что
1 1( U 1 , U 2 , t 0 , x 0 ) > 1 1( U 1 , U 2 , t 0 , x 0 ) .
На основании максимальности по Парето U P , а также свойства 1.1 (из раздела 1 настоящей статьи) получаем
I 2( U 1 ^ , U 2 , t 0 , x 0 ) < I 2( U 1 , U 2 , t 0 , x 0 ).
Затем, также как в доказательстве леммы 3.1, во-первых, установим существование функции Беллмана V 2 ( t , x ) = x ‘0 2 ( t ) x , для которой
I 2( U 1 , U 2 , t 0 , x 0 ) = V 2( t 0 , x 0 ) = x 0 0 2( t 0 ) x 0 , (36)
во-вторых, с учетом D22 = D22 и D22 > 0 и учетом неравенства u2D22u2 - A ||u21| = ^2u2 u2 Vu2 e R , где A2 > 0 - наименьший корень характеристического уравнения det [D22 - AEn ] = 0, составим
W 2[ t , x ] = W 2[ t , x , u f ( t , x ) = P’"x , u 2 = Px , V 2 = x '0 2( t ) x ] =
= dK,(t,x) +| j (a(t)x + uy (t,x) + ) + [uy (t,x,d у (t,x) + p2x'd x - dt V dx ) ' 1 x z 2Z 1 ' z 21 1 ' z ' 22
= x '| d 0^ + © 2 ( t )[ A ( t ) + в (1) E n + P E n ] x + [ A '( t ) + P 1E n + P E n ] ® 2 < t ) + ( P ^)2 D 21 + ^E n I x =
I dt J
= x ' M 2 ( t , P ) x .
При достаточно больших P - P(3), квадратичная форма M2(t, P) > 0 (согласно критерию Сильвестра), кроме того, решение x(t) системы x = [ A (t) + P(1) En + PEn ]x, x (10) = x0 .
При x 0 * 0 ^ x ( t ) * 0 n (лемма 2.2), поэтому x '( t ) M 2( t , P ) x ( t ) > 0 V t e [ 1 0, J ]. Интегрируя обе части этого неравенства, получаем
0 < J x '( t ) M 2( t , P ) x ( t ) dt = J d^x ( t )) dt + J { u t [ t ] D21ut1[t ] + u c [ t ] D 22 u 2 c [ t ] } dt = t 0 t 0 t 0
= I 2( U 1 , U 1 , t 0 , x 0 ) — V 2( t 0 , x 0).
Отсюда и из (36) сразу следует справедливость (35).
Аналогично лемме 3.2 доказывается
Лемма 3.4. Пусть U 2 - угроза второго игрока на максимальную по Парето в Г v ситуацию
U P = ( U 1 P , U 2P ), т. е. нашлась стратегия U 2 ^ P x P - P > 0 такая, что
I 2( U 1 , U 2 , t 0 , x 0 ) > I 2( U 1 , U 2 , t 0 , x 0 )
(такая стратегия U 2 существует вследствие D 22 > 0).
Тогда справедлива импликация
D 21 < 0 ^ 3 P (4) = const > 0: V P = const - P (4)
I 2( U 1 ,U 2 , t 0 , x 0 ) < I 2( U , t 0 , x 0 )
для стратегии U 1 P ^ P x , т. е. U f реализует в игре Г неполную контругрозу на ситуацию U P .
-
4. Доказательство существования
Теорема 4.1. Предположим, что для игры Г выполнены ограничения (10). Тогда тройка ( U , 1 1 , 1 2 ) = (( U 1 , U 2 ), 1 1( U , t 0 , x 0 ), I 2( U , t 0 , x 0)) =
= (( — D 1 — 1 ( a ) ® P ( t ) x , — D 2 1 ( a ) ® P ( t ) x )» x 0 ® 1( t 0 ) x 0 , x 0 ® 2 ( t 0 ) x 0 )
является равновесием угроз и контругроз для дифференциальной игры
Г = ({1,2}, E ^(1.1),{U, };=1,2,{Ii (U1, U 2,10, x0)}=1,2), здесь матрица
— 1
X — 1 ( t ),
I J
0 P ( t ) = [ X — 1 ( t )] ‘ C -1 ( a ) + J X — 1 ( t )[ D 1 — 1 ( a ) + D — ( a )][ X — 1 ( t )] ‘ dT >
Математика
D i ( а ) = D 1, + a D 2 , , C ( а ) = C 1 + а С 2 , а = - у
2 ^ 2
1+712, 1 Л22 _ где Лii - наибольший корень уравнения det [Dii - ЛЕn ] = 0 , -7 - наибольший корень уравнения det [Dij - 7En ] = 0, X(t) - фундаментальная матрица системы 5с = A(t)x, X(У) = En (i, j = 1,2; i * j), а симметричные матрицы 0i (t) (i = 1,2) определены в (22).
Доказательство. Во-первых, из D 11 > 0 следует сразу два вывода: отсутствие в Г ситуации равновесия по Нэшу и наличие угрозы U 1 t со стороны первого игрока на максимальную по Парето ситуацию U P в двухкритериальной задаче Г v (замечание 3.1). Существование максимальной по Парето ситуации и максимальных по Парето выигрышей в Г v (а также их явный вид при этом) получены в утверждениях 2.1 и 2.2 соответственно. Условие D 21 < 0 позволяет построить неполную контругрозу U в второго игрока в ответ на угрозу первого (лемма 3.2), а D 22 > 0 и лемма 3.3 дают возможность довести второму игроку неполную контругрозу U 2 с до полной U 2 с . Одновременно требование D 22 > 0 влечет отсутствие ситуации равновесия по Нэшу (не существует max 1 2( U 1 , U 2, t Q , x 0) при V U 1 e U 1 ) и возможность аналитически сконструировать второму U 2
игроку угрозу U 2 e U 2 на U P в игре Г :
I 2( U 1 , U 2 , t 0 , x 0 ) - I 2( U , t 0 , x 0 ).
Условие D 21 < 0 и лемма 3.4 обеспечивают существование неполной контругрозы U С e U 1 первого игрока на угрозу U 2 t второго:
I 2( U 1 , U 2 , t 0 , x 0 ) < I 2( U , t 0 , x 0 ).
Наконец, из максимальности по Парето U P и свойства 1.1 будет следовать
1 1( U 1 , U 2 , t 0 , x 0 ) < 1 1( U , t 0 , x 0 ), а из D n > 0 и леммы 3.1. получаем существование U С e U 1 , такого, что 1 1( U С , U 2 , t 0 , x 0 ) > 1 1( U 1 , U 2 , t 0 , x 0 ).
Таким образом, мы установили, что в игре Г в ответ на угрозу на максимальную по Парето ситуацию U P любого игрока, у оставшегося имеется полная контругроза, что доказывает теорему 4.1.
Заключение
Итак, в предлагаемой читателю статье установлено, что в линейно-квадратичной позиционной дифференциальной игре Г при выполнении ограничений (10) не существует ситуации равновесия по Нэшу и одновременно существует равновесие угроз и контругроз. Этот факт показывает настоятельную необходимость дополнительных исследований свойств этого равновесия, вопросов существования, нахождения других классов игр (и не дифференциальных тоже!), обладающих выявленным теоремой 4.1 свойством (отсутствием ситуации равновесия по Нэшу и одновременного существования равновесия угроз и контругроз). Интерес представляют и вопросы устойчивости коалиционных структур [23]. Этому вопросу авторы надеются посвятить дальнейшие исследования.
Список литературы Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз
- Оуэн, Г. Теория игр/Г. Оуэн. -М.: Изд-во ЛКИ/URSS, 2010. -216 с.
- Жуковский, В.И. Равновесные управления многокритериальных динамических задач/В.И. Жуковский, Н.Т. Тынянский. -М.: Изд-во МГУ, 1984. -224 с.
- Вайсборд, Э.М. О коалиционных дифференциальных играх/Э.М. Вайсборд//Дифференциальные уравнения. -1974. -Т. 10, № 4. -С. 613-623.
- Вайсборд, Э.М. Введение в дифференциальные игры нескольких лиц и их приложения/Э.М. Вайсборд, В.И. Жуковский. -М.: Советское радио, 1980. -304 с.
- Zhukovskii, V.I. The Vector-Valued Maximin/V.I. Zhukovskii, M.E. Salukvadze. -N.Y. etc.: Academic Press, 1994. -404 p.
- Вилкас, Э.И. Формализация проблемы выбора теоретико-игрового критерия оптимальности/Э.И. Вилкас//Математические методы в социальных науках: Сб. статей. Вильнюс: Ин-т математики и кибернетики АН Лит. ССР, 1972. -Вып. 2. -С. 9-55.
- Вилкас, Э.И. Решения: теория, информация, моделирование/Э.И. Вилкас, Е.З. Майминас. -М.: Радио и связь, 1981. -328 с.
- Смольяков, Э.Р. Теория конфликтных равновесий/Э.Р. Смольяков. -М.: УРСС, 2005. -301 с.
- Смольяков, Э.Р. Обобщенное оптимальное управление и динамические конфликтные задачи/Э.Р. Смольяков. -М.: МАКС Пресс, 1983. -232 с.
- Смольяков, Э.Р. Равновесные модели при несовпадающих интересах участников/Э.Р. Смольяков. -М.: Наука, 1986. -223 с.
- Zhukovskii, V.I. Some Problems of Non-Antagonistic Differential Games/V.I. Zhukovskii//Mathematical Method in Operation Research: сб. науч. тр. -Bulgaria, Sofia: Academy of Sciences, 1985. -P. 103-195.
- Biltchev, S.J. ε-Z-Equilibrium in a Differential Game Described by a Parabolic System/S.J. Biltchev//Many Players Differential Game. -Bulgaria, Rousse: Technical Univ., 1984. -P. 47-52.
- Tersian, St.A. On the Z-Equilibrium Points in a Differential Game/St.A. Tersian//Many Players Differential Game. -Bulgaria, Rousse: Technical Univ., 1984. -P. 106-111.
- Gaidov, S.D. Z-Equilibrium in Stochastic Differential Game/S.D. Gaidov//Many Players Differential Game. -Bulgaria, Rousse: Technical Univ., 1984. -P. 53-63.
- Rashkov, P.I. Sufficient Conditions for Z-Equilibrium in a Differential Game in Banach Spase/P.I. Rashkov//Many Players Differential Game. -Bulgaria, Rousse: Technical Univ., 1984. -P. 91-99.
- Dochev, D.T. Existence of Z-Equilibrium in a Differential Game with Delay/D.T. Dochev, N.V. Stojanov//Many Players Differential Game. -Bulgaria, Rousse: Technical Univ., 1984. -P. 64-72.
- Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие угроз и контругроз/В.И. Жуковский. -М.: КРАСАНД, 2010. -192 с.
- Красовский, Н.Н. Позиционные дифференциальные игры/Н.Н. Красовский, А.И. Субботин. -М.: Наука, 1984. -456 с.
- Гантмахер, Ф.Р. Теория матриц/Ф.Р. Гантмахер. -М.: Физматлит, 2004. -560 с.
- Жуковский, В.И. Дифференциальные уравнения. Линейно-квадратичные дифференциальные игры. Учебное пособие для ВУЗов/В.И. Жуковский, А.А. Чикрий. -М.: Юрайт, 2017. -322 с.
- Жуковский, В.И. Равновесие по Нэшу и по Бержу в одной линейно-квадратичной игре/В.И. Жуковский, А.С. Горбатов, К.Н. Кудрявцев//Математическая теория игр и ее приложения. -2017. -Т. 9. -Вып. 1. -С. 62-94.
- Воеводин, В.В. Матрицы и вычисления/В.В. Воеводин, Ю.А. Кузнецов. -М.: Наука, 1984. -320 с.
- Zhukovskiy, V.I.Coalition equilibrium in a three-person game/V.I. Zhukovskiy, K.N. Kudryavtsev//2017 Constructive Nonsmooth Analysis and Related Topics (dedicated to the memory of V.F. Demyanov) (CNSA). -St. Petersburg, 22-27 May 2017. -pp. 1-4.