Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности

Автор: Бардин Александр Евгеньевич, Солдатова Наталья Геннадьевна

Журнал: Вестник Южно-Уральского государственного университета. Серия: Математика. Механика. Физика @vestnik-susu-mmph

Рубрика: Математика

Статья в выпуске: 1 т.6, 2014 года.

Бесплатный доступ

Рассмотрен новый подход к принятию решений для двухуровневой статической иерархической системы в условиях действия неопределенных факторов. Формализация оптимального решения базируется на понятиях равновесия по Нэшу, ситуационного сожаления по Сэвиджу и векторной гарантии.

Иерархическая игра, равновесие по нэшу, принцип минимаксного сожаления сэвиджа, векторная гарантия, неопределенность

Короткий адрес: https://sciup.org/147158795

IDR: 147158795

Текст научной статьи Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности

Постановка задачи

Рассматривается модель конфликта в виде двухуровневой иерархической игры трех лиц при неопределенности

Г = ({С ,1,2},{U,Xt }i=1,2,YUXX,{f(u,x,У)}=c,1,2), где С – игрок верхнего уровня иерархии (Центр), числа 1, 2 – порядковые номера игроков нижнего уровня. Управляющее воздействие Центра есть u е U, стратегия i-го игрока нижнего уровня есть xi е Xi, i е {1,2}. Игроки нижнего уровня независимо друг от друга выбирают свои стратегии, в результате реализуется ситуация игры (на нижнем уровне) x = (x1, x2) е X = X1 X X2. В игре Г каждый из трех игроков стремится достичь больших значений своей функции выигрыша fj (и, x, у), j е {С,1,2}. При этом он должен учитывать возможность реализации любой неопределенности y е Y .

Далее наряду с «чистыми» неопределенностями у е Y будем использовать «информирован- ные неопределенности» вида у (•): U X X ^ Y

или (в частном случае)

У(•): X ^ Y , введенные академиком Н.Н. Красовским при исследовании антагонистической минимаксной по-

зиционной дифференциальной игры [1, с. 353–354].

Перейдем к иерархической «процедуре» принятия решений в игре Г, которая заключается в определенном порядке ходов.

Рис. 1

Первый ход за обоими игроками нижнего уровня и Центром: они передают лицу, принимающему решения (ЛПР) и формирующему неопределенности, свои стратегии xi е Xi ( i = 1,2), и е U (рис. 1).

Второй ход за ЛПР, анали- тически конструирующем «ин-

Математика

формированную» неопределенность, именно он определяет функцию у(•): U X X ^ Y согласно min f„ (u, x, у) = f (u, x, у (u, x)) = f [u, x] Vu e U, х e Х                      (1)

у eY c              c и передает эту функцию у(u,x) Центру (рис. 2). Здесь используем подход из работ [2-4]. Далее будем предполагать, что указанная выше функция у(u, x): U X X ^ Y существует и единственна.

Центр

1 игрок

у ( u,x )

2 игрок

Неопределенность

Рис. 2

Отметим, что согласно (1) для любой неопределенности у e Y имеет место неравенство fc ( u , x , у ) fc [ u , x ]                                             (2)

при всех ( u , x ): U X X .

Третий ход за Центром: он формирует стратегию u (•): X ^ U, u (•) e UХ , такую, что max fc (u, x, у(u,x)) = max fc[u,x] = fc[u(x),x] = fc [x] Vх e Х                  (3)

ueU                    ueU и передает эту стратегию u(•) обоим игрокам нижнего уровня иерархии (рис. 3). Здесь также предполагаем существование и единственность функции у(х): X ^ Y.

Рис. 3

Четвертый ход за игроками нижнего уровня иерархии:

во-первых, i-ый игрок (i = 1,2) строит свою вспомогательную функцию j\[x] = minf(u(x),x,у) (i = 1,2);                                (4)

уeY во-вторых, по определенной в (4) функции fi [x] каждый игрок нижнего уровня находит так называемую функцию «сожаления» по Сэвиджу [5]

Ф] [ x ] = max f [ z , x 2 ] - f [ x , x 2 ], z e X 1

Ф2 [ x ] = max f [ x , z ] - f [ x , x 2 ], z e X 2

значения которых каждому из игроков i = 1,2 желательно получить возможно меньшими;

в-третьих , для вспомогательной бескоалиционной «игры гарантий» (без неопределенности)

Бардин А.Е.,                       Сильно гарантированное равновесие в одной иерархической

Солдатова Н.Г.                                   двухуровневой игре при неопределенности

Г G = <{1,2},{ Xi }fe { 1 ,2 ) ,{ ф ( X ) = Дx ] i [ x ]> / е{ 1 ,2 })

игроки нижнего уровня находят ситуацию равновесия по Нэшу [6], которая определяется равенствами max ф (х1, x 2) = ф1 (хе, x2), X1G X1

max ф 2 ( х е , x 2 ) = Ф 2 ( х е , x е ). х 2 е X 2

При этом снова будем предполагать, что ситуация равновесия по Нэшу в игре Г G единственна.

Отметим, что равновесная стратегия х ^ е Х 1 из (6) является максимальной по Парето в двухкритериальной задаче

XX „{ f [ x , , x 2 ], 1 [ x 1 , x | ] }> , (7) тогда увеличение исхода fx[_x 1 , x 2 ] влечет увеличение «сожаления» Ф 1 [ x 1 , x 2 ], а уменьшение «сожаления» Ф 1 [ x 1 , x2 ] приводит к уменьшению исхода fx[_x 1 , x 2 ]. При этом значение функции

Ф 1 [ x 1 , x 2 ] в ситуации равновесия ( х 2 , x 2 ) равно нулю, что является оптимальным (наименьшим) значением этой функции на множестве X = X 1 х X 2.

Аналогичное свойство выполняется для стратегии х 22 е Х 2 из равновесной ситуации ( x f , x 2 ) в двухкритериальной задаче

XX 2 , { fx2 , x 2 ], 2 [ xee , x 2 ] }) .                                   (8)

Раскроем «гарантированный смысл» указанного в (6) равновесия х е = ( x f , x 2 ) в исходной игре Г, именно:

с одной стороны, при известной игрокам i е {1,2} функции u (x1, x2) и любой неопределенности у е Y выполняется неравенство ft (u (x2), x2, у) > ft [ x2 ];(9)

с другой, для «замороженной» Центром u (x) и определенной равенством (1) функции у(u,x) будет f,(u (x1, x2), x1, x 2, у (u (x1, x2), x1, x 2)) < f1[ x2 ],(10)

f2( u (xe, x2), xe, x 2, у (u (xe, x2), xe, x 2)) < f2[ x2 ],(11)

для всех х 1 е Х 1 и х 2 е Х 2 .

Еще раз отметим, что minФг[x] = Фг[x2] = 0, iе{1,2},(12)

хе Х а нулевые и достигаемые в ситуации равновесия х2 значения функций сожаления являются наилучшими для каждого игрока i = 1,2.

в-ч2тв2ртых, игроки нижнего уровня «отправляют» Центру найденную равновесную (единственную) ситуацию х2 е Х (рис. 4).

Рис. 4

Последний пятый ход состоит в нахождении Центром своей гарантии f c [ x2 ] = f c ( u ( x2 ), x2 , у ( u ( x2 ), x2 )),

Математика

для нее выполнено неравенство j (и (xe), xe, у) > j [ Xе ] при любой неопределенности у е Y.

Определение 1. Сильно гарантированным равновесием в иерархической игре при неопределенности Г (с одним игроком верхнего уровня и двумя игроками нижнего уровня) называется набор

( Xе , и ( ), jg , jg , fg ),                                       (14)

где xe = (xf, x2) - ситуация равновесия по Нэшу в игре гарантий ГG , и (■): X ^ U есть функция, передаваемая Центром игрокам нижнего уровня, величины jgg = JC [ и (xe ), xe ], j,g = f1[ xе ], fg = f2[ xе ].

При этом предполагается, во-первых, игроки верхнего и нижнего уровней, а также ЛПР, «отвечающий» за построение «информированной» неопределенности у(■), придерживаются процедуры принятия решений, описанной выше (см. ходы 1-5);

во-вторых , обе функции у ( ) из равенства (1) и у ( ), определенная условием (3), а также равновесие по Нэшу в игре Г G единственны.

Очевидно следующее утверждение.

Лемма 1. Ситуация xe = ( x^ , x 2 ) будет равновесной в игре Г G тогда и только тогда, когда xe есть равновесие по Нэшу в игре

Г = ({1,2},{X („{1,},{f[x]}„(1.2|),(15)

где функции выигрыша игроков заданы равенствами (4).

Линейно-квадратичная игра без ограничений (скалярный случай)

Пусть в игре Г множества U = X1 = X2 = Y = R. Скалярные функции выигрыша игроков оп- ределены ниже: 2                         22

f Y — Л 112 4-    /7(,) У2 4- Л у2 4-3 Л^^11Х 4- 3/7 14- 3    /7(,) У jg ( и, x, у) — ^11U + у a 22 x, + азз У + 2 Т. a12 ux, + 2 a13 иу + 2 у a 23 x, у, г=1                             ,=1

j■( и, x, у) = b^1 и 2 + b22) x12 + bgg x 2 + b^g у 2 + 2 b1(2) ux1 + 2 b1(3) ux 2 + 2 b1(4) иу +

+ 2 b 23) x 1 x 2 + 2 b 24) x 1 у + 2 b 34) x 2 у + 2 b^ x 1 + 2 b 20 x 2,    i e ( 1,2 } .

Из условий dfc

+ 2] Т a 2? x, = 0, i = 1

—- = 2 a 33 у + 2 a 13 и d у

_ a 33 0

получаем, что min j (и, x, у) = j (и, x, у (и, x)) уeY c достигается при

у ( и , x ) = - a - 3

f)

a 13 и + Т a 23 x ,

V         ,=1

Окончательно имеем fg [ и, x ] = jg (и, x, у (и, x)) = a 33

2\ц2+ Vl/7 r,^r,^2 I y2-k ( a 33 a 11    a 13 ) и + y l a 33 a 22    ( a 23 ) I x , +

,=1 V)

({)-Л    ( , )^У            rt^nj-j

+ 2T ( a33 a12   a13 a23 ) x,U 4T a23 a23 xi xj i=1

Из условий

Бардин А.Е., Солдатова Н.Г.

ɶ

c = 2 a 33 ( a 11 a 33 d и          v

2 a 13 ) u + 2 ( an a 33 i = 1

a 13 a 2 *3 ) xi

= 0,

. a11a33 a13 < 0 получаем функцию и (•): X ^ U, именно и (х) = ( a23

a11 a33

)"   2 ( «& 1 a 33

V i = 1

^ a 13 a 2 3 ) xi

,

которую далее пишем в виде u (х) = с1 x1 + с 2 x 2 .

С учетом последнего равенства получаем функции fV x, y ] = ft (и (x), x, y) = ( cl bn) + b22 + 2 b(2) c) x2 +(c 2 bn) + b33) + 2 bn) c 2) x 2 + 2 (с c 2 bn) + c2 bi(2) + +c1 b1(3) + b2 3) х1 х2 + b44 y 2 + 2 (b^) c1 + b24 ) x1 у + 2 (b(4) c2 + b34)) x2 у + 2 b^) x1 + 2 b20) x2, которые ниже пишем в виде f (x, y) = d11)x2 + d22x2 + 2d(2)х1 х2 + d3(3)y2 + 2d^)x1 у + 2d23)x2у + 2d 10)x1 + 2d20)x2 .(20)

Из условий dfi [x,y ] = 2 d) y + 2 d1i) x + 2 d 3 i’ x2 = 0,

]   dу d33 > 0,    i e{1,2} имеем явный вид функций гарантированных исходов для игроков нижнего уровня f [ х] = min f [ x, y] = f [ x, y^ (x)], yeY где yi(x) = h i)x1 + h2i)x2, hi) =-(d3(3)) d 1(3), h2i) =-(d33) d23), ie {1,2} .

Таким образом f [ x ] = f d((ii) + d3 i) [h; i) )2 + 2 d1i) h; i)) x2 + f d (i1 + d3(i) (h^ i) 12 + 2 d 33’ h^ i)) x 2 + 2 (d3(i) h 1 i) h 3 i) + d 1i) + d1i) h (i) + i L J 11       33 \ 1 /         13 1 11         22      33 \ 2 1          23 2 12 у 33 1 2        12      13 2

+ d 23) h 1 ( i ) ) х 1 х 2 + 2 d 10 ) x 1 + 2 d 20 x 2,     i e { 1,2 } .

Введя новые обозначения, получаем f-[ x ] = Л71(1) x2 + k2 2 x 2 + 2 k1"2) х1 х 2 + 2 k1"0) x1 + 2 k 30) x 2.                        (23)

Используя достаточные условия существования равновесия по Нэшу в игре г=({1,2j,{ X, }i.{1.2),{Л[ x ]}i«{1.2}), решаем систему

ɶ dfL = 2 кЦ) x1 + 2 k§ x 2 + 2 k^ = 0, d^1

< -d f 2 = 2 к 22) x 2 + 2 k^x 1 + 2 к 20) = 0,                             (24)

d x 2

k ff <  0,     к 22) <  0.

Равновесная ситуация xe в игре Г представима в виде xe xf - 1 А 1,    x 2 - 1 А 2

= ( xe , xe ), где и

A       (1)z.(2)_,(1),(2)

^ 2 = k 11 k 20 k 10 k 12 .

(1) (2)      (1) (2)                      (1) (2)      (1) (2)

А = k 11 k 22 k 12 k 12 ^ 0, А 1 = k 10 k 22 k 12 k 20 ,

Математика

Как было отмечено выше, равновесная ситуация xe в игре Г совпадает с равновесной ситуацией в игре Г g . Суммируя полученные результаты, получаем следующее утверждение.

Теорема. Пусть в игре Г заданы множества

U = X 1 = X 2 = Y = R .

Скалярные функции выигрыша игроков определены равенствами (16) и выполнены неравенства a 33 0, a 11 a 33 - a 2 3 0 , d 3 (3) 0, k i 0, i e { 1,2 } , а также

A = kW k22) - kWk^ * 0, где величины d33), k^, ie {1,2} определены условиями (19)-(24).

Тогда в игре Г существует равновесно-сильно-гарантированное решение, явный вид которого представлен в (25).

Указанная в теореме система условий будет совместной, если, например, a 11 = a 33 = a ( 2) = 1, a i3 = V2, a 23) = 0, & i(i) = b 444) = 1, b 22) = b 3 3) = - 1, ь^ ) = b i ( 3 ) =— 2, ъ^ ) = b 24) = b 34) = 2, b 2 3 ) = 2.

Заключение

В работе рассмотрен один из подходов к проблеме формализации риска в игровых моделях иерархических структур, который основан на принципе минимаксного сожаления по Сэвиджу. Для иерархической игры в условиях действия неконтролируемых факторов (неопределенностей) можно предложить другие способы моделирования риска игроков верхнего и нижнего уровней, используя модификации различных принципов принятия оптимальных решений из теории задач при неопределенности [2–4].

Список литературы Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности

  • Красовский, Н.Н. Позиционные дифференциальные игры/Н.Н. Красовский, А.И. Субботин. -М.: Наука, 1974. -456 с.
  • Жуковский, В.И. Риски при конфликтных ситуациях/В.И. Жуковский. -М.: URSS, ЛЕНАНД, 2011. -328 с.
  • Жуковский, В.И. Уравновешивание конфликтов и приложения/В.И. Жуковский, К.Н. Кудрявцев. -М.: URSS, ЛЕНАНД, 2012. -304 c.
  • Жуковский, В.И. Уравновешивание конфликтов при неопределенности. II. Аналог максимина/В.И. Жуковский, К.Н. Кудрявцев//Математическая теория игр и ее приложения. -2013. -Т. 5, № 2. -С. 3-45.
  • Savage, L.Y. The theory of statistical decision/L.Y. Savage//J. American Statistic Association. -1951. -№ 46. -Р. 55-67.
  • Nash, J.F. Non-cooperative games/J.F. Nash//Ann. Math. -1951. -Vol. 54. -P. 289-295.
Статья научная