Об одной модификации равновесия по Нэшу

Автор: Жуковский Владислав Иосифович, Жуковская Лидия Владиславовна, Кудрявцев Константин Николаевич, Романова Виолетта Эдуардовна

Журнал: Вестник Южно-Уральского государственного университета. Серия: Математика. Механика. Физика @vestnik-susu-mmph

Рубрика: Математика

Статья в выпуске: 2 т.14, 2022 года.

Бесплатный доступ

К концу прошлого века в математической теории дифференциальных позиционных игр (ДПИ) утвердились четыре направления: бескоалиционный вариант ДПИ, кооперативный, иерархический и, наконец, наименее изученный коалиционный вариант ДПИ. В свою очередь, внутри коалиционного обычно выделяются игры с трансферабельными выигрышами (с побочными платежами, когда игроки в течение игры могут делиться своими выигрышами) и нетрансферабельными выигрышами (игры с побочными платежами, когда такие перераспределения отсутствуют по тем или иным причинам). Исследования коалиционных игр с побочными платежами сосредоточены и активно ведутся на факультетах прикладной математики и процессов управления Санкт-Петербургского госуниверситета и института математики и информационных технологий Петрозаводского госуниверситета (профессора Л.А. Петросян, В.В. Мазалов, Е.М. Парилина, А.Н. Реттиева и их многочисленные ученики). Однако побочные платежи не всегда присутствуют даже в экономических взаимодействиях, более того, побочные платежи могут быть вообще запрещены законодательно. Предпринятые нами в последние годы исследования равновесия угроз и контругроз (санкций и контрсанкций) в бескоалиционных дифференциальных играх позволяют, на наш взгляд, охватить и некоторые аспекты нетрансферабельного варианта коалиционных игр. Как раз вопросам внутренней и внешней устойчивости коалиций в классе ДПИ и посвящена настоящая статья. В ней выявлены коэффициентные ограничения в математической модели дифференциальной позиционной линейно-квадратичной игре шести лиц с двухкоалиционной структурой, при которых эта коалиционная структура внутренне и внешне устойчива.

Еще

Равновесие по нэшу, равновесие угроз и контругроз, оптимальность по парето, коалиция

Короткий адрес: https://sciup.org/147237459

IDR: 147237459

Текст научной статьи Об одной модификации равновесия по Нэшу

Как уже было упомянуто в аннотации, к концу прошлого века в теории позиционных дифференциальных игр (ПДИ) сформировались четыре направления исследований: бескоалиционный, кооперативный, иерархический и коалиционный варианты игры. Последний в свою очередь подразделяется на игры с побочными и без побочных платежей (трансферабельными и нетрансфера-бельными выигрышами). Изучение первого из них в России возглавляется известной санкт-петербургской научной школой по математической теории игр [1-4]; теория коалиционных ПДИ без побочных платежей только начинает своё становление на базе равновесия угроз и контругроз и группируется вокруг кафедры оптимального управления факультета вычислительной математики и кибернетики МГУ [5–8]. В настоящей статье эти исследования продолжаются для ДПИ шести лиц с двухкоалиционной структурой { К 1 = {1,2,3}, К 2 = {4,5,6} } .

Одновременно мы также предлагаем аналогичный поход к построению оптимальных (в формализованном далее смысле!) решений в коалиционных ДПИ, базирующийся на идеях принципа равновесности по Нэшу и метода динамического программирования Беллмана.

Напомним, что в 1949 году двадцатиоднолетний аспирант Принстонского университета Джон Форбс Нэш (мл) предложил в докторской диссертации понятие решения бескоалиционной игры, в последующем названного равновесием по Нэшу (РН). Оно, во-первых, сыграло неоценимую роль в становлении математической экономики, социологии, системного анализа, военных науках; во-вторых, ровно через 45 лет (1994 г.) Джону Нэшу (совместно с Харшаньи и Зельто-ном) присуждена Нобелевская премия «за фундаментальный анализ равновесия в теории некооперативных игр»; в-третьих, открывая сейчас почти любой современный журнал по теории игр, исследованию операций, системному анализу и по математической экономике, почти наверняка мы встретимся с работами, затрагивающими те или иные вопросы, связанные с равновесием по Нэшу (РН). Однако «there are spots on the sun». Сюда относятся внутренняя и внешняя неустойчивость множества РН, неустойчивость к отклонению от него двух и более игроков (РН устойчиво к отклонению только одного), РН может не существовать, «улучшаемость», отсутствие эквивалентности и взаимозаменяемости и т.д. В этих случаях авторы видят [9] два выхода. Во-первых, ограничиться лишь математическими моделями, свободными от некоторых из перечисленных (и не перечисленных!) негативных свойств. Во-вторых, вводить новые понятия равновесия, отличные от РН. Здесь, по нашему мнению, перспективными являются равновесие угроз и контругроз [5, 6] и равновесие по Бержу [7, 8]. Ещё раз подчеркнём, что в настоящей статье мы не стремимся подвергнуть РН критике, но используем идею Джона Нэша уже для формализации паретовского решения коалиционных ДПИ.

Рассмотрим бескоалиционную игру в нормальной форме, заданную упорядоченной тройкой: Г = / ХД. м,( f ( x Л ’( U f^  ii^ 'Н^/

Здесь N = {1,..., N} - множество порядковых номеров игроков, множество Xt е IR^’ стратегий xt игроков. Выбор xt е Xi происходит одновременно всеми игроками, в результате образуется ситуация x = (x1,...,xN) е X = ПXi. Сами интересы (цели) игроков определяются значениями (вы-teN игрышами) заданных функций выигрыша f (x) (i е N) . При этом каждый из игроков стремится возможно увеличить свой выигрыш.

Определение 1.1 Пара (xe, f e = f (xe )) e X x RN называется равновесием по Нэшу игры Г, если имеет место N равенств maxf(xe || x.) = ff.(xe) (i e N),                                    (1)

xt е Xf где использованы общепринятые в теории игр обозначения (xe || xt) = (x^,...,xei—t,x.,xze+1,...,xN).

Из (1) сразу следуют три важнейших свойства РН: во-первых, РН устойчиво к отклонению отдельного игрока, во-вторых , РН присуще свойство индивидуальной рациональности , т.е.

f ( x e ) max min ft ( x f , x t) ( i e N ), x t е X x t eX f

(здесь уже   t eN \ { t } = { 1,..., t 1, t + 1,..., N } ),   в-третьих,  xe совпадает с седловой точкой

( x ^ , x ^ ) e X 1 x X 2 в случае антагонистического варианта Г , (где уже N = { 1,2 } и f 1 ( x ) = — f 2( x ) = f ( x )), именно max f ( x 1 , x 2 ) = f 1 ( x 1 e , x ^ ) = min f ( x ^ , x 2) . Кроме того, определе- x 1 e X 1                              x 2 e X 2

ние 1.1 сразу отвечает на два вопроса: как каждому игроку t eN поступать в игре Г (ответ: следовать x ^ е Xt ) и какого выигрыша он добивается (ответ: f t ( xe )).

Теперь игре Г поставим в соответствие N-критериальную задачу Г и = ( X , { f t ( x ) } / ^ ).

Здесь уже множество X альтернатив x совпадает с множеством ситуаций игры Г, а критерий f t ( x ) - со скалярной функцией выигрыша f t ( x ) игрока t е N .

В 1909 г. итальянский социолог, экономист (а также богатый наследник) Вильфредо Парето предложил в качестве оптимального решения задачи Г и использовать максимальную (впоследствии названную «по Парето») альтернативу xp е X .

Определение 1.2 [9-11]. Альтернатива xp е X называется максимальной по Парето в задаче Г^,  если при любой альтернативе x е X несовместна система N неравенств ft- (x) > f.(xp ) □ □ (t e N),   из которых хотя бы одно строгое; при этом пару

Жуковский В.И., Жуковская Л.В.,                     Об одной модификации равновесия по Нэшу

Кудрявцев К.Н., Романова В.Э.

( xp , fp = f ( xp ) i g N) g X x R N называют максимумом по Парето в задаче Г ; напомним, что f = ( f„..., f N ) g R N .

Из определения 1.2 сразу следует, что при отходе от альтернативы xp нельзя одновременно увеличить компоненты всех критериев f • ( xp ) (i g N), а также увеличение хотя бы одной компоненты f ( xp ) вектора f ( xp ) неизбежно влечёт уменьшение хотя бы одной из оставшихся. Очевидна, наконец, лемма Карлина [12]:

Свойство 1.1. Если при каких-либо постоянных a 0 (i g N) справедливо равенство max £ a i f ( x ) = £ a i f ( x p X                           (2)

XGX iG^          ZGN то альтернатива xp - максимальна по Парето в задаче Ги .

Далее операцию (построения максимума по Парето), диктуемую (2), будем обозначать MAXPf ( x ) = f ( xp ) = fp , т. е.

MAX p f ( x ) = max a f ( x ) = a f ( xp )

для какого-либо постоянного N -вектора a = ( a 1 ,..., a N ) , a i >  0 (i g N) ; напоминаем, что штрих сверху означает операцию транспонирования ( a ' - N -вектор-строка).

  • 2.    Основные понятия теории коалиционных игр

Перейдем к возможному коалиционному варианту игры Г . Здесь прежде всего предполагаем, что на множестве N задана коалиционная структура , т. е. разбиение N на попарно непересе-кающиеся подмножества (коалиции). Для Г мы ограничивались двумя коалициями К , = { 1,2,3 } и К 2 = { 4,5,6 } ; коалиционная структура удовлетворяет условиям:

N = К , и К 2 и К , п К 2 = 0 .

При этом отдельные коалиции К (l = 1,2) имеют возможность на «коалиционных совещаниях» сообща выбирать свою стратегию xK = {xi | i g Kl } g Хк = П Xi (всё множество таких iG К, стратегий xK/ обозначим XК ). Тогда любая ситуация x g X в игре Г представима x = (xK, xK^), векторную функцию выигрыша коалиции К, обозначаем fK (xK, xK^) = (f m (xK, xK^ )| m g Kl) (l = 1,2), поэтому N вектор-функции выигрыша игроков (векторный критерий задачи Г) будет

  • f ( x ) = f ( x K 1 , x K 2 ) = ( f К ( x K , , x K 2 ), f К 2 ( x K , , x K 2 )) .

В результате переходим от исходного бескоалиционного варианта игры Г к игре коалиционной

G = (n = { К     К 2 }{ К , } , = 1 . . { ХК] ) ( = 12 . {. f K , ( X k , . X k , ) } , = L 2 )

Как уже упоминалось, игроки отдельной коалиции на своём «коалиционном совещании» совместно выбирают стратегию коалиции, выполняя два требования: индивидуальной и коллективной рациональности.

Обратимся к требованию индивидуальной рациональности, т. е. чтобы достигаемый в игре G выигрыш i-го игрока в выбранной ситуации xP был бы не меньше его максиминного, именно, fi(xP) > max min f(xi.x—i) = min ^(xg.x—i) = fg <^(xig.x—i) Vx-i GX_i, i gN, xiG Xix- iG X- i                x- iG X- i где, напомним, —i = N\i = {1,...,i-1,i +1,...,N}, x-i = (x,,...,xi-1,xi+1,...,xN) g X_i g П Xj .

j eN\ { i }

Заметим, что для рассматриваемых в настоящей статье играх такие максимины не существуют [6] и поэтому условия индивидуальной рациональности мы не учитываем.

Перейдем к требованию коллективной рациональности. Для членов коалиций Ki оно сводится к максимальности по Парето (по отношению к остальным партнёрам по коалиции Кд), именно,

МАХ   / К ( x k , x K ) = f к ( xp , x K ) ( l = 1,2).

xKl G X Ki   l   12     l    12

Таким образом, приходим к следующему понятию.

Определение 2.1. Набор стратегий xp = (хК, xp^) е X = XК х XК рето-оптимальным (КПО) для игры G, если назовём коалиционно Па-

МАХ f TV ( Xl" , Xl" ) = f TV ( Xl" , Xl" ),

K XX К^ К 2     JK 1 K 1 , K 2 7

  • X K 1 e X К 1

<

МАХ fK ( Xp , xK ) = fK ( Xp , Xp ).

J К 2 K 1 , К 2       К 2 K 1 , К 2

  • ь X K 2 e X К 2

Нетрудно видеть, что (4) является модификацией (1) для случая одноэлементных коалиций в

Г (операция max из (1) заменена на максимизацию по Парето МАХ p из (3)), а сами равенства

X i е X i

X K, ' X К,

  • (4)    поэтому являются модификацией РН (чем и вызвано название настоящей статьи). Естественно тогда, что перечисленные выше «пятна на солнце», характерные для РН, присущи и КПО.

  • 3.    Внутренняя и внешняя устойчивость коалиции

Вспоминая о бурном потоке публикаций (во второй половине прошлого века) по РН, вызванных докторской диссертацией Джона Нэша и последующим звездопадом Нобелевских премий по экономике (но базирующихся на проблемах математической теории игр), по нашему мнению, определение 2.1 не менее перспективно для изучения, чем определение 1.1. Однако далее мы сконцентрируемся на вопросах внутренней и внешней устойчивости коалиций в ПДИ.

Здесь считается, что в коалиционной игре Г найдена определённая в (4) коалиционно Парето-оптимальная (КПО) ситуация ( xp^ , x^ ) = xp и именно эта ситуация выбрана игроками для практического использования. Обоснованием такого выбора, например, для коалиции К 1 является, во первых, максимальность по Парето x ^ в задаче G 1 = ^ X К , / К ( x ^ , xp^ ^ из (4) (ведь игроки из К стремятся к возможно большим выигрышам для каждого, а в многокритериальной задаче G 1 именно x p доставляет максимум по Парето для /К ( xk , xK2 )).

Во-вторых, требование внутренней устойчивости К 1 : будем считать, что коалиция К 1 внутренне устойчива, если ни у одного из её игроков не возникает желание покинуть К 1 : либо перейти в коалицию К 2, либо образовать новую третью коалицию, состоящую лишь из одного «перебежчика». «Обнуление» такого «предательства» достигается, если хотя бы для одного из оставшихся в К 1 игрока появляется возможность «наказать перебежчика». Формально определим процесс наказания следующим образом.

Будем считать, что игрок 1 обладает угрозой на внутреннюю устойчивость К1, если у него имеется стратегия xT е X1 такая, что f (xT,xp,xp,xp) > /1 (xK ,Xp ).

В ответ на такую угрозу (см. (5)) у одного из оставшихся в К 1 , например, у игрока 2 имеется контругроза , если у него существует стратегия x C е X 2, для которой сразу выполнены два строгих неравенства:

/1( xT, xC, xp, xp) < /1( xp, xp),

/2(XT,xC,xp,xp) > max/_(x1,xp).

X 1 G X j

Жуковский В.И., Жуковская Л.В., Об одной модификации равновесия по Нэшу Кудрявцев К.Н., Романова В.Э.

Первое из них (именно (6)) «обнуляет» действие угрозы - сводит выигрыш «угрожающего» к меньшему, чем был первоначально f 1 (xP ) = f 1 ( x^ , x P ). Второе неравенство (см. (7)) даже «подталкивает» второго на использование xC , ибо в результате игрок 2 достигает самого большего выигрыша, о котором он может только мечтать. Аналогично определяется контругроза игрока 3 в ответ на угрозу первого на внутреннюю устойчивую К , а также реакция двух оставшихся игроков на желание одного из коалиции К покинуть эту коалицию.

Определение 3.1. Коалицию К называем внутренне устойчивой , если в ответ на возможность любого члена коалиции К покинуть К , у хотя бы одного из оставшихся имеется контругроза (вида (6) и (7)).

Заметим, отсутствие угроз приводит, естественно, к ненужности и контругроз.

Перейдём к внешней устойчивости коалиции (например, К 1 в игре Г) . Будем считать, что нежелание какого-либо игрока из К 2 выйти из коалиции К2 и присоединиться в К характеризует внешнюю устойчивость К . Очевидно также, что внутренняя устойчивость К 2 «обеспечивает» внешнюю устойчивость К и обратно.

Таким образом, внутренняя устойчивость каждой коалиции в коалиционной структуре гарантирует внутреннюю и внешнюю устойчивость, что в свою очередь приводит к устойчивости самой коалиционной структуры, т.е. к нежеланию нарушать сложившееся разбиение игроков на попарно непересекающиеся подмножества.

Наконец, заметим, что неравенств вида (6) и (7) для рассматриваемой далее в разделе 4 ПДИ мы добиваемся специальными коэффициентными ограничениями на функции выигрыша игроков из К .

Дальнейший материал статьи посвящён построению явного вида выделенных (определением 2.1) КПО для достаточно общего класса ПДИ.

  • 4.    Дифференциальная линейно-квадратичная игра шести лиц

Как принято в теории игр, такая математическая модель может задаваться упорядоченной пятёркой.

Г D =( N, { К = { 1,2,3 } , К 2 = { 4,5,6 } } , Z x , { AJ ; ^,{ I((U , t 0 , ^)} , gn \ (8) где N = {1,2,3,4,5,6} - множество порядковых номеров игроков, задана коалиционная структура (напоминаем, за счёт разбиения N на попарно непересекающиеся подмножества: N = К 1 и К 2 а К 1 п К 2 = 0 ); управляемая динамическая система Z x линейна (по x и ut ( г g N) ):

x = A(t)x + Zui, □ x(t0) = x0 □ zgN причём момент окончания игры S > 0 «заморожен» априори; тогда время продолжительности игры t g [t0,S], здесь 0< t0 < t < S; A(t) - непрерывная на [0,S] nxn-матрица (обозначим этот факт A(-) g Cnxn[0,S]); x g Rn- фазовый n-вектор; пары (t,x) g [10, S] x Rn - позиция игры, начальная позиция (t0, x0); управляющее воздействие i-го игрока ui g Rn (i g N), так как u = (u1,...,uN) g RNn , то управляющие воздействия коалиций uК1 = (u1,u2,u3) и нК = (u4,u5,u6) , поэтому u = (uК1, u^ ) ; множество стратегий игрока i g N, кроме того, согласно [13],

Ai = {Ui 4-ui(t,x) = Qi(t)x| VQ(•) g Cnxn[0,S]}, ситуация U = (U1,..., U6) g A = П Ai, A К = П Aj (l = 1,2); динамика игры (8) проявляется в zeN jG Кj том, что каждый игрок, исходя из собственных интересов (см. ниже (9)), выбирает свою стратегию Ui ^ui(t,x) = Qi(t)x (т. е. использует «свою» матрицу Qi(•) g Cnxn[t0,S]); затем игроки совместно определяют решение x(t), t g[10,S], системы линейных однородных дифференциальных уравнений с непрерывными по t коэффициентами

x ( t ) = [ A(t ) + S Q i (t )] x □ □ x(t 0 ) = x0.

Потом формируют реализации выбранных ими стратегий u i [t ] = u i (t , x(t )) = Q(t ) x(t) (i e N) ; заметим, что тогда n -вектора u i [ t ] непрерывны на [ 1 0, 9 ]. На непрерывных парах ( x(t ), u[t ]) = (u 1 [t ],..., u 6[ t ]) априори задана функция выигрыша i -го игрока в виде квадратичного функционала

-   9 _

I i (U , 1 0, x 0) = x '( 9 ) C i x( 9 ) + J S u j [t ] D ij u j [ t ] dt ( i e N), 1 0 1 j eN                у

причем штрих сверху означает операцию транспонирования; не ограничивая общности, считаем априори заданные постоянные n х n -матрицы C i , D ij симметричными. Заметим, что первые слагаемые в (9) называют терминальными , вторые - интегральными , а значение (9) - выигрышем игрока i в игре ГD . На содержательном уровне игроки, каждый на своем «коалиционном совещании», выбирают коллегиально свои стратегии; чтобы компоненты их трехкоординатных выигрышей I к = ( I r | r e R l ) ( l = 1,2) были возможно больше (и удовлетворяли условию индивидуальной рациональности). При выборе оптимального решения базируемся на определении 2.1, т. е. на коалиционной Парето-максимальной ситуации.

Предварительно упростим управляемую систему из ГD с помощью замены y = X - 1 ( t ) x , где dx

X(t) — фундаментальная n х n -матрица решений системы — = A(t)x, X(9) = E (E - единич-dt                      n n ная n х n -матрица). В результате система Sx переходит в Sy :

dy = Sui ’  У(t0) = X 1(t0)x0, dt множество стратегий i-го игрока Af в

A i = { U i + u i (t , y ) = Q i (t ) y | V Q ( . ) e C nxn [0, 9 ]}, функция выигрыша i -го игрока I i (U , 1 0, y 0) в

sf

Ti(Ui,10,y0) = y'(9)Cy(9) + J S uj[t]Dijuj[t] dt, 10 IjeN              У где постоянные n х n -матрицы Ci, Dij симметричны.

В результате исходная игра (8) приводится к виду

Г d = ( Я{ R 1 , К 2 } , S y , { A i } ; e, , { Ii (U , 1 0 , J o) } i eN) .

Возможная экономическая интерпретация (11). Предположим, что существует промышленный кластер, состоящий из шести предприятий, входящих, помимо того, в два объединения (или группы). Как правило, цель предприятия (или организации) - одновременное уменьшение расходов (затрат на выпуск продукции) (при C i 0), а также увеличение внутренних инвестиций (при D ii >  0) в собственное производство. Дополнительным условием являются противоположные интересы остальных участников кластера (если Dij 0 (i * j )).

В связи с этим далее предполагается, что

C i < 0, D ii 0, D ij <  0    (i , j e N; j * i ) .

Перейдём к использованию определения 2.1, но уже для дифференциальной игры (11).

Именно, введём для каждой коалиции R1 и  К2 множество её стратегий URj e Ar = П Ar re Ri

( l = 1,2), кроме того, используем трёхмерный функционал её выигрышей, который с учётом

U = ( U R , U К^ ) представим в виде К ( (Z j | j e R l ) ( l = 1,2). Тогда

^^(U , 1 о , y 0 ) = (T 1( U К 1 , U К 2 , 1 0 , y 0 ),^ 2 ( U К 1 , U К 2 , 1 0 , y 0 ),^ 3 ( U К1 ,U К 2 , 1 0 , y o )) и

2 ( U , 1 0 , y o ) = (^ 4 ( U К , U К 2 , 1 0 , y o ), ^5 ( U К 1 , U К 2 , 1 0 , y 0 ), ^6 ( U К 1 , U К 2 , 1 0 , y O )) .

Определение 4.1. Пару (U P ,Z P ) = ( u К , U К ; 1К(U P , 1 0 , y 0 ),Z ^ ( U P , 1 0 , y 0 ) ) е A xR6 назовём коалиционно Парето-оптимальным решением (КПО) игры Гd , если при любых начальных позициях (1 0, y 0) e [0, S ) n , У 0 * 0 n ,

_MAX   К К Х ( U К , U K2 , 1 0 , y 0 ) = 4 (U P , 1 0 , y 0 ),

UК1 еА К    1121

<

MAX   К KU ( U Кх , U К2 , 1 0 , y 0 ) = КК1(U P , 1 0 , y 0 ),

UК2 еАК2   2122

где, например, MAX P Кк (UК , UК , 10, y0) означает максимальность по Парето на множестве UК1 еА К     1     12

А К трёхмерного функционала Кк ^ ( UК , UP2 , 1 0, y 0). В этой статье максимум (по Парето) будем реализовывать, следуя свойству 1.1 (с нахождением скалярного максимума линейной свёртки трёх компонент ККх (UК , U К , 1 0, y 0) с положительными коэффициентами).

  • 5.    Вспомогательные сведения из теории матриц и квадратичных форм

Далее для постоянной симметричной n x n -матрицы D 0 ( < 0) означает определённую положительность (отрицательность) квадратичной формы x'Dx , где x е R n .

Утверждение 5.1. [14, c. 108]. Имеют место две цепочки импликаций:

  • а) D >  0 ^ 0 X x'x xDx xx V x е R n , b) D <  0 ^—N xx xDx <—X xx V x е R n , здесь уже Я ( —Л ) - наименьший и Л ( Я ) - наибольший корни уравнения det[ D X E n ] = 0; причем 0 Я < Л , E n - единичная n x n -матрица.

Замечание 5.1. Неоднократно используем управляющее воздействие вида ut = a e n x , e n - n -вектор-столбец со всеми компонентами, равными плюс единице, тогда e en = n , число a = const 0 .

Утверждение 5.2. Если D >  0, то для Л - наибольшего из корней det[ D X E n ] = 0 будет:

  • a ) [14]: Л <  nM - где M максимум модулей элементов d ij матрицы D = ( d ij );

n

  • b ) [15]: Л< min ^| d j |.

i =1„.„ п. = 1

Утверждение 5.3. Справедлива эквиваленция D 0 ^ ( 1) D = — D 0 (т. е. умножаем все элементы постоянной симметричной n x n -матрицы D на минус единицу) и тогда —Л >  0, наибольший из корней уравнения det[ D X E n ] = 0, совпадает с наименьшим из корней уравнения det[ D X E n ] = 0.

Замечание 5.2. Согласно утверждению 5.3 для оценки наименьшего из корней det[ D X E n ] = 0 достаточно оценить наибольший из корней характеристического уравнения det[ D X E n ] = 0.

Утверждение 5.4. (аналог лемм 4.1 и 4.2 из [7]) Справедливы импликации: где i , j е N, j * i и

  • a) D ii 0 ^ для каждого   U * i е A i  и   U * е A i  существует «своя» постоянная

a * ( U * , U i , 1 0 , y 0) 0, при которой для всех постоянных a a * ( U * i , U * ) при стратегии U i ^ a e n y выполняется строгое неравенство

T i (U i , U * i , 1 0 , y 0 ) Z i ( U * , U * i , 1 0 , y 0 ) .

Напомним, что функция выигрыша   Т ii   определена в (10), а    - i = N \ { i } =

= { 1,2,..., i - 1, i + 1,..., N } ;

  • b)      D j 0 ( j ^ i ) ^ при любых U * g A j  и U - j g A - j существует «своя» постоянная

a* ( и * , U * j , 1 0, y0 ) 0 такая, что V a a j ( u j , U * j ) при стратегии U j ^ a e n y будет

1j ( U j , U- j , 1 0 , y 0 ) j^j ( u j , U - j , 1 0 , y 0 ) .

Наконец, в [5, 6] установлена справедливость следующих утверждений.

Теорема 5.1. В игре Г при выполнении (12):

  • a)    не существует равновесия по Нэшу;

  • b)    не существует min J i ( U i , U - i , 1 0, y0 ) , и как раз поэтому условие индивидуальной рацио- U i ga i

нальности в игре Гd можно не учитывать (в определении оптимального решения);

  • c)    если кроме (12) выполняются ограничения на корни соответствующих характеристических уравнений ЛПЛ 22 12 Л 21, то в игре (11) существует [5] паретовское равновесие угроз и

  • контругроз.
  • 6. Максимальные по Парето ситуации и паретовские выигрыши

В заключение перейдём к центральному результату настоящей статьи: построению явного вида КПО-решения для коалиционной игры (11). При этом будем основываться на свойстве 1.1 и методе динамического программирования Беллмана. Понадобится также дополнительно решить одну статическую N -критериальную задачу, с которой начинается следующий параграф.

Прежде всего приведем вспомогательные утверждения (см. далее лемму 6.1).

Рассмотрим 6-критериальную статическую задачу

Г6 = ( к6 n,{ fi(u ) = u DaU + - + » 6 Di 6 u 6 }i=1,...,6), в которой ЛПР выбирает альтернативу u = (u1,...,u6)gМ6n с целью достичь одновременно возможно больших значений всех 6 компонент векторного критерия f (u) = (f1(u),..., f6(u)). Аналогом определения 1.2 здесь будет: альтернатива uP максимальна по Парето в Г6, если при Vu g R6n несовместна система неравенств fi(u) > fi(uP) (i = 1,...,6), из которых хотя бы одно строгое.

Ниже используем аналог свойства 1.1.

Лемма 6.1. Если в задаче Г6 симметричны постоянные n х n -матрицы Dj, а положительные числа Лii, Лij (i, j = 1,...,6,i ^ j) таковы, что

D ii 0, D ij 0 (при i ^ j ), Л 11 Л 22 Л 12 Л 21 , Л 44 Л 55 Л 45 Л 54 то при постоянных a -( i g N) таких, что

2    .      2      1

a = 1, a = —

1          2   2

Л 11 ! Л 12

1Л 21    Л 22 у

2

, a 3

1

+ a - Л 23

^

= 2

V

Л 33

у

*    ,      *      1

a 4 — 1, a 5 — ^

44+ Л 45 )

V Л 54    Л 55 у

2

, a 6

£

Л 4.

+ a j A 45

^

= 2

V

Л 66

у

квадратичные формы

f ( u ) = a j f 1 ( u ) + a j f 2 ( u ) + a j f 3 ( u ) + a 4 f 4 ( u ) + a j f 5 ( u ) + a - f s ( u ) = u 1 D 1 ( a* )u 1 + ... + u 6 ' D 6 ( a* )u 6 становятся определённо отрицательными; здесь

Di(a* ) = ajD1i + a2D2i + ajD3i + a4D4i + ajD5i + ajD6i , кроме того, Лii > 0 - наибольший корень характеристического уравнения Aii (Л) = det [Dii -ЛЕп ] = 0, соответственно, -Лij < 0 - наибольший (по абсолютной величине) корень уравнения Sij(Л) = det^Dij-ЛЕn" = 0 (i, j e{1,...,6}, j ^ i), также напомним, что Еп -единичная 6 х 6 -матрица.

Доказательство. В силу симметричности n х n -матриц Dii > 0, Dij < 0 (i, j eN ; j ^ i), используемых в задаче Г6, корни характеристических уравнений Aii (Л) = 0 и Sij (Л) = 0 вещест венны, кроме того, Л > 0, —Л- < 0 (i, j eN, j ^ i). Так как выполнены оценки u’D^u- < Л u’u^ ii                     ij                                                                                                                           i ii i          ii i i и ujDjuj' < -ЛijUj‘Uj (утверждение 5.1), то с учётом (см. ниже) табл. 6.1

  • f(U ) = О * f l ( U ) + a * f 2 ( U ) + ... + а * f 6 ( U ) =

= U 1 ' Г a * Dn + а 2 D 21 + ... + a * D 61 "I U 1 + ... + U 6 ’ Г a * D 16 + a * D 26 + ... + а * D 66 1 U 6 <

Г * А                А X .          *Z А хП '           . Г *Z А X . *Z А X .          *А П '

а 1 Л 11 + а 2 ( 21 ) + ... + а 6 ( 61 ) I U 1 U 1 + ... + а 1 ( 16 ) + а 2 ( —Л 26 ) + ••• + а 6 Л 66 I U 6 U 6

Заметим, что для проверки приведённых ниже формул удобнее воспользоваться следующими табл. 6.1 и 6.2.

Таблица 6.1

*

a 1

1

D 11

D 12

D 13

D 14

D 15

D 16

*

a 2

2

D 21

D 22

D 23

D 24

D 25

D 26

*

a 3

3

D 31

D 32

D 33

D 34

D 35

D 36

*

a 4

4

D 41

D 42

D 43

D 44

D 45

D 46

*

a 5

5

D 51

D 52

D 53

D 54

D 55

D 56

*

a 6

6

D 61

D 62

D 63

D 64

D 65

D 66

Здесь и далее компоненты вектор-столбца a = ( a 1, a 2, a 3, a 4 , a 5, a 6 ) , где a i заданы в (13).

В связи с тем, что Ui'DiiUi <ЛiiUiUi и Uj'DijUj <-Лij ||Uj|| , а также с учётом табл. 6.2 скаляр- ная функция f (u) < 0 Vu e R6n, u ^ 06n, если выполнены все неравенства из табл. 6.2.

Таблица 6.2

A 11 a * 21 « 2 -A 31 a * 41 a 4 -A 51 a * -A 61 a 6 0

******

-A 12 a 1 +^ 2 a 2 32 a 3 42 a 4 -A 52 a 5 - Л 62 a 6 0

******

—Л a 1 —Л a 2 + Л зз a з —Л a 4 —Л a 5 —Л a 6 < 0

14 a 1 — Л 24 a 2 — Л з4 a з + Л 44 a 4 — Л 54 a 5 — Л 64 a 6 0

******

—Л 15 « 1 2.5 a 2 Л 35 a 3 45 a 4 + Л 55 a 5 — A 65 a 6 0

******

—A 16 a 1 26 « 2 36 a 3 Л 46 a 4 Л 56 a 5 66 « 6 0

Более того, из табл. 6.1 получаем, что при

Л 11 « 1 21 a 2 31 a 3 < 0,

  • 13 a 1 23 a 2 33 a 3 0,

а также при

Л44a4 -Л54a5 - Л64a6 < 0, < -Л45a4 + Л55a5 - Л65a* < 0, -Л46a4 -Л56a5 -Л66a6 < 0, все 6 строгих неравенств из табл. 6.2 имеют место, ибо (кроме (14) и (15)) все остальные слагаемые отрицательны (так как -Лij < 0, а* > 0, i * j).

Установим, что при ЛПЛ22 <Л12Л21 и Л44Л55 <Л45Л54 первые два неравенства из табл. 6.2 выполняются. Действительно, если а* > 0, то первые два строгих неравенства (14) имеют место, если 0 < Л11 < а* < ^, что сразу следует из ЛПЛ22 < Л12Л2,. Наконец, выполнено третье нера-Л21       Л22

а     1 лп2 а *

венство в (14) для 0 а 3<--132^^ , где

2     Л 33

*    1

а = —

2   2

Л 11 ! Л12

. Аналогично, для справедливо-

сти (15) достаточно, чтобы а * = 1, а * = — ^44 + ^45-

4      5   2 54 Л 55

*      1

а 6 = -

6   2

Утверждение 6.1. Если в дифференциальной игре Г 6

Dtt 0, D ij 0 , C i < 0 ( i , j = 1,...,6 ; i * j ), ЛПЛ 22 К Лм, Л 44 Л 55 45 Л 5 4 , то максимальная по Парето ситуация U P в 6-критериальной задаче Г и будет

U P = ( U P , U P ,..., U P ) ^ ( u P (t , y X u P ( t , y ), ... , u 6P ( t , y ) ) = U P ( t , y ) =

= ( Q P ( t ) y , Q P ( t ) y ,..., Q P ( t ) y ) =

= ( - D 1 - 1 ( а * ) 0 P ( t ) y , - D - ( а * ) 0 P ( t ) y ,..., - D - ( а * ) 0 P ( t ) y ) ,

где 0 P ( ) - симметричная, непрерывная на [ 0, 5 ] n х n -матрица

0 P ( t ) = <  C ' ( а ) + J ^ D 1 ' ( а ) + D 21( а ) + ... + О 6 ' ( а ) >

- 1

и постоянные симметричные n х n -матрицы

Д ( а *) = D + а* * D 2 t + ... + а * D 6i (i = 1,...,6);                         (19)

положительные числа а * , а * ,..., а * определены рекуррентным образом в лемме 6.1.

Доказательство. Найдем максимальную по Парето ситуацию U P , применяя лемму 6.1 (конкретно, табл. 6.2 и метод динамического программирования (МДП) из [10, с. 112]. Само применение МДП здесь сведётся к осуществлению двух этапов. На первом для задачи Г 6 нужно найти 6 положительных чисел а * , а 2 ,..., а 6 , а также непрерывно дифференцируемую скалярную функцию V(t , y ) = y '0 ( t ) y, 0 ( t ) = 0' ( t )   V t e [ 0, 5 ] и n -вектор-функции u i ( t , y , V ) ( i e N) такие, что

V ( 5 , y ) = y 'C ( а *) y , C ( а *) = C 1 + « 2 c2 + ... + а * С 6;

затем с помощью скалярной функции

, d V W ( t , y , u 1 ,..., u 6 , V ) = —+ C t

d V 9 y

2'^/  *X          .6

( u 1 + ... + u 6 ) + а 1 u 1 D1( а ) u 1 + ... + а 6 u 6 D 6( а ) u 6

(8V определить n-вектор-функции u (t,y, V) (i e N), исходя из — = grad^V , i                               (5y        y J

max W(t,y,u1,...,u6,V) = Idem{ui ^ui(t,y,V) (i = 1,...,6)} u1,..., u6

при любых ( t , y , V ) e [ 0, 5 ] x R n + 1. Достаточные условия существования u ( t , y , V ) в (20) сводятся к выполнению требований: при V ( t , y ) e [ 0, 5 ) х R n чтобы выполнялись 12 тождеств

d W d u i

av

= — + 2 D i ( a ) U i ( t , y , V ) = 0 n    (i = 1,...,6),

u ( t , y , V )

d 2 W

dui где Di (a*) < 0 в силу леммы 6.1.

Из (21) получаем

= 2 D i-( a ) 0    ( i = 1,...,6) ,

1     1   * a v

U i ( t , y , V ) = -- D i ( « )—    ( i = 1,-»6) .

2         d y

Тогда

W ( t , y , u ( t , y , V ), V ) = W [ t , y , V ] = ^ - 1 4 V d t   4 L d y

( D - ' ( a -) + ... + D^a 1) ) d V .

v                           7 dy

Второй этап . Найдем решение первого уравнения из (21) вида V = Vp (t , y ) = y '0 p (t ) y,

0 p ( t ) = ^0 p ( t ) J дифференциального уравнения с частными производными

W (t , y , V ) = 0

с граничным условием ( C ( a * ) = C1 + a 2C2 + ... + a , C6 ) . Так как

V (S, y) = y 'C (a*) y   Vy e Rn, то при Vt e [0, S], Vy e Rn должно иметь место

W [ t , y , V ( t , y ) = y '0 py J = 0,    V ( S , y ) = y'C ( a *) y   V y e R n .

Оба эти требования выполнены, если симметричная n х n -матрица 0 p ( t ) удовлетворяет матричному дифференциальному уравнению типа Риккати (0 n х n - нулевая n х n -матрица):

0 p (t ) -0 p ( t ) ( D 1 - 1( a *) + ... + D 6 - 1( a * ) ) 0 p ( t ) = 0 n x n ,

0 p ( S ) = C ( a ) = a 1 C 1 + a 2 C 2 + ... + a 6 C 6;

решение 0 p полученного матричного уравнения имеет [10, с. 65] вид (18). Здесь учтена импликация

C i < 0(i = 1,

6) ^ C ( a ) = a 1C1 + a 2 C 2 + ... + a 6 C 6 0.

Наконец, из (22) приходим к справедливости (17). Таким образом, максимальная по Парето ситуация Up в задаче Г 6 имеет вид (17)-(19). □

Перейдем к построению максимальных по Парето выигрышей Jp = ( Jp ,..., J 6 ) = ( J 1 ( up , 1 0, y 0 ) ,..., J 6 ( up , 1 0, y 0 ) ) опять таки с помощью метода динамического программирования [10].

Утверждение 6.2. Пусть выполнены требования (16) (из утверждения 6.1) и для дифференциальной игры Г 6 удалось найти 6 скалярных непрерывно дифференцируемых функций вида V i ( t , y ) = y r0 i ( t ) y ( i = 1,..., N ) таких, что

V ( S , y ) = yrCfy   V y e R n ;

система из шести уравнений с частными производными

8 V

d V

N ( t ) y + y '0 p ( t ) M i ( t ) 0 p ( t ) y = 0,

Vt ( S , y ) = y’C i y   V y e IF    ( i = 1,...,6)

имеет решение вида Vt(t , y ) = y '0 i ( t ) y, [ 0 i ( t ) ] =0 i ( t ) (i = 1,...,6).

Тогда при любой начальной позиции ( t 0, y0) e [ 0, J ) x R , у0 ф 0 n имеет место

J P = Ji ( U P , t о , У о ) = У 0 ©( ( t о ) У 0    ( i = 1,-»6).

В (23) непрерывные n x n -матрицы

N ( t) = - ( D - ( a *) + ... + D - 1 (a*) ) © P ( t ),

Mi (t) = ©P (t) [ DfW) Dn DAu) +... + D^U*) D6 D. (a ) J©P (t)  (i = 1,...,6), n x n -матрицы ©P(t) и Di (a*) приведены в (18) и (19), а симметричные n x n -матрицы

У = N(t ) y ,

Наконец У ( t ) - фундаментальная матрица решения однородной системы

у ( 9 ) = E n .

Доказательство. Составим скалярные функции

W [ t , y , v ]=^ + iL        iJ d t

d v

N ( t ) y + [ up ( t , y ) J Dnup ( t , y ) + ... +

+[uP(t,У)J Di6uP(t,у)   (i = Ъ-,6), причем uP(t,y) - n-вектор-функции, определенные в (17).

Ищем решение V ( t , y ) (i = 1,...,6) системы из 6 уравнений с частными производными

W [t,У, V] = 0 ,  V(J,y) = УCy   Vy е Rn (i = 1,...,6)

в виде квадратичной формы V i (t , y ) = y i ( t ) y , [ © i ( t ) ] i ( t ) ( i = 1,...,6).

Установим два факта.

Во-первых , решению системы (25), (26) присуще свойство

Vi(t0,У0) = Ji (UP,10,У0)   (i = 1,...,6),(27)

где ситуация U P = (U P ,..., U 6P ) имеет вид (17). Действительно, если U P - ситуация из (16)-(19), то согласно (25) и (26) для решения yP ( t ) системы y = N(t ) y , y(t 0) = у 0 ф 0 n при y = yP ( t ) будет

0 = W [ t , Ур ( t ), V ( t , Ур ( t ))       V ( t•yP ( 1» .1 ■ V 't -P - t" T n ( t ) yP ( t ) +

L                  J       dt

J^Tl'

+ ^ [ u j ( t , У ( t )) J D ij u j ( t , У ( t )) = W i[ t ]     V t e [ t 0 , 9 1     ( i = 1,...,6).

j = 1

Интегрируя обе части этого тождества в пределах от 1 0 до 9 с учетом граничных условий из (26), приходим к

0 = J W i [ t ]dt = J dVi ( t^y p ( t )) dt + J jr [ uyP ( t , yP (t )) J' D ij u P ( t , yP (t )) dt = t 0                t 0                             t 0 j = 1

= vi( 9 , yP ( 9 ) ) - v i ( t 0 , У P ( t 0 )) + J^ [ u P( t , УP ( t )) J D ij u j( t , УP ( t )) dt =

  • 1 0 j = 1

= У ( J ) C i y ( J ) + J^ [ u j ( t , y ( t )) J D ij u j ( t , y ( t )) dt - V ( t 0 , У ( t = 1 0 j = 1

= Ji (UP, 10, У0) - V(t0, yP (t0))   (i = 1,...,6), отсюда сразу следует справедливость равенства (27).

Во-вторых , установим, что решение   Vt ( t , y )   ( г g N)  системы (26) имеет вид

V i ( t , y ) = y'0 i (t ) y , где симметричная n x n -матрица 0 i (t ) представима в виде (24). В самом деле, подставив V ( t , y ) = y'0 i (t ) y в (26), получаем справедливость (24), если только 0 i (t ) ( i = 1,...,6) является решением матричного линейного неоднородного дифференциального уравнения

0i+0i N + N 0 i +0 P ( t ) M i 0 P (t ) = 0 nxn ,   0 , ( 9 ) = C i (i = 1,...,6) .            (28)

Подстановкой 0 i ( t ) из (24) убедимся, что симметричная n x n -матрица 0 i ( t ) из (24) в самом деле является решением (28), что и завершает доказательство утверждения 6.2.       □

Замечание 6.1. Объединение утверждений 6.1 и 6.2 приводит к следующему итоговому результату, касающемуся явного вида максимального по Парето решения (U P , JP ) g A x IR6 игры Г 6 -

Пусть для дифференциальной игры Г 6:

  • 1)    постоянные симметричные n x n -матрицы

Dti 0,    D j 0,    с , 0,  ( i , j = 1,...,6; i ^ j );

  • 2)                           [ Л 11 Л 22 Л 12 Л 21 ],   [ Л 44 Л 55 Л 45 Л 54 1*

Тогда при V ( 1 0, y 0) g [ 0, 9 ) x R n , y 0 * 0 n будет

U P + uP (t , y ) = ( - D ( a ^0 P (t ) y , - D-4a) 0 P ( t ) y ,..., - D -V) © P ( t ) y ),

JP = (JP ,J2 ,...,JP ),   Jp = y0 0i(t0)y0   (i = 1,...,6) , а симметричные n x n -матрицы 0P (t) и 0Z (t) имеют вид:

- 1

,

0 P ( t ) = j C -V) + J [ D 1 - 1( a *) + D 2 - 1( a *) + ... + D 6 - 1( a *) ] d T

0 i ( t ) = [ y - 1( t ) ]'

' i

J Y ' ( t ) 0 p ( t ) M i ( t ) 0 p ( t ) Y ( t ) d T [ Y - 1( t )

(i = 1,...,6),

n x n -матрица Y ( t ) - фундаментальная матрица решения системы y = N ( t ) y , Y( 9 ) = En , симметричные матрицы

C( a* ) = C 1 + a * C2 + ... + a * C6 ,   D i ( a* ) = a* D 1i + a * D2 i + ... + a * D 6 i ,

N (t ) = - ( D 1 - 1 ( a *) + ... + D - 1 ( a *) ) 0 P ( t ),

Mi (t) = 0P (t) [ D- (a*) Dn D- (a*) +... + D6-1(a*) D6 D- (a*) ] 0P (t), положительные числа a*,a2,...,a* определены рекуррентным образом a = 1, a = — —;

  • 1              2  Л.

11+ Л 12

21 Л 22 J

*

, a3 = ^_

1 Л 13 ± « 2 Л

- 23

Л 33

,

  • 2    _    __2     1 Л,

— 1, a^ —

  • 4        5   2  Л.

44 +^ 5

54 Л 55 J

*

, a6 =^

1 Л 46 ± a 5 Л

Л 66

,

величина Лii (-Лij)  - наибольший (наименьший) корень характеристического уравнения det[Dii-ЛЕп] = 0 (соответственно, det^Dij-ЛЕn^ = 0) (i, j g{1,...,6} , j ^ i).

  • 7.    Явный вид КПО

Перейдём к центральной части статьи - построению явного вида КПО (коалиционного Паре-то-оптимального решения) игры Г , формализованного определением 2.1: при выполнении ограничения (16) для игры Гd , справедливы равенства

МАХ K (U ( и к , иК2 , 1 о , У о ) = К KU ( U P , 1 о , У о ),

<

и К, eA К,   112        1

МАХ 1 к (UP , UK , 1. , у п ) = 1 к (UP , и , у 0 ),

К 2 К ,    К 2 , о,^ о/       К 2 V , о ,-л ох ,

I U К 2 eA К 2

что, в свою очередь, будет следовать из max

U К , e A К ,

max

U К 2 e A К 2

[ « i^ U К 1 , Uр , 1 о , у о ) + a& U к , , Uр , 1 о , у о ) + OM U к , , U К ,1 о , у о ) ] —

  •    I « ^j ( и , 1 о , у о ), j 1

[ « 4X4 ( U К 1 , U К 2 , 1 о , у о ) + « ^( U к , , U К 2 , 1 о , у о ) + «*№ К , , U К 2 , 1 о , у о ) ] —

  •    I « :Im (U P , 1 о , у о ),

m 4

при V ( 1 0 , у о ) ё [ 0, 5 ) х Ж и , где постоянные

. *    ,      *    1| Л а — 1, а — — —:

И+ л12 ■ 21 Л 22 )

4      5  2 Л

44 +^ 1

■ 54 Л 55 )

*

, « з —

*

, а =---

6  2 Л бб

Л ii о - наибольший корень А ( Л ) det [ D ii - Л Еп ] о , ij о - наименьший корень уравнения       6 ij ( Л ) det [ D j Еп ] — о       ( i , j e { 1,...,6 } ,        j ^ i ),       Л ij о ;      ситуация

UP — — (U P ,..., U 6P ) ^ ( - D 1 - 1( a *)) © P ( 1 ) у ,..., - D ( - 1( a *)) © P ( 1 ) у ) . Итак, покажем, что найденная в предыдущем разделе настоящей статьи ситуация U P e A как раз и представляет собой объединение ( U К , U К^ ) U P , где U KPX ( u , p , U 2P , U P ) и U KP^ ( u 4P , U P , U 6 ) , которые найдены в (17)

  • (19) . Однако именно доказательство справедливости (29) и является содержанием статьи [5] для игры Г d , где «заморожены» стратегии U P^ ( и P , U 5 , U 6P ) e A К 2 (см. утверждение 3.1 из [5] при а * 1, в « 2 , Y а * ); более того, эти самые ( U P , U 2P , U P ) U KP как раз и реализуют max в

  • V              ;      1                             и К, e A к ,

(29), что, в свою очередь, и по свойству 1.1 влечёт их максимальность по Парето в трехкритери- альной задаче (у — и, + и2 + U3,у(1о) = уо,A^,{^i(Ц,U2,U3,UК2

. Отсюда, как след-

ствие, явный вид UК — (UP,UP,UP)^(-D-'a*))©P(1)у,-D-^a*))©P(1)у,-D3"1(a*))0P(1)у) и соответствующие выигрыши в такой ситуации UК e AК . Аналогично установим справедливость UК2 — (UP,UP,UP)^(-D^a*))©P(1)у,-О-1)»*))©P(1)у,-D(-1(a*))©P(1)у) и явный вид выигрышей в ситуации UК2 =(иP,UP, U6P ). Итак, приходим к справедливости следующего ут- верждения.

Теорема 7.1. Пусть для коалиционной дифференциальной игры с нетрансферабельными выигрышами

Г d —({ К 1 { 1,2,3 } , К 2 { 4,5,6 } } , I у , { A K i }w 2,{ Тк, ( U k , , U k 2 , t о , ^ о )} / 1,2) , выполнены ограничения

D ii о, D ij о , C i о , ( i , j I,...,6 ; i ^ j ); Л 11 Л 22 Л 12 Л 21 , Л 44 Л 55 Л 45 Л 54

Тогда коалиционно Парето-оптимальное решение игры Гd образует четвёрка fUp ,Up ;TK(UP ,Up,t0,x0),^ (Up,Up , 1o,x0)) g AK x AK xR3 xR3, у  K1 ,   К2 ’ К1 V K1 ,   2,0, 0 7, К2 V 1 ,   К2 , 0, 0^1      К1      К2                ’ где UК = (UP,UР,UР)g Aк , UК = (иf,UР,U6)g Aр , Up +-D/(a*)0P(t)y (i = 1,...,6) сим метричные постоянные n x n -матрицы,

D i (a* ) = a * D i1 (a* ) + a 2 Di2 (a* ) + a * Di3 ( a *) + a * Di4( a ) + a * Di5 (a* ) + a * Di6 ( a *) ( i = 1, -.-, 6),

*   ,     *    1

a = 1, a = ——■

1        2   2

11 । Л12

21 Л 22 )

, a 3 = ^— ( Л 13 + а * Л 23 ) ,

*               1I Л- aд — 1, as —

4        5    2  Л.

- 44   ! Л 45

-54 Л 55 )

, a 6 =      ( Л 46 + a^ 45 ) ,

2 Л66 V             ’

непрерывная симметричная n x n -матрица f .   . Э Г A ,   „ "

0 P ( t ) = <  C 1 ( a ) + J D -Dt ■ 1 ( a ) d T

I              t L i = 1           ]

- 1

,

Z P [t o, У о 1 = ^ к U P , U P , to , xo ) = (^( U p , U p , t o, x0)Д?(и Р , U P , t o, xn),Д(и Р , Up ■

K 1   0 , 0        К 1     К 1 ,   К 2 , 0 ,   01 K 1 ,   К 2 , 0 ,   0 ,   2 K i ,   К 2 , 0 ,   0 7,  3     р ,   К 2

IP [ t o, У о 1 = ^ к U P , U p , to , x 0) =( ^4( u P , U P , t o, x0 ),I5(U P , u f , t 0, x0 ),z6( u f , U P к 2 L 070 J      к 2     К 1 "    к 2 "  0"  0у 4 V K 1 “    к 2 7 07  0/"  5 v K 1 7    к 2 7 07  07’  6 v   К 1 7    к 2

К1 = (y0 01 (t0 )y0, y0 02 (10 )y0 , y0 03 (10 )y0 ) , тк2 =(У0 04(t0)У0, У0,05(t0)У0, У0 06(t0)У0),

C (a*) = £a2q, i=1

Г Э                            1

0 i (t ) = r Y - 1( t ) ]   C i - J Y'tt ) 0 P ( t ) M i ( t ) 0 p ( t ) d T Y - 1( t ) ,

, t 0 , x 0 ) I ,

, t 0 , x 0 ) I ,

Y ( t ) - фундаментальная матрица решений системы y = N(t ) y , Y ( Э ) = E n ,

N ( t) =- ^ D"x(a^0Р ( t ), Mt ( t ) = 0 P ( t) £ D-X(a^D y DjXa^ ,

*

i=1                                            Г j=1                            _ где Лii > 0 - наибольший корень А(Л) = det [Dii — ЛЕn ] = 0, -Лi < 0 - наименьший корень уравнения 5j(Л) = detГDj-ЛЕп] = 0 (i, j e{1,...,6}, j *i).

При этом обе коалиции внутренне и внешне устойчивы.

Доказательство . В [5] установлено, что согласно D 11 0 в игре Гd не существует равновесия по Нэшу, но по утверждению 5.1 из [5] может существовать угроза на внутреннюю устойчивость коалиции К 1 (т. е. B U T ^ a e n y и a = const 0 такие, что при V a a (e n - n -вектор с единичными компонентами) будет Z1 ( U T , U P , U P , Uр^ , 1 0, y 0 ) Кх ( U P , 1 0, у 0)).

В ответ на такую угрозу и согласно D 12 0 у игрока 2 из коалиции К 1 (по утверждению 5.4 из [5]) существует a 1 0 и такое, что при V a a 1 будет для U C ^ a e n y

^1(U1 ,U2,U3 ,UK2 ,t0,y0) < ^1(U ,t0,y0) , аналогично, согласно D22 > 0 B число a2 > 0, для которого при Va > a2 будет

2 ( U 1 , U C , U 3 , U k2 , t 0 , y 0 ) max ^( U к , U k2 , t 0 , y 0 ) .

2             U K 1 e A K 1        1     2

Но тогда для стратегии U C при а >  max { a 1 , a 2 } два последних строгих неравенства «объединяются» в контругрозу на внутреннюю устойчивость коалиции К со стороны игрока 1.

Таким образом, устанавливается внутренняя устойчивость К 1 и аналогичными рассуждениями внутренняя устойчивость К .

Заключение

Итак, при выполнении ограничений (16) в игре Г существует КПО решение (его явный вид можно найти в теореме 7.1). В конце статьи хотелось бы упомянуть о возможности предложенным здесь приёмом решать вопросы об устойчивости более сложных коалиционных структур.

Список литературы Об одной модификации равновесия по Нэшу

  • Парилина, Е.М. Новый подход к определению характеристической функции в стохастических играх / Е.М. Парилина, Л.А. Петросян // Устойчивость, управление, дифференциальные игры (SCDG2019): Материалы Международной конференции, посвященной 95-летию со дня рождения академика НН Красовского, (Екатеринбург, 16-20 сентября 2019 г.). Екатеринбург: ИММ УрО РАН, 2019. - 2019. - С. 243-247.
  • Parilina, E. On a Simplified Method of Defining Characteristic Function in Stochastic Games / E. Parilina, L. Petrosyan // Mathematics. - 2020. - Vol. 8, Iss. 7. - P. 1135.
  • Mazalov, V.V. Fish wars and cooperation maintenance / V.V. Mazalov, A.N. Rettieva // Ecological Modelling. - 2010. - Vol. 221, Iss. 12. - P. 1545-1553.
  • Mazalov, V. The Euler-Equation Approach in Average-Oriented Opinion Dynamics / V. Mazalov, E. Parilina // Mathematics. - 2020. - Vol. 8, Iss. 3. - P. 355.
  • Жуковский, В.И. Паретовское равновесие угроз и контругроз в одной дифференциальной игре трех лиц / В.И. Жуковский, Ю.Н. Житенева, Ю.А. Бельских // Математическая теория игр и её приложения. - 2019. - Т. 11, № 1. - С. 39-72.
  • Жуковский, В.И. К индивидуальной устойчивости паретовского равновесия угроз и контругроз в одной коалиционной дифференциальной игре с нетрансферабельными выигрышами / В.И. Жуковский, К.Н. Кудрявцев, Л.В. Жуковская, И.С. Стабулит // Математическая теория игр и ее приложения. - 2021. - Т. 13, № 1. - С. 89-101.
  • Salukvadze, M.E. The Berge Equilibrium: A Game-Theoretic Framework for the Golden Rule of Ethics / M.E. Salukvadze, V.I. Zhukovskii. - Birkhauser Basel, 2020. - 272 p.
  • Zhukovskiy,V.I. The Golden Rule of Ethics: A Dynamic Game-Theoretic Framework Based on Berge Equilibrium / V.I. Zhukovskiy, M.E. Salukvadze, A.Yu. Mazurov. - London, New York: Taylor and Francis, 2021. - 324 p.
  • Жуковский, В.И. Равновесные управления многокритериальных динамических систем / B.И. Жуковский, Н.Т. Тынянский. - М.: МГУ, 1984. - 224 c.
  • Жуковский, В.И. Дифференциальные уравнения. Линейно-квадратичные дифференциальные игры: учебное пособие для вузов / В.И. Жуковский, А.А. Чикрий. - 2-е изд., испр. и доп. -М.: Из-во Юрайт, 2020. - 322 с.
  • Подиновский, В.В. Парето-оптимальные решения многокритериальных задач / В.В. По-диновский, В.Д. Ногин. - М.: Физматлит, 2007. - 255 с.
  • Карлин, С. Математические методы в теории игр, программировании и экономике / C. Карлин. - М.: Мир, 1964. - 838 с.
  • Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. - М.: Наука, 1974. - 456 с.
  • Воеводин, В.В. Матрицы и вычисления / В.В. Воеводин, Ю.А. Кузнецов. - М.: Наука, 1984. - 318 с.
  • Parker, W.V. The characteristic roots of a matrix / W.V. Parker // Duke Math. J. - 1937. -Vol. 3, no. 3. - P. 484-487. DOI: 10.1215/S0012-7094-37-00338-7
Еще
Статья научная