Использование выигрыш-функций игроков в антагонистической игре для установления оптимального поведения

Автор: Кондрашова А.С.

Журнал: Экономика и социум @ekonomika-socium

Статья в выпуске: 3-2 (12), 2014 года.

Бесплатный доступ

Короткий адрес: https://sciup.org/140108485

IDR: 140108485

Текст статьи Использование выигрыш-функций игроков в антагонистической игре для установления оптимального поведения

Теория игр рассматривает задачи принятия решений в ситуациях с несколькими участниками, когда значение целевой функции для каждого из субъектов зависит и от решений, принимаемых всеми остальными участниками. В антагонистических играх участвуют только два игрока, которые преследуют противоположные цели. Для такого типа игр характерно, что один из игроков выигрывает ровно столько, сколько проигрывает другой и наоборот, поэтому такие игры называются играми с нулевой суммой. Тогда переговоры или соглашения игроков, их совместные действия лишаются смысла. Именно поэтому принятие решений в условиях неопределенности можно интерпретировать как антагонистические игры.

Функция выигрыша позволяет математически формализовать экономические задачи, путем использования игровых методов, базируясь при этом на линейном программировании, теории вероятностей и исследовании операций.

В теории мы всегда рассматриваем матричную игру m^n , в которой присутствуют два игрока A и B, где игрок A обладает m чистыми стратегиями S AC = {A 1 ,A 2 ,..,А m }, а игрок B- n чистыми стратегиями S BC = {В 1 ,B 2 ,..,В n }. Тогда значения функции выигрыша игрока A и его матрица имеют вид соответственно:

F A (i,j) = a ij

Каждый игрок выбирает такую свою чистую стратегию, которая способствует достижению поставленной перед ним цели – максимизации или минимизации прибыли для игроков A и B соответственно.

Если игрок A выбирает Ai- (i=1,...m) стратегию, то будет иметь один из выигрышей a i1 , ai2, ... ain , которые расположены в i- й строке матрицы, в зависимости от стратегии, выбранной игроком B, который будет стремиться минимизировать выигрыш игрока A, поэтому мы говорим о минимальном выигрыше как о показателе эффективности игрока A [1]:

i min aij, i   1,..., m.

1 j n

Но игрок A будет стараться выиграть больше, поэтому будет выбирать наибольший из своих показателей эффективности, то есть максимизировать минимальный выигрыш

i i m       i m    j n

Такой принцип выбора эффективной стратегии игрока A называется i0 (номер i 0 i ), соответствующая □ □ называется максиминной.

Для ситуации (A i0 , B l ), когда игрок A выбирает свою максиминную стратегию, а игрок B свою любую, выигрыш игрока A будет равен a i0l для которого справедливо неравенство:

ai0l                    ai0j      i0 = j n

Это значит, что при любой стратегии игрока B, игроку A будет гарантирован выигрыш нижней ценой игры.

Аналогичным образом можно прописать проигрыши игрока B в данной матрице. Если он выберет стратегию B j , то выигрышем игрока A будет один из a 1j , a 2j , … a mj , расположенных в j-м столбце, в зависимости от стратегии игрока A, который играет наилучшим для себя образом, поэтому это будет самое большое число в этом столбце:

  • □    j = □max aij , j ПП n – показатель неэффективности игрока стратегии

IM i□ □m

B j .

Но игрок B будет стремиться уменьшить свой проигрыш и выбирать наименьший из показателей неэффективности:

  • □    □ Dmin □ j □ □ □ Dmin max aij.

  • □    □ □ □ D^^ j□ □n      IDE j □ □ n□ 1DD i□ □m

Данный принцип называется минимаксным, проигрыш для игрока B -□ - минимаксом, а стратегия B j0, для которой □ = j0 .

Если игрок B придерживается своей минимаксной стратегии, а игрок A- любой своей стратегии, то для проигрыша a kj0 игрока B в ситуации (A k , B j0 ) получим неравенство:

akj0 □ □ □   < min aij0 = □ j0 = □ □□

IDE j□ □n

Значит игрок B не может проиграть б ольше □ □ □ поэтому это значение называется верхней ценой игры в чистых стратегиях.

Существует теорема, которая показывает взаимосвязь верхней и нижней цен игры (возьмем ее без доказательства, так как она является вспомогательным элементом):

Теорема: Для элементов матрицы А =

xHipoK 2 Игрок ГХ. *1 ................ д, Л «и ян *1я «1 *11 °ii «а «л, А А имеют место неравенства □ i□ □ aij □ □□□j , i=1, …, m, j=1, …, n, и, следовательно, нижняя цена игры не больше ее верхней цены в чистых стратегиях: □□□□□□.

Если □□□□□□, то соответствующие чистые стратегии игроков называются оптимальными, а матрица содержит седловую точку– то есть когда существует элемент aij , являющийся максимальным в своем столбце и минимальным в своей строке. Тогда чистые стратегии i и j будут оптимальными стратегиями для игроков A и B соответственно [2].

Это показывает, что именно выигрыш-функции игроков A и B, которые определяют выигрыши (или проигрыши) соответственно, дают возможность определять те оптимальные и разумные ситуации, из которых не выгодно выходить никому из игроков.

Статья