Использование выигрыш-функций игроков в антагонистической игре для установления оптимального поведения
Автор: Кондрашова А.С.
Журнал: Экономика и социум @ekonomika-socium
Статья в выпуске: 3-2 (12), 2014 года.
Бесплатный доступ
Короткий адрес: https://sciup.org/140108485
IDR: 140108485
Текст статьи Использование выигрыш-функций игроков в антагонистической игре для установления оптимального поведения
Теория игр рассматривает задачи принятия решений в ситуациях с несколькими участниками, когда значение целевой функции для каждого из субъектов зависит и от решений, принимаемых всеми остальными участниками. В антагонистических играх участвуют только два игрока, которые преследуют противоположные цели. Для такого типа игр характерно, что один из игроков выигрывает ровно столько, сколько проигрывает другой и наоборот, поэтому такие игры называются играми с нулевой суммой. Тогда переговоры или соглашения игроков, их совместные действия лишаются смысла. Именно поэтому принятие решений в условиях неопределенности можно интерпретировать как антагонистические игры.
Функция выигрыша позволяет математически формализовать экономические задачи, путем использования игровых методов, базируясь при этом на линейном программировании, теории вероятностей и исследовании операций.
В теории мы всегда рассматриваем матричную игру m^n , в которой присутствуют два игрока A и B, где игрок A обладает m чистыми стратегиями S AC = {A 1 ,A 2 ,..,А m }, а игрок B- n чистыми стратегиями S BC = {В 1 ,B 2 ,..,В n }. Тогда значения функции выигрыша игрока A и его матрица имеют вид соответственно:
F A (i,j) = a ij
Каждый игрок выбирает такую свою чистую стратегию, которая способствует достижению поставленной перед ним цели – максимизации или минимизации прибыли для игроков A и B соответственно.
Если игрок A выбирает Ai- (i=1,...m) стратегию, то будет иметь один из выигрышей a i1 , ai2, ... ain , которые расположены в i- й строке матрицы, в зависимости от стратегии, выбранной игроком B, который будет стремиться минимизировать выигрыш игрока A, поэтому мы говорим о минимальном выигрыше как о показателе эффективности игрока A [1]:
i min aij, i 1,..., m.
1 j n
Но игрок A будет стараться выиграть больше, поэтому будет выбирать наибольший из своих показателей эффективности, то есть максимизировать минимальный выигрыш
i i m i m j n
Такой принцип выбора эффективной стратегии игрока A называется i0 (номер i 0 i ), соответствующая □ □ называется максиминной.
Для ситуации (A i0 , B l ), когда игрок A выбирает свою максиминную стратегию, а игрок B свою любую, выигрыш игрока A будет равен a i0l для которого справедливо неравенство:
ai0l ai0j i0 = j n
Это значит, что при любой стратегии игрока B, игроку A будет гарантирован выигрыш нижней ценой игры.
Аналогичным образом можно прописать проигрыши игрока B в данной матрице. Если он выберет стратегию B j , то выигрышем игрока A будет один из a 1j , a 2j , … a mj , расположенных в j-м столбце, в зависимости от стратегии игрока A, который играет наилучшим для себя образом, поэтому это будет самое большое число в этом столбце:
-
□ j = □max aij , j ПП n – показатель неэффективности игрока стратегии
IM i□ □m
B j .
Но игрок B будет стремиться уменьшить свой проигрыш и выбирать наименьший из показателей неэффективности:
-
□ □ Dmin □ j □ □ □ Dmin max aij.
-
□ □ □ □ D^^ j□ □n IDE j □ □ n□ 1DD i□ □m
Данный принцип называется минимаксным, проигрыш для игрока B -□ - минимаксом, а стратегия B j0, для которой □ = j0 .
Если игрок B придерживается своей минимаксной стратегии, а игрок A- любой своей стратегии, то для проигрыша a kj0 игрока B в ситуации (A k , B j0 ) получим неравенство:
akj0 □ □ □ < min aij0 = □ j0 = □ □□
IDE j□ □n
Значит игрок B не может проиграть б ольше □ □ □ поэтому это значение называется верхней ценой игры в чистых стратегиях.
Существует теорема, которая показывает взаимосвязь верхней и нижней цен игры (возьмем ее без доказательства, так как она является вспомогательным элементом):
Теорема: Для элементов матрицы А =
Если □□□□□□, то соответствующие чистые стратегии игроков называются оптимальными, а матрица содержит седловую точку– то есть когда существует элемент aij , являющийся максимальным в своем столбце и минимальным в своей строке. Тогда чистые стратегии i и j будут оптимальными стратегиями для игроков A и B соответственно [2].
Это показывает, что именно выигрыш-функции игроков A и B, которые определяют выигрыши (или проигрыши) соответственно, дают возможность определять те оптимальные и разумные ситуации, из которых не выгодно выходить никому из игроков.