О формировании нового критерия, ориентированного на выбор сбалансированных решений в "игре с природой"

Бесплатный доступ

Представлено обоснование введения в практику решения задачи выбора решения в условиях статистической неопределенности нового критерия, ориентирующего лицо, принимающее решение, на проявление умеренного оптимизма. Показано, что использование этого критерия совместно с рядом классических критериев, ранжированных по степени их статистического оптимизма в виде порядковой шкалы, открывает возможность управления вероятностью сбалансированного выбора в каждой конкретной ситуации принятия решения.

Статистическая неопределенность, оптимизм, риск, критерий, решение, стратегия

Короткий адрес: https://sciup.org/148309574

IDR: 148309574   |   DOI: 10.25586/RNU.V9187.20.03.P.060

Текст научной статьи О формировании нового критерия, ориентированного на выбор сбалансированных решений в "игре с природой"

Проблема принятия взвешенных решений в условиях статистической неопределенности (и порождаемого ею риска) относится к числу наиболее сложных в практике управления. В процессе решения известной задачи «игры с природой» применительно к выбору оптимальных решений (стратегий) центральным моментом является определение критерия, которым будет руководствоваться лицо, принимающее решение (ЛПР), в соответствии со своим отношением к риску. При этом условия ситуации принятия решения также оказывают существенное влияние на выбор ЛПР, поскольку в одних случаях допустим только гарантированный результат, а в других возможен определенный риск. Под взвешенным выбором принято понимать такое решение, которое позволяет обеспечить оптимальное соотношение между оптимизмом и пессимизмом с точки зрения конкретного ЛПР в конкретной ситуации.

Практика принятия решений в условиях неопределенности выработала достаточно широкий спектр критериев – от крайне осторожных до предельно оптимистичных. Взвешенный выбор п ри этом осуществляется в основном за счет конструирования ком

Плуталов М.А. О формировании нового критерия, ориентированного на выбор... 61 бинированных критериев, среди которых наиболее распространенным является выигрыш-критерий Гурвица [8; 12].

Основное предназначение этого критерия состоит во взвешенном сглаживании крайнего пессимизма критерия Вальда и крайнего оптимизма максимаксного критерия. Однако сформулированная в работах Л.Г. Лабскера [5; 6; 7; 9] проблема сглаживания выи-грыш-критерия Гурвица и поэтапное ее решение показали, что феномен сглаживания не всегда возможен. В этих работах были найдены достаточные и необходимые условия на игру, при которых выигрыш-критерий Гурвица не обладает свойством сглаживания, следовательно, применять его для отыскания оптимальных стратегий в такой игре нецелесообразно. Эти выводы получили статистическое подтверждение в наших работах [2; 3; 4], выполненных совместно с И.С. Клименко.

Текущее состояние проблемы

В работе [10] указано на ограниченность возможностей критерия Гурвица, именно потому, что он, как правило, игнорирует вероятные промежуточные выигрыши, на которые указывают другие критерии. Достоинства и недостатки критерия Гурвица обсуждались в работах [11; 13].

Проведенный нами статистический анализ на репрезентативной выборке матриц эффективности показал [1], что при любых промежуточных значениях коэффициента оптимизма выбор по критерию Гурвица, как правило (почти 70% случаев), сводится к реализации либо критерия Вальда, либо максимакса. Еще примерно в 20% случаев критерий Гурвица (как, впрочем, и все остальные критерии) указывает на единственную (объективно оптимальную) альтернативу при любом значении коэффициента оптимизма. Лишь изредка (около 10% случаев) при двух-трех средних значениях коэффициента оптимизма он «находит» третью альтернативу, на которую указывают также критерии Лапласа и Сэвиджа. Это свидетельствует об относительно слабой чувствительности критерия Гурвица к вариациям коэффициента оптимизма с целью управления соотношением оптимизм-пессимизм.

Поэтому реальная возможность непосредственного использования критерия Гурвица для управления оптимизмом (или риском) выбираемых решений остается весьма ограниченной.

В качестве альтернативной методологии решения проблемы управления выбором нами был предложен [3] подход, основанный на формировании порядковой шкалы, значениями которой являлись бы практические показатели оптимизма соответствующим образом подобранных критериев из числа известных. Однако в ходе формирования такой шкалы выяснилось, что большинство используемых критериев тяготеют в сторону выбора осторожных решений. Как следствие, формируемая шкала оказывалась в существенной степени неоднородной, поскольку для области высокого оптимизма, хотя и умеренного по сравнению с предельным оптимизмом максимаксного критерия, не удавалось выявить подходящий критерий.

Отметим, что для оценивания степени оптимизма рассматриваемых критериев применялся развитый в источнике [2] подход, основанный на измерении частот совпадений выбора по каждому критерию и по критерию максимакса. Статистический анализ на выборке из 150 матриц эффективности показал, что наиболее близким по степени оптимиз-

62 в ыпуск 3/2020

ма к максимаксному критерию оказался критерий Лапласа. Этот критерий, как известно, отражает гипотезу о равномерном распределении вероятностей ожидаемых состояний природы (обстановки). В рассмотренном статистическом исследовании этот критерий выбирал ту же самую альтернативу, что и критерий максимакса, в 34% случаев, или, иными словами, коэффициент взаимной корреляции критериев максимакса и Лапласа составил λ ML = 0,34.

Немаловажным в этом исследовании оказался результат сравнительного оценивания оптимизма осторожных критериев, а именно критерия Вальда, формируемого на матрице эффективности, и критерия Сэвиджа, формируемого на матрице риска.

Первый из них настроен на ожидание максимума минимального выигрыша . Согласно критерию Вальда, оптимальным считается решение, соответствующее условию KW = max i min j xij ( xij – оценка эффективности i -го решения при j -м состоянии обстановки).

Второй ориентирован на минимум максимальных потерь : KS = min i max j Δ xij xij – разность между максимальной и текущей оценками эффективности в каждом столбце матрицы риска).

Сравнительный анализ этих критериев показывает:

  • 1.    Коэффициент корреляции критериев Сэвиджа и Вальда λ SW = 0,60. Как видим, вероятность совпадения альтернатив, рекомендуемых этими критериями, весьма высока, хотя они отнюдь не эквивалентны.

  • 2.    Коэффициент корреляции критериев максимакса и Вальда λ MW = 0,12. Этот, на первый взгляд, неожиданный результат отражает продемонстрированную в [2] отличную от нуля вероятность эквивалентности всех рассматриваемых критериев.

  • 3.    Коэффициент корреляции критериев максимакса и Сэвиджа λ MS = 0,24. Этот результат косвенно свидетельствует о том, что критерий Сэвиджа заметно более оптимистичен, чем критерий Вальда, т.е. понятия максимум минимального выигрыша и минимум максимальных потерь не эквивалентны.

  • 4.    Коэффициент корреляции критериев Лапласа и Вальда λ LW = 0,36, а коэффициент корреляции критериев Лапласа и Сэвиджа λ LS = 0,64. Их сравнение вновь косвенно подтверждает более высокую степень оптимизма последнего.

К этому следует добавить, что ранжирование рассмотренных выше критериев позволяет установить между ними следующее отношение нестрогого порядка:

K W ^ K S ^ K L ^ K M , (1)

где KW , KS , KL и KM – символические обозначения критериев Вальда, Сэвиджа, Лапласа и максимакса соответственно, а знак ^ означает «менее оптимистично».

Точнее говоря, критерии здесь связаны между собой отношением «менее оптимистично или эквивалентно», что в предельном случае допускает возможность эквивалентности всех рассматриваемых критериев при выборе объективно оптимальной альтернативы.

Сопоставление этих результатов позволяет сделать вывод о том, что степень оптимизма «осторожных» критериев зависит не столько от оценивания ее семантики с позиции здравого смысла, сколько от технологии конструирования самих критериев. Это обстоятельство было использовано нами для синтеза нового критерия с требуемыми свойствами.

Плуталов М.А. О формировании нового критерия, ориентированного на выбор...    63

Конструирование критерия сбалансированного оптимизма

Анализ (1) показывает, что задача формирования достаточно равномерной ранговой шкалы для априорного оценивания оптимизма критериев затруднена отсутствием критерия, который мог бы занять по степени своего оптимизма промежуточное положение между KL и KM .

Поскольку найти такой критерий оказалось невозможным [3], значит, его надо создать. Иными словами, ставится задача синтеза критерия, ориентированного на выбор умеренно или существенно оптимистичных решений в задаче игры с природой.

Искомый критерий сбалансированного оптимизма KR должен обеспечить целевой эффект, дающий возможность объективно настроенному ЛПР (объективисту) принимать взвешенные решения, абстрагируясь от чрезмерного оптимизма и крайнего пессимизма.

Как оказалось, подобному требованию соответствует следующая конструкция:

K R = max i A x ij ,                                (2)

где A x ij - разность между максимальной и минимальной оценками в кажДой строке матрицы эффективности.

Оптимальной по такому критерию будет признано решение, соответствующее условию:

K опт = max j (max i A xij ).                              (3)

Критерий сбалансированного оптимизма формируется из матрицы эффективности (табл. 1).

Таблица 1

Исходная матрица эффективности

A i

П1

П2

П3

П4

П5

П6

A1

87

49

47

46

63

37

A2

45

64

71

50

65

53

A3

40

53

43

50

50

50

A 4

63

28

11

43

35

62

A5

67

33

59

55

48

48

A6

42

70

65

83

51

38

Дополним эту матрицу столбцами, характеризующими крайние настроения оптимизма и пессимизма ЛПР (табл. 2).

Таблица 2

Дополненная матрица эффективности

A i

П1

П2

П3

П4

П5

П6

min( a ij )

max( a ij )

A1

87

49

47

46

63

37

37

87

A2

45

64

71

50

65

53

45

71

A3

40

53

43

50

50

50

40

53

A4

63

28

11

43

35

62

11

63

A5

67

33

59

55

48

48

33

67

A6

42

70

65

83

51

38

38

83

64 в ыпуск 3/2020

Дабы исключить риск принятия неблагоприятного решения, в каждой строке значение крайнего оптимизма уменьшается на степень «осторожного» оптимизма и выбирается альтернатива с наибольшим значением разности.

В нашем примере это альтернатива (стратегия) A4 (табл. 3).

Таблица 3

Матрица эффективности со взвешенными альтернативами

A i

П1

П2

П3

П4

П5

П6

δ

( aij )

A1

87

49

47

46

63

37

50

A2

45

64

71

50

65

53

26

A3

40

53

43

50

50

50

13

A4

63

28

11

43

35

62

52

A 5

67

33

59

55

48

48

34

A6

42

70

65

83

51

38

45

Тем самым ЛПР, выбирая этот критерий, придерживается рационального (взвешенного) решения по отношению к предельно рискованному критерию максимакса.

Как показал статистический анализ, коэффициент взаимной корреляции нового критерия с критерием максимакса λ R-M = 0,42, что позволяет заполнить им «вакансию» между критериями Лапласа и максимакса на порядковой шкале, сформированной в [3]:

KW ^ KS ^ KL ^ KR ^ KM.                      (4)

С разработкой этого «критерия сбалансированного риска» указанная шкала приобрела признаки инструментария, способного реально управлять риском принимаемых решений (выбираемых стратегий).

Заключение

При всем разнообразии тезауруса теории «игры с природой» в части характеристики сомнений ЛПР в преддверии выбора стратегии им, по сути, взвешивается два риска: риск упущенных возможностей и риск потери ресурсов. Очевидно, что, меняя такие параметры выбора, как коэффициенты оптимизма/пессимизма комбинированных критериев, управлять риском непосредственно не удается, поскольку процесс выбора альтернатив остается ненаблюдаемым. Однако оценивать априорную рискованность того или иного критерия на порядковой шкале мы в состоянии и, следовательно, можем управлять вероятностью сбалансированного выбора в каждой конкретной ситуации принятия решения.

Автор благодарит профессора И.С. Клименко за полезное обсуждение и ценные замечания.

Список литературы О формировании нового критерия, ориентированного на выбор сбалансированных решений в "игре с природой"

  • Клименко И.С., Плуталов М.А. О парадоксальном результате применения критерия Гурвица для поиска взвешенных решений в "игре с природой" // Вестник Российского нового университета. Серия "Сложные системы: модели, анализ и управление". 2016. Вып 3. С. 24-29.
  • Клименко И.С., Плуталов М.А., Чеботарев Г.А. К вопросу об оценивании оптимизма критериев выбора стратегий в "игре с природой" // Вестник Российского нового университета. Серия "Сложные системы: модели, анализ и управление". 2015. Вып. 2. С. 19-23.
  • Клименко И.С., Плуталов М.А., Чеботарев Г.А. К формированию ранговой шкалы оптимизма критериев выбора решений в "игре с природой" // Вестник Российского нового университета. Серия "Сложные системы: модели, анализ и управление". 2016. Вып. 3. С. 19-23.
  • Клименко И.С., Плуталов М.А., Чеботарев Г.А. Сравнительный анализ критериев выбора стратегий в "игре с природой" // Вестник Российского нового университета. Серия "Сложные системы: модели, анализ и управление". 2015. Вып. 1. С. 57-61.
  • Лабскер Л.Г. К вопросу о проблеме сглаживания критерием Гурвица и экономическое приложение // Инновации и инвестиции. 2016. № 6. С. 134-145.
Еще
Статья научная