Механизм выбора решений, определенных по значениям функции полезности
Автор: Тагиев Таги Гарягди оглы, Меньшиков Вячеслав Иванович
Журнал: Вестник Мурманского государственного технического университета @vestnik-mstu
Рубрика: Эксплуатация водного транспорта
Статья в выпуске: 4 т.20, 2017 года.
Бесплатный доступ
Рассмотрено описание процесса выбора решения судовым специалистом по обеспечению безопасного плавания судна. Качество описания процесса определяется положительной скалярной величиной, выраженной с помощью моделей функции выигрыша. Проанализирована важность процесса выбора разумного решения, принятого при минимальных потерях или с минимальной вероятностью максимальных потерь. Показано, что умение анализировать выигрыши, определяющие последствия от принятого решения, и способность принять решения в условиях неопределенности являются основными требованиями для лица, принимающего решения. Составлены условия, обеспечивающие реализацию выбора оптимальных решений из множества допустимых решений по критерию минимальной вероятности появления больших потерь (отрицательного выигрыша). Описаны условия выполнения трех требований, необходимых и достаточных для того, чтобы функция выигрыша обладала определенными свойствами. Сделан вывод о том, что критерий выбора и реализации наименее опасного в смысле потери и оптимального решения будет существовать, если существуют функции, которые удовлетворяют определенным требованиям. Учитывая вероятность выбора судовым специалистом "неработающих" или даже "ошибочных" решений, можно оценивать качество выбора и реализации решений, привлекая для этого такое понятие, как "риск". Особенностью безопасного плавания является то, что большая часть принимаемых решений должна выбираться в реальном масштабе времени, но с анализом функции выигрыша, которая позволяет провести четкую границу между принимаемыми и реализуемыми, оправданными и неоправданными решениями.
Безопасность мореплавания, выбор решений, минимальная вероятность максимальных потерь, качество выбора
Короткий адрес: https://sciup.org/142212227
IDR: 142212227 | DOI: 10.21443/1560-9278-2017-20-4-691-696
Текст статьи Механизм выбора решений, определенных по значениям функции полезности
Процесс выбора разумного решения, принятого при минимальных потерях или с минимальной вероятностью максимальных потерь, является основой безопасного плавания судна в любых навигационных условиях. Умение анализировать выигрыши, определяющие последствия от принятого решения, является неотъемлемой частью искусства управления состоянием плавания для любого судового специалиста. Принятие решения в условиях неопределенности (без должного анализа функции выигрыша) является весьма противоречивым, приводящим порой к выбору или "неработающих", или даже "ошибочных" (безрассудных) решений [1]. Под функцией выигрыша далее в работе будем понимать отношение лица, принимающего решение (ЛПР), к результату от использования принятого решения (возможного выигрыша или проигрыша).
Главной особенностью безопасного плавания является то, что большая часть принимаемых решений выбирается в реальном масштабе времени, когда анализ функции выигрыша практически невозможен или существенно затруднен [2]. Однако именно такой анализ функции выигрыша позволяет провести четкую границу между оправданными и неоправданными решениями, а значит использовать те преимущества, которые функция выигрыша способна дать при предсказании результатов от реализуемого решения [3].
Целью данной работы является описание процесса выбора решений и соответствующих управлений состоянием плавания судна, использующего в качестве ориентира скалярную величину, определенную с помощью модели функции выигрыша.
Материалы и методы
Для реализации поставленной цели необходимо рассмотреть задачу синтеза функции выбора решения, качество которого определено скалярной величиной. Описание процесса выбора решений и соответствующих управлений состоянием плавания судна производится с использованием элементов теории линейных функционалов.
Результаты и обсуждение
Описание процесса выбора решения, качество которого определено скалярной величиной
Пусть далее Р(δ) – линейный функционал, определенный на множестве ∆ функций δ, a F(δ) – линейный вектор-функционал ограничений. В рамках принятых обозначений составим более простой вариант стереотипа принятия решения судовым специалистом, потребовав, чтобы функция δ'(x) удовлетворяла бы условию
P&) = max P (5)| f (S) >0 . (1)
δ ∈ ∆
Для решения этой задачи введем функционал Лагранжа
φ(δ, u) = P(δ) + (u, F(δ)), (2)
где и T = (и 1 , ..., и п ) ≥ 0 Т , n – мерный вектор вещественных чисел размерности вектора-функционала F(δ), 0 – вектор, состоящий из одних нулей, а (и, F) – скалярное произведение векторов и и F. По определению пара {δ c , u c } является седловой точкой функционала φ(δ, u) в области {δ ∈ ∆, u ≥ 0}, если
φ(δ, u c ) ≤ φ(δ c , u c ) ≤ φ(δ c , u) (3)
для всех δ ∈ ∆ и и ≥ 0.
Тогда необходимым и достаточным условием оптимальности решающей функции
δ'(х) = { δ′0 (х), ..., δ'M(x)} по критерию (1) можно считать такой вектор ис, при котором пара {δ', ис} является седловой точкой функционала φ(δ, u) в области {δ ∈ ∆, u ≥ 0}, и кроме того выполняется условие
(u c , F(δ')) = 0.
Для нахождения отдельной компоненты эффективной решающей функции во всех функционалах, фигурирующих в выражении (1), оставим только компоненты, связанные с функцией δ i (x) для некоторого значения i е [1, М]. Тогда придем к следующей задаче: найти функцию 5' = 5' ( х ), такую что
Р i ( δ i ∗ ) = max Р i (δ i ) | P* (δi) ≤ ai , (4)
где P i (δ i ) = P ii (δ) – вероятность принятия правильного решения γ i , относительно случайных величин i -го класса и определяемая при i = j ; P 0 T (δ) = { P 1 (δ i ), ..., Р м (δ i )} – вектор вероятностей принятия ошибочных решений γ i ; a 0 T i = { а i1 ,..., a iM } – соответствующие ограничения. Например, a ij могут быть ограничениями на вероятность ошибочного решения γ i относительно случайных величин j -го класса при i ≠ j .
Положим далее, что P (δ) = P i (δ i ), a F (δ) = a 0i – Р 0 (δ). В таком случае можно считать, что функция δ ∗ i будет решением (4) тогда и только тогда, когда существует вектор u i c , такой что пара { δ i ∗ , u i c } – седловая точка функционала
φ i (δ i , и i ) = P i (δ i ) + ( u i , a 0i – P 0 (δ i )) (5)
в области {δ i ∈ [0, 1], u i ≥ 0} и при этом выполняется условие
( u i c , a 0i – Р 0 ( δ ∗ i )) = 0. (6)
Если далее учитывать, что {δ i , u i c } – седловая точка функционала (5), то по определению (3) найдем
φ i (δ i , u i c ) ≤ φ i ( δ i ∗ , u i c ) ≤ φ i ( δ i ∗ , и i )
для всех δi ∈ [0, 1], ui ≥ 0. Тогда левое неравенство дает возможность записать выражение вида max φi(δi, uc) = φi(δ∗, uc).
δ i
Представим функционал φ i (δ i , u i c ) в скалярной форме так, что
φ i (δ i , u ic ) = (δ i , L i ) + ∑ M u ij a ij , (7)
i=1
где
(S i , L i ) = J 5 , ( x ) L i (x, u c ) dx
X N скалярное произведение функций δi(x), Li(x). Тогда отношение (7) эквивалентно следующему равенству:
ФК 5*, uC) = max{(Si, Li)} + £Xaip i = 1
где штрихом обозначено суммирование по i ≠ j .
Учитывая линейность функционала, подлежащего максимизации по δ i , видим, что максимальное значение выражения, стоящего в фигурных скобках, зависит от знака функционала L i ( x ) так, что если
L i ( x ) > 0, то δ i ∗ = 1, а если L i ( x ) < 0, то δ ∗ i = 0.
Если же L i (x) = 0, то соответствующее значение δ i ∗ произвольно. Поскольку х* – непрерывная случайная величина, то равенство L i (x) = 0 будет встречаться с минимальной вероятностью. Поэтому для случайных величин, попадающих на границу L i (x, u i c ) = 0, значение функции δ ∗ i (x) можно выбрать произвольным числом на отрезке [0, 1]. После того как найден вид функции δ i ∗ (x), условие (6) можно рассматривать как уравнение, позволяющее найти значения { uicj }.
Таким образом, для любого i ∈ [1, М] может существовать вектор u i c ≥ 0, причем такой, что седловая точка функционала (5) в области {δ i ∈ [0, 1], u i ≥ 0} позволяет определить функцию выбора δ i ∗ (x) следующим образом:
5 * ( x , u C )
1, если L i ( x , u C ) > 0,
0, если L i ( x , u C ) < 0,
где функция L i (x, u i c ) определяется соотношением
M
L(x, u i ) = f(x) - ^ ' u C f , ( x ), (9)
j=i а числа { uicj } такие, что
M
£4^ — P j [ 5 ’ (x, u i )] = 0. (10)
-
i , J = 1
С физической точки зрения величину L i (x, u i c ) в выражении (8) можно рассматривать как комбинацию ветвей функции выигрыша, и как следует из выражения (8), процесс принятия решения во многом зависит от знака L i (x, u i c ). Дело в том, что готовясь принимать решение, человек, как правило, оценивает ожидаемую величину "выигрыша" и естественно принимает такое решение, реализация которого дает положительный "выигрыш". В то же время нельзя исключать те случаи, когда "выигрыш" будет являться отрицательной величиной. Поэтому далее следует рассмотреть вариант выбора оптимальных решений по критерию минимума вероятности максимальных потерь [4].
Выбор оптимальных решений по критерию минимума вероятности максимальных потерь
Исходя из проблемы, возникающей при выборе и реализации решений с потерями при условии L i (x, u i c ) < 0, целесообразно использование критерия выбора, который обеспечивал бы уменьшение вероятности возникновения больших потерь. В рамках данного подхода ниже дается решение задачи по выбору решения для случая, когда ЛПР должен делать выбор из допустимого множества таких решений, заданного так
U = (l i1 , p i1 ; ...; l ij p ij ; ...), i = 1, 2, ..., n, (11)
где li j – величина потерь, возникающих при j-м выборе решения u i ∈ U; p ij p ij – вероятность j-го исхода альтернативного решения u i .
Наиболее полную информацию относительно вероятности возникновения больших потерь при выборе и реализации решений может содержать функция вида [4; 5]:
pi(l) = P(ξi ≥ l), где ξi – вероятностная переменная, выражающая величину потерь в случае реализации допустимого решения ui ∈ U; l – значение величины потерь, определенное, например, следующим образом.
Уменьшение вероятностей возникновения больших потерь можно осуществить в том случае, если ЛПР выбирает такое решение u i ∈ U из (1), при котором было бы истинно следующее высказывание:
∀ l ∈ L p(l) = min p i (l), (12)
где L – область интересующих ЛПР значений потерь l.
Для реализации критерия (12) предположим, что вероятностные переменные, выражающие величину потерь в случае выбора и реализации решения u i ∈ U, соответствуют следующим высказываниям:
∀ i, j ∈ I (D 1 (i, j) ∨ D 2 (i, j) ∨ D 3 (i, j)), (13)
где
D 1 (i, j): ∀ l ∈ L имеет место p i (l) ≥ p j (l);
D 2 (i, j): ∀ l ∈ L имеет место p i (l) ≤ p j (l);
D 3 (i, j): ∀ l ∈ L имеет место p i (l) = p j (l).
Тогда при выполнении условий (13) критерий (12) может быть преобразован так
∀ l ∈ L p0(l) = min pi(l),(14)
а выбранное и реализованное ЛПР решение u i ∈ U будет являться оптимальным.
Помимо требований, накладываемых на функцию p i (l) и необходимых для реализации критерия (14), эта функция также должна отвечать условиям, вытекающим из ее определения, а именно
0 ≤ pi(l) ≤ 1(15)
и если l A > l B , то
p(lA) ≤ p(lB).(16)
Следовательно, критерий выбора и реализации наименее опасного в смысле потери и оптимального решения u i ∈ U вида (14) будет существовать, если существуют функции p i (l), которые удовлетворяют требованиям (13), (15) и (16). Тогда сформулируем условия, при которых возможно существование функции p i (l).
Исходя из достаточно общих соображений функции p i (l) = π(l, h i ), где h i – величина параметра h, она должна подчиняться следующим требованиям. Функции p i (l) должны принадлежать такому классу G определенных на оси l функций π(l, h) с параметром h, при котором истинна дизъюнкция вида
F1(π) ∨ F2(π), где
F 1 (π): если h a > h b , то ∀ l ∈ L π(l, h a ) ≥ π(l, h b );
F 2 (π): если h a > h b , то ∀ l ∈ L π(l, h a ) ≤ π(l, h b ).
Кроме того, функции из класса G должны быть определены на интервале 0 ≤ π(l, h) ≤ 1 так, чтобы при l a > l b выполнялись условия
π(l a , h) ≤ π(l b , h);
∀ l ∈ L π(l, hi) – pi(l) = min [π(l, h) – pi(l)], h ∈ Hi если Hi:{h|" l ∈ L π(l, h) ≥ pi(l)}.
Выполнение первого требования является необходимым и достаточным условием истинности высказывания (13). Выполнение второго и третьего требований необходимо и достаточно для того, чтобы функция p i (l) обладала свойствами (15) и (16). При формулировке последнего требования было принято во внимание условие, обозначенное в (13). В таком случае, учитывая вероятность выбора судовым специалистом "неработающих" решений или даже "ошибочных" (безрассудных) решений, можно оценивать качество выбора и реализации решений δ i ∗ (x, u i с ), привлекая для этого такое понятие, как "риск" с мерой, равной произведению
R = Li(x, uic )ω, где Li(x, uic ) – затраты, направляемые на компенсацию последствий от использования "ошибочных" или "неработающих решений", а ω – частота (вероятность) выбора таких решений, найденная по известной функции готовности судового специалиста к принятию работающих решений [1].
Заключение
Методы комплексного анализа и прогноза развития обстановки нуждаются в совершенствовании путем идентификации моделей динамики развития ситуаций, перерастания их в опасные и критические ситуации [6]. Критерием оптимальности судовождения, как и мореплавания в целом, является безопасность, которая обеспечивается точностью различных измерений навигационных параметров, проводимых с целью решения задач судовождения [7]. Главной особенностью безопасного плавания является то, что большая часть принимаемых решений должна выбираться в реальном масштабе времени, но с анализом функции выигрыша, которая позволяет провести четкую границу между принимаемыми и реализуемыми, оправданными и неоправданными решениями. При выборе и реализации решений без потерь ЛПР необходимо ориентироваться на величины "выигрышей". При этом величину "выигрыша" можно рассматривать как комбинацию ветвей функции полезности, соответствующих принимаемым решениям и реализуемым в управлении состоянием плавания судна. В то же время при выборе и реализации решений с потерями целесообразно использование критерия выбора, который обеспечивал бы уменьшение вероятности возникновения больших потерь.