Оптимальное проектирование в условиях неопределенности. Метод детерминизации
Автор: Левин В.И.
Журнал: Онтология проектирования @ontology-of-designing
Статья в выпуске: 3 (9) т.3, 2013 года.
Бесплатный доступ
Рассмотрены существующие подходы к оптимизации систем (оптимальному проектированию) в усло-виях неопределенности. Дана точная постановка задачи условной оптимизации в случае интервальной неопределенности параметров целевой функции и ограничений. В связи с этим изложена математи-ческая теория сравнения интервалов, включающая точное определение максимального и минимального интервалов. На ее основе сформулирован и обоснован метод детерминизации, позволяющий решить задачу путем cведения к двум полностью определенным задачам оптимизации того же типа.
Неопределенность, оптимизация при интервальной неопределенности, метод детерминизации
Короткий адрес: https://sciup.org/170178663
IDR: 170178663
Текст научной статьи Оптимальное проектирование в условиях неопределенности. Метод детерминизации
Задачи оптимизации имеют огромное прикладное значение: на их основе строятся методы оптимального проектирования разнообразных систем - технических, экономических, социальных и т.д., обеспечивающие достижение наилучшего, в определенном смысле, результата работы создаваемой системы. В связи с этим к настоящему времени уже создано огромное число методов решения задач оптимизации, как универсальных, рассчитанных на применение к задачам различных классов, так и специализированных, позволяющих эффективно решать лишь отдельные узкие классы задач [1-6]. Однако при всем различии существующих методов, они все обладают общим свойством - применимостью только к тем задачам оптимизации, в которых оптимизируемая функция известна точно (детерминирована). Между тем, встречающиеся на практике задачи оптимизации и оптимального проектирования таковы, что их оптимизируемые функции обычно известны не точно, а с той или иной степенью неопределенности (не-детерминированы). Это вызвано тем, что:
-
1) реальным процессам свойственна естественная неопределенность;
-
2) параметры большинства систем из-за погрешности их вычислений или измерений известны неточно;
-
3) параметры многих систем изменяются во времени.
В связи с этим, возникает проблема оптимизации не полностью определенных (недетерминированных) функций. Данная проблема достаточно сложна, по сравнению с традиционной оптимизацией полностью определенных (детерминированных) функций, поскольку для нее дополнительно необходимо:
-
1) обобщить понятие экстремума функции;
-
2) выяснить условия существования экстремума функции, связанные с её недетерминированностью;
-
3) разработать специальные методы поиска экстремума таких функций.
Реально эта проблема еще сложнее, поскольку имеющаяся информация об оптимизируемой функции может быть не только не полностью определенной, но и неоднозначной, неточной, противоречивой и т.д. В такой ситуации некоторые авторы считают, что модели для описания сложных систем могут быть смысловыми, носящими содержательно-описательный, словесный характер. Такой взгляд представляется не вполне логичным. Действительно, математика, как известно, строится как полностью определенная, однозначная, точная и непротиворечивая наука. Поэтому правильное применение математики к описанию сложных систем - неопределенных, неоднозначных, неточных противоречивых и т.д. - вполне может давать адекватные математические модели этих систем, лишенные неопределенности, неоднозначности, неточности и противоречивости. Для этого требуется всего лишь подобрать математический аппарат, который позволяет оперировать с неопределенностью и другими НЕ-свойствами исследуемой сложной системы так же точно и однозначно, как классическая математика оперирует с полностью определенными системами.
Есть различные подходы к нахождению оптимума не полностью определенных (недетерминированных) функций, различающиеся достоинствами и недостатками [7]. Первый подход - детерминированный – заключается в решении задачи оптимизации для определенных значений или сочетаний значений параметров оптимизируемой функции, взятых внутри заданных областей их неопределенности [7]. Так, можно взять наихудшее сочетание значений параметров внутри областей неопределенности (пессимистический подход) [7-10], их наилучшее сочетание (оптимистический подход) [11], центры областей неопределенности параметров (центральный подход) [12] и др. Основное достоинство подхода - простота интерпретации полученного решения, основной недостаток - слабо мотивированная ориентировка на какое-то одно значение (сочетание значений) параметров, которое на практике реализуется очень редко, что может обернуться неоправданной сложностью решения. Второй подход - вероятностный - состоит в решении задачи оптимизации для усредненных (ожидаемых, в смысле математического ожидания) значений параметров оптимизируемой функции или для таких значений параметров, которые обеспечивают достаточно высокую вероятность получения оптимума [13-16]. Этот подход предполагает задание вероятностных распределений указанных параметров внутри областей их неопределенности. Основное достоинство этого подхода - ориентировка получаемого решения хотя и на одно, но зато наиболее часто встречающееся (наиболее подходящее для получения оптимума) значение (сочетание значений) параметров функции, недостаток - необходимость знания вероятностных распределений параметров, что часто невозможно. Третий подход - нечеткий - идейно близок второму, но вместо вероятностных распределений параметров оптимизируемой не полностью определенной функции, являющихся объективными характеристиками, используются нечеткие распределения параметров, получаемые экспертным путем, т.е. субъективно [12].
В наших работах [17–24] был предложен и детально описан применительно к различным оптимизационным задачам детерминизационный подход к поиску оптимума не полностью определенных функций. Этот подход принципиально отличается от трех предыдущих тем, что оптимизация не полностью определенной функции проводится с учетом всего множества возможных значений недетерминированных параметров функции.
Указанный подход позволяет для любой функции, неопределенность которой заключается в том, что ее параметры известны нам лишь с точностью до интервалов возможных значений, свести нахождение оптимума такого типа функции к нахождению одноименных оптиму-мов двух полностью определенных функций. Таким образом, для нахождения оптимума не полностью определенных функций становится возможным применять многочисленные хорошо известные и эффективно работающие методы точного нахождения оптимума полностью определенных (детерминированных) функций. При этом собственно алгоритм нахождения оптимума не полностью определенной (недетерминированной) функции оказывается полностью определенным, однозначным, точным и непротиворечивым. Другой причиной выбора неопределенности именно интервального типа было то, что интервальные оценки неизвестных параметров систем наиболее просты и доступны для получения. В этом заключаются основные достоинства предложенного нами подхода к оптимизации не полностью определенных функций - мето- да детерминизации. Разумеется, у нашего метода есть и другие достоинства, а также и недостатки. Они подробно рассмотрены в п. 6.
В настоящей работе детерминизационный подход к оптимизации не полностью определенных функций излагается и обосновывается в наиболее общем виде, не зависящем от особенностей оптимизируемых функций.
1 Постановка задачи
Будем рассматривать следующую ситуацию. Пусть, существует некоторая произвольная непрерывная функция n переменных y = F(xiv, xn ),(1)
причем все параметры (коэффициенты) ее явного представления известны точно и пусть она определена в области, определяемой системой огранич ен ий
Фi (x1,..., Xn) < bi, i = 1, m }.(2)
Тогда относительно функции (1) можно сформулировать полностью определенную (детерминированную) задачу условной оптимизации
F(x 1,..., xn) = max, при Фi (x1,..., xn) < b, i = 1, m }.(3)
Конечно, возможен и вариант задачи (3), где необходимо не максимизировать, а минимизировать функцию F . В современном математическом программировании есть множест во методов эффективного решения задач (3), ориентирующихся на тип функций F и Ф i , i = 1, m .
Пусть теперь параметры p k , к = 1, l явного представления функции F известны не точно, а с точностью до интервалов возможных значений, т.е. имеют вид интервалов ~ k = [ p k 1 , p k 2]. Далее, пусть аналогичным образом неточно заданы параметры q s явного представления функций Ф i в левых частях ограничений задачи, а также и параметры b i в правых частях ограничений, т.е. qsi = [ qsi1,qsi 2], s = 1, t , b i = [ bn,b i 2], i = 1, m . Тогда функции F и Ф i , i = 1, m , также становятся интервальными (т.е. принимающими вид интервалов F и Ф i , i = 1, m ), определяемыми с точностью до интервалов возможных значений, равно как и параметры b i , i = 1, m (т.е. принимающие вид интервалов b i , i = 1, m ). В итоге полностью определенная задача условной оптимизации (3) переходит в не полностью определенную - интервальную задачу
F ( x 1 ,..., x n ) = max, при Ф( x 1 ,..., x n ) < b i , i = 1, m } . (4)
Конечно, возможен вариант задачи (4), где требуется не максимизировать, а минимизировать функцию F . Необходимо разработать методику решения оптимизационной задачи (4).
2 Математика сравнения интервалов
Рассмотрим два интервала ~ = [a1,а2] и b = [b1,b2]. Попытаемся сравнить эти интервалы по величине, рассматривая их как интервальные числа. Первое, что приходит в голову, - сравнить интервалы ~ и b на основе отношений в отдельных парах вещественных чисел (ai, bj ) , где ai g ~, bj g b . Но такой подход сразу ведет к провалу, поскольку в общем случае, при произвольных интервалах ~ и b , одни пары чисел (ai, bj ) будут находиться в отношении ai > bj , а другие - в противоположном отношении: ai < bj . Поэтому единственное, что остается, - реа- лизовать сравнение интервалов на теоретико-множественном уровне, рассматривая их как целое, не подлежащее дроблению на части. Этот путь был реализован автором в 1990-е годы. Ниже приводится краткое изложение полученных результатов [25–28].
Итак, в соответствии с полученными только что выводами, операции взятия максимума v и минимума л двух произвольных интервалов ~ = [ а 1 , a 2 ] и b = [ b 1 , b 2 ] введем в виде следующих теоретико-множественных конструкций ~ ~ ~ )
a v b = { a v b | a g a , b g b }, a л b = { a л b | a g a , b g b }. (5)
Взятие максимума (минимума) двух интервалов а и b определяется по формулам (5) как нахождение максимума (минимума) двух точечных величин a и b , при условии, что эти величины пробегают все возможные значения соответственно из интервалов ~ и b . Теперь для того чтобы интервалы а и b можно было сравнить по величине, установив отношение а > b или ~ < b , необходимо, во-первых, чтобы введенные операции v , л над этими интервалами существовали, во-вторых, чтобы эти операции давали в результате один из операндов - ~ или b , и в-третьих, чтобы эти две операции были согласованы, в том смысле, что если большим (меньшим) является один из интервалов, то меньшим (большим) является другой из них. Сформулированное условие сравнимости двух интервалов по величине является, очевидно, не только необходимым, но и достаточным.
К счастью, нетрудно доказать, что условие согласованности операций v и л над интервалами выполняется всегда, т.е. для любой пары интервалов (~, b ) . Очевидно также, что всегда выполняется условие существования введенных операций вычисления максимума v и минимума л двух интервалов a -, b , причем результатом операции оказывается некоторый, вообще говоря, новый интервал, который может отличаться как от ~ ,так и от b . Таким образом, необходимым и достаточным условием сравнимости интервалов a ) и b является условие, по которому операции a v b и а л b должны иметь результатом один из интервалов - ~ или b . Последняя формулировка условия сравнимости интервалов открывает возможность получения его в конструктивной форме, пригодной для практического применения. Основной результат здесь формулируется следующим образом.
Теорема 1. Для того чтобы два интервала а = [a1, a2 ] и b = [b1, b2 ] были сравнимы по величине (отношению >) и находились в отношении а > b , необходимо и достаточно, чтобы границы этих интервалов подчинялись условиям а 1 > ^ а2 > b2, (6)
а для того чтобы они были сравнимы по величине (отношению <) и находились в отношении a) < b) , необходимо и достаточно, чтобы выполнялись условия а1 < bl, а 2< b2- (7)
Эта теорема показывает, что интервалы ~ и b являются сравнимыми по отношению > или < (и находятся именно в этом отношении) только в том случае, когда в таком же отношении находятся их одноименные границы a 1 , b 1 и а 2, b 2. Иными словами, интервалы а и b находятся в отношении a ) > b ) только тогда, когда a ) сдвинут обеими границами вправо относительно b и находятся в противоположном отношении a ) < b только тогда, когда интервал a ) сдвинут обеими границами влево относительно b .
Значение теоремы 1 заключается в том, что она сводит сравнение двух интервалов и выбор большего (меньшего) из них к сравнению одноименных границ этих интервалов, являющихся вещественными числами. Так разрешается проблема сравнения интервалов.
Теорема 2. Для того чтобы два интервала ~ = [ а 1 , а 2] и b = [ b 1 , b 2] были не сравнимы по величине (по отношению > и < ), т.е. не находились в отношении ~ > b или ~ < b , необходимо и достаточно, чтобы выполнялись условия
( а 1 < b 1 , а 2 > b 2) или ( b 1 < а 1 , b 2 > а 2). (8)
Эта теорема показывает, что интервалы ~ и b не сравнимы по отношениям > и < только в том случае, когда один из них полностью «накрывает» другой. Значение теоремы 2 заключается в том, что она показывает существование определенных случаев несравнимости интервалов по отношениям > и < , в отличие от вещественных чисел, которые всегда сравнимы по указанным отношениям. Несравнимость некоторых интервалов есть естественный результат того, что интервальные числа, в отличие от обычных вещественных чисел, задаются не точно, а с неопределенностью (число принимает некоторое значение в заданном интервале, но не уточняется, какое именно это значение). На основании теорем 1, 2 можно доказать следующие положения.
Теорема 3. Для того чтобы в системе интервалов ~(1) = [а 1(1),а2(1)], ~(2) = [а1(2),а2(2)],... существовал максимальный интервал (который находится со всеми остальными интервалами в отношении >), необходимо и достаточно, чтобы границы этого интервала были расположены относительно одноименных границ всех остальных интервалов согласно условиям а1(1) > а1(2), а1(1) > а1(3),... 1
а 2 (1) > а 2 (2), а 2(1) > а 2(3),... J ‘
Конкретные условия (9) даны для случая, когда максимальным является интервал ~(1) , что, очевидно, не ограничивает общности.
Теорема 4. Для того чтобы в системе интервалов ~(1) = [а1(1),а2(1)], ~(2) = [а1(2),а2(2)],... существовал минимальный интервал (который находится со всеми остальными интервалами в отношении < ), необходимо и достаточно, чтобы границы этого интервала были расположены относительно одноименных границ всех остальных интервалов согласно условиям а1(1) < а1(2), а1(1) < а1(3),... 1
а 2 (1) < а 2 (2), а 2 (1) < а 2 (3),... / '
Аналогично теореме 3 условия (10) записаны для случая, когда минимальным является интервал а ~ (1) , что не ограничивает общности.
Теоремы 3 и 4 показывают, что интервал является максимальным (минимальным) в системе интервалов только в том случае, когда максимальны (минимальны) его нижняя граница - среди нижних границ всех интервалов - и верхняя граница - среди верхних границ всех интервалов.
3 Идея решения
В интервальной задаче (4) целевая функция F ( X 1 ,...,x n ) , функции Ф i ( X 1 ,..., x n ), i = 1, n , в левых частях ограничений и параметры b i , i = 1, m , в их правых частях являются интервальными и поэтому могут быть записаны в виде интервалов
F ( Х 1 ,..., X n ) = [ F 1 (X 1 ,...,X n ), F 2 ( X 1 ,...,X n )], _
Ф i ( X 1 ,..., X n ) = [Ф i 1 ( X 1 ,..., X n ),Ф i 2 ( X 1 ,..., X n )], i = 1, m , (11)
b = [ b i 1 , b i 2] , i = 1» m .
После соответствующих замен сформулированную ранее задачу (4) можно переписать в явном интервальном виде
[ F 1 ( % ! ,..., X n ), F 2 ( x 1 ,..., X n )] = max, ____
[Ф i! (xlv.., xn X Ф i 2( x!,..., xn )] < [ bi1, bi 2], i = 1, m, который поддается решению. Действительно, согласно теореме 3 интервальное уравнение в (12) можно записать в виде эквивалентной пары обычных (детерминированных) уравнений
F 1 ( x 1 ,..., x n ) = max, F 2( x 1 ,..., x n ) = max. (13)
Далее, согласно приведенному выше утверждению теоремы 1 систему интервальных неравенств в условии оптимизационной задачи (12) можно записать в виде эквивалентной системы обычных (детерминированных) неравенств
Ф i 1( x1,..., x n ) < b i 1? Ф i 2( Xt,..., x n ) < b i 2 , i = 1, m . (14)
Соединяя пару уравнений оптимизации (13) с системой неравенств-ограничений (14) получим 2 детерминированные (полностью определенные) задачи условной оптимизации вида (3), при этом первую из новых задач назовем нижней граничной задачей исходной интервальной задачи (4), а вторую - ее верхней граничной задачей:
F 1( X 1
x n ) = max,
Фn( x ^..., X n ) < b i 1 , i = 1, m , >
ФД x 1 ,..., x n ) < b i -2 , i = 1, m ,
- , x Ф11( X i ,-, x „) < bi i, i = 1, m ,
F 2 ( x , ,..., x n ) = max, 11 1 n 1 1 ---- ^ (16)
Ф 12 ( x 1 ,..., x n ) < b i 2 , i = 1, m.
Из выполненного нами построения следует, что пара детерминированных задач условной оптимизации (15), (16), рассматриваемых в совокупности, эквивалентна исходной интервальной задаче (4). Таким образом, для получения решения интервальной задачи (4) надо решить ее нижнюю (15) и верхнюю (16) граничные задачи. В общем случае решения нижней и верхней граничных задач имеют вид { M н( x ), F 1>max} , { M в( x ), F 2 , max}, где M н( x ), M в ( x ) - множества точек решений x = ( x 1 ,..., x n ) нижней и верхней граничной задачи, F 1max, F 2max - максимальные значения целевых функций этих задач. Решение x * , Fmax интервальной задачи (4) составляется из решений ее нижней и верхней граничных задач в виде
{ x * Е M н ( x ) П M в ( x ), F max = [ F>„ , F u»,. ]}- (17)
В качестве точки решения x * в (17) берется любая точка из пересечения множеств точек решения нижней и верхней граничных задач, а в качестве максимального значения целевой функции F max - интервал от максимального значения целевой функции нижней граничной задачи F 1 max до максимального значения целевой функции верхней граничной задачи F 2 max.
Из изложенного хорошо видно, что основное преимущество нашего подхода к решению интервальной задачи условной оптимизации заключается в возможности использования для этого традиционных, хорошо разработанных методов решения детерминированных задач условной оптимизации. Основанный на этом подходе метод решения интервальной задачи условной оптимизации естественно назвать методом детерминизации, поскольку он сводит решение недетерминированной задачи (4) к решению двух детерминированных задач (15) и (16).
4 Алгоритм решения
Для решения интервальной задачи условной оптимизации (4) методом детерминизации необходимо действовать по следующему алгоритму.
Шаг 1. Используя формулы интервальной математики, выражающие результаты элементарных преобразований интервалов [18]
[ a 1 , a 2 ] + [ b i ,b 2 ] = [ a 1 + b i , a 2 + b 2 ]; [ a i , a 2 ] - [ b i , b 2 ] = [ a 1 - b 2 , a 2 - b i ];
k [ a 1 , a 2]
= <
[ ka 1 ,ka 2], k > 0, [ ka 2, ka 1 ], k < 0;
[ a i , a 2] " [ b i , b 2] = [ min( a i ■ b j ),max( a i ■ b j )]; i , j i , j
[ a 1 , a 2 ]/[ b i , b 2 ] = [ a 1 , a 2 ] ■ [1/ b 2 ,1/ b i ],
~ ~ представляем целевую функцию F и функции ограничений Ф i задачи (4) в интервальной фор ме. Так же представляем параметры bi в ограничениях. Полученные выражения имеют вид (11).
Шаг 2. Используя интервальные представления целевой функции, функции ограничений и параметров, полученные на шаге 1, формируем нижнюю (15) и верхнюю (16) граничные задачи интервальной задачи условной оптимизации (4).
Шаг 3. Используя подходящие методы решения детерминированных задач условной оптимизации, получаем решения нижней {Mн (x), F1 max } и верхней {Mв (x), F2 max} граничных задач. Здесь Mн(x) - множество точек решения x = (xx,...xn) нижней граничной задачи, где ее целевая функция F1 достигает максимума F1max, а Mв(x) - множество точек x = (x1,...,xn) решения верхней граничной задачи, в которых целевая функция F2 достигает максимума F2,max .
Шаг 4. Выбирая в качестве точки решения задачи (4) любую точку x * из пересечения множеств Mн (x) и Mв (x) и беря в качестве нижней границы максимума Fmax интервальной целевой функции F задачи (4) максимум F1 max целевой функции нижней граничной задачи, а в ка честве верхней границы Fmax интервальной целевой функции F задачи (4) - максимум F2 max целевой функции верхней граничной задачи, получаем все решение задачи (4) в виде (17).
Пример (интервальная задача о назначениях). Есть 3 работы и 3 исполнителя - кандидата на работы. Заданы издержки aj = [a1zj, a2j ] выполнения j -й работы i -м исполнителем (i, j = 1,3), представляющие собой интервальные величины и составляющие интервальную матрицу издержек A=||aj-||=||[a1,j,a2,j]| =[A1,A2], где A1 = ||a1,j || и A2 = ||a2,у|| есть нижняя и верхняя граничные матрицы издержек. Надо распределить работы так, чтобы каждый исполнитель был занят выполнением ровно одной работы, а суммарные издержки на все работы были минимальны.
Введем множество неизвестных булевых матриц назначений X=||xj||,xj е{0,1}, где xj = 1, если i -й исполнитель выполняет j -ю работу, и xj = 0 в противном случае. Тогда имеем
3 3 3 ___ 3 ___
~
F(xj) =EEaijxij = min, при ф1(xy)-Exy = 1 j=1,3 Ф2(xj)=Sxj = 1 i=1,3‘ i=1 j=1 i=1 j=1
Эта задача представляет собой частный случай общей интервальной задачи (4). Поэтому для ее решения мы можем применить 4-шаговый алгоритм, описанный выше.
Шаг 1. С помощью формул (18) представляем целевую функцию F нашей оптимизационной задачи в интервальной форме
F ( x ij ) -
EE a iij x ij . i = 1 j = 1
EE a 2ij x ij i = 1 j = 1
~ ~
Представлять в интервальной форме функции Ф1(xj), Ф 2(xj) ограничений задачи, равно как и параметры в их правых частях не нужно, т.к. здесь нет интервальных параметров.
Шаг 2. Используя полученные на шаге 1 представления, формируем нижнюю F 1 и верхнюю F 2 граничные задачи решаемой интервальной задачи
3 3 3 ___ 3 ___
Fi(xiy)=EEanyxy = min, при Exy = 1 j=1,3 Exy = 1
i=1 У =1 i=1
3 3 3 ___ 3 ___
F 2( x iy ) = EE a 2, y x y = min, пРи E x iy = 1 j = 1,3 E x y = 1 i = 1,3
i=1 У=1 i=1
Шаг 3. Решаем нижнюю и верхнюю граничные задачи интервальной задачи, полученные только что на шаге 2 алгоритма. Для определенности принимаем следующее конкретное значение интервальной матрицы издержек
A = [Д, A 2 ], где A 1 =| a у|
1 2 2
1 2 2
A 2 =| l a 2, i/|
2 3 3
4 4 3
3 4 4
Имеется всего шесть различных значений матриц неизвестных X = x iy , удовлетворяющих ограничениям решаемой задачи. Поэтому в данном случае решение легко находится перебором на множестве этих матриц. В результате получаем решение нижней граничной задачи в виде { M н ( x ), F 1min}, где множество решений M н
M н ( X ) = ^ X , Q =
1 0 0
0 1 0
0 0 1
, X 1 ь =
X 1 с =
X 1 d =
а достигнутое минимальное значение целевой функции F min = 5. Далее, совершенно аналогично получаем решение верхней граничной задачи { M в ( x ), F 1min }. Именно, множество решений
1 0 0
X 2 b =
1 0 0
Mв (x) -]X2a = 0 0 0, а соответствующее достигнутое минимальное значение целевой функции верхней граничной задачи для исходной задачи составляет F2 min = 9.
Шаг 4. Находим пересечение множеств решений нижней граничной M н ( x ) и верхней граничной M в ( x ) задач. Оно состоит из одной матрицы назначений
X *
= X 1 b
= X 2 Q =
1 0 0
0 0 1
которая и есть решение всей задачи. Достигнутый на этом решении минимум заданной интервальной целевой функции составляет F min = [ F 1, min, F 2min ] = [5,9].
Оптимальное решение поставленной задачи о назначении 3 исполнителей на 3 работы таково: 1-й исполнитель назначается на 1 работу, 2-й - на 3 работу, а 3-й - на 2 работу. При этом издержки оцениваются минимальным интервалом возможных значений, равным [5, 9] .
Другие примеры решения оптимизационных задач с интервальными параметрами с использованием изложенного алгоритма даны в [7–9, 15, 19].
5 Сравнение предлагаемого подхода с существующими
Как уже говорилось во введении, проблема оптимизации не полностью определенных функций, по сравнению с традиционной оптимизацией полностью определенных функций, требует дополнительно:
-
1) обобщения понятия экстремума функции;
-
2) выяснения условий существования экстремума функций, связанных с ее неполной определенностью;
-
3) разработки специальных методов поиска экстремума таких функций.
Именно по этой схеме разработан предлагаемый в статье детерминизационный подход к оптимизации. Конкретно, обобщение понятия экстремума функции на случай не полностью определенных (интервальных) функций дано в п. 2 (формулы (5)). Далее, условия существования (не существования) экстремума интервальной функции даны в теоремах 1-4 того же п. 2. И, наконец, специальный метод поиска экстремума интервальной функции разработан в п. 4. Необходимость проведения всей этой работы представляется очевидной. Действительно, оптимизация полностью определенных функций основана на сравнении вещественных чисел, с выделением большего и меньшего из них, причем на числовой оси большее число сдвинуто вправо относительно меньшего. Однако, для оптимизации не полностью определенных функций такой подход не работает, поскольку не полностью определенные числа (например, интервальные), в отличие от вещественных, в общем случае не находятся в отношении «сдвинуто вправо (влево) на вещественной оси» и потому не могут сравниваться непосредственно, с выделением большего и меньшего. Вследствие этого для таких функций и приходится обобщать понятие экстремума. Далее, неполнота информации, которой характеризуются не полностью определенные числа и функции, при достижении определенного уровня может привести к несравнимости таких чисел и невозможности выделить из них большее и меньшее и, как следствие, - к отсутствию экстремума таких функций. В связи с этим и возникает необходимость нахождения условий существования экстремума не полностью определенных функций. Наконец, вследствие иного, более общего, чем для полностью определенных функций, понятия экстремума не полностью определенной функции и возможности не существования этого экстремума, вызванной неполнотой информации, приходится разрабатывать специальные методы отыскания экстремума таких функций. Важно понимать, что невозможность в определенных случаях найти экстремум не полностью определенной функции с помощью предложенного в статье алгоритма не связана с качеством алгоритма, а является следствием объективной реальности, а именно, отсутствия экстремума вследствие недостатка информации о функции.
Охарактеризуем теперь другие существующие подходы к оптимизации не полностью определенных функций. Кратко об основных достоинствах и недостатках этих подходов уже говорилось во введении. Рассмотрим вопрос подробнее. Начнем с детерминированного подхода. При этом подходе исходная задача оптимизации не полностью определенной функции фактически заменяется другой задачей - оптимизации полностью определенной функции. Причем конструирование этой новой задачи путем выбора определенных значений параметров внутри областей неопределенности параметров функции исходной задачи производится на основе чисто эвристических соображений и не опирается ни на какие математически ясные обобщения понятия экстремума на случай не полностью определенных функций. Вследствие этого новая задача оказывается, как правило, математически неэквивалентной исходной задаче, а интерпретация ее решения в терминах исходной задачи - проблематичной. Кроме того, из-за сложности некоторых критериев оптимизации, используемых в новой задаче (maxmin, minmax), трудоемкость алгоритмов поиска экстремума не полностью определенных функций при детерминированном подходе может оказаться высокой. Зато при этом подходе обычно не возникает проблемы выяснения условий существования экстремума функций, т.к. полностью определенные функции практически всегда имеют экстремум.
Теперь о вероятностном подходе. При первом варианте данного подхода исходная задача оптимизации не полностью определенной функции заменяется, как и в случае детерминированного подхода, другой задачей - оптимизации полностью определенной функции, которая теперь получается из исходной функции путем замены ее случайных параметров их математическими ожиданиями (центрами). Сразу ясно, что эта новая задача неэквивалентна исходной задаче в еще большей степени, чем при детерминированном подходе. Поскольку она, не опираясь ни на какие обобщения понятия экстремума для не полностью определенных функций, не учитывает не только неопределенность возможных значений параметров указанной функции, но и случайный характер реализации конкретных значений параметров функции на практике. Во втором варианте вероятностного подхода исходная задача оптимизации не полностью определенной функции с интервальными параметрами заменяется задачей оптимизации не полностью определенной функции со случайными параметрами. Последние получаются из интервальных параметров исходной задачи принятием гипотезы о равномерном распределении значений параметров внутри своих интервалов. Принятие указанной гипотезы сразу упрощает выбор экстремального интервала. Так, для выбора большего из двух интервалов ~ и b достаточно лишь вычислить вероятности P(a > b) и P(b > ~) и взять тот интервал, для которого вероятность превышения им второго интервала больше. Этот подход гарантирует существование решения, полученного с помощью гипотезы модельной задачи оптимизации функции со случайными параметрами. Но беда заключается в том, что модельная задача неэквивалентна исходной задаче оптимизации функции с интервальными параметрами, так как одно лишь задание неопределенности функции в форме интервалов возможных значений ее параметров не предполагает задания какой-то дополнительной информации, например, в виде вероятностных распределений внутри интервалов. Все, что ранее было сказано о вероятностном подходе, можно повторить для нечеткого подхода, с заменой термина «вероятностное распределение параметров не полностью определенной функции» термином «нечеткое распределение» параметров.
На практике для решения разнообразных задач оптимизации не полностью определенных функций, в зависимости от условий, могут применяться различные подходы. В общем случае рекомендуется начинать с детерминизационного подхода, поскольку он базируется на точном определении понятия максимума и минимума неопределенного числа (интервала), что упрощает интерпретацию полученного решения и делает его более прозрачным. Если детерминизационный подход не приводит к решению, вследствие недостаточной информации об оптимизируемой функции, целесообразно эту информацию пополнить путем сужения интервалов возможных значений параметров этой функции с помощью дополнительных измерений, наблюдений, привлечения более квалифицированных экспертов, после чего снова применить данный подход. Если и это не помогло получить решение, рекомендуется перейти к использованию остальных подходов. В первую очередь, целесообразно попытаться применить вероятностный подход, который достаточно прост в реализации. При этом надо иметь в виду, что используемые в этом подходе вероятностные распределения параметров оптимизируемой не полностью определенной функции должны быть известны с достаточной точностью, так как в противном случае найденное предположительно оптимальное значение функции может оказаться далеким от настоящего оптимума. Надо еще учитывать, что при вероятностном подходе получение оптимума функции вообще строго не гарантируется, а лишь «обещается» с определенной вероятностью, притом не обязательно близкой к единице, что не всегда приемлемо. Поэтому на практике часто применяют детерминированный подход к оптимизации не полностью определенных функций. Этот подход, в отличие от детерминизационного подхода, всегда обеспечивает существование оптимума не полностью определенной функции, и, в отличие от вероятностного подхода, гарантирует получение этого оптимума. К сожалению, при этом подходе, как уже говорилось ранее, вследствие преобразования исходной не полностью определенной функции в полностью определенную (детерминированную) новая задача оптимизации оказывается неэквивалентна исходной, а интерпретация ее решения в терминах исходной задачи проблематичной. Например, выбор минимального из двух интервалов ~ = [4,5], b = [3,15] с помощью детерминированного подхода по критерию оптимальности «ниж- няя граница интервала минимальна» дает решение min(a,b) = b = [3,15]. Однако это решение невозможно интерпретировать практически, поскольку оно противоречит эвристическим представлениям о проблеме. Так, любой автомобилист уверенно предпочтет как более экономную машину с расходом топлива от 4 до 5 л на 100 км машине с расходом топлива от 3 до 15 л!
Заключение
В данной статье показано, что проблема оптимизации не полностью определенных функций достаточно просто разрешима, если указанную неопределенность задавать в интервальной форме и использовать при этом конструктивную теорию сравнения величин интервалов, сводящую это сравнение к сравнению одноименных границ интервалов. Тем самым задача нахождения оптимума не полностью определенной функции сводится к более простой задаче отыскания одноименного оптимума двух полностью определенных (детерминированных) функций. Наш подход (его естественно назвать детерминизацией) примечателен тем, что позволяет вполне строго свести оптимизацию не полностью определенных функций к хорошо известным и эффективным методам оптимизации полностью определенных функций.
Список литературы Оптимальное проектирование в условиях неопределенности. Метод детерминизации
- Юдин, ДБ. Задачи и методы линейного программирования/Д.Б. Юдин, Е.Г. Гольдштейн. - М: Советское радио, 1964.
- Вентцель, КС. Введение в исследование операций/Е.С. Вентцель. - М: Советское радио, 1964.
- Уайлд,Д.Дж. Методы поиска экстремума/Д. Дж. Уайлд. -М: Наука, 1967.
- Корбут, А.А. Дискретное программирование/ А.А. Корбут, Ю.Ю. Финкелынтейн. - М: Наука, 1969.
- Моисеев, Н.Н. Методы оптимизации/ Н.Н. Моисеев, ЮЛ. Иванилов, Е.М. Столярова. - М.: Наука, 1978.