Чувствительность решения некоторых возмущенных задач оптимизации
Автор: Блинов Александр Олегович, Дмитриев Михаил Геннадьевич
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Методы оптимизации и теория управления
Статья в выпуске: 1 (28) т.7, 2016 года.
Бесплатный доступ
Рассматриваются возмущенные задачи оптимизации, формально представляющие собой задачи поиска экстремума функций многих переменных, возникающие при применении методов линейной свертки и идеальной точки, где часть весовых коэффициентов зависят от малого параметра. На основе асимптотического анализа задачи описывается чувствительность решения к изменению малого параметра, позволяющая построить коррекцию решения
Идеальная точка, линейная свертка, малый параметр
Короткий адрес: https://sciup.org/14336188
IDR: 14336188
The sensitivity of the solution of some optimization problems with perturbation
We consider perturbed optimization problems that formally represent the problem of finding the extremum of functions of several variables that arise when applying the methods of linear convolution and an ideal point where some of the weight coefficients depend on a small parameter. On the basis of the asymptotic analysis of the problem, the sensitivity of the solution to the change of a small parameter is described, which makes it possible to construct a correction for the solution
Текст научной статьи Чувствительность решения некоторых возмущенных задач оптимизации
Под чувствительностью решений к малым изменениям параметров задачи обычно понимают главные части скоростей изменения решений при этих изменениях параметров. В оптимизационных задачах различают два вида чувствительности –– по значению функции (критерия) и по решению.
Это понятие полезно для качественного анализа рассматриваемых задач, при оценке робастности систем, при построении разностных схем для численного решения соответствующих задач и других приложений. Зачастую при асимптотическом анализе возмущенных динамических систем не выделяют отдельно проблему чувствительности, но, тем не менее, найденные функции чувствительности активно используются при построении соответствующих асимптотических приближений в качестве членов приближения первого порядка.
Вопросы чувствительности решений динамических систем к изменениям параметров, включая решения динамических и статических
Статья выполнена при частичной поддержке гранта РФФИ №15-29-06053.
○ c А. О. Блинов, М. Г. Дмитриев, 2016
○ c Институт программных систем им. А.К. Айламазяна РАН, 2016
○ c Программные системы: теория и приложения, 2016
задач оптимизации, отдельно изучались в литературе [1] . Асимптотические разложения решений регулярно и сингулярно возмущенных динамических систем, в том числе и задач оптимизации в динамических системах строились в многочисленных работах (см. обзоры [2 –4] ).
При моделировании процессов принятия решений в реальных задачах появляются многокритериальные задачи оптимизации. Попытка получить решение одновременно лучшее по всем критериям или максимально удовлетворить интересы всех сторон, что возможно только в частных случаях, приводит к определению некоторого рационального компромисса.
Как отмечал Т. Л. Саати в [5] , исследование чувствительности в задачах многокритериальной оптимизации является актуальной проблемой.
Один из распространенных методов решения многокритериальных задач –– сведение многокритериальной задачи оптимизации к соответствующей скалярной. В литературе имеется много подходов к решению задачи «скаляризации» критериев [6 –9] , в их числе линейная свертка критериев.
-
1. Чувствительность линейной свертки для метода главного критерия
Не останавливаясь на аксиоматике и корректности использования линейной свертки [9] , определим формулы чувствительности для некоторых возмущенных скалярных задач оптимизации.
Пусть для конечного набора критериев
Ik (ж) ^ max, к = 1,.. ., m, xEX где X С Д” — некоторое выпуклое множество. Используя линейную свертку, приходим к однокритериальной задаче оптимизации т т
-
(1) I (ж) = У' C k I k (ж) ^ max, C k > 0, C k = 1,
t E X k=1 k=1
где предполагаем, что веса критериев известны. Будем также считать, что в (1) первый критерий является главным или базовым (доминирующим), т. е. с 1 > C k , к = 1, а остальные веса достаточно малые с к = c k е, a k > 0, к = 2,. .., m, и их можно упорядочить, используя упорядоченность между a k . Числовые конкретные значения малого положительного параметра 0 < е < е о < 1 и множителей ctk вводятся
т с помощью соотношений С1 + 52 „ке = 1, Ск = „ке, к = 1, „к > 0.
к=2
Получаем регулярно возмущенную задачу однокритериальной оптимизации
т
-
(2) ! е (ж) = С 1 1 1 ( х) + еа к ! к (ж) ^ max,
^—^ хЕХ к=2
решение которой зависит от малого положительного параметра е. Предположим, что выполнены следующие условия:
-
(1) множество X — выпуклое ограниченное множество в пространстве Я ” и все функции-критерии ! к (ж) достаточно гладкие функции своих переменных на X;
-
(2) функция-критерий I 1 (ж) сильно вогнутая на X.
Учитывая, что все критерии — гладкие функции, построим серию задач максимизации для членов разложения 1 е (ж), представляя решение в виде ряда по целым степеням малого параметра и используя соответствующее разложение критерия I e (ж) в ряд по целым степеням е , как в [10, 11] .
Пусть
-
(3) ж(е) = ж 0 + еж 1 + ... е X.
Подставляя (3) в ( 2) и раскладывая ! е (ж) в ряд по степеням е, имеем
-
(4) I (ж(е)) = 1е(ж) = I 0 (ж 0 ) + е! 1 (ж 0 ) + е 2 ! 2 (ж 1 ) + ... ^ max
х0,х1,...ЕХ или
! е (ж) = c i f ! 1 (ж 0 ) + е ( " V ж 1 + 1 е 2 (ж 1Г ^ 2 !^ ж 1 + ... ) +
I у дж у 2 дж 2 j
+е( £ а к ! к (ж - )+ е ] Г „ к (°^ Vж 1 +...) = \ к =2 к =2 ж / у
= сЫ.^Н = [= , ( \)
т m 1
ж1 + ^ «к Ыж" + к=2
+E 2 = 1 (« 1 ) т ■ « 1
A / дI k (ж " \
+ L"« k=2 x 7
т ж1 + O(£3) =
m т д I ж ж1+
= = 1 I 1 (« 0 ) + £ ^ « к I k (ж " ) + £ 2 ^Ц (ж 1 )
+ '^ « к f ^1(ж ) ^ ж 1] + е 3 ^(ж " ,ж 1 ) + О(е 4 ) ^ max
■
\ дж / I х 0 ,х 1 ,... е х
Здесь К(ж°,ж1) — известная функция своих аргументов. На основе леммы о перестановке операции максимизации с разложением в регулярный ряд [11] , при четных степенях параметра е последовательно получаются оптимизационные задачи для ж " , ж 1 и т. д., а при нечетных степенях параметра е — известные функции предыдущих приближений.
Из представления (5) получаем, что главный вклад в искомую оптимальную альтернативу ж(е) вносит ж" — решение задачи
I"(ж") = =111 (ж) ^ max, хех где последнее выражение –– главная часть критерия (2), а коэффициент эь(х0)\т mm
С1 ( — дх ) ж 1 + 52 « к I k (ж " ) при первой степени е в разложении (5) ' Х к=2
в силу необходимого условия оптимальности для ж " принимает вид
m
£ «кIk(ж")■ к=2
Последнее выражение есть чувствительность по значению функции линейной свертки (2) к изменению параметра е (или чувствительность оптимального значения функции (2) ).
Учитывая гладкость критериальных функций и ограниченность множества X , легко показать, что имеет место
Утверждение 1. При выполнении условий 1, 2 в задаче (2) найдется такое достаточно малое £", что при всех 0 < е < £" для чувствительности по значению линейной свертки
т
-
(8) 1 1 (х 0 ) = £ « к 1 к (х 0 )
к=2
имеет место соотношение I * = I * + el 1 (х 0 ) + О(е 2 ), где I * = max 1 е (х) , I * = 1 0 (х 0 ) = c 1 I 1 (х) ^ max .
х Е Х ' х Е Х
Знание чувствительности оказывается полезным при качественном анализе влияния изменений весов на общую эффективность линейной свертки. Так, если чувствительность отрицательная, то небольшое увеличение весов небазовых критериев, не нарушающее упорядоченности критериев, приводит к уменьшению общей эффективности, а соответствующее уменьшение весов –– увеличивает общую эффективность. Если же чувствительность положительная, то при увеличении весов небазовых критериев с сохранением прежней упорядоченности общая эффективность –– возрастает, а при уменьшении –– убывает.
Далее, из (5) следует, что для нахождения х 1 -чувствительности решения задачи (2) к изменениям параметра е, имеем задачу (9) 1 c i (x 1 ) T д4 1 (х 0 )х 1 + ^ « к Г^ (х 0 ) ^ х 1 ^ max .
-
2 . к =2 дх х 1
Из условия 2 следует, что гессиан функции есть отрицательно определенная матрица и поэтому точка максимума в (9) –– искомая чувствительность решения –– имеет следующее представление /1пх 1 ( 92 l 1( оЛ Х^ « к д1 к , Ох
-
(10) х = -(ах?(х)) Еса?(х).
4 7 к=2 1
Из (10) и свойств гессиана следует, что чувствительность х 1 зависит явно от всех весов и градиентов небазовых критериев.
Используя (10) , субоптимальная альтернатива первого порядка для задачи (2) , или асимптотическое приближение первого порядка, получается из (3) и имеет вид
Г 9 2 i 1 / оЛ \^ с к д1 к / ох
-
(11) х(е)=х 0 + ех =х ’ - (х 0 ) (х 0 ).
дх2 ! ^-^ с дх х 7 к=2 1
Теперь, применяя традиционные рассуждения при построении асимптотического приближения решения вариационных задач методом малого параметра (см. [11] ), нетрудно получить, что имеет место доказанное в [10]
Утверждение 2. Если при выполнении условий 1, 2 в задаче (2) найдется достаточно малое e q такое, что Х ( е ) = х° + ex 1 Е X при всех 0 < е < Е о , тогда
-
(1) решение х * задачи (2) существует и единственно в некоторой окрестности решения х 0 , и при этом имеет место оценка IIх * - х ( е ) | < СЕ 2 ;
-
(2) 1 е (х 0 ) < 1 е ( Х ( е )) , причем неравенство строгое, если х 1 = 0 ;
-
(3) I * — I£ ( X ( e )) < Се 4 , где С > 0 — некоторая постоянная.
Если вычисляемая по формуле (10) чувствительность х 1 решения х * ненулевая, то она формирует коррекцию к х 0 и приближение (11) к решению обеспечивает точность приближения порядка О ( е 2) , а по значению функции линейной свертки—порядка О ( е 4 ).
Следствие 1. Значение критерия линейной свертки имеет вид
т
I* = IE(x*) = Ii(x0) + е £ «кIk(х0)+ к=2
-
+ 2Е 2 [ (х 1 ) - . Л +2 g « к () Т х - ] + ... ..
Последнее представление следует из (5) , поскольку в силу необходимых условий оптимальности для базовой альтернативы выполня- 811 ( ж 0 ) ются соотношения — дж ’ = 0.
Таким образом, несмотря на сравнительно малый вклад ех 1 в общую эффективность (порядка О ( е 2 )), эта коррекционная альтернатива может существенно влиять на изменение базовой альтернативы, приближая ее к оптимальной.
Следующий член ё2! 2 (х 1 ) в представлении (4) вносит существенно меньший (на порядок по е ) вклад в общий критерий эффективности I e (х). Он формируется на основе определения х 1 решением задачи максимизации квадратичного критерия, порождаемого гессианом базового и градиентами остальных критериев.
Так как в общем случае базовая альтернатива не является оптимальной для небазовых критериев, величины норм их градиентов, вычисляемых вдоль базовой альтернативы, говорят о степени пренебрежения базовой альтернативой целей, формируемых небазовыми критериями.
Например, если вдоль базовой альтернативы значение || ^ ^у- (ж 0 ) больше значений взвешенных норм градиентов других небазовых критериев, тогда больший вклад в чувствительность ж 1 вносит слагаемое, порождаемое соответствующим небазовым критерием c номером s.
Отметим также, что сравнение норм векторов ^ дХ (ж 0 ), к = 2,..., т, намечает другой подход к сравнению критериев между собой с точки зрения альтернативы ж 0 , и при этом это ранжирование может не совпадать с первоначальным.
Пример. Пусть рассматриваются три задачи максимизации:
71 (ж) = —0.5((ж1 — 1)2 + (ж2 — 0.5)2) ^ max, 72(ж) = —0.5((ж1 — 2)2 + (ж2 — 3)2) ^ max, 73(ж) = —0.5((ж1 — 4)2 + (ж2 — 6)2) ^ max, и для линейной свертки предложены веса с1 = 0.75, с2 = 0.15, с3 = 0.1. Имеем
7 (ж) = ^ с к 1 к (ж) = — 0.375((ж 1 — 1) 2 + (ж 2 — 0.5) 2 ) — к =1
-
— 0.075((ж 1 — 2) 2 + (ж 2 — 3) 2 ) — 0.05((ж 1 — 4) 2 + (ж 2 — 6) 2 ) ^ max. х Е Х
-
2. Чувствительность решения для метода идеальной точки
Пусть при этом е = 0.1, ( 2 = 1.5, ( 3 = 1, тогда
7(ж) = 7 * (ж) = 1 1 (ж) + е 5 ( к 7 к (ж) ^ max . х Е Х к=2
Нетрудно видеть, что точное решение ж *( е ) в задаче на максимум линейной свертки (2) имеет вид ж * = (- /Х^ ) , и оптимальное значение критерия линейной свертки 7(ж * ) = — 1.977. Вдоль очевидного базового решения ж 0 = (0 1 5) линейная свертка принимает значение 7 * (ж 0 ) = — 2.506. Находя градиенты всех частных критериев и гессиан базового критерия вдоль ж 0 , из (9) получаем поправку к базовой альтернативе ж 1 = (12 333) . Теперь из (11) следует, что ж ( е ) = ж 0 + еж 1 = (, 1 . 6 ,) . 7 3 3 /
Вычисляя 7 * ( ж ( е )) = — 2.036, замечаем, что 7 * ( ж ( е )) = — 2.036 > 7 * (ж 0 ) = — 2.506, т. е. с ростом номера асимптотического приближения растет точность аппроксимации по оптимизируемому критерию и значение критерия свертки вдоль асимптотического приближения значительно возрастает.
Хотя вес второго критерия в 1.5 раза выше веса третьего критерия, вклад третьего критерия в коррекционную альтернативу примерно во столько же раз выше соответствующего вклада второго критерия. Последнее обстоятельство связано с различной величиной соответствующих градиентов, и поэтому величины реакций сторон при определении коррекций в базовой альтернативе определяются не только весами критериев, но и величинами норм их градиентов.
Перейдем к анализу чувствительности для метода идеальной точки при наличии главного критерия.
Для простоты изложения рассмотрение проведем на классе трехкритериальных задач. Пусть известен вектор
Ildeal = (I*, I* I , I*k = maxIk(ж), к = 1, 2, 3, сЕХ определяющий так называемую идеальную точку в пространстве критериев.
Предположим, что положительно определенная матрица весов R, ранжирующая среднеквадратичные отклонения компонент текущего критериального вектора I r (ж) = (1 1 (ж) 1 2 (ж) 1 з (ж)) т от их идеальных значений I * к = 1, 2, 3, имеет вид
R = (
R i eR 2
ER 2 eR 3
) > °'
где e — малый параметр, ° < e < Е о < 1, и
R 1 = Т 11 , R 2 = (Г 12 ги), R 3 = ( Г 2 2 Г 2 3 ) .
\^23 Т зз)
Будем искать альтернативу ж Е X С R ” путем решения задачи 4М = (1 Т (ж) — I * deal ) Т r ( i t (ж) — I * deal ) ^ min . сс Е Х
С учетом представлений I r (ж) = (^ г (ж ) ), I^ i = ( ^ *eal ) , где \и г (ж)/ XJLduaeaU
L T (ж) = 1 1 (ж), D T (ж) = ( 1 2 (ж) ) , L* deal = I * , D *deal ( l * ) , из (11)
имеем
-
(13) min { I E (x) = (I r (x) - I * deai )TR(I r (x) - I * deai )} =
же A
= min{[(Lr(x) - L’deal)TRl(Lr(x) Lideal) + xGX
+2e(L r (x) L ideal ) T R 2 ( D r ( x ) - D *deal ) +
+ e ( D r ( x ) - D* deal)T R 3 ( D r ( x ) - D *deal ) ] } =
= { [^ 11 (I 1 (x) - I 1 ) 2 + -T 22 (R(x) - I * ) 2 + -T 33 (I 3 (x) - I * ) 2 +
+2-Tu(I 1 (x) - I * )(I 2 (x) - I * ) + 2eT i3 (I i (x) - I * )(I 3 (x) - I * ) +
+2 eT 23 ( I 2 ( x ) - I 2 )( I 3 ( x ) - I 3 ) + . . .] } x min .
^ex
Подставим (3) в (13) и разложим 1 Е (х(е)') в ряд по степеням е:
|
Г(г(е)) = /th U/1 (x 0 ) - I * )+ +- ('. ) T x 1 +2-w x 1 +..: , 0\ r*\ I (dI 2( x 0 ) A 1 . 1 2/ 1\T d' 2 I 2 ( x
, Lr / 0x r*\ . ( dI3(x0) A 1 . 1 2/ 1\T 9' 2 I 3 ( a
Lr ( 0\ г *A 1 ( dI1(x0) \ 1 , 1 2/ b,T 9 2 I 1 (
|
2 + |
|||
|
X1 +.. X1 +.. ^+. ^x 1 + . . . |
. .] .. + |
2 + 2 + ] X |
||
|
X |
/Г / 0\ r*\ . ( dI 2 (x0) A 1 1 2/ bT 92I 2 (x 0 ( I 2 ( x ) I 2 )+ 4 dx ) x + 2- ( x ) dx 2 |
|||
|
,9 0x T *x . (dI 1 ( x0 ) \ 1 1 2, 1xT Э 2I 1 ( x 0 ) 1 . +2 -T 13 ( I 1 ( x ) I 1 ) + e^ dx J x + 2 - ( x ) dx 2 x + . |
.. |
X |
||
|
X |
/Г / 0\ r*\ . ( dI 3 (x 0 ) A 1 . 1 2/ 1\T d2I 3 (x 0 ( I 3 ( x ) I 3 )+ 4 dx ) x + 2e ( x ) dx 2 |
^x 1 + . . . |
+ |
|
|
.9 0\ T *\ . (dI 2 ( x 0 ) \ 1 1 2/ bT Э 2 I 2 ( x 0 ) 1 +2eT 23 (I 2 (x ) I 2 ) + el ^x ) x +2e (x ) ^^ 2 x +. |
.. |
X |
||
|
X |
(r ( 0\ r*A_L (dI3(x0) V 1 , 1 2/ 1aT d2I3(x0 [ (I 3 ( x ) I 3 ) + 4 dx ) x + 2e ( x ) dx 2 |
x + . . . |
} |
|
-
(14) I e ( x ( s )) = eVr 22 (I 2 (x0) - I * ) 2 +
+г зз (/ з (х 0 ) - I 3 ) 2 + 2 t 23 ( I 2 ( x 0 ) - I * )( I 3 ( x 0 ) - I * ) } + +е 2 |2г 22 (1 2^0 ) - I * ) ( Э1 дХ Х1 ) х 1 +2г зз ( 1 з ( x 0 ) - I * ) ( Э1 дхХ 01 ) х 1 + +2Г 23 [ ( I 2 ( x 0 ) - I * ) (dIdX X^ У х 1 + (1 з ( х 0 ) - I * ) (dI 2 dX 0 ) у X 1 ]j +
+Н (х 0 ,х 1 )е 3 + О ( е 4 ) ^ min .
ж ,ж .... £
Учитывая гладкость критериев, ограниченность X , а также равенства 1 1 (ж 0 ) = ! * , ^^т-) = 0, получаем
Утверждение 3. При выполнении условий 1, 2 найдется доста точно малое в о , что при всех 0 < Е < Е о для чувствительности по значению 1 1 (ж 0 ) функции 1 е (х) в задаче (13) имеет место соотношение
-
(15) 1 1 (ж 0 ) = Т 22 (1 2 (х 0 ) - I * ) 2 + т зз (1 з (х 0 ) - 7 * ) 2 +
+Г23(12(Х°) - 12)(1з(х°) - I*), и при этом I* = е1 1 (ж0) + О(е2).
Здесь, как и в случае задачи (2) , чувствительность по критерию является функцией весов и значений неглавных критериев вдоль базовой альтернативы. Указанная чувствительность является также положительной функцией отклонений значений неглавных критериев от максимальных значений этих критериев и поэтому из (15) следует, что при слабом уменьшении весов неглавных критериев близость к идеальной точке в пространстве всех критериев возрастает, а при слабом увеличении тех же весов – уменьшается.
Заключение
Определение чувствительности по решению в рассмотренных задачах приводит к приближенному аналитическому описанию семейства решений многокритериальной задачи, как функций весов, а определение чувствительности по значению общего критерия позволяет описать приближенно изменение значения общих критериев в зависимости от изменения весов. Итак, функции чувствительности, позволяют создать наглядный механизм обратной связи в итеративной схеме принятия решения, т.е. на «ошибки» в предыдущем выборе решения появляется реакция в следующей итерации, и таким образом, последовательно учитываются интересы всех сторон в процессе принятия решений.
Список литературы Чувствительность решения некоторых возмущенных задач оптимизации
- Е. Н. Розенвассер, Р. М. Юсупов. Чувствительность систем управления, Наука, М., 1981, 464 с.
- Ф. Л. Черноусько, В. Б. Колмановский. Вычислительные и приближенные методы оптимального управления//Итоги науки и техн. Сер. Мат. анал., т. 14, ВИНИТИ, М., 1977. С. 101-166.
- А. Б. Васильева, М. Г. Дмитриев. Сингулярные возмущения в задачах оптимального управления//Итоги науки и техн. Сер. Мат. анал., т. 20, ВИНИТИ, М., 1982. С. 3-77.
- М. Г. Дмитриев, Г. А. Курина. Сингулярные возмущения в задачах управления//Автоматика и телемеханика, 2006, №1. С. 3-51.
- Т. Саати. Принятие решений при зависимостях и обратных связях. Аналитические сети, ЛКИ, М., 2008, 360 с.
- J. Figueira, S. Greco, M. Ehrgott (eds.). Multiple criteria decision analysis: state of the art surveys, Springer, 2004, 1085 p.
- А. Б. Петровский. Теория принятия решений, Академия, М., 2009, 400 с.
- В. Д. Ногин. Принятие решений в многокритериальной среде: количественный подход, Физматлит, М., 2005, 176 с.
- В. Д. Ногин. Линейная свертка критериев в многокритериальной оптимизации//Искусственный интеллект и принятие решений, 2014, №4. С. 73-82.
- М. Г. Дмитриев. Приближенное решение оптимизационной задачи для линейной свертки многих критериев на основе метода малого параметра//Технологии техносферной безопасности, 2010, №3(31), 0421000050/0046, URL: http://agps-2006.narod.ru/ttb/2010-3/16-03-10.ttb.pdf.
- С. В. Белокопытов, М. Г. Дмитриев. Решение классических задач оптимального управления с погранслоем//Автомеханика и телемеханика, 1989, №7. С. 71-82.