Метод локального улучшения управления для неоднородных дискретных систем
Автор: Расина Ирина Викторовна, Гусева Ирина Сергеевна, Фесько Олесь Владимирович, Усенко Олег Валерьевич
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 1, 2016 года.
Бесплатный доступ
При изучении неоднородных управляемых систем различными школами и направлениями основной упор сделан на непрерывные системы с изменяющейся во времени структурой. Для них получены необходимые и достаточные условия, а также итерационные процедуры. Один из подходов состоит в обобщении на такие системы достаточных условий оптимальности Кротова. На этой основе построена иерархическая модель неоднородной управляемой структуры, в которой нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. В работе рассматривается класс неоднородных дискретных систем, для которого оба уровня - дискретные. Такие системы широко распространены на практике, а также получаются в процессе дискретизации непрерывных систем при решении задач оптимизации итерационными методами. Для указанного класса формулируются достаточные условия оптимальности типа Кротова. Эти условия и принцип локализации используются для построения метода улучшения. Приводится иллюстративный пример.
Оптимальное управление, дискретные системы, приближенные методы улучшения управления
Короткий адрес: https://sciup.org/14835164
IDR: 14835164 | УДК: 517.977 | DOI: 10.18101/2304-5728-2016-1-27-37
Method of control local improvement for non-homogeneous discrete systems
In studying of non-homogeneous control systems by different schools the main attention is paid to continuous systems with time-varying structure. The necessary and sufficient conditions, as well as iterative procedures have been obtained for them. One of the approaches is to generalize the sufficient conditions for optimality of Krotov type on such systems. On this basis a non-homogeneous hierarchical model of controlled structure have been developed in which the lower level is a description of similar processes at different stages, and the upper level connects these descriptions into a single process, and controls the functioning of the system in whole. In various control problems, in particular in optimization problems, both levels are considered in interaction. We have considered the class of non-homogeneous discrete systems for which both levels are discrete. These systems are prevalent in practice and can be obtained from the process of continuous systems digitalization for solution of optimization problems using iterative methods. We have formulated the sufficient conditions of optimality of Krotov type for this class of systems. These conditions and the principle of localization are used to construct improvement method. The article contains illustrative examples.
Текст научной статьи Метод локального улучшения управления для неоднородных дискретных систем
В теории оптимального управления накоплено большое количество теоретических результатов, а также разнообразных итерационных методов.
Однако следует заметить, что подавляющее большинство разработанных точных и приближенных методов относится к системам с непрерывным временем. Для общих систем с дискретным временем, в особенности нелинейных, их арсенал оказывается значительно беднее. Основная причина такого положения – отсутствие в общем случае дискретного аналога принципа максимума Понтрягина для непрерывных систем, с которым долгое время связывались многие теоретические работы в области оптимального управления, основанные на методе вариаций и необходимых условиях оптимальности. Об этом, в частности, свидетельствуют, известные работы по дискретным системам [1-3].
Дискретные модели привлекали внимание исследователей главным образом возможностью применения методов нелинейного программирования к решению задач оптимального управления, в том числе – непрерывных с помощью частичной или полной дискретизации задачи по управлению и состоянию [1-5].
Хотя изучение неоднородных управляемых систем [6-10] началось еще с 70-х годов прошлого века, речь в основном идет о непрерывных системах. Дискретные неоднородные системы практически не изучены.
В работе рассматривается класс неоднородных дискретных управляемых систем, как продолжение исследований для непрерывных систем той же структуры.
Один из возможных подходов состоит в обобщении для них достаточных условий оптимальности Кротова [11]. За основу взята абстрактная динамическая система как многошаговая, операторы которой на разных шагах допускают различную интерпретацию [12]. В [6, 13, 14] предложена и развита математическая модель дискретно-непрерывной системы (ДНС) в виде конкретизации указанной абстрактной модели [12], применимая для широкого класса задач управления неоднородными процесса- ми, и для нее получен аналог достаточных условий Кротова для непрерывных и дискретных систем. При таком подходе строится иерархическая модель, в которой нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии.
В данной работе рассматривается модель, в которой, и на нижнем уровне, действуют дискретные управляемые системы (НДС) [14]. Такие системы могут рассматриваться как самостоятельные «дискретнодискретные», так и в качестве вспомогательных для ДНС с учетом естественной дискретизации непрерывных подсистем в реальных вычислениях.
Для неоднородных дискретных систем (НДС) строится метод локального улучшения управления. В основу построений положены достаточные условия оптимальности типа Кротова, представленные далее, и принцип локализации [15]. Рассматривается иллюстративный пример.
1. Неоднородные дискретные процессы и основные конструкции
Рассмотрим подробнее важное приложение иерархического принципа как прямой аналог динамической ДНС – двухуровневую модель, в которой нижний уровень составляют дискретные динамические системы однородной структуры. На верхнем уровне фигурирует дискретная модель общего вида
X ( k + 1) = f ( k , x ( k), u ( k )),
k e K = {kT,kT +1,...,kF}, u e U(k,x), где k – номер шага (этапа), x и u – соответственно переменные состояния и управления произвольной природы (возможно различной) для различных k , U(k, x) – заданное при каждом k и x множество.
На некотором подмножестве K'c K, kF £ K', u(k) интерпретируется как пара (uv(k),md (k)) , где md (k) - процесс (xd(k,t),ud (k,t)) , t e T(k,z(k)), md (k) e Dd (k, z(k)), а Dd - множество допустимых процес- сов md , удовлетворяющих системе xd (k, t +1) = f d (k, z, t, xd (k, t), ud (k, t)), t G T = {t7 (z), ti (z)+ 1,...,tF (z)}
xd g X d ( k , z , t ), ud g U d ( k , z , t , xd ) , z = ( k , x , uv ) .
Здесь Xd (k, z, t), Ud (k, z, t, xd) - заданные при каждом t, z и xd множе- ства.
Оператор правой части (1) сводится к следующему:
f ( k , x , u ) = 9 ( z , Yd ( z ) ) , Y d = ( t i , x d , t F , x F ) e Г d ( k , z ),
Г d ( z ) = Y d : t i = t ( k , z ), t F = 9(k , z ), x d = ^(k , z ), x F е Г F ( k , z )}.
На множестве D процессов m = (x (k), u (k), xd (k, t), ud (k, t)), удовлетворяющих (1), (2), рассматривается задача оптимального управления о минимизации концевого функционала I = F(x(kF)) при фиксированных kI = 0, kF, x(kI) и дополнительных ограничениях x(k) е X(k).
Для решения этой задачи вводится множество E процессов m , где исключены дискретные цепочки, и обобщенный лагранжиан по аналогии с лагранжианом для ДНС [13, 14]:
L = G ( x ( kF ) ) - ^ R ( k , x ( k ), u ( k )) + K \ K ‘ \ kF
+ 2 ( Gd ( z ) - E t ( z )\ tF R d ( z , t , xd ( k , t ), ud ( k , t )) ) ,
K '
G ( x ) = F ( x ) + ф ( k F , x ) - ф ( k i , x ( k i ) ) ,
R ( k , x , u ) = ф ( k + 1, f ( k , x , u ) ) - ф ( k , x ) , G d ( k , z , yd ) = - Ф ( k + 1, 9 ( k , z , yd ) ) + ф ( k , x ( k ) ) + + Фd ( k , z , t F , x F ) - фd ( k , z , t i , x l ) ,
R d ( k , z , t , xd , ud ) = ф 1 ( k , z , t + 1, fd ( k , z , t , xd , ud ) ) - ф 1 ( k , z , t , xd ), ца ( k , z , t ) = sup { Rd ( k , z , t , xd , ud ) : xd е X d ( k , z , t ), ud е U d ( k , z , t , xd ) }, ld ( k , z ) = inf { Gd ( k , z , Yd ) :( Yd ) е r d ( k , z ), xd е X d ( k , z , t F )}.
^ ( k ) =
sup{R (k, x, u): x е X(k), u е U (k, x)}, t е K \ K' ' - inf{/d (z):x е X (k), uv е Uv (k, x)}, k е K', l = inf{G (x): x е Г n X (kF)}.
Здесь ф ( k , x ) - произвольный функционал, ^d ( k , z , t , x d ) - произвольное параметрическое семейство функционалов (с параметрами k , z ).
Легко убедиться, что L(m) = I(m) при m е D, т.е. при выполнении отброшенных связей L(m) совпадает с I(m) . Действительно, при m е D , как видно,
R = ф ( k + 1, x ( k + 1) ) - ф ( k , x ) ,
R d = ф 1 ( k , z , t + 1, xd ( t + 1)) - фа ( k , z , t , xd ), L = F ( x ( k F )) + ^ ( ф ( k , x ) - ф ( k , x )) +
K \ K '
' ! Е Ф ( k,z.t , x ) - ф ( k,z,t . x )) .
K ' ( T ( k . z ) J
Отсюда непосредственно следуют теоремы, аналогичные теоремам для ДНС [13, 14].
Теорема 1. Для любого элемента m е D и любых ф. vd имеет место оценка
I ( m ) - inf I < А = I ( m ) - 1 .
Пусть имеются два процесса m I е D . m II е E и функции ф и v d такие.
что L
( m II ) < L ( m I ) = I ( m I )
,и m II
е D .
Тогда I ( m II ) < I ( m I ).
Теорема 2. Пусть имеются последовательность процессов { m s } с D и функционалы ϕ , ϕ d , такие что:
-
1) R ( k . x s ( k ) . U s ( k ) ) ^ д ( k ) . к е K ;
-
2) R d ( z s . t . x s ( t ) . u d ( t ) ) - / ( z s . t ) ^ 0. k е K ' . t е T ( Z s ) ;
-
3) G d ( Z s . y d ) - 1 d ( Z s ) ^ 0. k е K ' ;
-
4) G ( X s ( I f ) ) ^ 1 .
Тогда последовательность { ms } – минимизирующая для I на D .
r
\
Ia = aI + (1 - a ) E |A u ( k )l2 +Z|A ud ( k. t )l2 .
^ K \ K ' \ kF K '
J
где ае[0.1]. Au = u - uI. Aud = ud - udI. При построении метода будем отталкиваться от задачи улучшения элемента. Задан элемент mI е D и требуется найти элемент mII е D. для которого справедливо неравенство: I (m II )< I (m I).
Согласно принципу расширения, будем решать задачу улучшения для функционала L a . Имеем L a ( m II ) - L a ( m I ) < 0. Рассмотрим приращение функционала L α ( m ) :
A L а «А G - E k \ k ' A R - E ( A G d - E A R d ),
K '
T ( k . z )
где A R = R TT A x + R T A u + 1 A u T R A u , A G = G „ T A x , A G d = G dT A x + G d T A xd d , x u uu x x d F
2 xF
A Rd = R d T A x + R d T A xd + R d T A ud + 1 A ud T R d A Uud . Здесь функции
-
x x u 2 uu
-
G , Gd , R , Rd выписаны для функционала I α .
Предположим, что матрицы Ruu и Rud d u d отрицательно определены (этого всегда можно добиться за счет выбора параметра α [15]). Найдем A u , A ud , доставляющие максимум выражениям для A R и A Rd . Нетрудно видеть, что A u = - ( Ruu ) - 1 Ru , A u d =- ( Rd, d ) - 1 Rd, . Для выполнения неравенства A L < 0 потребуем далее, чтобы A R , A G , A G , A Rd не зависели от A x , A x F , A xd . Зададим функции ф, ф1 в виде: ф ( k , x ) = у(k ) x , фа ( k , t , x , x d ) = y d ( z , t ) x d + Ax .
Тогда из сформулированных условий получим:
A u = - ( H „„ )- 1 Hu , y ( kF ) = - aFx , Уk ) = Hx , k e K \ K ' , И k ) = H x + £У ( k , t i )+ A ( k , t i ) , ^ ( k , t F ) = H x d , A ( k , t F ) = H xf ,
У ( k , t ) = H d d , A ( k , t ) = H xd , A u d =- ( H du ) - 1 H d d , k e K ' .
Здесь
H ( k , x , u,y ( k + 1 )) = у T ( k + 1 ) f ( k , x ( k ), u ( k )) - ( 1 - a ) A u |2, k e K \ K ' \ kF , H ( k , x,у ( k + 1 ), x d , xdF ) = у T ( k + 1 ) y ( k , x d , x F ), k e K ' ,
Hd ( k , t , x , x d , u d ,yd ( k , t + 1 ) ) = y d ( k , t + 1 ) f d ( k , t , x , x d ( k , t ), u d ( k , t ) ) - ( 1 - a ) A u d ( k , t ) , a - коэффициент, a e [0,1].
3. Итерационная процедура
На основе полученных соотношений можно сформулировать следующую итерационную процедуру на шаге s .
-
1. «Слева направо» просчитывается НДС (1), (2) при u = u s ( к ), u d = u d ( к , t ) и заданных начальных условиях, получаются соответствующие траектории ( xs ( k ), xsd ( k , t )) .
-
2. «Справа налево» разрешается НДС относительно у ( к ) , y d ( к , t ) и λ ( k , t ).
-
3. Находятся A u , A u d и новые управления u s + 1( к ) = u s ( к ) + А u , u d + 1 ( к ) = u d ( к ) + А u d .
-
4. Просчитывается «слева направо» исходная НДС (1), (2) при новых управлениях с заданными начальными условиями.
Процесс итераций заканчивается, когда | I s + 1 - I s | ~ 0 с заданной точностью.
Имеет место следующее утверждение о сходимости.
Теорема 3. Пусть для НДС (1), (2) построена указанная итерационная процедура, и функционал I ограничен снизу. Тогда она генерирует улучшающую последовательность элементов { m s } е D , сходящуюся по функционалу, т.е. существует число I * , такое что I * < I ( m s ), I ( m s ) ^ I * .
Доказательство. Доказательство следует непосредственно из свойства монотонности (по функционалу) рассмотренного оператора улучшения. Таким образом, получается монотонная числовая последовательность
{ I s } = { I ( m s )} , I s + 1 < I s , ограниченная снизу, которая по известной теореме анализа сходится к некоторому пределу: Is ^ I * . Теорема доказана.
Пример. Проиллюстрируем один шаг метода на примере. Пусть задана неоднородная дискретная управляемая система:
x d ( l + 1 ) = x d ( t ) ud ( t ) - ( ud ( t ) ) 2 , x d ( t + 1 ) = x d ( t ), X ( 0 ) = x d ( 0 ) = 1, t = 0,1,2; x 1 ( t + 1 ) = x d ( t> d ( t ) - (u d ( t ) ) 2 , t = 3,4;
I = x d ( 5 ) ^ min.
Нетрудно видеть, что K = 0,1,2. Поскольку роль связующей переменной на двух рассматриваемых этапах играет x 1 d , то в терминах этой переменной легко записать процесс верхнего уровня: x ( 0 ) = x d ( 0,0 ) , x ( 1 ) = x d ( 0,3 ) = 9, x d ( 1,4 ) = x ( 1 ) = ^, x ( 2 ) = x d ( 1,5 ) . Тогда I = x ( 2 ) . Основные конструкции принимают вид:
H ( 0, t , v 2 ( 0, t + 1 ) v 2 ( 0, t + 1 ), x 2 , x 2d , u2 ) =
= v 1 ( 0, t +1( x d 2 ( 0, t У ( 0, t ) - ( u2 ( 0, t ) ) 2 ) +
+ v2 ( 0, t + 1 ) x d ( 0, t ) - ( 1 - a ) ( a u2 ( 0, t ) ) 2 ;
H ( 1, t , V 1 2 ( 1, t + 1 ), x 2 , u 2 ) =
= v 2 ( 1, t + 1( x 2 ( 1, t ) u 2 ( 1, t ) - ( u 2 ( 1, t ) ) 2 ) - ( 1 - a ) ( a u 2 ( 1, t ) ) 2;
H ( k , v ( k + 1 ) , x ) = v ( k + 1 ) x 2 ( k , tF );
v(k) = v(k +1), k = 1, v(2) = -aFx =-a;
v1 (0,t) = v2(0,t +1), v2 (0,3) = v(1) = -a,
V 2 ( 0, t ) = v 2 ( 0, t + 1 ) u2 ( 0, t ), v 2 ( 0,3 ) = 0;
v 1 ( 1, t ) = v 1 ( 1, t + 1 ) u2 ( 1, t ), v 2 ( 1,5 ) = v ( 2 ) = - a .
Приращения управлений на текущем приближении определяются по формулам:
A u 2 ( 0, t ) = - ( 2 ( 2 a - 2 - v 2 ( 0, t + 1 ) )) - 1 v 2 ( 0, t + 1 ) ( x 2 ( 0, t ) - 2 u 2 ( 0, t ) ),
A u 2 ( 1, t ) = - ( 2 ( 2 a - 2 - v 2 ( 1, t + 1 ) )) - ' v 2 ( 1, t + 1 ) ( x 2 ( 1, t ) - 2 u 2 ( 1, t )J.
Поскольку уравнения нижнего уровня не зависят от переменной x верхнего уровня, то Л ( k , t ) = 0.
В качестве начального приближения были выбраны значения u2 ( 0, t ) = 0.1, u2 ( 1, t ) = 1 , при этом 1 1 =- 2.001 . Расчеты на шаге проводились для значений a = 0.05,0.1,0.4 . В табл. 1 отражены результаты, полученные после выполнения одного шага алгоритма, которые подтверждают работоспособность предложенного алгоритма.
|
α |
0.05 |
0.1 |
0.4 |
|
I 2 |
- 2.1817 |
- 2.4062 |
- 7.0191 |
Таблица 1. Значения функционала I при разных значениях α .
Заключение
Таким образом, в работе приведена иерархическая модель неоднородной дискретной системы (НДС), для которой поставлена задача оптимального управления и сформулированы достаточные условия оптимальности типа Кротова. На основе этих условий, принципах расширения и локализации получен метод локального улучшения. Доказана теорема о сходимости метода по функционалу. Рассмотрен иллюстративный пример.
Список литературы Метод локального улучшения управления для неоднородных дискретных систем
- Пропой А. И. О принципе максимума для дискретных систем управления//Автомат. и телемех. -1965. -Т. 26. -№ 7. -С. 1177-1187.
- Пропой А. И. Элементы теории оптимальных дискретных процессов. -М.: Наука, 1973. -256 с.
- Болтянский В. Г. Оптимальное управление дискретными системами.-М.: Наука, 1973. -448 с.
- Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. -М.: Наука, 1982. -432 с.
- Горбунов В. К. О сведении задач оптимального управления к конечномерным//Журнал выч. мат. и мат. физ. -1978. -Т. 18. -№ 5. -С.1083-1095.
- Гурман В. И. К теории оптимальных дискретных процессов//Автомат. и телемех.-1973. -№ 6. -С. 53-58.
- Васильев С. Н. Теория и применение логико-управляемых систем//Труды. 2-я Международная конференция «Идентификация систем и задачи управления» (SICPRO'03). -2003. -С. 23-52.
- Бортаковский А. С. Достаточные условия оптимальности управления детерминированными логико-динамическими системами//Информатика.-Вып. 2-3.-Сер. Автоматизация проектирования. -М.: ВНИИМИ -1992. -С. 72-79.
- Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями. -М.: Наука, 2005.
- Lygeros J. Lecture Notes on Hybrid Systems. -Cambridge: University of Cambridge, 2003.
- Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. -М.: Наука, 1973. -448 с.
- Кротов В. Ф. Достаточные условия оптимальности для дискретных управляемых систем//ДАН СССР.-1967. -Т. 172. -№ 1. -С. 18-21.
- Гурман В. И., Расина И. В. Дискретно-непрерывные представления импульсных решений управляемых систем//Автомат. и телемех. -2012. -№ 8. -С. 16-29.
- Расина И. В. Иерархические модели управления системами неоднородной структуры. -М.: ФИЗМАТЛИТ, 2014.
- Гурман В. И., Расина И. В. О практических приложениях достаточных условий сильного относительного минимума//Автомат. и телемех.-1979. -№ 10. -С. 12-18.