Метод локального улучшения управления для неоднородных дискретных систем
Автор: Расина Ирина Викторовна, Гусева Ирина Сергеевна, Фесько Олесь Владимирович, Усенко Олег Валерьевич
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 1, 2016 года.
Бесплатный доступ
При изучении неоднородных управляемых систем различными школами и направлениями основной упор сделан на непрерывные системы с изменяющейся во времени структурой. Для них получены необходимые и достаточные условия, а также итерационные процедуры. Один из подходов состоит в обобщении на такие системы достаточных условий оптимальности Кротова. На этой основе построена иерархическая модель неоднородной управляемой структуры, в которой нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. В работе рассматривается класс неоднородных дискретных систем, для которого оба уровня - дискретные. Такие системы широко распространены на практике, а также получаются в процессе дискретизации непрерывных систем при решении задач оптимизации итерационными методами. Для указанного класса формулируются достаточные условия оптимальности типа Кротова. Эти условия и принцип локализации используются для построения метода улучшения. Приводится иллюстративный пример.
Оптимальное управление, дискретные системы, приближенные методы улучшения управления
Короткий адрес: https://sciup.org/14835164
IDR: 14835164 | DOI: 10.18101/2304-5728-2016-1-27-37
Текст научной статьи Метод локального улучшения управления для неоднородных дискретных систем
В теории оптимального управления накоплено большое количество теоретических результатов, а также разнообразных итерационных методов.
Однако следует заметить, что подавляющее большинство разработанных точных и приближенных методов относится к системам с непрерывным временем. Для общих систем с дискретным временем, в особенности нелинейных, их арсенал оказывается значительно беднее. Основная причина такого положения – отсутствие в общем случае дискретного аналога принципа максимума Понтрягина для непрерывных систем, с которым долгое время связывались многие теоретические работы в области оптимального управления, основанные на методе вариаций и необходимых условиях оптимальности. Об этом, в частности, свидетельствуют, известные работы по дискретным системам [1-3].
Дискретные модели привлекали внимание исследователей главным образом возможностью применения методов нелинейного программирования к решению задач оптимального управления, в том числе – непрерывных с помощью частичной или полной дискретизации задачи по управлению и состоянию [1-5].
Хотя изучение неоднородных управляемых систем [6-10] началось еще с 70-х годов прошлого века, речь в основном идет о непрерывных системах. Дискретные неоднородные системы практически не изучены.
В работе рассматривается класс неоднородных дискретных управляемых систем, как продолжение исследований для непрерывных систем той же структуры.
Один из возможных подходов состоит в обобщении для них достаточных условий оптимальности Кротова [11]. За основу взята абстрактная динамическая система как многошаговая, операторы которой на разных шагах допускают различную интерпретацию [12]. В [6, 13, 14] предложена и развита математическая модель дискретно-непрерывной системы (ДНС) в виде конкретизации указанной абстрактной модели [12], применимая для широкого класса задач управления неоднородными процесса- ми, и для нее получен аналог достаточных условий Кротова для непрерывных и дискретных систем. При таком подходе строится иерархическая модель, в которой нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии.
В данной работе рассматривается модель, в которой, и на нижнем уровне, действуют дискретные управляемые системы (НДС) [14]. Такие системы могут рассматриваться как самостоятельные «дискретнодискретные», так и в качестве вспомогательных для ДНС с учетом естественной дискретизации непрерывных подсистем в реальных вычислениях.
Для неоднородных дискретных систем (НДС) строится метод локального улучшения управления. В основу построений положены достаточные условия оптимальности типа Кротова, представленные далее, и принцип локализации [15]. Рассматривается иллюстративный пример.
1. Неоднородные дискретные процессы и основные конструкции
Рассмотрим подробнее важное приложение иерархического принципа как прямой аналог динамической ДНС – двухуровневую модель, в которой нижний уровень составляют дискретные динамические системы однородной структуры. На верхнем уровне фигурирует дискретная модель общего вида
X ( k + 1) = f ( k , x ( k), u ( k )),
k e K = {kT,kT +1,...,kF}, u e U(k,x), где k – номер шага (этапа), x и u – соответственно переменные состояния и управления произвольной природы (возможно различной) для различных k , U(k, x) – заданное при каждом k и x множество.
На некотором подмножестве K'c K, kF £ K', u(k) интерпретируется как пара (uv(k),md (k)) , где md (k) - процесс (xd(k,t),ud (k,t)) , t e T(k,z(k)), md (k) e Dd (k, z(k)), а Dd - множество допустимых процес- сов md , удовлетворяющих системе xd (k, t +1) = f d (k, z, t, xd (k, t), ud (k, t)), t G T = {t7 (z), ti (z)+ 1,...,tF (z)}
xd g X d ( k , z , t ), ud g U d ( k , z , t , xd ) , z = ( k , x , uv ) .
Здесь Xd (k, z, t), Ud (k, z, t, xd) - заданные при каждом t, z и xd множе- ства.
Оператор правой части (1) сводится к следующему:
f ( k , x , u ) = 9 ( z , Yd ( z ) ) , Y d = ( t i , x d , t F , x F ) e Г d ( k , z ),
Г d ( z ) = Y d : t i = t ( k , z ), t F = 9(k , z ), x d = ^(k , z ), x F е Г F ( k , z )}.
На множестве D процессов m = (x (k), u (k), xd (k, t), ud (k, t)), удовлетворяющих (1), (2), рассматривается задача оптимального управления о минимизации концевого функционала I = F(x(kF)) при фиксированных kI = 0, kF, x(kI) и дополнительных ограничениях x(k) е X(k).
Для решения этой задачи вводится множество E процессов m , где исключены дискретные цепочки, и обобщенный лагранжиан по аналогии с лагранжианом для ДНС [13, 14]:
L = G ( x ( kF ) ) - ^ R ( k , x ( k ), u ( k )) + K \ K ‘ \ kF
+ 2 ( Gd ( z ) - E t ( z )\ tF R d ( z , t , xd ( k , t ), ud ( k , t )) ) ,
K '
G ( x ) = F ( x ) + ф ( k F , x ) - ф ( k i , x ( k i ) ) ,
R ( k , x , u ) = ф ( k + 1, f ( k , x , u ) ) - ф ( k , x ) , G d ( k , z , yd ) = - Ф ( k + 1, 9 ( k , z , yd ) ) + ф ( k , x ( k ) ) + + Фd ( k , z , t F , x F ) - фd ( k , z , t i , x l ) ,
R d ( k , z , t , xd , ud ) = ф 1 ( k , z , t + 1, fd ( k , z , t , xd , ud ) ) - ф 1 ( k , z , t , xd ), ца ( k , z , t ) = sup { Rd ( k , z , t , xd , ud ) : xd е X d ( k , z , t ), ud е U d ( k , z , t , xd ) }, ld ( k , z ) = inf { Gd ( k , z , Yd ) :( Yd ) е r d ( k , z ), xd е X d ( k , z , t F )}.
^ ( k ) =
sup{R (k, x, u): x е X(k), u е U (k, x)}, t е K \ K' ' - inf{/d (z):x е X (k), uv е Uv (k, x)}, k е K', l = inf{G (x): x е Г n X (kF)}.
Здесь ф ( k , x ) - произвольный функционал, ^d ( k , z , t , x d ) - произвольное параметрическое семейство функционалов (с параметрами k , z ).
Легко убедиться, что L(m) = I(m) при m е D, т.е. при выполнении отброшенных связей L(m) совпадает с I(m) . Действительно, при m е D , как видно,
R = ф ( k + 1, x ( k + 1) ) - ф ( k , x ) ,
R d = ф 1 ( k , z , t + 1, xd ( t + 1)) - фа ( k , z , t , xd ), L = F ( x ( k F )) + ^ ( ф ( k , x ) - ф ( k , x )) +
K \ K '
' ! Е Ф ( k,z.t , x ) - ф ( k,z,t . x )) .
K ' ( T ( k . z ) J
Отсюда непосредственно следуют теоремы, аналогичные теоремам для ДНС [13, 14].
Теорема 1. Для любого элемента m е D и любых ф. vd имеет место оценка
I ( m ) - inf I < А = I ( m ) - 1 .
Пусть имеются два процесса m I е D . m II е E и функции ф и v d такие.
что L
( m II ) < L ( m I ) = I ( m I )
,и m II
е D .
Тогда I ( m II ) < I ( m I ).
Теорема 2. Пусть имеются последовательность процессов { m s } с D и функционалы ϕ , ϕ d , такие что:
-
1) R ( k . x s ( k ) . U s ( k ) ) ^ д ( k ) . к е K ;
-
2) R d ( z s . t . x s ( t ) . u d ( t ) ) - / ( z s . t ) ^ 0. k е K ' . t е T ( Z s ) ;
-
3) G d ( Z s . y d ) - 1 d ( Z s ) ^ 0. k е K ' ;
-
4) G ( X s ( I f ) ) ^ 1 .
Тогда последовательность { ms } – минимизирующая для I на D .
r
\
Ia = aI + (1 - a ) E |A u ( k )l2 +Z|A ud ( k. t )l2 .
^ K \ K ' \ kF K '
J
где ае[0.1]. Au = u - uI. Aud = ud - udI. При построении метода будем отталкиваться от задачи улучшения элемента. Задан элемент mI е D и требуется найти элемент mII е D. для которого справедливо неравенство: I (m II )< I (m I).
Согласно принципу расширения, будем решать задачу улучшения для функционала L a . Имеем L a ( m II ) - L a ( m I ) < 0. Рассмотрим приращение функционала L α ( m ) :
A L а «А G - E k \ k ' A R - E ( A G d - E A R d ),
K '
T ( k . z )
где A R = R TT A x + R T A u + 1 A u T R A u , A G = G „ T A x , A G d = G dT A x + G d T A xd d , x u uu x x d F
2 xF
A Rd = R d T A x + R d T A xd + R d T A ud + 1 A ud T R d A Uud . Здесь функции
-
x x u 2 uu
-
G , Gd , R , Rd выписаны для функционала I α .
Предположим, что матрицы Ruu и Rud d u d отрицательно определены (этого всегда можно добиться за счет выбора параметра α [15]). Найдем A u , A ud , доставляющие максимум выражениям для A R и A Rd . Нетрудно видеть, что A u = - ( Ruu ) - 1 Ru , A u d =- ( Rd, d ) - 1 Rd, . Для выполнения неравенства A L < 0 потребуем далее, чтобы A R , A G , A G , A Rd не зависели от A x , A x F , A xd . Зададим функции ф, ф1 в виде: ф ( k , x ) = у(k ) x , фа ( k , t , x , x d ) = y d ( z , t ) x d + Ax .
Тогда из сформулированных условий получим:
A u = - ( H „„ )- 1 Hu , y ( kF ) = - aFx , Уk ) = Hx , k e K \ K ' , И k ) = H x + £У ( k , t i )+ A ( k , t i ) , ^ ( k , t F ) = H x d , A ( k , t F ) = H xf ,
У ( k , t ) = H d d , A ( k , t ) = H xd , A u d =- ( H du ) - 1 H d d , k e K ' .
Здесь
H ( k , x , u,y ( k + 1 )) = у T ( k + 1 ) f ( k , x ( k ), u ( k )) - ( 1 - a ) A u |2, k e K \ K ' \ kF , H ( k , x,у ( k + 1 ), x d , xdF ) = у T ( k + 1 ) y ( k , x d , x F ), k e K ' ,
Hd ( k , t , x , x d , u d ,yd ( k , t + 1 ) ) = y d ( k , t + 1 ) f d ( k , t , x , x d ( k , t ), u d ( k , t ) ) - ( 1 - a ) A u d ( k , t ) , a - коэффициент, a e [0,1].
3. Итерационная процедура
На основе полученных соотношений можно сформулировать следующую итерационную процедуру на шаге s .
-
1. «Слева направо» просчитывается НДС (1), (2) при u = u s ( к ), u d = u d ( к , t ) и заданных начальных условиях, получаются соответствующие траектории ( xs ( k ), xsd ( k , t )) .
-
2. «Справа налево» разрешается НДС относительно у ( к ) , y d ( к , t ) и λ ( k , t ).
-
3. Находятся A u , A u d и новые управления u s + 1( к ) = u s ( к ) + А u , u d + 1 ( к ) = u d ( к ) + А u d .
-
4. Просчитывается «слева направо» исходная НДС (1), (2) при новых управлениях с заданными начальными условиями.
Процесс итераций заканчивается, когда | I s + 1 - I s | ~ 0 с заданной точностью.
Имеет место следующее утверждение о сходимости.
Теорема 3. Пусть для НДС (1), (2) построена указанная итерационная процедура, и функционал I ограничен снизу. Тогда она генерирует улучшающую последовательность элементов { m s } е D , сходящуюся по функционалу, т.е. существует число I * , такое что I * < I ( m s ), I ( m s ) ^ I * .
Доказательство. Доказательство следует непосредственно из свойства монотонности (по функционалу) рассмотренного оператора улучшения. Таким образом, получается монотонная числовая последовательность
{ I s } = { I ( m s )} , I s + 1 < I s , ограниченная снизу, которая по известной теореме анализа сходится к некоторому пределу: Is ^ I * . Теорема доказана.
Пример. Проиллюстрируем один шаг метода на примере. Пусть задана неоднородная дискретная управляемая система:
x d ( l + 1 ) = x d ( t ) ud ( t ) - ( ud ( t ) ) 2 , x d ( t + 1 ) = x d ( t ), X ( 0 ) = x d ( 0 ) = 1, t = 0,1,2; x 1 ( t + 1 ) = x d ( t> d ( t ) - (u d ( t ) ) 2 , t = 3,4;
I = x d ( 5 ) ^ min.
Нетрудно видеть, что K = 0,1,2. Поскольку роль связующей переменной на двух рассматриваемых этапах играет x 1 d , то в терминах этой переменной легко записать процесс верхнего уровня: x ( 0 ) = x d ( 0,0 ) , x ( 1 ) = x d ( 0,3 ) = 9, x d ( 1,4 ) = x ( 1 ) = ^, x ( 2 ) = x d ( 1,5 ) . Тогда I = x ( 2 ) . Основные конструкции принимают вид:
H ( 0, t , v 2 ( 0, t + 1 ) v 2 ( 0, t + 1 ), x 2 , x 2d , u2 ) =
= v 1 ( 0, t +1( x d 2 ( 0, t У ( 0, t ) - ( u2 ( 0, t ) ) 2 ) +
+ v2 ( 0, t + 1 ) x d ( 0, t ) - ( 1 - a ) ( a u2 ( 0, t ) ) 2 ;
H ( 1, t , V 1 2 ( 1, t + 1 ), x 2 , u 2 ) =
= v 2 ( 1, t + 1( x 2 ( 1, t ) u 2 ( 1, t ) - ( u 2 ( 1, t ) ) 2 ) - ( 1 - a ) ( a u 2 ( 1, t ) ) 2;
H ( k , v ( k + 1 ) , x ) = v ( k + 1 ) x 2 ( k , tF );
v(k) = v(k +1), k = 1, v(2) = -aFx =-a;
v1 (0,t) = v2(0,t +1), v2 (0,3) = v(1) = -a,
V 2 ( 0, t ) = v 2 ( 0, t + 1 ) u2 ( 0, t ), v 2 ( 0,3 ) = 0;
v 1 ( 1, t ) = v 1 ( 1, t + 1 ) u2 ( 1, t ), v 2 ( 1,5 ) = v ( 2 ) = - a .
Приращения управлений на текущем приближении определяются по формулам:
A u 2 ( 0, t ) = - ( 2 ( 2 a - 2 - v 2 ( 0, t + 1 ) )) - 1 v 2 ( 0, t + 1 ) ( x 2 ( 0, t ) - 2 u 2 ( 0, t ) ),
A u 2 ( 1, t ) = - ( 2 ( 2 a - 2 - v 2 ( 1, t + 1 ) )) - ' v 2 ( 1, t + 1 ) ( x 2 ( 1, t ) - 2 u 2 ( 1, t )J.
Поскольку уравнения нижнего уровня не зависят от переменной x верхнего уровня, то Л ( k , t ) = 0.
В качестве начального приближения были выбраны значения u2 ( 0, t ) = 0.1, u2 ( 1, t ) = 1 , при этом 1 1 =- 2.001 . Расчеты на шаге проводились для значений a = 0.05,0.1,0.4 . В табл. 1 отражены результаты, полученные после выполнения одного шага алгоритма, которые подтверждают работоспособность предложенного алгоритма.
α |
0.05 |
0.1 |
0.4 |
I 2 |
- 2.1817 |
- 2.4062 |
- 7.0191 |
Таблица 1. Значения функционала I при разных значениях α .
Заключение
Таким образом, в работе приведена иерархическая модель неоднородной дискретной системы (НДС), для которой поставлена задача оптимального управления и сформулированы достаточные условия оптимальности типа Кротова. На основе этих условий, принципах расширения и локализации получен метод локального улучшения. Доказана теорема о сходимости метода по функционалу. Рассмотрен иллюстративный пример.
Список литературы Метод локального улучшения управления для неоднородных дискретных систем
- Пропой А. И. О принципе максимума для дискретных систем управления//Автомат. и телемех. -1965. -Т. 26. -№ 7. -С. 1177-1187.
- Пропой А. И. Элементы теории оптимальных дискретных процессов. -М.: Наука, 1973. -256 с.
- Болтянский В. Г. Оптимальное управление дискретными системами.-М.: Наука, 1973. -448 с.
- Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. -М.: Наука, 1982. -432 с.
- Горбунов В. К. О сведении задач оптимального управления к конечномерным//Журнал выч. мат. и мат. физ. -1978. -Т. 18. -№ 5. -С.1083-1095.
- Гурман В. И. К теории оптимальных дискретных процессов//Автомат. и телемех.-1973. -№ 6. -С. 53-58.
- Васильев С. Н. Теория и применение логико-управляемых систем//Труды. 2-я Международная конференция «Идентификация систем и задачи управления» (SICPRO'03). -2003. -С. 23-52.
- Бортаковский А. С. Достаточные условия оптимальности управления детерминированными логико-динамическими системами//Информатика.-Вып. 2-3.-Сер. Автоматизация проектирования. -М.: ВНИИМИ -1992. -С. 72-79.
- Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями. -М.: Наука, 2005.
- Lygeros J. Lecture Notes on Hybrid Systems. -Cambridge: University of Cambridge, 2003.
- Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. -М.: Наука, 1973. -448 с.
- Кротов В. Ф. Достаточные условия оптимальности для дискретных управляемых систем//ДАН СССР.-1967. -Т. 172. -№ 1. -С. 18-21.
- Гурман В. И., Расина И. В. Дискретно-непрерывные представления импульсных решений управляемых систем//Автомат. и телемех. -2012. -№ 8. -С. 16-29.
- Расина И. В. Иерархические модели управления системами неоднородной структуры. -М.: ФИЗМАТЛИТ, 2014.
- Гурман В. И., Расина И. В. О практических приложениях достаточных условий сильного относительного минимума//Автомат. и телемех.-1979. -№ 10. -С. 12-18.