Об одном методе решения задачи идентификации динамических систем

Автор: Булдаев Александр Сергеевич, Хишектуева Ишин-Хорло Дамбадоржиевна, Анахин Владимир Дмитриевич, Дамбаев Жаргал Гомбоевич

Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths

Рубрика: Управляемые системы и методы оптимизации

Статья в выпуске: 4, 2020 года.

Бесплатный доступ

Для решения задачи идентификации динамических систем применяются теория и методы оптимального управления. Рассматривается новый подход к решению задачи, основывающийся на представлении условий улучшения управления в форме специальных задач о неподвижной точке операторов управления. Такое представление дает возможность применить и модифицировать теорию и методы неподвижных точек для построения релаксационных последовательностей управления в задачах оптимизации рассматриваемого класса. Предлагается алгоритм приближенного решения задачи идентификации на основе итерационных методов поиска неподвижных точек. Рассматриваемый алгоритм характеризуется свойствами нелокального улучшения управления и принципиальной возможностью строгого улучшения неоптимальных управлений, удовлетворяющих известным необходимым условиям оптимальности, в отличие от градиентных и других локальных методов. Эффективность предлагаемых методов оптимизации иллюстрируется на расчете модельной задачи.

Еще

Параметрическая оптимизация, условия улучшения управления, задача о неподвижной точке, метод оптимизации

Короткий адрес: https://sciup.org/148308968

IDR: 148308968   |   DOI: 10.18101/2304-5728-2020-4-14-25

Текст научной статьи Об одном методе решения задачи идентификации динамических систем

Известным подходом к решению задач параметрической идентификации динамических систем является сведение к задачам оптимизации параметров. Для решения возникающих задач, как правило, применяют методы конечномерной оптимизации неявно заданных целевых функций. Менее распространенным подходом является интерпретация задачи идентификации как задачи оптимального управления и применение аппарата теории и методов оптимального управления для поиска оптимальных параметров. При этом используют методы, основанные на реализации необходимых условий оптимальности управления [1] и локальные методы улучшения управления, в частности градиентные [2].

Предлагаемый в статье метод является модификацией развиваемых нелокальных методов улучшения и оптимизации управлений на основе решения конструируемых задач о неподвижной точке в пространстве управлений [3; 4] применительно к рассматриваемой задаче идентификации. Эти методы являются развитием нелокальных методов, которые были первоначально разработаны в классах линейных [5] и полиномиальных [6] по состоянию динамических систем и основывались на решении специальных задач Коши и краевых задач в пространстве состояний.

  • 1    Задача идентификации

Задача идентификации динамических систем рассматривается в следующей постановке аналогично работам [1; 2].

Пусть измеряются выходные характеристики динамического объекта y ( t ) = ( У 1 ( t ),—, У, ( t )) на фиксированном интервале времени T = [ t 0, t j. Относительно объекта известна дифференциальная система уравнений движения:

x( t ) = f ( x ( t ), о , t ), x ( t o ) = a , o e W , a e A , (1) в которой x ( t ) = ( x , ( t ),..., xn ( t )) — вектор состояния, о = ( ® 1 ,..., to m ) и a = ( a^...,a n ) — векторы параметров. Множества W c Rl , A c Rn выпуклы и замкнуты.

Ставится задача определить вектор параметров с = ( о , a ) со значениями в множестве Q = W х A , при котором заданная функция Ф ( с ) от параметров, характеризующая меру близости решений системы (1) x ( t ) = x ( t, с ), t e T к функции y ( t ) = ( y 1 ( t ),..., ys ( t )), t e T , принимала наименьшее значение:

Ф ( о ) = [ F ( x ( t ), y ( t )) dt = [ F ( x ( t ), t ) dt ^ inf .        (2)

T

T

σ Ω

n

F ( x , У ) = Е X ( x - У ‘ ).

i = 1

Отметим актуальный для приложений случай, в котором задача идентификации (1), (2) находит важное применение.

При моделировании многих задач математической физики возникает проблема поиска их решений, обусловленная большой размерностью и сложностью моделируемых систем дифференциальных уравнений. Известным подходом к исследованию таких задач является упрощение модели, сводящееся к замене исходных дифференциальных уравнений более простыми уравнениями меньшей размерности. Задачу упрощения и понижения размерности системы дифференциальных уравнений можно сформулировать в следующей постановке аналогично работам [1; 2].

По известной выходной характеристике y ( t ) = ( y 1( t ),..., ys ( t )) заданной системы дифференциальных уравнений:

y ( t ) = 7 ( У ( t X t ), У ( t 0 ) = У 0

требуется определить параметры системы (1) при n s , для которой заданная функция (2), характеризующая близость решений систем, принимает наименьшее значение.

Таким образом, задачу упрощения и понижения размерности дифференциальной системы можно рассматривать как частный случай задачи идентификации (1), (2).

  • 2    Метод неподвижных точек

Задача (1), (2) рассматривается как задача оптимального управления при следующих предположениях.

Функции f ( x , о , t ), F ( x , t ) и их частные производные по переменным x и ω непрерывны по совокупности аргументов на соответствующих множествах Rn х W х T и Rn х T . Функция f ( x , о , t ) удовлетворяет условию Липшица по x в Rn х W х T с константой L 0: II 7 ( x , о , t ) - 7 ( У , о , t )|| L ||x - У 11 .

Условия гарантируют существование и единственность решения x ( t , < 7 ), t е T системы (1) для любого допустимого управления о еО .

Функция Понтрягина с сопряженной переменной ψ Rn и стандартная сопряженная система в задаче (1), (2) принимают следующий вид:

H ( ^ , x , о , t ) = ( ^ , 7 ( x , о , t )) - F ( x , t ),

  • Ч & ( t ) = — H x ( V ( t ), x ( t ), о , t ), t е T , ^ ( t i ) = 0.          (3)

Для допустимого управления о eQ обозначим ^ ( t , о ), t е T - решение стандартной сопряженной системы (3) при x ( t ) = x ( t, о ) и аргументе to , соответствующему вектору о . Обозначим частное приращение произвольной вектор-функции g ( yx,..,yt ) по переменным y s , ys :

А ys , ys , . ys 2 +A ys 2 g ( y 1 ’"'’ y ) =

= g ( y i ,-, y s , +A y s , ,-, y s 2 +A y s 2 ,-, yi ) - g ( y i ,-, yi )

Рассмотрим задачу улучшения управления в следующей общей постановке:

для заданного управления σ I Ω требуется найти управление σ Ω с условием А о Ф ( о 7 ) = Ф ( о ) - Ф ( о 7 ) 0 .

В соответствии с работой [4] определим модифицированную дифференциально-алгебраическую сопряженную систему в форме:

p ( t ) = - H x( P ( t ), x ( t ), to , t ) - r ( t ), P ( t l ) = 0,                   (4)

(Hx ( P ( t )> x ( t )> to - t ) + r ( t )> y ( t ) x ( t )) = A y ( t ) H ( P ( t )> x ( t )> to - t ) ,      (5)

в которой по определению полагаем r ( t ) = 0 в случае линейности функций F , f по x (линейная по состоянию задача (1), (2)), а также в случае y ( t ) = x ( t ) при соответствующих t е T .

В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (4), (5) в силу определения совпадает со стандартной сопряженной системой (3).

В нелинейной по состоянию задаче (1), (2) алгебраическое уравнение (5) всегда можно разрешить относительно величины r ( t ) (возможно, не единственным образом).

Для допустимых управлений о eQ , о 7 eQ обозначим p ( t , о 7 , о ), t е T — решение модифицированной сопряженной системы (4), (5) при x ( t ) = x ( t , о 7 ), y ( t ) = x ( t, о ), to = to 7 . Из определения следует очевидное равенство p ( t , о , о ) = у (t, о ), t е T .

Обозначим P Y — оператор проектирования на множество Y с R k в евклидовой норме

P y ( z ) = arg min(|| y - z ||), z e R k .

y Y

Из работы [4] следует, что для решения задачи улучшения заданного управления σ I Ω достаточно решить следующую систему уравнений относительно о = ( to , a ) при заданном параметре a 0:

to = P w ( to1 + a j H to ( p ( t , о 7 , о ), x ( t, о ), to 7 , t ) dt + s to ),                (6)

T

А ю f H ( Р ( t , ° , ° ), x ( t , ° ), ю1 , t ) dt =

T

/                                                      \             (7)

= И H m ( p ( t , ° , ° ), x ( t, ° ), ю1 , t ) dt + s " , ю - ю

T a = Pa(a1 + ap(10,°,°)),                     (8)

в которой в уравнении (7) по определению полагается s = 0 в случае линейности функции f по ю (линейная по параметру ю задача (1), (2)), а также для ю = ю 1 .

В нелинейной по параметру ю задаче (1), (2) уравнение (7) всегда можно разрешить относительно величины s ю (возможно, не единственным образом).

Таким образом, систему (6)-(8) всегда можно свести (возможно, не единственным образом) к приведенной системе уравнений с однозначно определенной величиной s ю .

Пусть система условий (6)-(8) имеет решение ° п = ( ю 11 , a11 ) (возможно, не единственное). Тогда имеет место оценка улучшения целевой функции:

А °" ф(°1) < - 0a р—ю । f - a aa11—a1112.

В частном случае задачи (1), (2), когда вектор начальных условий a е A не меняется и имеет заданное значение, задача улучшения управления сводится к системе уравнений (6), (7).

Структура полученных условий улучшения управления и используемая система обозначений решений фазовой и сопряженной систем в форме явной зависимости от управления позволяет интерпретировать систему уравнений (6)-(8) как задачу о неподвижной точке специального оператора управления. Это позволяет применить развитую теорию и методы неподвижных точек для эффективного поиска улучшающих управлений.

Выбирая однозначно определенные правила определения указанных выше величин r ( t ) и s ю , будем получать однозначно определенные операторы управления. Таким образом, возникают модификации предлагаемого метода неподвижных точек для улучшения управления с различными однозначно определенными операторами управления. Множества неподвижных точек возможных модификаций оператора управления позволяют сущест -венно расширить потенциал улучшения заданного управления.

Данная особенность предлагаемого подхода неподвижных точек позволяет конструировать специальные вычислительные технологии улучшения управления, в которых на каждой итерации улучшения выбирается наилучшее по определенному правилу управление. Такие технологии улучшения управления могут эффективно реализовываться с помощью параллельных вычислений на многопроцессорных компьютерах.

Выделим другую важную особенность предлагаемого метода.

Решение CT 1 eQ задачи о неподвижной точке, отличающееся от улучшаемого управления ст 1 eQ , обеспечивает строгое улучшение по целевой функции ввиду указанной ранее оценки улучшения. Это свойство позволяет методу неподвижных точек строго улучшать экстремальные неоптимальные управления ст 1 eQ , удовлетворяющие дифференциальному принципу максимума [1] в задаче (1), (2), в случае существования неподвижных точек, отличающихся от ст 1 eQ .

Метод решения задачи идентификации состоит в последовательном решении конструируемых задач о неподвижной точке для улучшения управления.

  • 3    Итерационный алгоритм решения

Для численного решения задачи о неподвижной точке (6)-(8) для улучшения заданного управления ст 1 выбирается следующий итерационный процесс при k 0 :

CT + 1 = P w ( CT + a j H m ( p ( t , CT , CT ), x ( t , CT ), CT , t ) dt + s m ),

T

A to k j H ( p ( t , CT , CT ), x ( t , CT ), CT , t ) dt = T

, jHm(p(t,CT,CT),x(t,CT), CT,t)dt + sto,CT - CT \ T ak+1' = Pa(a1 + ap(to,CT,CT)).

Задается начальное приближение итерационного процесса ст 0 eQ при k = 0.

Расчет задачи о неподвижной точке (6)-(8) осуществляется до первого улучшения исходного управления CT . Далее строится новая задача улучшения для полученного управления CT I , и расчет повторяется. Итерации улучшения управления продолжаются до тех пор, пока не выполнится условие

| Ф ( ст ") ( ст 1 )| 8 ф ( ст 1 )| , где 8 0 — заданная точность расчета.

Анализ принципиальной сходимости рассматриваемого итерационного процесса к решению задачи о неподвижной точке при достаточно малых параметрах проектирования a 0 проводится аналогично работам [4; 6] на основе известного принципа сжимающих отображений, применяемого в работе [7].

Предлагаемый метод неподвижных точек характеризуется тем, что улучшающие управления определяются решениями соответствующих задач о неподвижной точке при любом значении параметра проектирования a > 0. В частности, при достаточно малых a > 0, обеспечивающих принципиальную сходимость конструируемого итерационного процесса последовательных приближений к решению задачи о неподвижной точке.

В целом, оптимизация управлений на основе расчета конструируемых задач о неподвижной точке предлагаемым итерационным методом последовательных приближений сводится к чередующемуся решению задач Коши для фазовых и сопряженных переменных.

Эффективность предлагаемого алгоритма решения задачи идентификации иллюстрируется на расчете модельной задачи упрощения и понижения размерности дифференциальной системы уравнений.

  • 4    Модельная задача «Кинетика ядерного реактора»

Рассматривается задача понижения размерности системы дифференци альных уравнений, описывающей кинетику ядерного реактора [1]: у, = 641,02у + 21,02 у 2 +141,03 у3 +120,192у 4 + +253,844у5 + 74,358у6 + 27,051у7 + 200,

у 2 = 0,0123 ( у 1 - у 2 ) , у з = 0,03 ( у 1 - у 3 ) , & 4 = 0,112 ( у 1 - у 4 ) , у = 0,301 ( у 1 - у 5 ) , у 6 = 1,149 ( у - у 6 ) , у 7 = 3,012 ( у - у 7 ) , у 1 (0) = ... = у 7 (0) = 0,25, T = [0,8].

Идентифицируемая упрощенная система имеет вид: x = w 1 x + w 2 x 2 + w 3, x 2 = w 4 x 1 + w 5 x 2 , X 1 (0) = vp x 2 (0) = v 2 , T = [0,8].

В качестве минимизируемой целевой функции, характеризующей близость решений, рассматривается среднеквадратическая ошибка:

  • 8 2                        2

I ( wv ) = JE ( x ( t ) - у - ( t ) )2 dt , w = ( w 1 ’-> w 5 ) , v = ( v 1 , v 2 ) .      (11)

0 - = 1

Задача состоит в определении таких значений вектора параметров (w, v), при которых целевая функция (11) принимает наименьшее значе- ние.

В источнике [8] были получены следующие расчетные оптимальные значения параметров и целевой функции:

w * = - 0,1206; w * = 0,0692; w 3' = 0,1296; w * = - 0,0065; w * = 0,0294; 1              ,            *2          ,                   3          ,                  4             ,             *5          ,

  • a,                                    a,                                               a,       a,                                                                             \       /

    v 1 = 0,5809; v = 0,2610; I ( w , v ) = 0,0244.

Качественный и численный анализ системы (9) показал, что система является вычислительно неустойчивой ввиду существования собственного числа, соответствующего переменной x 1 , которое имеет достаточно большую положительную вещественную часть. При численных расчетах этой системы обнаружилось расхождение между решением исходной системы (9) и идентифицируемой системы (10) с расчетными значениями параметров (12). Поэтому была поставлена и решена вспомогательная задача идентификации параметров системы (10):

y = U 1 У 1 + u 2 y 2 + u 3 y 3 + u 4 y 4 + u 5 y 5 + U 6 y 6 + u 7 y 7 + u 8 ,

Ут = 0,0123 ( y i - y 2 ) , У з = 0,03 ( y i - y 3 ) , y 4 = 0,112 ( y i - y 4 ) ,     (13)

y 5 = 0,301 ( y i - y 5 ) , У б = 1,149 ( y i - y 6 ) , У 7 = 3,012 ( y i - y 7 ) ,

У 1 (0) = ... = y 7 (0) = 0,25, T = [0,8].

,..., u 8),

ф ( u ) = £ Е ( y . ( t ) - z - ( t ) )2 dt ^ min, u = ( u i i = 1

где z(t) — приближенное решение, построенное следующим образом. Первые две компоненты вычисляются по модели (10) с расчетными оптимальными значениями параметров (12). Остальные компоненты восстанавливаются по уравнениям исходной модели (9) для переменных y3,..., y7.

Таким образом, z ( t ) является решением системы:

zi =-0,1206z1 + 0,0692z2 + 0,1296, z2 =-0,0065z1 + 0,0294z 2, z3 = 0,03(zi -z3), z, = 0,112(zi -z4), z5 = 0,301(zi -z5), z6 = 1,149(zi -z6), z7 = 3,012(zi -z7), T = [0,8], z1(0) = 0,5809, z2(0) = 0,2610, z3(0) =... = z7(0) = 0,25.

Для численного решения задачи идентификации (13) использовался описанный ранее метод неподвижных точек. Таким образом, были найдены следующие расчетные оптимальные значения управляющих параметров задачи (13):

ui1 = - 87,9013; u 2 = 8,0383; u3 = 13,0397; u 4 = 34,0451; u 5 = 22,0533; u6 = 27,0638; z2 7 =- 14,9313; u8 = 30,1494; Ф ( ui) = 0,00146.

В результате в качестве «понижаемой системы» рассматривалась тема (13) со значениями коэффициентов (14).

Минимизируемая целевая функция имеет вид: 82             2

ф ( w ) = JE ( x - ( t ) - y. ( t ) ) dt , w = ( w i ,..., w 5 ) .

сис-

0 1=1

Методом неподвижных точек были получены следующие расчетные значения параметров и целевой функции:

W =- 0,1102; w 2 = 0,0414; w 3 = 0,1292;

w 4 = 0,0371; w 5 =- 0,0904; Ф ( w ) = 0,0009.

На рис. 1 представлены графики траекторий переменных y 1, y 2 численного решения понижаемой системы и траекторий переменных x 1, x 2 численного решения идентифицируемой системы (15):

Рис. 1. y ( t ) — решение «понижаемой» системы, x ( t ) — полученное решение

Сравнительный анализ достигнутых расчетных значений целевой функции с известными данными о минимальной среднеквадратичной ошибке, полученными градиентными методами в [1], показал значительно лучшую эффективность метода неподвижных точек.

Предлагаемый метод неподвижных точек продемонстрировал в рамках расчета модельной задачи достаточно широкую область сходимости итерационного алгоритма по начальному приближению, удобство и простоту экспериментальной настройки скалярного проекционного параметра для регулирования качества и скорости сходимости итерационного процесса.

Заключение

Построенный метод неподвижных точек для улучшения управления в рассматриваемом классе нелинейных задач идентификации характеризуется свойством нелокальности, обусловленной фиксированностью параметра проектирования и отсутствием процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления, характерной для градиентных методов. Предлагаемый метод обладает потенциальной возможностью строгого улучшения неоптимальных экстремальных управлений, удовлетворяющих дифференциальному принципу максимума. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.

Одно из основных отличий разработанного проекционного метода неподвижных точек от стандартного метода проекции градиента состоит в том, что параметр проектирования a 0 фиксируется в итерационном процессе последовательных приближений. В методе проекции градиента этот параметр варьируется на каждой итерации приближений для обеспечения улучшения управления.

Указанные свойства предлагаемого метода неподвижных точек являются важными факторами повышения вычислительной и качественной эффективности решения задач идентификации нелинейных динамических систем и определяют перспективное направление развития методов идентификации.

Список литературы Об одном методе решения задачи идентификации динамических систем

  • Габасов Р., Кириллова Ф. М. Качественная теория оптимальных процессов. М.: Наука, 1971. 508 с.
  • Ащепков Л. Т., Новосельский А. В., Тятюшкин А. И. Идентификация динамических систем как задача управления параметрами // Автоматика и телемеханика. 1975. № 3. С. 178-182.
  • Булдаев А. С. Хишектуева И.-Х. Д. Метод неподвижных точек в задачах параметрической оптимизации систем // Автоматика и телемеханика. 2013. № 12. C. 5-15.
  • Булдаев А. С. Методы неподвижных точек на основе операций проектирования в задачах оптимизации управляющих функций и параметров динамических систем // Вестник Бурятского государственного университета. Математика, информатика. 2017. № 1. С. 38-54.
  • Срочко В. А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.
  • Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
  • Самарский А. А., Гулин А. В. Численные методы. М.: Наука, 1989. 432 с.
Статья научная