Об одном методе оценки параметров квадратичных систем
Автор: Булдаев Александр Сергеевич
Журнал: Вестник Бурятского государственного университета. Философия @vestnik-bsu
Рубрика: Управляемые системы и методы оптимизации
Статья в выпуске: 9, 2015 года.
Бесплатный доступ
Конструируется метод оценивания коэффициентов системы обыкновенных дифференциальных уравнений, квадратичной по переменным состояния. Описываемый подход основывается на специальных формулах приращения функционалов от решений системы, не содержащих остаточных членов разложений.
Квадратичная система, параметрическая оптимизация, приращение функционала
Короткий адрес: https://sciup.org/148183097
IDR: 148183097 | DOI: 10.18097/1994-0866-2015-0-9-125-131
Текст научной статьи Об одном методе оценки параметров квадратичных систем
Для задач параметрической идентификации динамических систем распространенным является оптимизационный подход, в соответствии с которым рассматривается определенная задача оптимизации параметров. Для решения возникающей задачи параметрической оптимизации можно использовать методы решения конечномерных задач математического программирования с неявно заданными функциями от параметров [1]. Другой способ решения основывается на применении теории и методов оптимального управления [2; 3]. Предлагаемый в данной работе подход основывается на построении и реализации специальных формул приращения конструируемых функционалов от решений системы, не содержащих остаточных членов разложений.
-
1. Задача параметрической оптимизации
Рассматривается система обыкновенных дифференциальных уравнений следующего вида x,(t) = Il J(a,t)Xj(t)Xk(t) + I!bu(a,t)Xj(t) + c(a,t), 1 = 1,...,n,
J , k = 1 J = 1
или в векторной форме
x ( t ) = f ( x ( t ), a,t ), x ( t o ) = x 0 , t e T = [ t o , t i ], (1)
где x(t) = (x1(t),...,xn(t)) - вектор состояния, a = (a1,...,am) - вектор постоянных коэффициентов системы со значениями в компактной области Ac Rm. Функция f (x,a,t) является квадра- тичной по х с коэффициентами, непрерывными по а и измеримыми по t, на множестве R" х АхT. Общее предположение измеримости по t класса допустимых функций f связано с возможностью использования дифференциальных уравнений с разрывными по t правыми частями («толчками» [4] в заданные моменты времени), а также с использованием интегралов от измеримых по t функций в качестве функционалов. Предположим, что свойства функции f обеспечивают существование и единственность решения системы (1) х(t) = х(t,а), t е T для любого допустимого а.
Пусть известен вектор параметров а 0 еА системы (1), который соответствует некоторому стандартному состоянию системы, называемому невозмущенным. Невозмущенному состоянию соответствует решение х 0( t ) = х ( t,а 0), t е T .
Примем далее, что истинное, или возмущенное состояние системы описывается системой (1) при некотором а* = а 0 + А а 0 еА . Предположим, что заданы измерения х(0 ) в дискретные моменты времени 0 е0 = {0 k : к = 1,..., K ; t 0 < 0 1 < ... < 0K < t 1 } возмущенного решения х ( t , а* ), t е T . Дополнительно могут быть заданы измерения Ф l , l = 1, L функционалов от возмущенного решения. Функционалы определяются соотношениями
Ф1 (а) = ф1 (х(t,а)) + [ F1 (х(t,а),а,t)dt, l = 1L, (2) T где функции Fl (х,а,t), l = 1,L являются квадратичными по х с коэффициентами, непрерывными по а и измеримыми по t, на множестве R” хАхT. Функции ф1 (х), l = 1,L квадратичны по х на R”.
Отметим, что измерение х i (0к ) для i -й компоненты возмущенного решения в момент времени 0к можно представить в форме измерения функционала, имеющего вид (2)
J‘k (а) = I" Lq* (t), х (t ,а))dt, i е{1,..., n}, к е{1,..., K}, T в котором измеримая вектор-функция qik(t) = (qi(t),...,q'*(t)), t е T определяется соотношениями
[0, j ^ i, qj (t) = L . для j = 1,...,n , З(t - 0k) - дельта-функция.
Зt - 0 ), j = i
Допустим, что статистические погрешности в измерениях устранены и в результате предварительной обработки данных в пределах заданной точности известно возмущенное решение х * ( t ) = х ( t , а* ), t е T и значения функционалов Ф l ( а * ), l = 1, L . Задача состоит в нахождении вектора возмущения параметров А а 0 = а * - а 0 по известным данным.
В алгоритмах теории малых возмущений, применяемых для решения обратных задач [5, 6], предполагают малость вектора возмущения параметров по сравнению с а 0. С этой целью в задачу вводят малый параметр s > 0 по правилу За 0 = еАа 0. Далее систему (1) и функционалы (2) линеаризуют в окрестности невозмущенного вектора параметров а 0 и отыскивают малую вариацию За 0 так, чтобы Ф l (а 0 + За 0) ~Ф l ( а * ) при всех l . Если найденный возмущенный вектор ( а 0 + За 0) сильно отличается от а 0, то ( а 0 + За 0) принимается за новое начальное невозмущенное приближение а 1 = а 0 + За 0 и процесс уточнения новой вариации За 1 повторяется. Таким образом, строится последовательность приближений а5 +1 = а5 + За" , 5 = 0,1,..., которая при определенных условиях сходится в том или ином смысле. Основой способа вычисления вариаций За5 является система алгебраических уравнений, построенная на формулах вариации функционалов З Ф l ~ Ф l ( а5 + За5 ) -Ф l ( а5 ) для различных l .
В рассматриваемом классе квадратичных по состоянию обратных задач возможно получение формул приращения функционалов (2), не содержащих остаточных членов разложений. Использование таких формул приращения функционалов позволяет решить задачу определения искомого вектора приращения параметров Аа0 без последующих его локальных уточне- ний, т.е. предлагаемый в работе метод оценивания возмущенных параметров имеет нелокальный характер.
Рассмотрим функцию Понтрягина H ( р , x,a,t ) = ^р , f ( x , a,t )) с сопряженной переменной р е Rn . Для дифференцируемой функции р ( t ), t е T с условием р ( t^ = 0 и нелокального возмущения A x ( t ) = x * ( t ) - x 0 ( t ), t е T можно записать тождество Лагранжа
J T {{ р ( t), A x ( t )} + pP ( t), A x ( t )}} dt = 0 . (3)
При этом второе слагаемое в тождестве можно представить как
(р ( t ), A x ( t )) = H ( р ( t ), x * ( t ), a , t ) - H ( р ( t ), x 0 ( t ), a 0, t ) =
= H ( р ( t ), x * ( t ), a * , t ) - H ( р ( t ), x * ( t ), a 0, t ) +
+ H ( р ( t ), x * ( t ), a 0, t ) - H ( р ( t ), x 0 ( t ), a 0, t ) = A a * H ( р ( t ), x * ( t ), a 0, t ) +
+ H (р (t), x 0(t), a0, t), Ax (t)) +1 (Hxx (р (t), x 0(t), a0, t) Ax (t), Ax (t)).(4)
Введем модифицированную сопряженную систему уравнений для переменной р(t), t е T р (t) = - Hx (р (t), x0 (t), a0, t) - 2 Hxx (р (t), x0 (t), a0, t) Ax (t) + q (t),(5)
с начальным условием
р(ti) = °.
При этом q ( t ) - измеримая функция, для которой определен линейный функционал от решения системы (1)
J (a) = Jr qq (t), x (t, a)} dt.(7)
Предположим существование и единственность решения р 0( t ) = р ( t , a 0), t е T сопряженной системы (5) с условием (6). Полагая р ( t ) = р 0( t ), t е T в тождестве (3) и учитывая (4)-(6), получаем формулу приращения функционала (7), не содержащую остаточных членов разложения
Aa* J (a0) = Jr {q (t), Ax (t)} dt = -J Aa* H (р0 (t), x * (t), a0, t) dt.(8)
Выбирая измеримые функции q ( t ), t е T , можно строить различные функционалы (7). При этом совокупность соотношений (8) будет образовывать систему алгебраических уравнений относительно неизвестного вектора параметров a * .
Приусловиилинейностифункции f ( x , a , t ) по a равенство (8) принимаетвид
J T( q ( t )> A x ( t )} dt = { - J T H a ( р 0( t )> x *( t ), a 0 , t ) dt , A a 0 ). (9)
В этом случае, выбирая не менее m различных функций q ( t ), t е T можно перейти к переопределенной системе линейных уравнений вида (9) относительно вектора A a 0 = a * - a 0, которая может быть эффективно решена по критерию наименьших квадратов [7].
Пусть дополнительно кроме возмущенного решения x * ( t ), t е T заданы значения функционалов (2) от возмущенного решения. Получим формулы приращения этих функционалов, позволяющие сформировывать уравнения алгебраической системы для определения искомого вектора a * .
Тождество Лагранжа (3) для произвольной дифференцируемой функции р ( t ), t е T принимает форму
J T {( р ( t )» A x ( t )} + ( р ( t )» A^ x ( t )} } dt = ( р ( t i ), A x ( t i )).
Для фиксированного l е{1,...,L} выберем р(t1) = -Ф*х(x0(t1)) -1 ^xr(x0(t1))Ax(t1). Тогда из предыдущего равенства получаем формулу приращения терминальной части функционала (2) ф (x *(ti))- ф (x 0 (ti)) = -JT {(р (t)»Ax (t)) + (р(t X A^x (t))}dt. (10)
Рассмотрим сопряженную систему (5) со следующими начальным условием и функцией q ( t )
p (ti) = -фХ (x0 (ti)) - 2, ф1 (x0 (ti))Ax (tD,
q(t) = Fpx0(t),a0,t) +1 Fxx(x0(t),a0,t)Ax(t), t e T.(12)
Пусть p1 (t) = p1 (t,a0), t e T - решение задачи Коши (5), (11). Полагая p(t) = p1 (t), t e T в (10), на основании (4), (5), (11) и (12) получаем равенство ф1 (x* (t1)) - ф1 (x0 (t1)) + J (F1 (x* (t), a0, t) - F1 (x0 (t), a0, t))dt =
= -[ A . H(p1 (t), x* (t), a0, t)dt.(13)
Tα
Определим функцию Понтрягина для функционала (2) в форме
H1 ( p , x,a,t ) = pp , f ( x , a , t )) - F1 ( x,a,t ).
Учитывая, что
A a H1 ( p1 ( t ), x * ( t ), a 0, t ) = A J H ( p1 ( t ), x * ( t ), a 0, t ) -A j F1 ( x * ( t ), a 0, t ), из равенства (13) получаем формулу приращения функционала (2)
A . Ф 1 (а 0) = -[ A . Hl ( pl ( t ), x * ( t ), a 0, t ) dt . (14)
αTα
Совокупность равенств (14) при различных I e {1,.... L} образует алгебраическую систему из L уравнений относительно искомого вектора параметров а * . При условии линейности функций f ( x , a , t ), F ( x , a , t ) по a имеемлинейную систему уравненийотносительно A a 0
Ф 1 (a ) -Ф 1 (a 0) = { - J h J * ( p1 ( t ), x *( t ), a 0, t ) dt , A a 0 }, I = 1 L .
Таким образом, точные формулы (8), (14) функционалов «измерений» позволяют производить нелокальную оценку вектора возмущенных параметров a * . Построение точных формул для рассматриваемого квадратичного по состоянию класса обратных задач использует специальную форму сопряженной системы уравнений (5), которая отличается от стандартной формы сопряженной системы, рассматриваемой в теории малых возмущений для обратных задач. При этом в точных формулах (8), (14) ив построенных модифицированных сопряженных системах используется возмущенное решение x * ( t ), t e T , которое требуется задать для реализации процедуры нелокального оценивания.
Отметим, что в случае линейности по x функций f ( x,a,t ), F ( x,a,t ), модифицированные сопряженные системы совпадают со стандартными, которые не содержат возмущенное решение.
Укажем выгодные отличия предлагаемого метода от, например, известного [8] прямого интегрального метода, который также позволяет производить нелокальную оценку вектора возмущенных параметров на основе точной формулы для возмущения A x ( t ) = x * ( t ) - x 0 ( t ), t e T .
-
1) В методе [8] требуется задание всех компонент возмущенного решения x * ( t ), t e T . В предлагаемом методе достаточно использовать только компоненты возмущенного решения, которые фигурируют в частных приращениях по а функций Понтрягина H , H1 в соответствующих уравнениях (8), (14).
-
2) Метод [8] позволяет производить оценку вектора возмущенных параметров на основе известных данных только для линейных по состоянию функционалов (7). Предлагаемый метод может использовать для оценки данные «измерений» квадратичных по состоянию функционалов вида (2).
Для построения системы алгебраических уравнений относительно вектора возмущенных параметров требуется задание возмущенного решения x * ( t ), t e T . На практике данные наблюдений X = { x(0 ): 0 e© } возмущенного решения задаются на дискретном множестве моментов времени 0 e© = {0k : k = 1,..., K ; 1 0 < 0 1 < ... < 0K < t 1}. Применяя среднеквадратическое приближение ( K достаточно велико) или интерполяцию ( K достаточно мало), можно построить гладкую функцию : x ( t ), t e T , которую будем рассматривать как прообраз возмущенного решения или квазирешение по терминологии [5]. Квазирешение : x ( t ), t e T будем использовать для построения практической процедуры оценки вектора возмущенных параметров.
Для фиксированных i e{1,..., n}, k e{1,...,K} определим функцию q‘k(t) = (qi (t),..., q^(t)), [0, j ^ i, где qi (t) = < для j = 1,..., n , d( t - e) - дельта-функция, t e T, 0k e0. Обозначим j [5( t - ek), j = i kZ k pik (t), t e T - решение сопряженной системы (5) при Ax(t) = x(t) - x0 (t), q(t) = qik (t) с началь ным условием pik (t1) = 0 . Рассмотрим систему уравнений (8) относительно a* = а для i = 1, n , k = 1, K при q(t) = qik (t), p0 (t) = pik (t), x* (t) = x(t), Ax(t) = x(t) - x0 (t), t e T xe) -x°Ш.) = -[ A„H(pik(t),x(t),a0,t)dt, i = 1n , k = 1K . (15)
T a
Пусть дополнительно заданы значения Фl, l = 1,...,L функционалов «измерений» вида (2). Обозначим p1 (t), t e T - решение сопряженной системы (5) при Ax(t) = x(t) - x0(t), q(t) = F‘(x0(t), a0, t) +1F (x0(t), a0, t)Ax(t) с начальным условием p 1 (t)=-^x(x °(t1))- 2 Ф^(x °(t1))Ax (t1).
Присоединим к системе уравнений (15) систему уравнений (14) относительно a* = а для l = 1, L при Ф 1 (а * ) = Ф 1 , pl ( t ) = pl ( t ), x* ( t ) = x(t ), t e T
Ф l -Ф l(a 0) = -[ A H ( pl ( t ), x(t)a 0, t ) dt , l = 1 L . (16)
T a
При условии линейности функций f ( x,a,t ), F ( x,a,t ) по a , система уравнений (15), (16)
является линейной относительно вектора А а = а - а 0, которая может быть эффективно решена по методу наименьших квадратов [7]. Пусть а 1 = а 0 + А а 1 eA - решение системы (15), (16).
Введем функционал от решений системы (1), характеризующий меру близости решения к возмущенному решению
K
Ф(а) = ^ (x (ek, а) - x(ek), x (ek, a) - x(ek)) + k=1
L
+ Н Ф l (a ) -Ф l , Ф l ( a ) -Ф l\ . (17)
l = 1 '
Если Ф ( а 1 ) -Ф ( а 0)| превышает заданную точность расчета, то а 1 принимается за новое начальное приближение вместо а 0 и расчет повторяется. Иначе а 1 принимается за оценку а* .
В случае линейности функций f (x,а,t), F(x,a,t) по а последовательность приближений a+1 = a +Aas, s = 0,1,... является релаксационной: Ф(а5+1) <Ф(а5). Действительно, решение
Aa +1 системы (15), (16) определяется согласно методу наименьших квадратов из условия
Ф ( «5 +1) = Ф ( «5 +Aas ) ^ min. Невозрастающая последовательность Ф ( а5 ), s = 0,1,... ограни-
Aas чена снизу, поэтому имеет конечный предел, т. е. Ф(а5) - Ф(а5+1) ^ 0 при s ^да .
На практике вычислений вместо (17), следуя [5], удобно использовать безразмерную форму
функционала в виде
K
Ф(а) = Z k=1
/ x (e k , a )
\ x(ek )
1 x ( e k, a ) , x(ek )
+ V/Ф l ( a ) 1 ф l ( a ) A
1 + / 1, 1 .
/ i :1\ ф l ф l /
Отметим н елокальный характер итерационной процедуры оценивания вектора возмущенных параметров: в процедуре отсутствует малый параметр, характеризующий близость соседних приближений. Нелокальность приближений является существенным фактором повышения эффективности оценивания параметров.
Предлагаемый подход легко обобщается на полиномиальные по состоянию системы и функционалы с помощью соответствующей модификации сопряженной системы [9].
Заключение
Выделим основные особенности предлагаемой процедуры оценивания.
-
1. Нелокальность оценивания: в процедуре отсутствует малый параметр, характеризующий близость оцениваемого вектора возмущенных параметров к невозмущенному вектору параметров.
-
2. Для нелокального оценивания вектора возмущенных параметров могут использоваться значения нелинейных полиномиальных по состоянию функционалов «измерений» от возмущенного решения.
-
3. При условии точного задания возмущенного решения процедура позволяет определить точный вектор возмущенных параметров за одну итерацию вычислений.
-
4. Процедура не требует обязательной наблюдаемости всех компонент возмущенного решения. Достаточно использовать данные наблюдений только для компонент возмущенного решения, фигурирующих в частных приращениях по вектору параметров для функции Понтрягина.
В целом построенный в процедуре расчетный вектор возмущенных параметров может быть использован в качестве начального приближения для дальнейшего уточнения методами последовательной минимизации [5] различных функционалов отклонений решения системы (1) от наблюдаемого прообраза решения (квазирешения). Если функционалы отклонений имеют вид (2), в котором функции ϕl ( x ), Fl ( x , α , t ) полиномиальны по переменной x , то для минимизации можно применить процедуры нелокального улучшения вектора параметров α , предложенные в [9].
Список литературы Об одном методе оценки параметров квадратичных систем
- Васильев О.В. Лекции по методам оптимизации. -Иркутск: Изд-во Иркут. ун-та, 1994. -344 с.
- Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. -М.: Наука, 1976. -392 с.
- Методы решения задач математического программирования и оптимального управления. -Новосибирск: Наука, 1984. -232 с.
- Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. -М.: Наука, 1985. -222 с.
- Марчук Г.И. Математические модели в иммунологии. Вычислительные методы и алгоритмы. -М.: Наука, 1991. -300 с.
- Марчук Г.И. Математическое моделирование в проблеме окружающей среды. -М.: Наука, 1982. -319 с.
- Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов. -М.: Наука, 1986. -232 с.
- Himmelblau D.M., Jones C.R., Bischoff K.B. Determination of rate constants for complex kinetics models//Ind. Eng. Chem. Fund. -1967. -Vol.6, No. 4. -P. 539-543.
- Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. -Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. -260 с.