Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени
Автор: Мурзабеков Заинелхриет Нугманович, Мурзабеков Асан Заинелхриетович
Журнал: Проблемы информатики @problem-info
Рубрика: Теоретическая информатика
Статья в выпуске: 3 (15), 2012 года.
Бесплатный доступ
Рассматривается задача оптимального управления нестационарными нелинейными системами с закрепленными концами траекторий. Получен алгоритм управления для одного класса нелинейных систем с ограничениями на управления на конечном отрезке времени.
Задача оптимального управления, дифференциальные уравнения, метод множителей лагранжа, нелинейная система, функционал
Короткий адрес: https://sciup.org/14320134
IDR: 14320134
Текст научной статьи Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени
Введение. Математическая теория процессов управления возникла из потребностей прикладных дисциплин. Ее развитие началось с создания средств управления движением и конструирования автоматических устройств различного назначения. Теория процессов управления используется при исследовании динамики робототехнических и электроэнергетических систем, химических и ядерных реакторов, биологических и экологических процессов, экономических и финансовых моделей. В настоящее время теория процессов управления применяется также при создании коммуникационных систем и конструировании средств автоматизации новых поколений с использованием компьютерной техники и передовых информационных технологий.
В основе решения задач оптимального управления лежит принцип максимума Понтрягина (решение сводится к соответствующей краевой задаче) [1, 2]и динамическое программирование (задача сводится к решению уравнения Беллмана) [3].
Основной проблемой современной теории управляемых движений является решение задач синтеза управлений с учетом различных ограничений. Эта проблема чрезвычайно актуальна, но еще недостаточно разработана. Теория может привести к новым направлениям в динамической оптимизации, теории дифференциальных уравнений, вычислительной математике. Разработка различных способов построения алгоритмов управления, обладающих необходимыми для приложений свойствами, является актуальной задачей современных информационных технологий [4].
Работа рекомендована к публикации Программным комитетом VIII Международной азиатской школы-семинара “Проблемы оптимизации сложных систем”.
В настоящей работе предлагается конструктивный метод построения синтезирующего управления для нелинейной управляемой системы, основанный на принципе обратной связи с учетом ограничений на управления [5, 6].
Постановка задачи. Рассмотрим класс нелинейных управляемых систем вида x = A(t)x + B(t)u + d(x,t) + f(t), t E (t0,T), x(t0) = xo, x(T)= xt; (1)
u( t ) E U ( t ) = { u | a ( t ) < u( t ) < в ( t ) , t E ( t o ,T ) , а , в E C [ t o ,T ] }c L 2 (( t o ,T ) , R m ) , (2) где x( t ) — вектор состояния объекта управления размерности n х 1; u = u(x ,t ) — вектор управляющих воздействий размерности m х 1; f ( t ) — заданная вещественная, непрерывная и ограниченная при t E [ 1 0 ,T ] векторная функция размерности n х 1 ; A ( t ) , B ( t ) — заданные непрерывные и ограниченные матрицы размерности n х n, n х m соответственно; d(x ,t ) — заданный непрерывный по (x ,t ) и ограниченный при t E [ t o ,T ] вектор размерности n х 1 ; x 0 , x T — заданные векторы.
Обозначим через A( t o , T, x o , x T ) множество допустимых пар { x( t ) , u( t ) } :
A( to, T, xo, xt ) = {(x, u) : u( t) E U (t), x = A (t )x + B (t )u + d(x,t) + f (t), to Пусть на множестве допустимых пар (3) задан функционал T J(x, u) = 2 У [(x - xT)*Q(t)(x - xT) + (u - uT)*R(t)(u - ut)] dt, (4) t0 где Q(t), R(t) — заданные симметричные непрерывные и ограниченные матрицы размерности n х n и m х m соответственно, удовлетворяющие условию Q (t) > 0 (неотрицательноопределенная матрица); R(t) > 0 (равномерно положительно-определенная матрица). Задача: найти синтезирующее управление u(x,t), такое что соответствующая ему пара (x( t), u( t)) E A( to ,T, xo, x T) и доставляет минимальное значение функционалу (4). Для решения поставленной задачи с помощью множителей Лагранжа специального вида образуем вспомогательный функционал. Для этого прибавим к выражению для функционала (4) систему дифференциальных уравнений (1) с множителем А = K (t)(x — xT) + q(t) и выражение А1 (а — u) + A2(u — в), где А 1 > 0; А2 > 0. В результате получаем функционал — xT ) *Q (t)(x — xT) + 2(u — uT ) * R (t )(u — uT ) + ( K (t )(x — xT ) + +q(t))*(A(t)x + B(t)u + d(x,t) + f(t) — x) + A*(x,t)(а(t) — u) + A2(x,t)(u — в(t))] dt, (5) где q(t) — вектор размерности n х 1; K (t) — симметричная положительно-определенная матрица размерности n х n. Множитель А = K(t)(x — xT) + q(t) снимает ограничения, налагаемые на допустимые пары {x(t), u(t)} в виде системы дифференциальных уравнений (1), а функции {А1(x, t), А2(x,t)} — соответствующие ограничения, налагаемые на управления (2). Для рассматриваемой задачи метод множителей Лагранжа (принцип освобождения от связей) состоит в следующем: исходная задача оптимального управления с ограничениями сводится к другой задаче, но уже без ограничений. При этом новая задача формулируется таким образом, чтобы ее решение являлось решением первоначальной задачи. Введем в рассмотрение следующие функции: v(x,t) = 2(x - xt)*K(txx - xt) + (x - xt)*q(t), dx = K(t)x+q(t), i i M(x, u,t) = ^(x - xT) [Q(t) + K(t)](x - xT) + ^(u - uт) R(t)(u - uт) + + (K(t)(x - xt) + q(t))*(A(t)x + B(t)u + d(x, t) + f (t)) + (x - xт)q(t)+ + A1(x, t)(a(t) - u) + A2(x, t)(u - в(t))• Тогда справедливо следующее представление функционала (5): T L(x, u) = v(xo, 1o) + j M(x, u, t)dt. (6) t0 Решение задачи. Алгоритм решения задачи реализуется путем задания матриц K(t), W(t, T) и функций { q(t), Ai(x, t), A2(x, t)}, соответствующих условию допустимости пары {x(t), u(t)}, т. е. {x(t), u(t)} e A(10, T, xo, xi). Проведем выбор (K, W, q, A 1, A2), так чтобы при каждом фиксированном t e (to, T) функция M (x, u, t) достигала наименьшего значения на паре (x, u). Если при этом функция x удовлетворяет дифференциальному уравнению (1) при управлении u = u(x, t) с условиями (2), то пара (x(t), u(t)) является искомым решением поставленной задачи. Методами дифференциального исчисления из (6) находим управление, доставляющее минимальное значение функции M(x, u, t) в следующем виде: u - uт = -R-1 (t)[B*(t)(K(t)(x - xt) + q(t)) - A1 (x,t) + A2(x,t)]•(7) Обозначим ^(x, t) = -R- 1(t)[-A 1(x, t) + A2(x, t)]. Тогда синтезирующее управление (7) принимает вид u - uт = -R-1 (t)B*(t)(K(t)(x - xт) + q(t)) + ф(x, t)•(8) Множители A 1 > 0, A2 > 0 заданы таким образом, чтобы выполнялись условия Ai(x, t)(a(t) - u) = 0, A2(x, t)(u - в(t)) = 0•(9) Для этого осуществлен выбор λ1 , λ2, ϕ в виде A 1(x, t) = -R(t) inf(0, w(x, t) - a(t)), A2(x, t) = -R(t) inf(0, в(t) - w(x, t));(10) ^(x, t) = - inf(0, w(x, t) - a (t)) + inf(0, в(t) - w(x, t)),(11) где w(x, t) = uт - R- 1(t)B*(t)(K(t)(x(t) - xт) + q(t)). Матрицы K(t), W(t,T), t e [to, T] и функция q(t) заданы следующим образом: KK + KA(t)+ A*(t)K - KB(t)R- 1(t)B*(t)K + Q(t) = 0, K(to) = Ko;(12) WW = WA1(t) + Ai (t)W - Bi (t), W(T,T) = 0;(13) q= -A1(t)q - K(t)fi(t) + W- 1(t,T)B(t)^(x,t), q(to) = W- 1(to,T)[x(to) - xт - y(to)]• (14) Здесь Ai (t) = A(t) + D (xt,t) - B (t)R- i(t)B* (t)K(t), Bi(t) = B(t)R- i(t)B* (t), fi(x - xT,t)= f (t) + d(x, t) - D(xT,t)(x - xT) + Axt + But, D(xt,t) = dx, x = xt. Пусть существуют решения уравнений (11)–(13) и выполнены условия (8). Тогда дифференциальные уравнения, определяющие закон движения системы (1) с управлением u(x, t) = w(x,t) + ^(x, t), можно представить в следующем виде: x = A 1(t)(x - xT) - B 1(t)q(t) + fi(x - xt,t) + B(t)^(x,t), x(1o) = xo. (15) Используя решения дифференциальных уравнений (13), (14), аналогично [5, 6] получаем, что состояние системы (14), соответствующее управлению (8), в конечный момент времени равно x(T) = xT. Действительно, выполнение краевых условий (2) следует из соотношения x(t) - xt = W(t,T) q(t) + y(t), t G [to, T], где функция y(t) удовлетворяет дифференциальному уравнению У = Ai(t)y + (W(t,T)K(t) + E) fi(x - xt,t), y(T) = 0. (16) Найдем минимальное значение функционала (6) L(x, u) = |(xo - xt)*K(to)(xo - xt) + |q*(to)W(to,T)q(to)+ + I • 2v-(x,t)R(t)^(x,t) + y• (t)K(t)f(t)1 dt. t0 Результаты, полученные при решении поставленной задачи, сформулируем в виде следующего утверждения. Теорема. Для оптимальности пары (x(t), U(t)) G A(to, T, xo, x1) в задаче (1), (2), (4) необходимо и достаточно, чтобы: 1) функция x(t) удовлетворяла дифференциальному уравнению xc = Ai(t)(x - xt) - Bi(t)q(t) + fi(x - xt,t) + B(t)^(x,t) (17) с условиями x(to) = xo, x(T) = xT; 2) управление u(t) определялось формулой u(x,t)= ut - Ri(t)B*(t)(K(t)(x - xt) + q(t)) + ^(x,t), (18) где матрицы K(t), W(t,T) являются решениями уравнений (11) и (12), функция q(t) удовлетворяет дифференциальному уравнению (13), а функция ^(x, t) определена в виде (10). Алгоритм решения задачи на ПЭВМ. Опишем удобный для реализации на ПЭВМ алгоритм решения задачи оптимального управления (1), (2), (4). 1. Используя метод Рунге — Кутты, проинтегрировать систему дифференциальных уравнений (11), (12) для определения матриц K(t), W(t, T) в интервале [tо, T] с условиями K(tо) = Kо, W(T, T) = 0. 2. Задать условия x(t0) = x0, x(T) = xT и вычислить q(t0) = W- 1(t0, T)(x(t0) — y(t0)). 3. Используя метод Рунге — Кутты, проинтегрировать систему дифференциальных уравнений (13), (15), (16) в интервале [tо,T],задав начальные условия x(tо)= Хо, y(T)=0, q(tо) = W- 1(tо, T)(x(tо)—y(tо)). В процессе интегрирования системы (13), (16) на печать необходимо вывести графики оптимальной траектории Х(t) и оптимального управления u(t). Если необходимо провести расчеты для новых условий x(tо) = x0, x(T) = xT, то повторить пп. 2,3. Следует отметить, что K0 — произвольная симметричная положительно-определенная (n х n)-матрица. При задании различных начальных условий K(tо) = K0 для матричного дифференциального уравнения (12) получаем различные матрицы K(t) и W(t, T). Однако при этом получается одна и та же вектор-функция u(t) вида (17), поскольку задача имеет единственное решение. При вычислении вектор-функции q(t) по формуле (13) влияние матрицы K(t) компенсируется. Заключение. Предложен новый подход построения синтезирующего управления, основанного на принципе обратной связи и приводящего динамическую систему в требуемое состояние за конечное время при наличии ограничений на управления. Задача решена с использованием множителей Лагранжа, зависящих от фазовых координат и времени. За счет выбора А0(x, t) = K(t)x + q(t) удается построить оптимальное управление по принципу обратной связи, а А 1(x, t) > 0 и А2(x, t) > 0 выбираются таким образом, чтобы были выполнены условия дополняющей нежесткости в методе множителей Лагранжа.
Список литературы Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени
- Атанс М. Оптимальное управление. Введение в теорию и приложения/М. Атанс, П. Фалб. М.: Машиностроение, 1968.
- Понтрягин Л. С.} Математическая теория оптимальных процессов/Л.~С.~Понтрягин, В.~Г.~Болтянский, Р.~В.~Гамкрелидзе, Е.~Ф.~Мищенко. М.: Наука, 1976.
- Беллман Р.} Динамическое программирование и современная теория управления/Р.~Бел\-лман, Р.~Калаба. М.: Наука, 1968.
- Куржанский А.~Б.} Дифференциальные уравнения в задачах синтеза управлений//Дифференц. уравнения. 2005. Т.~41, \No~1. С. 12-22.
- Мурзабеков З.~Н.} Достаточные условия оптимальности динамических систем управления с закрепленными концами//Мат. журн. 2004. \No~2. С. 52-59.
- Мурзабеков З.~Н.} Конструктивный метод решения краевых задач оптимального управления для линейных нестационарных управляемых систем при наличии внешних воздействий и ограничений на управления//Докл. НАН РК. Сер. физ.-мат. 2009. \No~3. С. 16-21.