Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени

Автор: Мурзабеков Заинелхриет Нугманович, Мурзабеков Асан Заинелхриетович

Журнал: Проблемы информатики @problem-info

Рубрика: Теоретическая информатика

Статья в выпуске: 3 (15), 2012 года.

Бесплатный доступ

Рассматривается задача оптимального управления нестационарными нелинейными системами с закрепленными концами траекторий. Получен алгоритм управления для одного класса нелинейных систем с ограничениями на управления на конечном отрезке времени.

Задача оптимального управления, дифференциальные уравнения, метод множителей лагранжа, нелинейная система, функционал

Короткий адрес: https://sciup.org/14320134

IDR: 14320134

Текст научной статьи Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени

Введение. Математическая теория процессов управления возникла из потребностей прикладных дисциплин. Ее развитие началось с создания средств управления движением и конструирования автоматических устройств различного назначения. Теория процессов управления используется при исследовании динамики робототехнических и электроэнергетических систем, химических и ядерных реакторов, биологических и экологических процессов, экономических и финансовых моделей. В настоящее время теория процессов управления применяется также при создании коммуникационных систем и конструировании средств автоматизации новых поколений с использованием компьютерной техники и передовых информационных технологий.

В основе решения задач оптимального управления лежит принцип максимума Понтрягина (решение сводится к соответствующей краевой задаче) [1, 2]и динамическое программирование (задача сводится к решению уравнения Беллмана) [3].

Основной проблемой современной теории управляемых движений является решение задач синтеза управлений с учетом различных ограничений. Эта проблема чрезвычайно актуальна, но еще недостаточно разработана. Теория может привести к новым направлениям в динамической оптимизации, теории дифференциальных уравнений, вычислительной математике. Разработка различных способов построения алгоритмов управления, обладающих необходимыми для приложений свойствами, является актуальной задачей современных информационных технологий [4].

Работа рекомендована к публикации Программным комитетом VIII Международной азиатской школы-семинара “Проблемы оптимизации сложных систем”.

В настоящей работе предлагается конструктивный метод построения синтезирующего управления для нелинейной управляемой системы, основанный на принципе обратной связи с учетом ограничений на управления [5, 6].

Постановка задачи. Рассмотрим класс нелинейных управляемых систем вида x = A(t)x + B(t)u + d(x,t) + f(t), t E (t0,T), x(t0) = xo, x(T)= xt;         (1)

u( t ) E U ( t ) = { u | a ( t ) <  u( t ) в ( t ) , t E ( t o ,T ) , а , в E C [ t o ,T ] }c L 2 (( t o ,T ) , R m ) , (2) где x( t ) — вектор состояния объекта управления размерности n х 1; u = u(x ,t ) — вектор управляющих воздействий размерности m х 1; f ( t ) — заданная вещественная, непрерывная и ограниченная при t E [ 1 0 ,T ] векторная функция размерности n х 1 ; A ( t ) , B ( t ) — заданные непрерывные и ограниченные матрицы размерности n х n, n х m соответственно; d(x ,t ) — заданный непрерывный по (x ,t ) и ограниченный при t E [ t o ,T ] вектор размерности n х 1 ; x 0 , x T — заданные векторы.

Обозначим через A( t o , T, x o , x T ) множество допустимых пар { x( t ) , u( t ) } :

A( to, T, xo, xt ) = {(x, u) : u( t) E U (t), x = A (t )x + B (t )u + d(x,t) + f (t), to

Пусть на множестве допустимых пар (3) задан функционал

T

J(x, u) = 2 У [(x - xT)*Q(t)(x - xT) + (u - uT)*R(t)(u - ut)] dt,           (4)

t0

где Q(t), R(t) — заданные симметричные непрерывные и ограниченные матрицы размерности n х n и m х m соответственно, удовлетворяющие условию Q (t) > 0 (неотрицательноопределенная матрица); R(t) > 0 (равномерно положительно-определенная матрица).

Задача: найти синтезирующее управление u(x,t), такое что соответствующая ему пара (x( t), u( t)) E A( to ,T, xo, x T) и доставляет минимальное значение функционалу (4).

Для решения поставленной задачи с помощью множителей Лагранжа специального вида образуем вспомогательный функционал. Для этого прибавим к выражению для функционала (4) систему дифференциальных уравнений (1) с множителем А = K (t)(x xT) + q(t) и выражение А1 (а u) + A2(u в), где А 1 > 0; А2 > 0. В результате получаем функционал

xT ) *Q (t)(x xT) + 2(u

uT ) * R (t )(u uT ) + ( K (t )(x xT ) +

+q(t))*(A(t)x + B(t)u + d(x,t) + f(t) x) + A*(x,t)(а(t) u) + A2(x,t)(u в(t))] dt, (5)

где q(t) — вектор размерности n х 1; K (t) — симметричная положительно-определенная матрица размерности n х n.

Множитель А = K(t)(x xT) + q(t) снимает ограничения, налагаемые на допустимые пары {x(t), u(t)} в виде системы дифференциальных уравнений (1), а функции {А1(x, t), А2(x,t)} — соответствующие ограничения, налагаемые на управления (2).

Для рассматриваемой задачи метод множителей Лагранжа (принцип освобождения от связей) состоит в следующем: исходная задача оптимального управления с ограничениями сводится к другой задаче, но уже без ограничений. При этом новая задача формулируется таким образом, чтобы ее решение являлось решением первоначальной задачи.

Введем в рассмотрение следующие функции:

v(x,t) = 2(x - xt)*K(txx - xt) + (x - xt)*q(t),   dx = K(t)x+q(t), i                                                  i

M(x, u,t) = ^(x - xT) [Q(t) + K(t)](x - xT) + ^(u - uт) R(t)(u - uт) +

+ (K(t)(x - xt) + q(t))*(A(t)x + B(t)u + d(x, t) + f (t)) + (x - xт)q(t)+

+ A1(x, t)(a(t) - u) + A2(x, t)(u - в(t))

Тогда справедливо следующее представление функционала (5):

T

L(x, u) = v(xo, 1o) + j M(x, u, t)dt.                              (6)

t0

Решение задачи. Алгоритм решения задачи реализуется путем задания матриц K(t), W(t, T) и функций { q(t), Ai(x, t), A2(x, t)}, соответствующих условию допустимости пары {x(t), u(t)}, т. е. {x(t), u(t)} e A(10, T, xo, xi).

Проведем выбор (K, W, q, A 1, A2), так чтобы при каждом фиксированном t e (to, T) функция M (x, u, t) достигала наименьшего значения на паре (x, u). Если при этом функция x удовлетворяет дифференциальному уравнению (1) при управлении u = u(x, t) с условиями (2), то пара (x(t), u(t)) является искомым решением поставленной задачи.

Методами дифференциального исчисления из (6) находим управление, доставляющее минимальное значение функции M(x, u, t) в следующем виде:

u - uт = -R-1 (t)[B*(t)(K(t)(x - xt) + q(t)) - A1 (x,t) + A2(x,t)]•(7)

Обозначим ^(x, t) = -R- 1(t)[-A 1(x, t) + A2(x, t)]. Тогда синтезирующее управление (7) принимает вид u - uт = -R-1 (t)B*(t)(K(t)(x - xт) + q(t)) + ф(x, t)•(8)

Множители A 1 > 0, A2 > 0 заданы таким образом, чтобы выполнялись условия

Ai(x, t)(a(t) - u) = 0, A2(x, t)(u - в(t)) = 0•(9)

Для этого осуществлен выбор λ1 , λ2, ϕ в виде

A 1(x, t) = -R(t) inf(0, w(x, t) - a(t)), A2(x, t) = -R(t) inf(0, в(t) - w(x, t));(10)

^(x, t) = - inf(0, w(x, t) - a (t)) + inf(0, в(t) - w(x, t)),(11)

где w(x, t) = uт - R- 1(t)B*(t)(K(t)(x(t) - xт) + q(t)).

Матрицы K(t), W(t,T), t e [to, T] и функция q(t) заданы следующим образом:

KK + KA(t)+ A*(t)K - KB(t)R- 1(t)B*(t)K + Q(t) = 0, K(to) = Ko;(12)

WW = WA1(t) + Ai (t)W - Bi (t), W(T,T) = 0;(13)

q= -A1(t)q - K(t)fi(t) + W- 1(t,T)B(t)^(x,t), q(to) = W- 1(to,T)[x(to) - xт - y(to)] (14)

Здесь

Ai (t) = A(t) + D (xt,t) - B (t)R- i(t)B* (t)K(t), Bi(t) = B(t)R- i(t)B* (t), fi(x - xT,t)= f (t) + d(x, t) - D(xT,t)(x - xT) + Axt + But,  D(xt,t) = dx, x = xt.

Пусть существуют решения уравнений (11)–(13) и выполнены условия (8). Тогда дифференциальные уравнения, определяющие закон движения системы (1) с управлением u(x, t) = w(x,t) + ^(x, t), можно представить в следующем виде:

x = A 1(t)(x - xT) - B 1(t)q(t) + fi(x - xt,t) + B(t)^(x,t), x(1o) = xo.        (15)

Используя решения дифференциальных уравнений (13), (14), аналогично [5, 6] получаем, что состояние системы (14), соответствующее управлению (8), в конечный момент времени равно x(T) = xT.

Действительно, выполнение краевых условий (2) следует из соотношения

x(t) - xt = W(t,T) q(t) + y(t), t G [to, T], где функция y(t) удовлетворяет дифференциальному уравнению

У = Ai(t)y + (W(t,T)K(t) + E) fi(x - xt,t), y(T) = 0.               (16)

Найдем минимальное значение функционала (6)

L(x, u) = |(xo - xt)*K(to)(xo - xt) + |q*(to)W(to,T)q(to)+

+ I2v-(x,t)R(t)^(x,t) + y (t)K(t)f(t)1 dt.

t0

Результаты, полученные при решении поставленной задачи, сформулируем в виде следующего утверждения.

Теорема. Для оптимальности пары (x(t), U(t)) G A(to, T, xo, x1) в задаче (1), (2), (4) необходимо и достаточно, чтобы:

  • 1)    функция x(t) удовлетворяла дифференциальному уравнению

xc = Ai(t)(x - xt) - Bi(t)q(t) + fi(x - xt,t) + B(t)^(x,t)               (17)

с условиями x(to) = xo, x(T) = xT;

  • 2)    управление u(t) определялось формулой

u(x,t)= ut - Ri(t)B*(t)(K(t)(x - xt) + q(t)) + ^(x,t),               (18)

где матрицы K(t), W(t,T) являются решениями уравнений (11) и (12), функция q(t) удовлетворяет дифференциальному уравнению (13), а функция ^(x, t) определена в виде (10).

Алгоритм решения задачи на ПЭВМ. Опишем удобный для реализации на ПЭВМ алгоритм решения задачи оптимального управления (1), (2), (4).

  • 1.    Используя метод Рунге — Кутты, проинтегрировать систему дифференциальных уравнений (11), (12) для определения матриц K(t), W(t, T) в интервале [tо, T] с условиями K(tо) = Kо, W(T, T) = 0.

  • 2.    Задать условия x(t0) = x0, x(T) = xT и вычислить q(t0) = W- 1(t0, T)(x(t0) y(t0)).

  • 3.    Используя метод Рунге — Кутты, проинтегрировать систему дифференциальных уравнений (13), (15), (16) в интервале [tо,T],задав начальные условия x(tо)= Хо, y(T)=0, q(tо) = W- 1(tо, T)(x(tо)y(tо)). В процессе интегрирования системы (13), (16) на печать необходимо вывести графики оптимальной траектории Х(t) и оптимального управления u(t). Если необходимо провести расчеты для новых условий x(tо) = x0, x(T) = xT, то повторить пп. 2,3.

Следует отметить, что K0 — произвольная симметричная положительно-определенная (n х n)-матрица. При задании различных начальных условий K(tо) = K0 для матричного дифференциального уравнения (12) получаем различные матрицы K(t) и W(t, T). Однако при этом получается одна и та же вектор-функция u(t) вида (17), поскольку задача имеет единственное решение. При вычислении вектор-функции q(t) по формуле (13) влияние матрицы K(t) компенсируется.

Заключение. Предложен новый подход построения синтезирующего управления, основанного на принципе обратной связи и приводящего динамическую систему в требуемое состояние за конечное время при наличии ограничений на управления. Задача решена с использованием множителей Лагранжа, зависящих от фазовых координат и времени. За счет выбора А0(x, t) = K(t)x + q(t) удается построить оптимальное управление по принципу обратной связи, а А 1(x, t) > 0 и А2(x, t) > 0 выбираются таким образом, чтобы были выполнены условия дополняющей нежесткости в методе множителей Лагранжа.

Список литературы Оптимизация одного класса управляемых нелинейных систем на конечном отрезке времени

  • Атанс М. Оптимальное управление. Введение в теорию и приложения/М. Атанс, П. Фалб. М.: Машиностроение, 1968.
  • Понтрягин Л. С.} Математическая теория оптимальных процессов/Л.~С.~Понтрягин, В.~Г.~Болтянский, Р.~В.~Гамкрелидзе, Е.~Ф.~Мищенко. М.: Наука, 1976.
  • Беллман Р.} Динамическое программирование и современная теория управления/Р.~Бел\-лман, Р.~Калаба. М.: Наука, 1968.
  • Куржанский А.~Б.} Дифференциальные уравнения в задачах синтеза управлений//Дифференц. уравнения. 2005. Т.~41, \No~1. С. 12-22.
  • Мурзабеков З.~Н.} Достаточные условия оптимальности динамических систем управления с закрепленными концами//Мат. журн. 2004. \No~2. С. 52-59.
  • Мурзабеков З.~Н.} Конструктивный метод решения краевых задач оптимального управления для линейных нестационарных управляемых систем при наличии внешних воздействий и ограничений на управления//Докл. НАН РК. Сер. физ.-мат. 2009. \No~3. С. 16-21.
Статья научная