Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем

Бесплатный доступ

Рассматривается численный метод синтеза оптимального управления для нелинейных аффинно-управляемых систем с функционалами типа нормы в L p ( p  1, 2,  ), который является модификацией метода последовательных приближений Пикара. Установлены условия сходимости предложенного метода.

Оптимальное управление, функционал типа нормы, последовательные приближения, условия сходимости

Короткий адрес: https://sciup.org/148204327

IDR: 148204327

Текст научной статьи Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем

В [1] изложен общий подход к вычислительной процедуре синтеза оптимального управления применительно к решению некоторых задач управления переориентацией космического аппарата, который был основан на схеме последовательных приближений с использованием определенного вида «линеаризации» для существенно нелинейных уравнений движения космического аппарата [2] с целью последующего применения принципа максимума Н.Н. Красовского (метода моментов) [3, 4] для решения ряда вспомогательных задач оптимального управления с функционалами типа нормы в Lp ( p = 1, 2, от ). Впервые этот подход был предложен в [5] и затем последовательно развивался в [6 - 8], а в [1], наконец, была отмечена его тесная связь с соответствующей модификацией метода Пикара [9] применительно к управляемым системам достаточно общего вида. При этом в [1] рассматривались квазилинейные управляемые системы в предположении, что они порождаются нелинейными уравнениями углового движения твердого тела и нелинейностью действующих на космический аппарат возмущающих моментов (градиентно-гравитационного, гироскопического и т.п. [2]). В отличие от [1], здесь рассматриваются нелинейные аффинно-управляемые системы следующего вида:

dx

— = f ( t , x ) + Bu , dt

где x e R n - вектор переменных состояния

Rm - вектор управляющих параметров, на которые ограничения не накла-n x m дываются, B e R   - постоянная матрица, а f (t, x) - некоторая вектор-функция, такая, что f : R1 x Rn > Rn. Правая часть уравнения (1) для любой непрерывной или кусочно-непрерывной (с разрывами первого рода) программы управления и (t) удовлетворяет условиям теоремы Пикара [9].

Для системы (1) рассматривается двухточечная граничная задача управления [3] с фиксированными начальным и конечным состоянием:

x ( t о ) = x 0 ; x ( t f ) = x f ,          (2)

где x о и x f - заданные векторы, а моменты времени t о и t f также фиксированы. Требуется найти оптимальное управление, доставляющее минимум функционалу J ( и ) типа нормы в L p ( p = 1, 2, от ) для программы управления и [ t о , t f ] (и векторной нормы гельдеровского типа для и e R m с показателями v = 1,2, от [10,11]):

J ( и ) ^ min .             (3)

Цель настоящей статьи – изложение вычислительных процедур метода синтеза оптимального управления в задачах (1) - (3) и условий его сходимости, следуя [1].

1.    ПОСТАНОВКА ЗАДАЧИ

В [1] показано, что в общем случае уравнения углового движения космического аппарата можно привести к уравнениям состояния управляемой системы следующего вида:

d x

— = Ax + Bu + F ( t , x ) ,      (4)

dt где x, и и B - векторы и матрица такие же как n×n и в (1), а A е R - некоторая постоянная матрица, а F(t, x) - заданная вектор-функция. Из сравнения (1) и (4) получим f (t, x) = Ax + F (t, x), (5) то есть для заданной в (1) вектор-функции f (t, x) и каким-либо образом назначенной матрицы A в (5) всегда можно определить вектор-функцию F (t, x). С учетом (5) уравнение (1) приводится к уравнению вида (4) и, соответственно, для численного решения задачи оптимального управления (1) - (3) тогда можно применить метод последовательных приближений, рассмотренный в [1]. В связи с этим вначале отметим, что для его реализации следует: во-первых, задать матрицу A в (5); во-вторых, построить подходящее начальное приближение для задачи (1) - (3). Вообще говоря, решение этих задач допускает вполне определенный произвол и в достаточной степени взаимосвязано. С учетом процедуры построения последовательных приближений, изложенной в [1], одно из предъявляемых к матрице A в (5) требований состоит в,том, чтобы она вместе с матрицей B из (4) образовывала вполне управляемую пару [3]. Соответственно, построение начального приближения для задачи (1) - (3) или, что то же самое, для задачи (2) - (4) также будет непосредственно связано с введением какой-либо аппроксимации для вектор-функции F(t, x), например, в виде F (t, x(t)) = F (t), где x (t), V t е [ tq, tf ], - некоторый допустимый процесс в пространстве состояний рассматриваемой системы. В частности, наиболее простой аппроксимацией является следующая: F(t) = 0. Тогда начальное приближение - в виде пары: x(0) (t), и(0) (t), Vt е [tq, tf ], - можно получить с учетом F(t, x) = 0, например, из решения линейной граничной задачи управления (2), (4):

= Ax |0) + Bu (0) ;

dt

x (0)( t q ) = x 0 , x (0)( t f ) = x f , (6) где и (0)( t ) - управление, например, доставляющее минимум функционалу (3). В силу полной управляемости пары матриц ( A , B ) гарантируется существование решения этой задачи. Отметим, что сведение задачи построения начального приближения к задаче (3), (6) в основном было обусловлено последующим применением метода моментов в виде принципа максимума Н.Н. Красовского [1, 3, 4,6 - 8]. В зависимости от свойств вектор-функции F ( t , x ) в качестве начального приближения метода можно выбирать любое допустимое решение двухточечной граничной задачи (2), (4).

Итак, предполагая, что матрица A в (5) задана и начальное приближение для задачи (2) - (4) тем или иным способом получено в виде пары: x (0)( t ) , и (0)( t ) , V t е [ t q , t f ] , далее изложим процедуру построения последовательных (пошаговых) приближений к решению задачи оптимального управления (1) - (3), а затем установим условия их сходимости.

  • 2.    ОСНОВНЫЕ СООТНОШЕНИЯ

И ВСПОМОГАТЕЛЬНЫЕ ЗАДАЧИ МЕТОДА ПРИ ПОСТРОЕНИИ ПРИБЛИЖЕНИЯ НА k -м ШАГЕ

Пусть, исходя из какого-либо начального приближения для задачи (2) - (4), на ( к 1) -м шаге получена пара и ( k 1) ( t ) , x ( k 1) ( t ), V t е [ t q , t f ], для которой x ( k 1) ( t q ) = x q , x ( k 1) ( t f ) = x f . Предваряя изложение вычислительных процедур для k -го шага метода и следуя методу последовательных приближений Пикара, вначале отметим, что для полученных и 1 k - 1) ( t ) и x 1 k - 1) ( t ) = x Q k - 1) ( t ) можно было бы последовательно решить начальные задачи:

Ду (k-1)m dxV)- = Ax (—-1)( t) + Bu (k-1)( t) + F (t, x (--1)( t));

dt

x (k 1)( t q ) = x q ( i = 1,2,3,... ).                   (7)

В силу теоремы Пикара: lim x ik 1)( t) = x^ 1)( t), где x ^ 1) dx ^-1)

dt

i →∞

( t ) - решение задачи Коши:

= Ax d 1) + Bu ( k 1) ( t ) + F ( t , x '; 1)

) ,

x « 1) ( t q ) = x q .                (8)

Поэтому необходимость в решении задач (7) оказывается избыточной, то есть для заданного ( к 1) -го приближения достаточно решить только задачу (8). Очевидно, что в общем случае для задачи (8) будет получено x^ 1) ( t f ) ^ x f . Иначе, при выполнении с требуемой точностью условия x^ 1)( t f ) = x f , пара и 1 k 1)( t ) , x k 1) ( t ) - возможное искомое решение задачи оптимального управления для (1) - (3). Далее этот случай будет рассмотрен отдельно.

Если же получено xk— 1) (tf) ^ xf, то построение k -го приближения необходимо завершить соответствующей коррекцией программы управления и(k 1)(t) с целью обеспечения выполнения конечного условия (2). При этом нелинейность в (4) можно заменить вектор-функцией Fk—1(t) = F (t, xdk 1)(t)). Коррекция программы управления и(k 1)(t) связана с решением вспо- могательной задачи оптимального управления для системы (4) с тем же функционалом J(и), что и в (3), а именно:

dx-L = Ax ( k ) + Bu ( k ) + Fk ч ( t ) ;

dt                       k

x ( k ) ( t 0) = x 0 , x ( k ) ( t f ) = x f ,          (9)

где и ( k ) ( t ) - скорректированное оптимальное управление, которое отыскивается также как и управление и ( k 1)( t ) . Полученное решение задачи (9) в виде пары и ( k ) ( t ) , x ( k ) ( t ) будет являться искомым k -м приближением для задачи оптимального управления системой (1) - (3). Задачи управления типа (9) с какими-либо аппроксимациями для нелинейности в (4) в виде вектор-функций времени были введены в [11] как опорные задачи управления для рассматриваемого здесь метода.

Вычитая уравнение (8) из уравнения (9), получим d^xkL = A5x(k) + B5и(k) (t) ,    (10)

dt где

5 и ( k ) ( t ) = и ( k ) ( t ) - и ( k - 1) ( t ), 5 x ( k ) ( t ) = x ( k ) ( t ) - x ( k - 1) ( t ) -соответствующие отклонения. Решение уравнения (10) с учетом 5 x ( k ) ( t о ) = 0 имеет вид

t

5 x ( k ) ( t ) = j Ф ( t , т ) B 5 и ( k ) ( т ) d т ,        (11)

tо где Ф(t,т) - переходная матрица для системы (9) [1, 3]. При t = tf из (11) получим 5x(k)(tf ) = xf - x„ 1)(tf ) или в силу построения оптимального управления и(k)(t) при решении задачи (9):

tf

5 x ( k ) ( t f ) = j ф (t f , т ) B 5 и ( k ) ( т ) d т = x f - x ( k - 1) ( t f ) .(12) t 0

Поскольку выше предполагалось, что x да 1)( t f ) ^ x f , то с решением задачи (12), а фактически - с решением задачи (9), k -й шаг завешается и полученная при этом пара и ( k ) ( t ) , x ( k ) ( t ) - k -е приближение к решению задачи оптимального управления (1) - (3). Если же при решении задачи (8) было получено x ^ 1)( t f ) = x f (с наперед заданной и достаточно высокой точностью), то в этом случае решение задачи (12) не требуется, исключая случай повышения требуемой точности решения на этом шаге. Тем не менее, следует отметить, что если условие x да 1)( t f ) = x f все-таки оказывается выполненным, то уравнение (12) относительно

5 и ( k ) ( t ) в общем случае допускает существование тождественно ненулевых решений - нуль-финитных управлений [12] 5 v ( t ) , которые с учетом (11), (12) здесь удовлятворяют следующим условиям:

tf j Ф( t, т) B 5 v(k )(т) d т = 0.        (13)

t 0

Решение уравнения (13) на k -м шаге, то есть управления 5 v ( k ) , сводится к решению изопериметрической задачи, в которой для заданного и ( k - 1) ( t ) требуется минимизировать функционал J ( и» + 5 v ( k ) ) по 5 v ( k ) . Если при этом будет получено 5 v ( k ) ( t ) ^ 0 и J ( u (k-1) + 5 v ( k ) ) <  J ( u^ -1 ) ) , то k -й шаг тем самым завершается и, очевидно, что тогда будет получена искомая программа управления u k (t) = u^ -1 ( t ) + 5 v ( k ) ( t ) , для которой x ( k ) ( t ) - решение начальной задачи: d x (-) = Ax ( k ) + Bu ( k ) ( t ) + F ( t , x ( k ) ), x ( k ) ( t 0) = x 0. dt

Если же 5 v ( k ) ( t ) = 0 , то искомым приближенным оптимальным управлением для задачи (1) - (3) будет программа управления и ( k 1)( t ) .

Итак, в общем случае, когда решение уравнения (13) не требуется и k ^ да , то имеет место: x да - 1)( t ) ^ x дада )( t ) ; и ( да )( t ) = lim и ( k ) ( t ) , где k ^да x да° )( t ) - решение задачи:

d x ( да )

—= Ax ^^ + Bu (да) (t) + F (t, x да)), х (дада) (t 0) = х 0, dt для которого выполняется условие x^)(tf) = xf, а и(да)(t) - искомое оптимальное управле-ние для рассматриваемой задачи (1) - (3) и J(и(да)) = lim J(и(k)) - её значение.

k →∞

3.    ОБ УСЛОВИЯХ СХОДИМОСТИ МЕТОДА

Условия сходимости рассматриваемой модификации метода последовательных приближений Пикара для управляемых систем вида (1) непосредственно связаны с условиями сходимости последовательностей 5x(k)(tf) ^ 0 и Ax^k)(tf) ^ 0, где Ax(k) (t) = x^k) (t) - xдада-1) (t). Пусть x^k,) (t) - решение задачи (8) на (k +1 )-м шаге, то есть dr(k)

dx^ = Ax Lk) + Bu (k)(t) + F (t, xLk)), x k)(t0) = x 0.

Вычитая уравнение (8) из (14), с точностью до малых первого порядка получим dAx (k)

x   — A k (t )Ax k)) + B 5 u(k)(t), dt

A x 5 ) ( 1 0 ) - 0 .                            (15)

Список литературы Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем

  • Горелов Ю.Н., Морозова М.В., Пыринов Н.И., Юрин В.Е. Метод синтеза оптимального управления для квазилинейных систем при моделировании перенацеливания аппаратуры зондирования космического аппарата//Управление движением и навигация летательных аппаратов: Сб. тр. XVII Всеросс. научно-техн. семинара по управлению движением и навигации ЛА: Ч.I. Самара: Изд-во СамНЦ РАН, 2014. С. 54-61.
  • Маркеев А.П. Теоретическая механика. -Москва-Ижевск: НИЦ «Регулярная и стохастическая динамика», 2007. -592 с.
  • Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.
  • Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.
  • Горелов Ю.Н., Данилов С.Б., Тропкина Е.А. Об одном подходе к приближенному решению задачи оптимального управления переориентацией космического аппарата//Обозрение прикладной и промышленной математики. 2011, т.18, в.3. С.429-431.
  • Горелов Ю.Н., Данилов С.Б., Юрин В.Е. Синтез оптимального управления переориентацией космического аппарата одним методом последовательных приближений//Управление движением и навигация летательных аппаратов: Сб. тр. XVI Всеросс. научно-техн. семинара по управлению движением и навигации ЛА: Ч.III. Самара: Изд-во СНЦ РАН, 2013. С.34-40.
  • Горелов Ю.Н., Курганская Л.В., Мантуров А.И., Соллогуб А.В., Юрин В.Е. К задаче оптимизации программ управления угловым движением космического аппарата дистанционного зондирования Земли//Гироскопия и навигация. 2014, №1 (84). С.81-97.
  • Горелов Ю.Н. К решению задачи синтеза оптимального управления переориентацией космического аппарата при перенацеливании аппаратуры зондирования одним методом последовательных приближений//Известия СамНЦ РАН, 2014, т.16, № 4. С.127-131.
  • Матвеев Н.М. Методы интегрирования обыкновенных дифференциальных уравнений. М.: Высшая школа, 1967. 564 с.
  • Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. М.: Наука, 1984. 320 с.
  • Горелов Ю.Н. Об одном подходе к моделированию оптимального управления многомерными линейными системами//Вестник Самарского госуд. ун-та. 2013, № 9/2 (110). С.184-190.
  • Синяков А.Н. Системы управления упругими подвижными объектами. Л.: Изд-во ЛГУ, 1981. 200 с.
Еще
Статья научная