Об управлении одной системой второго порядка в сопротивляющейся среде
Автор: Стрелкова Н.А.
Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Механика. Математическое моделирование
Статья в выпуске: 3 (30), 2015 года.
Бесплатный доступ
Исследуется задача минимизации энергетических затрат для объекта, движение которого в сопротивляющейся среде описывается линейным дифференциальным уравнением второго порядка. Управление полагается ограниченным по модулю. В аналитическом виде найдены минимальное значение функционала, фазовые траектории и оптимальное управление. Приводятся иллюстрирующие примеры.
Оптимальное управление, сопротивляющаяся среда, минимум энергетических затрат, принцип максимума понтрягина
Короткий адрес: https://sciup.org/14729990
IDR: 14729990
Текст научной статьи Об управлении одной системой второго порядка в сопротивляющейся среде
Рассматривается задача о переводе начального состояния линейной системы второго порядка в начало координат в течение заданного времени. Управление ограничено по модулю, минимизируется функционал энергетических затрат. Исследуемая система описывает управляемое движение материального объекта (тела) в сопротивляющейся среде. В данной постановке, при условиях, что величина управления не ограничена и отсутствует сопротивление среды, задача исследовалась в работах [1; 2].
В статье для решения рассматриваемой задачи используется принцип максимума Л.С. Понтрягина [3]. Приводятся результаты решения с учетом и без учета сопротивления среды краевой задачи принципа максимума. Построены оптимальные законы изменения управления, определены фазовые траектории, найдены минимальные значения энергозатрат при перемещении объекта.
1. Постановка задачи оптимального управления
Рассматривается задача оптимального управления движением объекта, подверженного действию сил сопротивления. Предполагается, что сила сопротивления пропорциональна скорости движения тела. Обозначим через x(t) - координату, определяющую положение объекта, а через u (t) - управляющую силу, ограниченную по модулю. Движение объекта описывается дифференциальным уравнением второго порядка вида x + kx = u, (1)
где k – положительная постоянная. Без ограничения общности считаем, что дано тело единичной массы, а управление u ( t ) удовлетворяет ограничению
| u ( t )| ^ 1 . (2)
Требуется найти управление u ( t ) , переводящее систему (1) из начального состояния
x ( 0 ) = x 0 > 0, х( 0 ) = 0 (3)
в конечное положение
x ( T ) = x ( T ) = 0 (4)
т = 2 4x 0 ,
и минимизирующее функционал энергетических затрат
T
J = - J u2 dt , (5)
где время перехода T задано.
Отметим, что к соотношениям (1)–(4) сводятся также задачи оптимального управления переориентацией сферически симметрично твердого тела в сопротивляющейся среде [4].
-
2. Применение принципа максимума
Воспользуемся принципом максимума Л.С. Понтрягина [3]. Определим фазовые координаты при помощи соотношений x1 = x, x2 = x и преобразуем уравнение (1) к виду xi _ x2, x2 = — kx 2 + U.
Введем сопряженные переменные ψ 1 , ψ 2 и константу ψ 0 , соответствующие фазовым координатам x 1, x 2 и функционалу (5). Составим функцию Гамильтона–Понтрягина
H = — 0 0 u +1 / 1 x 2 - ку 2 x 2 + у 2 u . (7)
Если у 0 = 0, то этот случай по форме совпадает с задачей быстродействия, подробно рассмотренной в работе [4]. Тогда оптимальное управление имеет вид
[- 1, 0 < t < т , U = <
[+ 1, т < t < T .
Время T окончания процесса и момент τ пе-
T т = —
при к = 0.
В этом случае значение функционала (5) равно
Т
J = р (11)
Пусть теперь у 0 ^ 0. Из условия максимума функции Гамильтона–Понтрягина (7) следует, что у 0 < 0.. Без ограничения общности можно положить у 0 = - 1.
Выпишем сопряженную систему дифференциальных уравнений
JV1 = 0, у 2 = у + ку 2, найдем ее общее решение
У1 = аъ kt 1
у2 = а2е + —ах
и преобразуем функцию H :
H = - 1 ( и - у 2 ) 2 + 1 у 2 2 + у 1 x 2 - ку 2 x 2 . (13)
Если при всех t е [ 0, T ]
|у2| < 1,(14)
то функция H достигает максимума, когда и = у 2.(15)
Если при некоторых t е [ 0, T ]
|у2I > 1,(16)
то функция H достигает максимума, когда выражение ( и - у 2 ) 2 будет иметь минимальное значение.
Отдельно рассмотрим эти два случая.
реключения управления определяются из следующих соотношений при к ^ 0 :

т = 2 ( T + kx 0 ) (9)
-
3. Построение оптимального решения задачи при условии (14)
Из соотношений (13), (15) следует, что и = a2ekt + 0-а . (17)
2 k 1
и из выражений:
Подставим выражение (17) в систему дифференциальных уравнений (6) и найдем общее решение этой системы:
, d^ - kt . 1 kt _ 1
x< — d--e +-- a cec +— at\t ,
1 1 k 2 k 2 2 k 2 1 ,
- kt 1 kt 1
x^ — d^e + ce + a, .
2 2 2 k 2 k 2 1
Постоянные a 1, a 2, d 1, d 2 определим из граничных условий (3), (4):
Найдем условие, при котором реализуется закон изменения управления по формуле (20). Воспользуемся соотношениями (14), (15). Получаем, что начальное значение фазовой координаты x 0 должно удовлетворять ограничению
- k 3 sh kT
x
2 - 2ch kT + kT sh kT °
_ k 2 ( 1 - e - kT ) x о
2 - 2ch kT + kT sh kT ’
2 - 2ch kT + kT sh kT x^ -------\-----
0 k 2 ( ch kT - 1 )
.
, 1 - ch kT + kT sh kT к —-----------------------Xo,
-
1 2 - 2ch kT + kT sh kT
, = k ( e kT - l ) x о
-
2 2 ( 2 - 2ch kT + kT sh kT ) ’
Подставим эти соотношения в систему (18) и преобразуем полученные выражения. Тогда
1 - ch kT + ch kt - ch k ( T - 1 ) x, —------------------------------
-
1 2 - 2ch kT + kT sh kT
k ( T - 1 ) sh kT
-
2 - 2ch kT + kT sh kT x 0,
x о +
x 2 —
k sh kt + k sh k ( T - 1 ) - k sh kT 2 - 2ch kT + kT sh kT
x 0 .
Подставим a 1, a 2 в формулу (17) и найдем
управление
u — k2
( 1 - e - kT ) ek t - sh kT
2 - 2ch kT + kT sh kTx
а затем – значение функционала энергетических затрат
J —
k 3 x 02 sh kT
2 ( 2 - 2ch kT + kT sh kT ) ’
Отметим, что из формулы (20) следует,
что управляющая функция u ( t ) монотонно
возрастает от минимального
u ( 0 ) — k ( 1 - ch kT ) x 0 < 0
v J 2 - 2ch kT + kT sh kT
значения
до макси-
мального значения
u ( T ) —
k 2 ( ch kT - 1 ) x о > 0
2 - 2ch kT + kT sh kT '
Из соотношений (11), (21) и (22) следует, что значение функционала, вычисляемое по формуле (21), меньше, чем значение функционала, вычисляемого по формуле (12). Таким образом, управление (20) единственно и удовлетворяет необходимым условиям принципа максимума. Поскольку теорема существования оптимального управления [1; 2] применима к данной задаче, то найденное управление является оптимальным.
Соотношения (19)–(21) описывают решение задачи оптимального по расходу энергии управления перемещением объекта в сопротивляющейся среде. Найдем частное решение рассматриваемой задачи для случая, когда сопротивление среды отсутствует. Вычислим в формулах (19)–(22) пределы функций при k ^ 0. Раскрывая неопределенности по правилу Лопиталя получаем, что если x0 удовлетворяет условию x0 - —, (23)
то оптимальные фазовые траектории и управляющая функция имеют вид
x 1 — T 3 x 0 t T 2 x 0 t + x 0 ,
6 2 6
x 2 — T T x 0 t - TT x 0 t ,
12 6
— T T x 0 t T 2 x 0 ,
а минимальное значение функционала качества равно
J — T T x 02 . (26)
Пример 1
Рассмотрим задачу оптимального
управления (1)–(5) с учетом и без учета со-
противления среды, для которой выполняются условие (23) при k = 0 и условие (22) при к ^ 0. На рис. 1 представлены график зависимости функции управления от времени и оптимальные траектории на фазовой плоскости при x 0 = 2,532 , T = 5 , к = 0; 0,8 . Используя соотношения (26), (21), получаем J min = 0,308 при к = 0 и J min = 0,792 при к = 0,8 .
x 2 =
Х 1 =
tc 2 e kk |
- kt + ~ 1 |
— ( к ~2 e -k 2 |
kt + 1 ) . |
,

Рис. 1. x 0 = 2,532 , T = 5
При и = у 2 фазовые переменные x 1 , x 2 определяются уравнениями (18). Закон управления и постоянные c 1, c 2, c ~1, c ~2, a 1, a 2, d 1, d 2 найдем из условий непрерывности функций x 1 ( t ) x 2 ( t ) , и ( t ) в точках переключения и из граничных условий (3), (4). Данным требованиям удовлетворяет управление вида
и = 1
- 1, 0 < t < Т 1 ,
2 ekt - А,
----7----2, T 1 < t < т 2 ,
А 1
+ 1, т 2 < t < T .
Фазовые траектории описываются формулами
4. Построение оптимального решения задачи при условии (16)
Если при некоторых t е[0, T] выполняется условие (16), то управление, доставляющее минимум выражению (и - у 2 )2, представимо в виде у2, если |у2I < 1, и = 1
sign у 2, если | у 2| > 1.
Из второго равенства системы (12) следует, что функция у 2 ( t ) является монотонной функцией времени t и поэтому на промежутке [ 0, T ] может менять свой знак не более одного раза. Следовательно, в качестве возможных оптимальных управлений можно рассматривать шесть управляющих последовательностей { у 2 , - 1 } , { у 2, + 1 } , { - 1, у 2 } , { + 1, у 2 } , {- 1, у 2 , + 1 } , {+ 1, у 2 , - 1 } .
Для отрезка времени, на котором и Е-1, имеем t cl - к/
< X1 =— к " ~ке C1, x 2 = 1 (kc 2 e ~ kt - 1) .
к
Аналогично, при и е+ 1, получаем
x1 = i
x 2
1 - е ~kt k 2
d 1 e - kt
- t + x 0 , 0 < t < Т 1 , k
e kt А
+ 77“---t + d2, T1 < t < T2,(28)
к 2 А 1 к А 1
ek ( T - t ) - 1 t - T
P + ’ т 2 ~t~ ’
1 e kt - 1, 0 < t < т , kk 1
- kd 1 e - kt
ekt А 2
+--- —, т < t < т 2, к А 1 к А 1 1 2
e k ( T - t ) 1
k k ,
т 2 < t < T .
Значение функционала (5) равно
J = 1 ( т + T - т )--^ + ^^-( т - т ) . (30)
2 1 27 к А 1 2 А 2и 1
Из геометрического смысла определенного интеграла следует, что затраты энергии, вычисляемые по формуле (30), ниже, чем затраты энергии по формуле (11).
В соотношениях (27)–(30):
А 1 = e k т 2 - e k т 1, А 2 = e k т 2 + e k т 1,
d 1 =
e2 к т 1 + А 1 к 2А 1
, d 2 =
т 1(А 2 А1 ) к А 1
+ x 0 + 72". k
Моменты τ 1 , τ 2 переключения управления определяются из следующей системы трансцендентных уравнений:
- 2 t + X о ,0 < t < T 1 ,
2 1 - 3 ( t 2 + т ) t + 6 T 1 1 - 2 т
2 x 0
k τ 2 k τ 1
+ 2 + T = 2 ^e.---kT1e— ek2 - ek
X1 = ‘
6 ( т 2
—
+
, e k 2 + e k = ekT + 1.
Поскольку соотношения (27), (31) определяют управление так же, как и в п. 3, единственным образом, то найденное управление является оптимальным.
Выражения (27)–(32) справедливы, если x 0 удовлетворяет условию
x 2
+ X 0 , T 1 < t < T 2 ,
1 2 1 2
_ t 2 - Tt + - T 2, г 2 < t < T ,
- t , 0 < t < T 1 ,
„« Iz k l i k+ l L, т t < ' 2 , (37)
T 2 - 7
t - T , т 2 < t < T .
2 - 2ch kT + kT sh kT 2 . ( .к J
------, --------г----< X) < — ln| ch-T I. (33)
k 2 ( ch kT - 1 ) 0 k 2 ( 2 J
Значение функционала качества равно
J=T -
73 T 2 -12 X о
.
2 , К k >
Если x0 = — ln l ch — T I , то время пере- k 2 I 2 J
Соотношения (35)–(38) справедливы, если
хода T совпадает с временем T min в задаче об
T 2
T 2
оптимальном по быстродействию управлении объектом, движение которого описывается соотношениями (1)–(4). В этом случае
— < X 0 <— .
τ 1
= т
2 = 1 ( T + kx о )
и минимальное значение
T функционала J = — 2
.
Если xn = — , то T = T = —T , J = — .
0 4, 1 2 2 , J 2
T 2
Если X n > —, то 0 4
k = 0 решения не имеет.
задача (1)–(5) при
2 , L k J
При x0 > —lnl ch—T I рассматривае-k \ 2 J мая задача (1)–(5) решения не имеет.
Если сопротивление среды отсутствует, то моменты τ1 , τ2 переключения управления определяются в явном виде и соответственно равны
T - J3T 2-12 Xo T + J3T 2-12 Xo
Ti = —-----", т2 =--------- (34)
Оптимальное управление и траектории оптимального движения имеют вид u =
- 1, 0 < t < T i ,
< 2t-(t2 + T), T1 < t <т2,
T 2 - 7
+ 1, T 2 < t < T ,
Пример 2
Рассмотрим задачу оптимального управления (1)–(5) с учетом и без учета сопротивления среды, для которой выполняется условие (39) при k = 0 и условие (33) при k ^ 0. На рис. 2 представлены график зависимости функции управления от времени и оптимальные траектории на фазовой плоскости при X 0 = 2,532 , T = 3,7 , k = 0; 0,8 . Используя соотношения (34), (38), найдем моменты переключения управления T 1 = 0,216 , т 2 = 3,484 и минимальное значение функционала энергетических затрат J min = 0,760 при k = 0, а по формулам (32), (30) вычислим моменты переключения управления T = 0,271 , т 2 = 3,312 и J min = 1,511 при k = 0,8 . Отметим, что при управлении движением объекта в среде с сопротивлением по сравнению с движением в среде без сопротивления увеличились промежутки [ 0, т 1 ] , [ т 2, T ]
времени движения с максимальным по модулю значением управления и уменьшился промежуток времени [ т 1 ,т 2 ] , при этом затраты энергии возросли почти вдвое.

Рис. 2. x 0 = 2,532 , T = 3,7
Пример 3
Рассмотрим задачу оптимального управления (1)–(5) с учетом и без учета сопротивления среды, для случая, когда заданное время перехода совпадает с минимальным временем, при котором еще возможен переход из начального состояния (3) в конечное положение (4). Тогда управление u ( t ) является кусочно-постоянной функцией и имеет одно переключение. Момент переключения вычисляется по формулам (9), (10), а минимальное значение функционала – по формуле (11).
На рис. 3 представлены график зависимости функции управления от времени и оптимальные траектории на фазовой плоскости, когда x 0 = 2,532 .
При k = 0: T = 3,182 , т = 1,591 , J min = 1,591 ; при k = 0,8 : T = 3,625 , т = 2,825 , J min = 1,813 .
Заключение
Список литературы Об управлении одной системой второго порядка в сопротивляющейся среде
- Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 764 с.
- Лейтман Дж. Введение в теорию оптимального управления. М.: Наука, 1968. 192 с.
- Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В. и др. Математическая теория оптимальных процессов. М.: Наука, 1976. 392 с.
- Стрелкова Н.А. Оптимальная переориентация сферически симметричного твердого тела в сопротивляющейся среде//Шестые Поляховские чтения: Изб. тр. междунар. науч. конф. по механике. Санкт-Петербург, 31 января -3 февраля 2012 г. М.: Издатель И.В. Балабанов, 2012. С. 75-79.