Научные статьи \ Математика. Естественные науки \ Математика \ Математическая кибернетика

Управление с "поводырем" двухзвенным манипулятором с вращательными парами

Автор: Лутманов С.В., Попова Е.С.

Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi

Рубрика: Механика. Математическое моделирование

Статья в выпуске: 4 (27), 2014 года.

Бесплатный доступ

Решается игровая задача управления о переводе схвата манипулятора на базовую траекторию движения в предположении, что измерение фазового вектора игры производится с некоторой погрешностью. Численно подтверждено, что процедура управления с "поводырем" является эффективным средством управления конфликтно-управляемым динамическим объектом в условиях неточного измерения фазового вектора дифференциальной игры.

Манипулятор, математическая модель, дифференциальная игра, управление с "поводырем"

Короткий адрес: https://sciup.org/14729943

IDR: 14729943 | УДК: 519.7

Текст научной статьи Управление с "поводырем" двухзвенным манипулятором с вращательными парами

На горизонтальной плоскости рассматривается двухзвенный механический манипулятор с двумя вращательными парами (рис. 1), управление которым осуществляется моментами, развиваемыми в соединительных парах. Задана траектория схвата и его закон движения вдоль этой траектории. Указанный закон движения реализуется посредством известных программных управлений. В случае, когда начальные условия для схвата нарушаются, его дальнейшее движение будет отклоняться от базового.

Возвращение схвата на базовую траекторию осуществляется посредством применения дополнительных управлений. В предположении, что нарушения начальных условий незначительны, задача о возращении схвата на базовую траекторию сводится к задаче приведения фазового вектора линеаризованной модели в начало координат. Линеаризация производится в окрестности базового закона движения. В работе [2] эта задача была решена в предположении, что в соединительных парах могут возникать неконтролируемые помехи в виде вращательных моментов. Неконтролируемой помехе предписывалось стремление максимально навредить в решении задачи перевода схвата на базовую траекторию. На дополнительные управления и вращательные моменты, развиваемые неконтролируемой помехой, накладывались геометрические ограничения в виде выпуклых компактных множеств.

В данной статье допускается, что измерение фазового вектора линеаризованной модели производится неточно. Известно [3], что в этих условиях оптимальная стратегия управления, реализованная в форме прицеливания на соответствующий стабильный мост, является неустойчивой по отношению к ошибке измерения фазового вектора. В данной статье оптимальное управление манипулятором осуществляется в виде процедуры управления с " поводырем " [1], преодолевающей этот недостаток.

1 . Линеаризованная модель

Манипулятор представляет собой механизм с двумя степенями свободы. Пусть qw. q0: [0,1]^ R4 закон движения, манипу лятора, порожденный управлением w* (•) и 0

выходящий из начального положения q , а qw• q0* : [0,1] ^ R4 - выходящий из начального положения q °*. Полагаем x ( t ) qw** ,q0* ( t ) qw**,q0 (t ) , t e[0,1] .

Предполагается, что величина ||q °*- q ⁰|| мала. Дифференциальные уравнения линеаризованной модели имеют вид [2]

x _ A ( t ) x + B ( t ) ( u + v ) , (1.1)

Q _ bw 1 — bcq ₄ 2 sin( q 1 — q 2 )

³ ab — c ²cos²( q 1 — q 2 )

—

cw₂ cos( q 1 — q 2 ) ab — c ² cos² ( q 1 — q 2 ) 1 c² q ₃²si^n[2⁽ q 1 ^— q 2 ^)] -

2 ab — c²cos²(q 1 — q₂)

q aw₂ + acq ₃² sin( q 1 — q ₂)

⁴ ab — c ²cos²( q 1 — q ₂)

—

^c w 1 c^os( q 1 ^— q 2 ) ,

2------2+ ab — c cos (q1 — q2)

, ¹ c² q 4 ²s^in[2⁽ q 1 ^— q 2 ^)]

+— •------;----;---------

2 ab — c ²cos²( q 1 — q ₂) ,

Здесь u e R2 - вектор дополнительных управляющих параметров, а v e R2 - вектор

где

A (t)

_ d Q ( t , q , u )

d q

управляющих параметров помех. При этом

u e P _«

f 0

fF 1

P q 2 )

fF 1

P q 2 )

B (t)

q ^_ q * 0 w , q

f> 1

p 1 ld q з)

(t), w=w •( t)

p 1Id q 4)

p Q4 1

ld q 4))

V eQ _<

fV11

P v 2 )

[ u’1

< u 2 )

22 2

u1 + u₂< a 1,

V’²+ v 22 < в²1,

a > в > 0.

_ d Q (t, q, w)

5 w

f 0 ⁰

P Q3 1

0 (t), w=w •

0 1

0 11

fd Q3 1*

q^_q . t w ,q

'•( t)

d w1 )

d w1)

P w2 )

P w2 ) )

Задача возвращения схвата на базовую траекторию представляет собой антагонистическую дифференциальную игру наведения-уклонения, целевым множеством для которой служит начало координат. В этой игре первый игрок распоряжается управляющими параметрами u e P, а второй - параметрами v e Q. Первый игрок решает задачу наведения и поэтому является игроком-союзником. Свою оптимальную стратегию он строит в форме экстремального прицеливания на стабильный мост, обрывающийся в конечный момент на целевом множестве. Выше уже отмечалось, что такой способ управления является эффективным, если измерение фазового вектора игроком-союзником производится без погрешностей. В противном случае игрок-союзник должен применить процедуру управления с "поводырем".

Q =

f ^Q1

IQ4 )

, Q1 = q3, Q2 = q4,

2. Процедура управления с "поводырем"

Предполагается, что в любой момент времени выполнено неравенство

Ix (t)" x •( 11< Z Z a 0.

где x*(t)- измеренное значение фазового вектора линеаризованной модели. Следуя [1] опишем позиционную процедуру управления с "поводырем". Пусть W - стабильный мост первого игрока в антагонистической дифференциальной игре с динамикой (1.1), обрывающийся в момент времени 5 g[0, T] в начале координат. Введем виртуальный динамический объект, который будем называть "поводырем". Его динамика описывается тем же дифференциальным уравнением (1.1), что и реальный объект. Для отличия фазовый вектор "поводыря" будем обозначать буквой w . Таким образом,

w = A (t) w + B (t)(u + v), t g[ 10, T ] , w G Rn , u G P, v G Q.

Рассмотрим разбиение Д промежутка времени [ 10,5] на полуинтервалы:

К^,^Ts+1 ) , s = 0,1,^, k^-1, ^Т 0 = t 0, ^тк = ⁵^.

Опишем действия первого игрока на каждом из указанных полуинтервалах (см. рис. 2).

Рис. 2. Траектория "поводыря"

Полуинтервал [т₀,т1). Определяем точку w₀на сечении моста как ближайшую к x *. Имеем

II^x ’-М=.min,! x'-w • (2.¹) где x * измеренное первым игроком в начальный момент времени t₀положение фазового вектора. Управление u0 = const первого игрока на полуинтервале [т₀,т1) находится из условия

(z₀, Bu °) = min (z₀, Bu}, (2.2)

' 0 / u G P ' 0 '

где z0 = x* - w₀. Если условия (2.1), (2.2) определяют вектор u0 g P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения

x = A (t) x + B (t)(u 0 + v (•)), x (t J = x *, t g[t о, т1).

Полагаем x1 = lim x (t). Движение пово-t ^T1

дыря w(•) отождествим с тем решением дифференциального уравнения в контингенциях

w g A (t) x + B (t)(P + v0),

^w(t*) = ^w0, t^G[^T0^,^т1),

( z₀, Bv⁰) = max (z₀, Bv}, ' / v G q ^x '

для которого выполнено включение w(т1 )g W (т1). Такое решение существует по определению стабильного моста. Полагаем w1 = lim w (t).

t ^т1

Полуинтервал [т1, т2). Пусть x1* - измеренное первым игроком в момент времени τ₁положение фазового вектора. В общем случае w1 ^ x* . Управление u¹ = const первого игрока на полуинтервале [т1, т 2) определяем из условия

(z, Bu '\ = min (z,, Bu}, (2.3)

\ ¹ / u G P ' ¹

где z1 = x* - w1. Если условие (2.3) определяет вектор u¹g P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения

x = A (t) x + B (t)(u1 + v (•)),

x(т1 ) = x1, t G[т₁, т2 ) .

Полагаем x₂= lim x (t). Движение "по-t ^т 2

водыря" w(•) отождествим с тем решением дифференциального уравнения в континген-циях w g A (t) x + B (t)(P + v1),

^w(^т1 ) = ^w1, t^G[^то,^т1),

(Zj, Bv¹) = max (zj, Bv},

' ' vgq ' '

для которого выполнено включение w(т2 )e W (t2). Такое решение существует по определению стабильного моста. Полагаем w₂= lim w (t). и т. д.

t ^Т 2

Полуинтервал [ts,ts+1). Пусть x* - измеренное первым игроком в момент времени τs положение фазового вектора. В общем случае ws ^ x*. Управление us = const первого игрока на полуинтервале [ts,ts+1) определяем из условия

(zs,Bus\ = min(z ,Bu),, (2.4) s u e PX где zs = xs - ws. Если условие (2.4) определяет вектор us e P неоднозначно, то берется любой из них. Движение реального динамического объекта получим интегрированием дифференциального уравнения

X = A (t) x + B (t)(u^s + v (•)), ^x(Т ) = ^Xs , t^e[^Ts, ^Ts+1 ).

Полагаем x_s₊₁= lim x (t). Движение t ^t+1

"поводыря" w(•) отождествим с тем решением дифференциального уравнения в контин-генциях

w e A (t) x + B (t)(P + vs), w (Ts ) = ws , t e[Ts ,Ts +1 ) , (zs,Bvs\ = max(z ,Bv), \ ' veQ ' '

для которого выполнено включение w(t_s₊₁) e W (t_s₊₁). Такое решение существует по определению стабильного моста. Полагаем w_s₊₁= lim w (t). и т. д.

t ^^Ts+1

Таким образом, на каждом полуинтервале [t_s,t_s₊₁), s = 0,1,...,k -1 разбиения промежутка времени [t*, T] будет получено движение "поводыря" w (•) и движение реального динамического объекта x (•) .Справедливо следующее утверждение [1].

Позиционная процедура управления с "поводырем" позволяет по любому £ > 0 подобрать величины Z (£)> 0 и 5 (£ )> 0, для которых бы выполнялось xА (0) < £ , где xА(-)- ломаная Эйлера, выходящая из начального положения (10, x0 )e W и порожденная процедурой управления с "поводырем", если длина шага разбиения А меньше д (£ )> 0, а точность измерения фазового вектора не ниже Z (£) > 0.

3. Численный эксперимент

В рассматриваемой дифференциальной игре стабильный мост первого игрока, обрывающийся в момент времени 5 e [0, T] в на- чале координат, имеет вид

W = {(t,x)|£ (t,x)< 0, t e[0,5]}, где

£ 0 (t, x ) =

= max{0, max ^x, s (t)} + J minBB (t) u, s (t)ddz + l,S^u^e^P

+ j max BB (t ) v, s (t ) ^dz t

- max meM

(3,1)

S(4)={l e R 2| ||l|| = 1}, s (t ) = ( X [ T, t]) ' l °, т e [t, T], l0 e S(4) - вектор, доставляющий максимум в (3.1).

При проведении численного эксперимента были установлены следующие значения параметров задачи. Каждое звено двух- звенного манипулятора имеет длину l1 = 12 = 1 м, масса схвата m=1 кг , массы стержней - m1 = m2 = 1 кг . Отклонение схвата манипулятора от начального положения определяется вектором

1-0.21 рад ^ 0.40 рад 0 рад сек рад

V 0 ~к / и составляет величину р0 = 0.45177 .

Заметим, что

(0, x°*)e W .

Принимается также, что а = 10 н • м, в = 1 н • м, д = 0.005 м .

Все вычисления проводились в среде пакета Mathematica 8. В рамках численного эксперимента рассмотрены два случая. В первом случае в условиях неточного измерения фазового вектора игрок-союзник реализует свою стратегию в виде стандартного прицеливания на мост, а во втором случае – в форме процедуры управления с "поводырем".

В процессе прицеливания на мост определение w₀— точки моста, ближайшей к точке

x £ W (t) = {x е R41 (t, x) e W}, t e [0,5]

осуществляется путем решения задачи математического программирования на условный минимум с ограничением типа неравенства

( pl - x1 ) +( p2 - x2 ) +( p3 - x3 ) +

⁺( P 4

x4) ^ min,

(3.2)

s(t,x1,x2,x3,x4,)< 0. (3.3)

Заметим, что задача (3.2), (3.3) является невырожденной задачей выпуклого программирования. Тогда необходимые условия локального минимума в форме правила множителей Лагранжа служат для нее и достаточными условиями глобального минимума. При реализации процедуры управления с "поводырем", описанной в предыдущем пункте, удержание "поводыря" на стабильном мосту на каждом шаге процесса осуществляется выбором управляющего па- раметра первого игрока из условия ds < 0.

Случай первый. Управление манипулятором производится в форме стандартного прицеливания на стабильный мост в условиях неточного измерения фазового вектора. На рис. 3 показана траектория фазового вектора игры в проекции на первые две координаты, в предположении, что второй игрок действует самым неблагоприятным для первого игрока образом. Расстояние фазового вектора до начала координат (по всем четырем координатам) в конечный момент времени равно pk = 0.06224, что говорит о неэффективности приведенной процедуры управления.

Рис. 3. Траектория движения управляемого объекта

Случай второй. В условиях неточного измерения фазового вектора управление манипулятором осуществляется в форме позиционной процедуры управления с "поводырем". На рис. 4 показана траектория фазового вектора игры в проекции на первые две координаты, в предположении, что второй игрок действует самым неблагоприятным для первого игрока образом. Расстояние фазового вектора до начала координат (по всем четырем координатам) равно pk = 0.00031. В случае, когда второй игрок действует случайно, оно практически равно нулю. Полученные результаты являются приемлемыми.

Рис. 4. График движения управляемого объекта при оптимальном действии помехи

Заключение

В работе численно подтверждено, что процедура управления с поводырем является эффективным способом управления в дифференциальной игре наведения в условиях неточного измерения фазового вектора игры. Этот факт позволил решить задачу возвращения схвата манипулятора на базовую траекторию с заданной степенью точности, в предположении, что его отклонение от базового закона движения в каждый момент времени измеряется с погрешностью.

Список литературы Управление с "поводырем" двухзвенным манипулятором с вращательными парами

Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 456 с.
Лутманов С.В., Попова Е.С. Игровые задачи управления двухзвенным манипулятором с вращательными парами//Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2012. Вып. 44. С. 59-73.
Лутманов С.В., Попова Е.С. Реализация процедуры управления с "поводырем" в одной антагонистической дифференциальной игре двух лиц наведения на целевое множество//Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2013. Вып. 45. С. 39-54.