Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

Бесплатный доступ

Предметом данной статьи является программируемая система управления роботом-манипулятором. Рассмотрена сложная нелинейная динамика, связанная с практическим применением систем и манипуляторов. Традиционный метод управления заменяется разработанной системой Elma и адаптивной радиальной базовой функцией нейронной сети, что повышает стабильность системы и скорость отклика. С помощью программного обеспечения, связанного с MATLAB, разработаны соответствующие контроллеры и компенсаторы. Представлены результаты обучения нейросетевого контроллера для программирования траекторий робота. Анализируются динамические ошибки различных типов нейросетевых контроллеров и двух методов управления.

Еще

Робот-манипулятор, программируемая система управления, нейронная сеть, нелинейные многомерные компенсаторы, моделирование, динамический анализ, динамические ошибки

Короткий адрес: https://sciup.org/148325297

IDR: 148325297   |   DOI: 10.37313/1990-5378-2022-24-4-106-115

Текст научной статьи Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

На раннем этапе проектирования управления манипулятором динамическая модель системы и связанные с ней параметры системы должны быть точно описаны при проектировании контроллера [1]. В традиционных методах проектирования управления, таких, как вычислительное управление крутящим моментом и управление обратной динамикой, это работает нормально [2]. Рассчитав крутящий момент манипулятора робота и составив динамическое уравнение, вы можете получить хороший эффект управления [3]. Но данные методы основаны на возможности получить точную модель данных. Однако получить точную математическую модель робота в реальном производстве и использовании сложно [4]. Кроме того, из-за влияния различных полезных нагрузок могут возникнуть трудности с получением соответствующих методов на основе моделей. В последнее время нейросетевые калькуляторы используются для улучшения характеристик систем управления при разработке систем управления роботами-манипуляторами. В системах числового управления (ЧПУ) нейросетевой интерполятор траекторий звеньев робота может использоваться вместо традиционного сплайн-интерполятора [5].

Это исследование используется для обучения компенсаторов с использованием нейронных сетей в системах числового управления роботами-манипуляторами и при отсутствии точных исходных данных [6]. Адаптивный нейросетевой компенсатор используется для замены традиционного ПИД-регулятора и других методов компенсации динамической ошибки, вызванной скручивающей нагрузкой в приводе звена робота [7]. Нелинейная динамическая связь привода выбирает двухпрямой робот-манипулятор в угловой системе координат в качестве моделируемого объекта управления [8].

Целью данной работы является синтез и обучение многомерного нейросетевого контроллера для компенсации и коррекции динамической ошибки траектории робота. И контроллер нейронной сети, и моделирование проекта выполняются в MATLAB [9].

  • 2.    МАТЕМАТИЧЕСКИЕ МОДЕЛИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ КОМПЕНСАТОРОВ

Как правило, многомерные компенсаторы динамических ошибок описываются нелинейными выражениями, соответствующими динамической модели робота, представленной в виде уравнений Лагранжа:

где (q, q', q) - N x 1 векторов обобщенных координат положений, скоростей и ускорений звеньев робота; N – количество ссылок робота.

Основными нагрузками приводов робота являются элементы векторов левой части в уравнении (1), где:

Q_iner = A (q) q ̈ - N × 1 вектор моментов инерции или сил, вызванных ускоренным движением звеньев; A (q) - матрица кинетической энергии N × N механизма робота;

Q_cor = B (q, q ̇ ) q ̇ - вектор N × 1 кориолисовых и центробежных моментов или сил; B (q, q ̇ ) - матрица N × N;

Q_grav = C (q) - N × 1 вектор гравитационных и других потенциальных моментов или сил.

В правой части уравнения (1): Q_d – вектор N × 1 крутящих моментов или сил, создаваемых приводами робота; Q_L – вектор N × 1 дополнительных нагрузок, возникающих в приводах из-за трения в соединениях и действия внешних сил на захват.

Траектории звеньев робота в системах ЧПУ рассчитываются путем решения обратных задач кинематики в базовых точках траектории захвата робота, а затем они интерполируются с использованием полиномов сплайнов. Следовательно, используя программные значения векторов положения, скорости и ускорения звеньев (q_p, (q_p) ̇, (q_p) ̈ ), можно рассчитать программные значения крутящего момента или силовых нагрузок, которые приводы звена должны преодолеть:

; ; ; (2) ;;

Qff =<2mer + Qcor + Qgrav (3)

Выражения (2) и (3) могут быть непосредственно использованы для компенсации динамических ошибок в системах ЧПУ роботов с моментными приводами звеньев и ПИД-регуляторами положений звеньев робота (Игнатова и Ростов, 2014). На рисунке 1 показана соответствующая функциональная схема системы с динамическими компенсаторами, включенными в схему прямой связи (FF) системы управления.

Однако, если есть дополнительные нагрузки Q_L, система с контролем крутящего момента FF может иметь большие динамические ошибки, которые могут быть уменьшены с помощью дополнительного линейного компенсатора:

upid = Kpe + K^ edt — K4q + Kcomq‘p , (4) где K_com = diag {K_ (com, i)} – матрица коэффициентов линейного компенсатора.

Нелинейные компенсаторы могут быть включены в обратную связь (FB) системы управления вместе с ПИД-регулятором или более сложным нелинейным регулятором. В этом случае компенсаторы FB используют сигналы обратной связи реальных положений и скоростей звеньев робота, измеренных соответствующими датчиками:

Qiner = ^^^pid^cor = B(q,q)q ; Qgrav = Clq>. (5) ;

Qfb = ^iner + Qcor + ^arav, (6) где вектор Upid рассматривается как вектор реальных ускорений.

На рисунке 2 показана функциональная схема с нелинейными компенсаторами FB, включенными в замкнутый контур системы.

Многовариантные компенсаторы (5) и (6) выполняют линеаризацию нелинейной динамики робота, описываемой уравнением (1), и тем самым обеспечивают более стабильную работу приводов робота.

  • 3.    ОБУЧЕНИЕ НЕЛИНЕЙНЫХ НЕЙРОСЕТЕВЫХ КОМПЕНСАТОРОВ

    • 3.1.    Проектирование компенсаторов с помощью нейронных сетей Элмана

Цель исследования заключалась в разработке модели адаптивной нейронной схемы управления нелинейными динамическими системами манипуляционного робота.

В качестве примера рассмотрим промышленный трехзвенный робот-манипулятор, звенья которого соединены между собой приводами вращательного движения. Положение звеньев определяется углами ϕ 1 , ϕ 2 , ϕ 2 . Помимо этого, на звенья робота действуют силы веса, которые направлены под некоторым углом α к выбранной системе координат, что демонстрирует возможность устройства работать под любым углом к горизонту.

Основной характеристикой объекта управления является его передаточная функция, записанная в терминах преобразования Лапласа, которая определяет соотношение выхода объекта y(s) к входу x(s) при нулевых начальных условиях.

Математическая модель, описывающая движение робота, имеет следующий вид:

ф = O)y (Oy = -^7 (Oy + ^ 5,   ( 7 )

где Ф – угол отклонения от заданной траектории движения;

tOy – угловая скорость вращения вокруг вертикальной оси;

  • 5 – угол поворота вокруг вертикальной оси;

T s – постоянная времени;

K – постоянный коэффициент с размерностью рад/с.

Уравнение, описывающее объект управления, имеет характер интегрируемого звена с опозданием, и описывается дифференциальным уравнением, поскольку в качестве исходной величины рассматривается не угловая скорость, а угол поворота, который является интегралом от угловой скорости:

T^ + d^ = kXi       (8)

dt1 dt         *■

Передаточная функция звена:

Привод робота имеет характер апериодического звена первого порядка, который можно описать дифференциальным уравнением:

T dx* + X, = kxr(10)

dt ‘

Соответственно передаточная функция звена привода имеет следующий вид:

я (5) =(11)

  • 4    " Тгз+1

Для управления движением робота-манипулятора, представляющего собой нелинейную динамическую систему, целесообразно применять нейроконтроллер, который базируется на искусственной нейронной сети Элмана (рис. 1):

аЧЛ) = tansig (IW^p + ЛИ^раЧк — 1) + Ь1) ;

.

Преимуществом нейронной сети Элмана является повышенная устойчивость, поскольку в ней обратные связи заведены из выходов внутренних нейронов на промежуточный слой, что делает ее более устойчивой по сравнению с рекуррентной сетью аналогичного типа (например, нейронная сеть Хопфилда, в которой внутренние обратные связи подводятся к первичным входам, где происходит смешивание сигналов). Кроме того, нейронная сеть Элмана позволяет учитывать предысторию наблюдаемых процессов и накапливать информацию для выбора правильной стратегии управления роботом.

В системе MatLab / Simulink создана модель искусственной нейронной сети для управления манипуляционным роботом, содержащая входной слой из 15 нейронов и скрытый слой в вариантах от 12 до 19 нейронов, которые имеют локальные обратные связи через линии задержки. Выходной слой содержит 1 нейрон с линейной функцией активации (purelin) (см. рис. 2).

Состояние нейронов рекуррентного слоя сети опишем следующими уравнениями: (V (к) = LWVCk -1) + wup + Ь^аЧо) = aj оЧк) = t™sifl(n4k)). (12)

Линейный слой нейронной сети является безынерционным, а состояние его нейронов определяется соотношениями:

I fn2 (к) = LW^a1^) + b2

а2 (к) = purelin(n2 (к)).

Рис. 1. Структура нейронной сети

Рис. 2. Структурная модель искусственной нейронной сети управления промышленным трехзвенным манипуляционным роботом

Последовательность значений выходного сигнала, который попадает на линию обратной связи с задержкой, содержащей N-1 блоков опоздания z-1, а выход линии задержки, который состоит из значений входа в момент времени k, k-1, ..., k-N-1, опишем следующим выражением:

Угол поворота манипулятора представим в виде общей переменной , где u1 - настоящий угол поворота первого звена и u2 - настоящий угол поворота второго звена. Поскольку в этом примере , поэтому удовлетворяются равенства z = (z±,z2) = It и где r1 и r2 – желаемые углы поворота манипулятора; z – управляемая траектория манипулятора, v – дополнительная траектория манипулятора, y – вектор состояния манипулятора.

Для описания изменений желаемых углов поворота манипулятора используем следующие законы: r1(t) = sin(t) и r2(t) = cos(t).

Опишем модель нейронной схемы адаптивного управления манипулятором с помощью такого уравнения состояний с переменной структурой:

(—a — |vL если u > v; u = — = —(a + |v|)syn(u — v) = j 0, если и = v;

\ a + |i?|, если u < v.

(16) где        – вектор состояний,        – посто янный параметр,

( 1, если it > v;

1—1, если и < v.

Для получения решений представленного уравнения численным методом используем соответствующие два разностных уравнения с шагами по времени . Элементы функции в этих уравнениях вычисляют как конечные разности первого порядка (разностные коэффициенты Ньютона). В указанных уравнениях равенство u = r заменяется на неравенство .

Обучение сети (корректировку весовых коэффициентов и смещений нейронов до достижения заданной ошибки) будем проводить с использованием метода сопряженных градиентов (Флетчера-Ривса), которому свойственна хорошая сходимость вычислительного процесса: для положительно определенной квадратичной функции от n переменных минимум достигается не более чем через n шагов.

Алгоритм обучения нейронной сети состоит из следующих шагов:

  • 1.    В начальный момент времени t=1 все нейроны скрытого слоя устанавливаются в нулевое положение - исходное значение равно нулю.

  • 2.    Входное значение подается на сеть, где происходит его прямое распространение.

  • 3.    Согласно выбранному алгоритму Флетчера-Ривса, который по сравнению с алгоритмом градиентного спуска, регулирует скорость сходимости не только за счет настройки параметра скорости, но и корректирует размер шага на каждой итерации, достижение установленного значения ошибки выполним за минимальное количество итераций.

  • 4.    Установим t=t+1 и осуществим переход на 2 шаг. Обучение нейронной сети выполняется до тех пор, пока суммарная среднеквадратичная погрешность сети не примет наименьшее значение.

  • 3.2. Проектирование компенсатора с адаптивной радиальной базовой функцией нейронной сети для аппроксимации локальной модели

В этой части разрабатывается компенсатор нелинейной динамической модели на основе нейронной сети RBF на основе литературы (2) и (3), который сравнивается с компенсатором нейронной сети в предыдущей части.

где — матрица момента инерции порядка n*n, _ ^ '' " — вектор центробежной силы порядка n*n, — вектор силы тяжести порядка n*1, q — вектор, представляющий переменную сустава, а τ — вектор приложенного крутящего момента в суставе.

Динамическое уравнение манипулятора обладает следующими свойствами

Свойство 1. Матрица инерции является симметричной положительно определенной;

Свойство 2. Если ^xCq-q) определяется правилом записи Кристоффеля, матрица ^х(ч) 2Cx(q,q) кососимметрична.

Поскольку и являются просто функциями q, их можно моделировать с помощью статических нейронных сетей.

m„tJ(q) -Ej »jtj!4jj(v) +^/») = ^/fcjW+ Emk/'?): Sxk(q) = Ei Pki^M^ + £kk + £м№

Среди них           — веса нейронной сети;                 — радиальная базисная функция, входом которой является вектор q, — ошибки моделирования mxkj(q) и соответственно и считаются ограниченными.

Для моделирование с помощью динамической нейронной сети с входными данными q и q. Модель нейронной сети имеет вид cxkjtq.q) = I; akjl^kjlto + siy (z) = «^-^(z) + Eik/z).

Среди них                         — радиальная базисная функция входного вектора  – ошибка моделирования элемента , в предположении, что он также ограничен.

Используя нейросетевое моделирование, динамическое уравнение манипулятора странстве можно записать в виде

Mx(q)x + Cx(q,q)x + G^q) = Fx.

Среди них

xkj(q) = 9kj^kjto + Edkj(q): cxkj Cq. q) = a^kj (z) + Eckj (z);

9xkW = Pk^M + ^gkW- в

про-

Используя матрицы GL и их операции умно- жения, можно записать с помощью ^(q)=[{9}T-p(q)}] + fM(q).

где и      – матрицы GL, элементами которых являются и                    – ма трица, элементами которой являются ошибки моделирования .

Аналогично, для и существуют

Vw) = [raT №)j]+yz):

где                 , {B} — матрицы GL и векторы GL, элементами которых являются ;                and

  • — элементы, матрицы ошибок моделирования и      соответственно.

Предполагая, что 1 — это идеальная траектория рабочего пространства, тогда 2 и 2 — это идеальная скорость и идеальное ускорение.

(25) r(t) = xr(t) — x(t) = e(t) + Ae(t)

где Λ — положительно определенная матрица.

Лемма 1 (лемма Барбала): если функция h:R→R — равномерная непрерывная функция, определенная на [0,+∞), lim_(t→∞) ∫_0^th(δ)d существует и конечна, то lim_(t→∞)h(t)=0.

Лемма 2. Let                 , где * представляет собой свертку,                и H (s)

является строго экспоненциально устойчивой передаточной функцией порядка n*n. Если , то                     непрерывно при t→∞

Рассмотрим систему SISO второго порядка, пусть                , тогда мы можем получить                 и             . Чтобы гарантировать, что H(s) является строго экспоненциально стабильной передаточной функцией, можно определить, что c>0. Если вышеуказанные условия выполнены и , можно получить , ce(t)+e(t)=0, что обеспечивает экспоненциальную замкнутость системы.

Используя i для представления оценочно- го значения, зададим                , затем и представляют собой формулы {θ},

{A} и {B } оценки.

Конструктивно контроллер выполнен в виде

F. = [{9}T ■ (S(q)}K + [U}T ■ №)}K + где . Первые три члена регулятора – управление на основе модели, член K_r эквивалентен управлению с пропорциональной производной (PD), а последний член закона управления является надежным членом, который подавляет ошибку моделирования нейронной сети.

Из выражения регулятора очевидно, что регулятору не нужно решать обратную матрицу Якоби. В реальном управлении проигравший может быть получен с помощью .

Подставляя уравнения (23) и (24) в уравнения (21), можно получить

{[WT ■ P(q)}] + ^м(чЖ + <[{Л}Т ■ (Z(z)}] + ec(z№ Ч^ЧНШ + е^^р,.

Подставляя закон управления (26) в приведенную выше формулу, можно получить

{[{9}T ■ {S(q)}l + Ем№+ {[(Д}т - (Z(z)}] +

+5c(z)}x + [{B}T ■ (Я(д)}] + Ec(q) =

[{0}T " {5(q)}]xr + № ■ {7(z)}]zr +

+[{B}T ■ {W(q)}] + Kr + ks sgn(r).

Подставляя x=xr-r и x=xr-r в приведенное выше уравнение, мы можем получить

{[{6/ • {6(q)}l + EM(q)K^r - r) + {[{4}T. {Z(z)}] +

+EC (z)Xxr - r) + [{B}T ■ {//(q)}] + Eg (q) =

= [{9}T • [6(q)}]fr + [ЙГ' {Z(z)}]xr+ [] + Kr + kssgn(r)

Подставляя уравнения (23) и (24) в приве- денные выше уравнения, мы можем получить МДд)т + Cx

= [{9}T ■ (5(q)}]^r+!wT ■ {Z(z)}]ir + [{B}T ■ №)}] + E.

Для замкнутой системы, если K>0,k,>//E//па- раллелен, а адаптивный закон устроен как вк = rk ■ {^k(q)}xtrk;

(31) Pk = М^к^)тк.

Среди них

и и – векторы θ ˆ_k и a ˆ_k соответственно, тогда ,                         непрерывно, и e^0 и e '^0 при t^“.

В соответствии с интегральной линейной функцией Ляпунова, предложенной в ссылке, ее можно проанализировать на устойчивость следующим образом.

V = 1 rTMk(q)r + ^2=1 ^k Гк-^к +

Среди них Гк = Гкт>0;Qk = Q^> 0; Nk = Nk > 0 и и — векторы θ ˆ_k и a ˆ_k соответственно, тогда , непрерывно, и e^0 и e '^0 при t^“.

В соответствии с интегральной линейной функцией Ляпунова, предложенной в ссылке, ее можно проанализировать на устойчивость следующим образом.

V = ; rTMk(,q)r +1^=1 SkT vs, +

Среди них Г_к Q_k N_ka являются положительно определенными парно-секундными матрицами. Производная по V, получаем

У =гтМкг + |гтМкг+Е^1 57^^ +

Так как матрица кососимметрична, то , можно получить приведенную выше формулу и = гт(м,г+с,г)-^., ^W -SL. "iQi^k-y., Wtfk-

Подставляя уравнение (30) в приведенное выше уравнение, мы можем получить

7 = -r^Kr- i,rTsgn(r) + ^=1 (Мт ■ {{k(q)}xerte + Х?=1 ^ ■ Йьй)^^

=1Р^Мтк+тЧ-у,^ eiv;^-^ 40^-2^! Рткм^к.

Подставим адаптивный закон (31) в формулу (36) и объединим неравенство         парал лельно, получим

Анализ конвергенции:

  • (1)    Из                     , из леммы

, eL2 непрерывно, то при

,

  • (2)    Из 7 < тК получаем 00 .

  • 4. МОДЕЛИРОВАНИЕ

Следовательно, когда V(t)L., существуют , и

В этом разделе представлены результаты моделирования, показывающие работу предлагаемого адаптивного нейроконтроллера. В этом разделе предложенная схема управления применяется к двухзвенному проекту, математическая модель которого была разработана в пакете Solidworks и импортирована в пакет MATLAB вторым поколением Simulink [22].

Изначально первое звено перемещается, а второе нет. Показано, что после обучения первого звена отрабатываются внешние возмущения. Затем второе звено начинает двигаться, а первое останавливается. После этого оба звена перемещаются, оказывая динамические возмущения на каждое звено. Его динамическое уравнение

КГ„1 = р + Ql + Z/COS^Z) ql + qZcos^Z)].

;

-q2 q2sin(q2) -q2(ql+ q2)sin(q2) q2 qlsin(q2)            0

л _ [flcosql + 5 cos(ql + q2)l , где известное параметров v=12,   q1=9, q2=8, g=9.8, внешние помехи системы ,d1=2, d2=3, d3=6 .Пред положим, что ожидаемые инструкции по отслеживанию угла звеньев и угловой скорости являются следующим уравнением qld = 1 + 0.2sin(0.5Trt);

q2d = 1 — 0.2cos(0.5Trt).

Начальное состояние системы [q1 q2 q3 q4]^T= [0.6 0.3 0.5 0.5]^T , предполагаем            ,

. При моделировании используем формулу закона управления и формулу адаптивного закона:

В нейронной сети RNF параметры функции Гаусса установлены на c=[-2 -1 0 1 2] и b=3 , начальный вес 0,1Т

Параметры моделирования робота-манипулятора следующие:

L(1):’qlim’, [-180 180]*deg;’m’, 0, ...’Jm’, 200e-6, ...’G’, -62.6111, ...’B’, 1.48e-3;

L(2) :’qlim’,[-180 180]*deg ;’m’, 17.4, ...’Jm’, 200e-6, ...’G’, 107.815, ...’B’, .817e-3.

Рис. 3. Механическая модель робота-манипулятора

1)    имитационное моделирование нейронных сетей ELman

Из рис. 4 видно, что в случае адаптивной компенсации на начальном этапе имеет место некоторая степень возмущения, а угловая скорость и положение имеют тенденцию к сближению.

Рис. 4. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации Эльмана

Рис. 5. Аппроксимация внешнего возмущения и функции f(x) с адаптивной компенсацией Эльмана

Рис. 6. Ошибка между идеальной траекторией и реальной траекторией

Из графиков (рис. 5, 6) видно, что возмущения практически полностью скомпенсированы, а процесс управления роботом вполне удовлетворительный.

Экспериментальные результаты также доказывают, что предложенный подход достаточно устойчив к динамическим возмущениям, вызванным взаимным влиянием динамики звеньев. Предлагаемый метод управления является оригинальным и успешно использует преимущества SMC, нейросетевого и адаптивного управления.

2)    Имитационное моделирование нейронных сетей RBF

Для аппроксимации каждого элемента Мх№ and GAq") входом нейронной сети RBF является q, рассчитанное количество точек скрытого слоя равно 7. Для аппроксимации каждого элемента Gx(q-q), вход нейронной сети RBF равен (q, q), а количество точек скрытого слоя дизайна равно 7.

ПараметрывсехфункцийГауссапринимаются как Ci = [-1.5 -1.0 -0.5 0 0.5 1.0 1.5] и ^i = 10 , а начальное значение нейронной сети установлено равным 0 . Закон управления принимает формулу (26), а адаптивный закон принимает формулу (31). Выгода выби-

„ [30 рается как К = [

^],k_s=0,5. Из леммы 2

желательно, чтобы

л [ o 15] . Параметры

адаптивного закона (31) принимаются как \\ rk = diag[2.0},gk = diag{0.10] и jVk — diag{5.0)

..

Результаты моделирования показаны на рис. 7 и рис. 8.

Как видно из рис.8, в начале моделирования значение ошибки относительно велико из-за фазы обучения нейронной сети управляющему входу. Когда нейросетевой компенсатор проходит обучение, ошибки в основном аннулируются, а траектория движения и расчетное значение сходятся.

Рис. 7. Вход управления для каналов 1 и каналов 2

Рис. 8. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации RBF

position tracking of x2 axis position tracking of x1 axis

Рис. 9. Аппроксимация для переменных H^*(4)H- 11^(9,4)11 и 116,(4)11

Поскольку траектория слежения не является непрерывным возбуждением, оценочные значения 11^(4)11- lte)ll и I|G,O?)II не сходятся к ll^(l)lk IICrMII и HG,(q)l, которые часто встречаются в инженерной практике. Из моделирования двух нейронных сетей видно, что, хотя нейронная сеть RBF имеет более высокую скорость обучения и обучения при том же планировании траектории, общая точность ошибок меньше, чем у Элмана. Но если есть больше условий помех и неопределенной среды, общие результаты обучения RBF лучше.

ЗАКЛЮЧЕНИЕ

Таким образом, подводя итоги исследования, можно сделать следующие выводы. В ходе исследования качество выполнения роботом конкретных задач зависит не только от качества материала, из которого он изготовлен, качества подвижных частей, но и от качества математических моделей, в которых эффективность и точность управления роботом основаны на анализе его динамической модели и уменьшают погрешность между запланированной и фактической траекториями. В данной статье показана нейронная сеть, отличающаяся тем, что разработана модель двух адаптивной нейронной схемы управления нелинейными динамическими системами манипулятивного робота на основе рекуррентной сети Элмана. Обоснован выбор архитектуры сети и предложен алгоритм ее обучения методом сопряженных градиентов. Моделирование адаптивной нейронной сети RBF показывает, что хотя она имеет более быстрое время отклика, но при отсутствии непрерывного возбуждения система не сходится и значение ошибки намного больше, чем у сети Элмана.

Модель вращения плоского манипулятора описывается дифференциальным уравнением первого порядка с переменной структурой и выходным уравнением. Модель имеет простую структуру и может быть использована, когда неизвестны внутренняя динамика и параметры управляемой системы. Компьютерное моделирование применения модели оптимального управления слежением за углом поворота манипулятора подтверждает теоретические положения и демонстрирует высокую эффективность ее функционирования.

Этот метод также может быть применен к моделированию манипулятора с несколькими степенями свободы. В то же время модель может быть использована в методе адаптивного управления манипулятором после доработки.

Список литературы Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

  • A.-V. Duka, “Neural Network based Inverse Kinematics Solution for Trajectory Tracking of a Robotic Arm,” Procedia Technology, vol. 12, pp. 20–27, Dec. 2014, doi: 10.1016/j.protcy.2013.12.451.
  • Y. H. Kim and F. L. Lewis, “Neural network output feedback control of robot manipulators,” IEEE Transactions on Robotics and Automation, vol. 15, no. 2, pp. 301–309, Apr. 1999, doi: 10.1109/70.760351.
  • S. Islam and P. Liu, “Robust Sliding Mode Control for Robot Manipulators,” Industrial Electronics, IEEE Transactions on, vol. 58, pp. 2444–2453, Jul. 2011, doi: 10.1109/TIE.2010.2062472.
  • Yazdanpanah M. J. and Karimian Khosrowshahi G., “Robust control of mobile robots using the computed torque plus H∞ compensation method,” 632249139440000000. https://www.sciencegate.app/document/10.1109/cdc.2003.1273069 (accessed Jun. 29, 2022).
  • R. E. N, R. N. V, and Y. Zhengjie, “Neural network compensation of dynamic errors in a position control system of a robot manipulator,” Computing, Telecommunication and Control, vol. 64, no. 1, pp. 53–64, 2020, doi: 10.18721/JCSTCS.13105.
  • F. W. Lewis, S. Jagannathan, and A. Yesildirak, Neural Network Control Of Robot Manipulators And Non- Linear Systems. CRC Press, 2020.
  • K. Kara, T. Missoum, K. Hemsas, and M. Hadjili, “Control of a robotic manipulator using neural network based predictive control,” Dec. 2010, pp. 1104–1107. doi: 10.1109/ICECS.2010.5724709.
  • S. Seshagiri and H. Khalil, “Output Feedback Control of Nonlinear Systems Using RBF Neural Networks,” Neural Networks, IEEE Transactions on, vol. 11, pp. 69–79, Feb. 2000, doi: 10.1109/72.822511.
  • I. V. Tetko, V. Kůrková, P. Karpov, and F. Theis, Artifi cial Neural Networks and Machine Learning – ICANN 2019: Theoretical Neural Computation: 28th International Conference on Artifi cial Neural Networks, Munich, Germany, September 17–19, 2019, Proceedings, Part I. Springer Nature, 2019.
  • M. W. Spong and M. Vidyasagar, Robot dynamics and control. New York: John Wiley & Sons, 1989.
  • Y. Zhengjie, E. Rostova, and N. Rostov, “Neural Network Compensation of Dynamic Errors in a Robot Manipulator Programmed Control System,” 2020, pp. 554–563. doi: 10.1007/978-3-030-34983-7_54.
  • L. Y.-J, T. S.-C, W. D, L. T.-S, and C. C.l.p, “Adaptive neural output feedback controller design with reduced-order observer for a class of uncertain nonlinear SISO Systems,” UM, vol. 22, no. 8, 2011, doi: 10.1109/TNN.2011.2159865.
  • Z. Liu, G. Lai, Y. Zhang, X. Chen, and C. Chen, “Adaptive Neural Control for a Class of Nonlinear Time-Varying Delay Systems With Unknown Hysteresis,” IEEE transactions on neural networks and learning systems, vol. 25, pp. 2129–40, Dec. 2014, doi: 10.1109/TNNLS.2014.2305717.
  • N. Duan and H.-F. Min, “NN-based output tracking for more general stochastic nonlinear systems with unknown control coeffi cients,” Int. J. Autom. Comput., vol. 14, no. 3, pp. 350–359, Jun. 2017, doi: 10.1007/s11633-015-0936-4.
  • B. Luo, D. Liu, X. Yang, and H. Ma, “H ∞ Control Synthesis for Linear Parabolic PDE Systems with Model-Free Policy Iteration,” in Advances in Neural Networks – ISNN 2015, Cham, 2015, pp. 81–90. doi: 10.1007/978-3-319-25393-0_10.
  • C. Chen, Z. Liu, K. Xie, Y. Zhang, and C. L. Philip Chen, “Adaptive neural control of MIMO stochastic systems with unknown high-frequency gains,” Inf. Sci., vol. 418, no. C, pp. 513–530, Dec. 2017, doi: 10.1016/j.ins.2017.08.027.
  • Y. Chen, J. Liu, H. Wang, Z. Pan, and S. Han, “Modelfree based adaptive RBF neural network control for a rehabilitation exoskeleton,” Jun. 2019, pp. 4208–4213. doi: 10.1109/CCDC.2019.8833204.
  • M. Wang and A. Yang, “Dynamic Learning From Adaptive Neural Control of Robot Manipulators With Prescribed Performance,” IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 47, no. 8, pp. 2244–2255, 2017, doi: 10.1109/TSMC.2016.2645942.
  • M.-D. Tran and H.-J. Kang, “Nonsingular Terminal Sliding Mode Control of Uncertain Second-Order Nonlinear Systems,” Mathematical Problems in Engineering, vol. 2015, p. e181737, Oct. 2015, doi: 10.1155/2015/181737.
  • R. Ortega and M. W. Spong, “Adaptive motion control of rigid robots: a tutorial,” in Proceedings of the 27th IEEE Conference on Decision and Control, 1988, pp. 1575–1584 vol.2. doi: 10.1109/CDC.1988.194594.
  • S. S. Ge, C. C. Hang, and L. C. Woon, “Adaptive neural network control of robot manipulators in task space,” IEEE Transactions on Industrial Electronics, vol. 44, no. 6, pp. 746–752, 1997, doi: 10.1109/41.649934.
  • “Design and implementation of a RoBO-2L MATLAB toolbox for a motion control of a robotic manipulator.” https://ieeexplore.ieee.org/document/7473678/ (accessed Jun. 30, 2022).
  • S. Kh. Zabihifar, A. Kh. D. Markazi, and A. S. Yushchenko, “Two link manipulator control using fuzzy sliding mode approach,” Herald of the Bauman Moscow State Technical University. Series Instrument Engineering, Dec. 2015, doi: 10.18698/0236-3933-2015-6-30-45.
Еще
Статья научная