Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

Чжэнцзе Янь; Клочков Ю.С.; Лин Си; Zhengjie Yan; Klochkov Yu.S.; Lin Si

doi:10.37313/1990-5378-2022-24-4-106-115

Научные статьи \ Прикладные науки. Медицина. Технология \ Инженерное дело. Техника в целом

Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

Автор: Чжэнцзе Янь, Клочков Ю.С., Лин Си

Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc

Рубрика: Машиностроение и машиноведение

Статья в выпуске: 4 т.24, 2022 года.

Бесплатный доступ

Предметом данной статьи является программируемая система управления роботом-манипулятором. Рассмотрена сложная нелинейная динамика, связанная с практическим применением систем и манипуляторов. Традиционный метод управления заменяется разработанной системой Elma и адаптивной радиальной базовой функцией нейронной сети, что повышает стабильность системы и скорость отклика. С помощью программного обеспечения, связанного с MATLAB, разработаны соответствующие контроллеры и компенсаторы. Представлены результаты обучения нейросетевого контроллера для программирования траекторий робота. Анализируются динамические ошибки различных типов нейросетевых контроллеров и двух методов управления.

Робот-манипулятор, программируемая система управления, нейронная сеть, нелинейные многомерные компенсаторы, моделирование, динамический анализ, динамические ошибки

Короткий адрес: https://sciup.org/148325297

IDR: 148325297 | УДК: 62-529 | DOI: 10.37313/1990-5378-2022-24-4-106-115

Increasing the accuracy of the robot by using neural networks (neural compensators and nonlinear dynamics)

The subject of this article is a programmable control system for a robotic arm. The complex nonlinear dynamics associated with the practical application of systems and manipulators is considered. The traditional control method is replaced by the developed Elma system and the adaptive radial neural network core function, which improves system stability and response speed. With the help of software associated with MATLAB, the corresponding controllers and compensators are developed. The results of training a neural network controller for programming robot trajectories are presented. Dynamic errors of various types of neural network controllers and two control methods are analyzed.

Текст научной статьи Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

На раннем этапе проектирования управления манипулятором динамическая модель системы и связанные с ней параметры системы должны быть точно описаны при проектировании контроллера [1]. В традиционных методах проектирования управления, таких, как вычислительное управление крутящим моментом и управление обратной динамикой, это работает нормально [2]. Рассчитав крутящий момент манипулятора робота и составив динамическое уравнение, вы можете получить хороший эффект управления [3]. Но данные методы основаны на возможности получить точную модель данных. Однако получить точную математическую модель робота в реальном производстве и использовании сложно [4]. Кроме того, из-за влияния различных полезных нагрузок могут возникнуть трудности с получением соответствующих методов на основе моделей. В последнее время нейросетевые калькуляторы используются для улучшения характеристик систем управления при разработке систем управления роботами-манипуляторами. В системах числового управления (ЧПУ) нейросетевой интерполятор траекторий звеньев робота может использоваться вместо традиционного сплайн-интерполятора [5].

Это исследование используется для обучения компенсаторов с использованием нейронных сетей в системах числового управления роботами-манипуляторами и при отсутствии точных исходных данных [6]. Адаптивный нейросетевой компенсатор используется для замены традиционного ПИД-регулятора и других методов компенсации динамической ошибки, вызванной скручивающей нагрузкой в приводе звена робота [7]. Нелинейная динамическая связь привода выбирает двухпрямой робот-манипулятор в угловой системе координат в качестве моделируемого объекта управления [8].

Целью данной работы является синтез и обучение многомерного нейросетевого контроллера для компенсации и коррекции динамической ошибки траектории робота. И контроллер нейронной сети, и моделирование проекта выполняются в MATLAB [9].

2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ КОМПЕНСАТОРОВ

Как правило, многомерные компенсаторы динамических ошибок описываются нелинейными выражениями, соответствующими динамической модели робота, представленной в виде уравнений Лагранжа:

где (q, q', q) - N x 1 векторов обобщенных координат положений, скоростей и ускорений звеньев робота; N – количество ссылок робота.

Основными нагрузками приводов робота являются элементы векторов левой части в уравнении (1), где:

Q_iner = A (q) q ̈ - N × 1 вектор моментов инерции или сил, вызванных ускоренным движением звеньев; A (q) - матрица кинетической энергии N × N механизма робота;

Q_cor = B (q, q ̇ ) q ̇ - вектор N × 1 кориолисовых и центробежных моментов или сил; B (q, q ̇ ) - матрица N × N;

Q_grav = C (q) - N × 1 вектор гравитационных и других потенциальных моментов или сил.

В правой части уравнения (1): Q_d – вектор N × 1 крутящих моментов или сил, создаваемых приводами робота; Q_L – вектор N × 1 дополнительных нагрузок, возникающих в приводах из-за трения в соединениях и действия внешних сил на захват.

Траектории звеньев робота в системах ЧПУ рассчитываются путем решения обратных задач кинематики в базовых точках траектории захвата робота, а затем они интерполируются с использованием полиномов сплайнов. Следовательно, используя программные значения векторов положения, скорости и ускорения звеньев (q_p, (q_p) ̇, (q_p) ̈ ), можно рассчитать программные значения крутящего момента или силовых нагрузок, которые приводы звена должны преодолеть:

; ; ; (2) ;;

Qff ⁼<2mer + Qcor + Qgrav (3)

Выражения (2) и (3) могут быть непосредственно использованы для компенсации динамических ошибок в системах ЧПУ роботов с моментными приводами звеньев и ПИД-регуляторами положений звеньев робота (Игнатова и Ростов, 2014). На рисунке 1 показана соответствующая функциональная схема системы с динамическими компенсаторами, включенными в схему прямой связи (FF) системы управления.

Однако, если есть дополнительные нагрузки Q_L, система с контролем крутящего момента FF может иметь большие динамические ошибки, которые могут быть уменьшены с помощью дополнительного линейного компенсатора:

^upid = K_pe + K^ edt — K₄q + K_comq‘_p , (4) где K_com = diag {K_ (com, i)} – матрица коэффициентов линейного компенсатора.

Нелинейные компенсаторы могут быть включены в обратную связь (FB) системы управления вместе с ПИД-регулятором или более сложным нелинейным регулятором. В этом случае компенсаторы FB используют сигналы обратной связи реальных положений и скоростей звеньев робота, измеренных соответствующими датчиками:

Qiner = ^^^pid^cor = B(q,q)q ; Qgrav = Clq>. (5) ;

Qfb ⁼ ^iner + Qcor + ^arav, (6) где вектор U_pid рассматривается как вектор реальных ускорений.

На рисунке 2 показана функциональная схема с нелинейными компенсаторами FB, включенными в замкнутый контур системы.

Многовариантные компенсаторы (5) и (6) выполняют линеаризацию нелинейной динамики робота, описываемой уравнением (1), и тем самым обеспечивают более стабильную работу приводов робота.

3. ОБУЧЕНИЕ НЕЛИНЕЙНЫХ НЕЙРОСЕТЕВЫХ КОМПЕНСАТОРОВ
- 3.1. Проектирование компенсаторов с помощью нейронных сетей Элмана

Цель исследования заключалась в разработке модели адаптивной нейронной схемы управления нелинейными динамическими системами манипуляционного робота.

В качестве примера рассмотрим промышленный трехзвенный робот-манипулятор, звенья которого соединены между собой приводами вращательного движения. Положение звеньев определяется углами ϕ 1 , ϕ 2 , ϕ 2 . Помимо этого, на звенья робота действуют силы веса, которые направлены под некоторым углом α к выбранной системе координат, что демонстрирует возможность устройства работать под любым углом к горизонту.

Основной характеристикой объекта управления является его передаточная функция, записанная в терминах преобразования Лапласа, которая определяет соотношение выхода объекта y(s) к входу x(s) при нулевых начальных условиях.

Математическая модель, описывающая движение робота, имеет следующий вид:

ф = O)_y (O_y = -^7 (Oy + ^ 5, ( 7 )

где Ф – угол отклонения от заданной траектории движения;

tOy – угловая скорость вращения вокруг вертикальной оси;

5 – угол поворота вокруг вертикальной оси;

T _s – постоянная времени;

K – постоянный коэффициент с размерностью рад/с.

Уравнение, описывающее объект управления, имеет характер интегрируемого звена с опозданием, и описывается дифференциальным уравнением, поскольку в качестве исходной величины рассматривается не угловая скорость, а угол поворота, который является интегралом от угловой скорости:

_T^ ₊ d^ _{= kXi} (8)

dt1 dt *■

Передаточная функция звена:

Привод робота имеет характер апериодического звена первого порядка, который можно описать дифференциальным уравнением:

T dx* + X, = kxr(10)

dt ‘

Соответственно передаточная функция звена привода имеет следующий вид:

я (5) =(11)

⁴ " Т_гз+1

Для управления движением робота-манипулятора, представляющего собой нелинейную динамическую систему, целесообразно применять нейроконтроллер, который базируется на искусственной нейронной сети Элмана (рис. 1):

аЧЛ) = tansig (IW^p + ЛИ^раЧк — 1) + Ь¹) ;

Преимуществом нейронной сети Элмана является повышенная устойчивость, поскольку в ней обратные связи заведены из выходов внутренних нейронов на промежуточный слой, что делает ее более устойчивой по сравнению с рекуррентной сетью аналогичного типа (например, нейронная сеть Хопфилда, в которой внутренние обратные связи подводятся к первичным входам, где происходит смешивание сигналов). Кроме того, нейронная сеть Элмана позволяет учитывать предысторию наблюдаемых процессов и накапливать информацию для выбора правильной стратегии управления роботом.

В системе MatLab / Simulink создана модель искусственной нейронной сети для управления манипуляционным роботом, содержащая входной слой из 15 нейронов и скрытый слой в вариантах от 12 до 19 нейронов, которые имеют локальные обратные связи через линии задержки. Выходной слой содержит 1 нейрон с линейной функцией активации (purelin) (см. рис. 2).

Состояние нейронов рекуррентного слоя сети опишем следующими уравнениями: (V (к) = LWVCk -1) + wup + Ь^аЧо) = aj оЧк) = t™sifl(n4k)). (12)

Линейный слой нейронной сети является безынерционным, а состояние его нейронов определяется соотношениями:

I ^fn² (к) = LW^a¹^) + b²

а² (к) = purelin(n² (к)).

Рис. 1. Структура нейронной сети

Рис. 2. Структурная модель искусственной нейронной сети управления промышленным трехзвенным манипуляционным роботом

Последовательность значений выходного сигнала, который попадает на линию обратной связи с задержкой, содержащей N-1 блоков опоздания z-1, а выход линии задержки, который состоит из значений входа в момент времени k, k-1, ..., k-N-1, опишем следующим выражением:

Угол поворота манипулятора представим в виде общей переменной , где u1 - настоящий угол поворота первого звена и u2 - настоящий угол поворота второго звена. Поскольку в этом примере , поэтому удовлетворяются равенства z = (z±,z2) = It и где r1 и r2 – желаемые углы поворота манипулятора; z – управляемая траектория манипулятора, v – дополнительная траектория манипулятора, y – вектор состояния манипулятора.

Для описания изменений желаемых углов поворота манипулятора используем следующие законы: r₁(t) = sin(t) и r₂(t) = cos(t).

Опишем модель нейронной схемы адаптивного управления манипулятором с помощью такого уравнения состояний с переменной структурой:

(—a — |vL если u > v; u = — = —(a + |v|)syn(u — v) = j 0, если и = v;

\ a + |i?|, если u < v.

(16) где – вектор состояний, – посто янный параметр,

( 1, если it > v;

1—1, если и < v.

Для получения решений представленного уравнения численным методом используем соответствующие два разностных уравнения с шагами по времени . Элементы функции в этих уравнениях вычисляют как конечные разности первого порядка (разностные коэффициенты Ньютона). В указанных уравнениях равенство u = r заменяется на неравенство .

Обучение сети (корректировку весовых коэффициентов и смещений нейронов до достижения заданной ошибки) будем проводить с использованием метода сопряженных градиентов (Флетчера-Ривса), которому свойственна хорошая сходимость вычислительного процесса: для положительно определенной квадратичной функции от n переменных минимум достигается не более чем через n шагов.

Алгоритм обучения нейронной сети состоит из следующих шагов:

1. В начальный момент времени t=1 все нейроны скрытого слоя устанавливаются в нулевое положение - исходное значение равно нулю.
2. Входное значение подается на сеть, где происходит его прямое распространение.
3. Согласно выбранному алгоритму Флетчера-Ривса, который по сравнению с алгоритмом градиентного спуска, регулирует скорость сходимости не только за счет настройки параметра скорости, но и корректирует размер шага на каждой итерации, достижение установленного значения ошибки выполним за минимальное количество итераций.
4. Установим t=t+1 и осуществим переход на 2 шаг. Обучение нейронной сети выполняется до тех пор, пока суммарная среднеквадратичная погрешность сети не примет наименьшее значение.
3.2. Проектирование компенсатора с адаптивной радиальной базовой функцией нейронной сети для аппроксимации локальной модели

В этой части разрабатывается компенсатор нелинейной динамической модели на основе нейронной сети RBF на основе литературы (2) и (3), который сравнивается с компенсатором нейронной сети в предыдущей части.

где — матрица момента инерции порядка n*n, _ ^ '' " — вектор центробежной силы порядка n*n, — вектор силы тяжести порядка n*1, q — вектор, представляющий переменную сустава, а τ — вектор приложенного крутящего момента в суставе.

Динамическое уравнение манипулятора обладает следующими свойствами

Свойство 1. Матрица инерции является симметричной положительно определенной;

Свойство 2. Если ^xCq-q) определяется правилом записи Кристоффеля, матрица ^х(ч) ^— 2C_x(q,q) кососимметрична.

Поскольку и являются просто функциями q, их можно моделировать с помощью статических нейронных сетей.

m„_tJ(q) -Ej »jtj!4jj(v) +^/») = ^/fcjW+ Emk/'?): Sxk(q) = Ei Pki^M^ + £kk + £м№

Среди них — веса нейронной сети; — радиальная базисная функция, входом которой является вектор q, — ошибки моделирования mxkj(q) и соответственно и считаются ограниченными.

Для моделирование с помощью динамической нейронной сети с входными данными q и q. Модель нейронной сети имеет вид cxkjtq.q) = I; akjl^kjlto + siy (z) = «^-^(z) + Eik/z).

Среди них — радиальная базисная функция входного вектора – ошибка моделирования элемента , в предположении, что он также ограничен.

Используя нейросетевое моделирование, динамическое уравнение манипулятора странстве можно записать в виде

Mx(q)x + Cx(q,q)x + G^q) = Fx.

Среди них

™_xkj(q) = 9_kj^kjto + Edkj(q): c_xkj Cq. q) = a^_kj (z) + E_ckj (z);

9xkW = Pk^M + ^gkW- в

про-

Используя матрицы GL и их операции умно- жения, можно записать с помощью ^(q)=[{9}T-p(q)}] + fM(q).

где и – матрицы GL, элементами которых являются и – ма трица, элементами которой являются ошибки моделирования .

Аналогично, для и существуют

Vw) = [raT №)j]+yz):

где , {B} — матрицы GL и векторы GL, элементами которых являются ; and

— элементы, матрицы ошибок моделирования и соответственно.

Предполагая, что 1 — это идеальная траектория рабочего пространства, тогда 2 и 2 — это идеальная скорость и идеальное ускорение.

(25) r(t) = xr(t) — x(t) = e(t) + Ae(t)

где Λ — положительно определенная матрица.

Лемма 1 (лемма Барбала): если функция h:R→R — равномерная непрерывная функция, определенная на [0,+∞), lim_(t→∞) ∫_0^th(δ)d существует и конечна, то lim_(t→∞)h(t)=0.

Лемма 2. Let , где * представляет собой свертку, и H (s)

является строго экспоненциально устойчивой передаточной функцией порядка n*n. Если , то непрерывно при t→∞

Рассмотрим систему SISO второго порядка, пусть , тогда мы можем получить и . Чтобы гарантировать, что H(s) является строго экспоненциально стабильной передаточной функцией, можно определить, что c>0. Если вышеуказанные условия выполнены и , можно получить , ce(t)+e(t)=0, что обеспечивает экспоненциальную замкнутость системы.

Используя i для представления оценочно- го значения, зададим , затем и представляют собой формулы {θ},

{A} и {B } оценки.

Конструктивно контроллер выполнен в виде

F. = [{9}T ■ (S(q)}K + [U}T ■ №)}K + где . Первые три члена регулятора – управление на основе модели, член K_r эквивалентен управлению с пропорциональной производной (PD), а последний член закона управления является надежным членом, который подавляет ошибку моделирования нейронной сети.

Из выражения регулятора очевидно, что регулятору не нужно решать обратную матрицу Якоби. В реальном управлении проигравший может быть получен с помощью .

Подставляя уравнения (23) и (24) в уравнения (21), можно получить

{[W^T ■ P(q)}] + ^м(чЖ + <[{Л}^Т ■ (Z(z)}] + e_c(z№ Ч^ЧНШ + е^^р,.

Подставляя закон управления (26) в приведенную выше формулу, можно получить

{[{9}^T ■ {S(q)}l + Е_м№+ {[(Д}^т - (Z(z)}] +

+5_c(z)}x + [{B}^T ■ (Я(д)}] + E_c(q) =

[{0}T " {5(q)}]xr + № ■ {7(z)}]zr +

+[{B}^T ■ {W(q)}] + Kr + k_s sgn(r).

Подставляя x=xr-r и x=xr-r в приведенное выше уравнение, мы можем получить

{[{6/ • {6(q)}l + EM(q)K^r - r) + {[{4}T. {Z(z)}] +

+E_C (z)Xx_r - r) + [{B}^T ■ {//(q)}] + E_g (q) =

= [{9}T • [6(q)}]fr + [ЙГ' {Z(z)}]xr+ [] + Kr + kssgn(r)

Подставляя уравнения (23) и (24) в приве- денные выше уравнения, мы можем получить МДд)т + Cx

= [{9}T ■ (5(q)}]^r+!wT ■ {Z(z)}]ir + [{B}T ■ №)}] + E.

Для замкнутой системы, если K>0,k,>//E//па- раллелен, а адаптивный закон устроен как вк = rk ■ {^k(q)}xtrk;

(31) Pk = М^_к^)т_к.

Среди них

и и – векторы θ ˆ_k и a ˆ_k соответственно, тогда , непрерывно, и e^0 и e '^0 при t^“.

В соответствии с интегральной линейной функцией Ляпунова, предложенной в ссылке, ее можно проанализировать на устойчивость следующим образом.

V = 1 r^TM_k(q)r + ^2₌₁ ^_k Г_к-^_к +

Среди них Г_к = Г_к^т>0;Q_k = Q^> 0; N_k = Nk > 0 и и — векторы θ ˆ_k и a ˆ_k соответственно, тогда , непрерывно, и e^0 и e '^0 при t^“.

V = ; r^TM_k(,q)r +1^₌₁ S_k^T vs, +

Среди них Г_к „ Q_k „ N_ka являются положительно определенными парно-секундными матрицами. Производная по V, получаем

У =гтМкг + |гтМкг+Е^1 57^^ +

Так как матрица кососимметрична, то , можно получить приведенную выше формулу и = гт(м,г+с,г)-^., ^W -SL. "iQi^k-y., Wtfk-

Подставляя уравнение (30) в приведенное выше уравнение, мы можем получить

7 = -r^Kr- i,rTsgn(r) + ^=1 (Мт ■ {{k(q)}xerte + Х?=1 ^ ■ Йьй)^^

+К₌₁Р^Мтк+тЧ-у,^ eiv;^-^ 40^-2^! Р^т_км^_к.

Подставим адаптивный закон (31) в формулу (36) и объединим неравенство парал лельно, получим

Анализ конвергенции:

(1) Из , из леммы

, e∈L2 непрерывно, то при

(2) Из 7 < -т^тК получаем 00 .

4. МОДЕЛИРОВАНИЕ

Следовательно, когда V(t)∈L., существуют , и

В этом разделе представлены результаты моделирования, показывающие работу предлагаемого адаптивного нейроконтроллера. В этом разделе предложенная схема управления применяется к двухзвенному проекту, математическая модель которого была разработана в пакете Solidworks и импортирована в пакет MATLAB вторым поколением Simulink [22].

Изначально первое звено перемещается, а второе нет. Показано, что после обучения первого звена отрабатываются внешние возмущения. Затем второе звено начинает двигаться, а первое останавливается. После этого оба звена перемещаются, оказывая динамические возмущения на каждое звено. Его динамическое уравнение

КГ„1 = р + Ql + Z/COS^Z) ql + qZcos^Z)].

;

-q2 q2sin(q2) -q2(ql+ q2)sin(q2) q2 qlsin(q2) 0

л _ [flcosql + 5 cos(ql + q2)l , где известное параметров v=12, q1=9, q2=8, g=9.8, внешние помехи системы ,d1=2, d2=3, d3=6 .Пред положим, что ожидаемые инструкции по отслеживанию угла звеньев и угловой скорости являются следующим уравнением qld = 1 + 0.2sin(0.5Trt);

q2d = 1 — 0.2cos(0.5Trt).

Начальное состояние системы [q1 q2 q3 q4]^T= [0.6 0.3 0.5 0.5]^T , предполагаем ,

. При моделировании используем формулу закона управления и формулу адаптивного закона:

В нейронной сети RNF параметры функции Гаусса установлены на c=[-2 -1 0 1 2] и b=3 , начальный вес 0,1Т

Параметры моделирования робота-манипулятора следующие:

L(1):’qlim’, [-180 180]*deg;’m’, 0, ...’Jm’, 200e-6, ...’G’, -62.6111, ...’B’, 1.48e-3;

L(2) :’qlim’,[-180 180]*deg ;’m’, 17.4, ...’Jm’, 200e-6, ...’G’, 107.815, ...’B’, .817e-3.

Рис. 3. Механическая модель робота-манипулятора

1) имитационное моделирование нейронных сетей ELman

Из рис. 4 видно, что в случае адаптивной компенсации на начальном этапе имеет место некоторая степень возмущения, а угловая скорость и положение имеют тенденцию к сближению.

Рис. 4. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации Эльмана

Рис. 5. Аппроксимация внешнего возмущения и функции f(x) с адаптивной компенсацией Эльмана

Рис. 6. Ошибка между идеальной траекторией и реальной траекторией

Из графиков (рис. 5, 6) видно, что возмущения практически полностью скомпенсированы, а процесс управления роботом вполне удовлетворительный.

Экспериментальные результаты также доказывают, что предложенный подход достаточно устойчив к динамическим возмущениям, вызванным взаимным влиянием динамики звеньев. Предлагаемый метод управления является оригинальным и успешно использует преимущества SMC, нейросетевого и адаптивного управления.

2) Имитационное моделирование нейронных сетей RBF

Для аппроксимации каждого элемента Мх№ and GAq") входом нейронной сети RBF является q, рассчитанное количество точек скрытого слоя равно 7. Для аппроксимации каждого элемента G_x(q-q), вход нейронной сети RBF равен (q, q), а количество точек скрытого слоя дизайна равно 7.

ПараметрывсехфункцийГауссапринимаются как Ci = [-1.5 -1.0 -0.5 0 0.5 1.0 1.5] и ^i = 10 , а начальное значение нейронной сети установлено равным 0 . Закон управления принимает формулу (26), а адаптивный закон принимает формулу (31). Выгода выби-

„ [30 рается как К = [

^],k_s=0,5. Из леммы 2

желательно, чтобы

л [ o 15] . Параметры

адаптивного закона (31) принимаются как \\ rk = diag[2.0},gk = diag{0.10] и jVk — diag{5.0)

Результаты моделирования показаны на рис. 7 и рис. 8.

Как видно из рис.8, в начале моделирования значение ошибки относительно велико из-за фазы обучения нейронной сети управляющему входу. Когда нейросетевой компенсатор проходит обучение, ошибки в основном аннулируются, а траектория движения и расчетное значение сходятся.

Рис. 7. Вход управления для каналов 1 и каналов 2

Рис. 8. Аппроксимация угловой скорости и положения звена 1 и звена 2 в случае адаптивной компенсации RBF

position tracking of x2 axis position tracking of x1 axis

Рис. 9. Аппроксимация для переменных H^*(4)H- 11^(9,4)11 и 116,(4)11

Поскольку траектория слежения не является непрерывным возбуждением, оценочные значения 11^(4)11- lte)ll и I|G,O?)II не сходятся к ll^(l)lk IICrMII и HG,(q)l, которые часто встречаются в инженерной практике. Из моделирования двух нейронных сетей видно, что, хотя нейронная сеть RBF имеет более высокую скорость обучения и обучения при том же планировании траектории, общая точность ошибок меньше, чем у Элмана. Но если есть больше условий помех и неопределенной среды, общие результаты обучения RBF лучше.

ЗАКЛЮЧЕНИЕ

Таким образом, подводя итоги исследования, можно сделать следующие выводы. В ходе исследования качество выполнения роботом конкретных задач зависит не только от качества материала, из которого он изготовлен, качества подвижных частей, но и от качества математических моделей, в которых эффективность и точность управления роботом основаны на анализе его динамической модели и уменьшают погрешность между запланированной и фактической траекториями. В данной статье показана нейронная сеть, отличающаяся тем, что разработана модель двух адаптивной нейронной схемы управления нелинейными динамическими системами манипулятивного робота на основе рекуррентной сети Элмана. Обоснован выбор архитектуры сети и предложен алгоритм ее обучения методом сопряженных градиентов. Моделирование адаптивной нейронной сети RBF показывает, что хотя она имеет более быстрое время отклика, но при отсутствии непрерывного возбуждения система не сходится и значение ошибки намного больше, чем у сети Элмана.

Модель вращения плоского манипулятора описывается дифференциальным уравнением первого порядка с переменной структурой и выходным уравнением. Модель имеет простую структуру и может быть использована, когда неизвестны внутренняя динамика и параметры управляемой системы. Компьютерное моделирование применения модели оптимального управления слежением за углом поворота манипулятора подтверждает теоретические положения и демонстрирует высокую эффективность ее функционирования.

Этот метод также может быть применен к моделированию манипулятора с несколькими степенями свободы. В то же время модель может быть использована в методе адаптивного управления манипулятором после доработки.

Список литературы Повышение точность работы робота за счет применения нейронных сети (нейронных компенсаторов и нелинейной динамики)

A.-V. Duka, “Neural Network based Inverse Kinematics Solution for Trajectory Tracking of a Robotic Arm,” Procedia Technology, vol. 12, pp. 20–27, Dec. 2014, doi: 10.1016/j.protcy.2013.12.451.
Y. H. Kim and F. L. Lewis, “Neural network output feedback control of robot manipulators,” IEEE Transactions on Robotics and Automation, vol. 15, no. 2, pp. 301–309, Apr. 1999, doi: 10.1109/70.760351.
S. Islam and P. Liu, “Robust Sliding Mode Control for Robot Manipulators,” Industrial Electronics, IEEE Transactions on, vol. 58, pp. 2444–2453, Jul. 2011, doi: 10.1109/TIE.2010.2062472.
Yazdanpanah M. J. and Karimian Khosrowshahi G., “Robust control of mobile robots using the computed torque plus H∞ compensation method,” 632249139440000000. https://www.sciencegate.app/document/10.1109/cdc.2003.1273069 (accessed Jun. 29, 2022).
R. E. N, R. N. V, and Y. Zhengjie, “Neural network compensation of dynamic errors in a position control system of a robot manipulator,” Computing, Telecommunication and Control, vol. 64, no. 1, pp. 53–64, 2020, doi: 10.18721/JCSTCS.13105.
F. W. Lewis, S. Jagannathan, and A. Yesildirak, Neural Network Control Of Robot Manipulators And Non- Linear Systems. CRC Press, 2020.
K. Kara, T. Missoum, K. Hemsas, and M. Hadjili, “Control of a robotic manipulator using neural network based predictive control,” Dec. 2010, pp. 1104–1107. doi: 10.1109/ICECS.2010.5724709.
S. Seshagiri and H. Khalil, “Output Feedback Control of Nonlinear Systems Using RBF Neural Networks,” Neural Networks, IEEE Transactions on, vol. 11, pp. 69–79, Feb. 2000, doi: 10.1109/72.822511.
I. V. Tetko, V. Kůrková, P. Karpov, and F. Theis, Artifi cial Neural Networks and Machine Learning – ICANN 2019: Theoretical Neural Computation: 28th International Conference on Artifi cial Neural Networks, Munich, Germany, September 17–19, 2019, Proceedings, Part I. Springer Nature, 2019.
M. W. Spong and M. Vidyasagar, Robot dynamics and control. New York: John Wiley & Sons, 1989.
Y. Zhengjie, E. Rostova, and N. Rostov, “Neural Network Compensation of Dynamic Errors in a Robot Manipulator Programmed Control System,” 2020, pp. 554–563. doi: 10.1007/978-3-030-34983-7_54.
L. Y.-J, T. S.-C, W. D, L. T.-S, and C. C.l.p, “Adaptive neural output feedback controller design with reduced-order observer for a class of uncertain nonlinear SISO Systems,” UM, vol. 22, no. 8, 2011, doi: 10.1109/TNN.2011.2159865.
Z. Liu, G. Lai, Y. Zhang, X. Chen, and C. Chen, “Adaptive Neural Control for a Class of Nonlinear Time-Varying Delay Systems With Unknown Hysteresis,” IEEE transactions on neural networks and learning systems, vol. 25, pp. 2129–40, Dec. 2014, doi: 10.1109/TNNLS.2014.2305717.
N. Duan and H.-F. Min, “NN-based output tracking for more general stochastic nonlinear systems with unknown control coeffi cients,” Int. J. Autom. Comput., vol. 14, no. 3, pp. 350–359, Jun. 2017, doi: 10.1007/s11633-015-0936-4.
B. Luo, D. Liu, X. Yang, and H. Ma, “H ∞ Control Synthesis for Linear Parabolic PDE Systems with Model-Free Policy Iteration,” in Advances in Neural Networks – ISNN 2015, Cham, 2015, pp. 81–90. doi: 10.1007/978-3-319-25393-0_10.
C. Chen, Z. Liu, K. Xie, Y. Zhang, and C. L. Philip Chen, “Adaptive neural control of MIMO stochastic systems with unknown high-frequency gains,” Inf. Sci., vol. 418, no. C, pp. 513–530, Dec. 2017, doi: 10.1016/j.ins.2017.08.027.
Y. Chen, J. Liu, H. Wang, Z. Pan, and S. Han, “Modelfree based adaptive RBF neural network control for a rehabilitation exoskeleton,” Jun. 2019, pp. 4208–4213. doi: 10.1109/CCDC.2019.8833204.
M. Wang and A. Yang, “Dynamic Learning From Adaptive Neural Control of Robot Manipulators With Prescribed Performance,” IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 47, no. 8, pp. 2244–2255, 2017, doi: 10.1109/TSMC.2016.2645942.
M.-D. Tran and H.-J. Kang, “Nonsingular Terminal Sliding Mode Control of Uncertain Second-Order Nonlinear Systems,” Mathematical Problems in Engineering, vol. 2015, p. e181737, Oct. 2015, doi: 10.1155/2015/181737.
R. Ortega and M. W. Spong, “Adaptive motion control of rigid robots: a tutorial,” in Proceedings of the 27th IEEE Conference on Decision and Control, 1988, pp. 1575–1584 vol.2. doi: 10.1109/CDC.1988.194594.
S. S. Ge, C. C. Hang, and L. C. Woon, “Adaptive neural network control of robot manipulators in task space,” IEEE Transactions on Industrial Electronics, vol. 44, no. 6, pp. 746–752, 1997, doi: 10.1109/41.649934.
“Design and implementation of a RoBO-2L MATLAB toolbox for a motion control of a robotic manipulator.” https://ieeexplore.ieee.org/document/7473678/ (accessed Jun. 30, 2022).
S. Kh. Zabihifar, A. Kh. D. Markazi, and A. S. Yushchenko, “Two link manipulator control using fuzzy sliding mode approach,” Herald of the Bauman Moscow State Technical University. Series Instrument Engineering, Dec. 2015, doi: 10.18698/0236-3933-2015-6-30-45.

Еще