Система управления роботом-манипулятором с использованием нейросетевых алгоритмов ограничения рабочей области схвата

Автор: Войнов Игорь Вячеславович, Казанцев Александр Михайлович, Морозов Борис Александрович, Носиков Максим Владимирович

Журнал: Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника @vestnik-susu-ctcr

Рубрика: Управление в технических системах

Статья в выпуске: 4 т.17, 2017 года.

Бесплатный доступ

Описаны состав и структура системы управления промышленным робототехническим комплексом, предназначенным для работы в герметичных камерах в условиях сильных радиационных излучений. В связи с превышением рабочей зоны манипулятора робототехнического комплекса над рабочим пространством герметичной камеры и необходимостью останова или уменьшения скорости движения при достижении зон ограничения предложено использование искусственной нейронной сети на основе персептрона с сигмоидальной функцией активации, формирующего на выходе сигнал в диапазоне [0; 1], используемый как коэффициент передачи сигналов от внешних контуров управления и органов ручного управления манипулятором к внутренним контурам системы управления. Приведен вариант структуры системы управления, представлен способ формирования обучающих выборок нейронной сети и результаты математического моделирования работы системы управления.

Еще

Робот-манипулятор, искусственная нейронная сеть, персептрон, обучающая выборка, система управления

Короткий адрес: https://sciup.org/147155224

IDR: 147155224   |   DOI: 10.14529/ctcr170404

Текст научной статьи Система управления роботом-манипулятором с использованием нейросетевых алгоритмов ограничения рабочей области схвата

В 2015 году филиалом Южно-Уральского государственного университета в г. Миассе по техническому заданию одного из ведущих предприятий атомной промышленности был спроектирован и изготовлен робототехнический комплекс МР-48. Его основное назначение – исключение ручных операций и введение автоматизированных и автоматических режимов работы при выполнении технологических операций с материалами в условиях сильных радиационных полей. Манипулятор робототехнического комплекса МР-48 конструктивно представляет собой шестизвенный манипулятор с вращательными степенями свободы в каждом сочленении. Кинематическая схема манипулятора, а также системы координат, связанные с каждым из звеньев, заданные в соответствии с правилами Денавита – Хартенберга [1], представлены на рис. 1, 2.

Рис. 1. Кинематическая cхема манипулятора МР-48

Рис. 2. Оси систем координат, связанные со звеньями

Управление в технических системах

Параметры кинематики манипулятора в представлении Денавита – Хартенберга приведены в таблице.

Параметры системы координат звеньев манипулятора

i

Сдвиг θ i , °

α i , °

a i , м

d i , м

Диапазон, °

1

0

90

0

0,14

+176…–251

2

90

0

0,39

0

±109

3

90

90

0,02

0

±95

4

180

90

0

0,32

±194

5

180

90

0,02

0

±109

6

0

0

0

0,35

±360

В состав аппаратуры роботизированного комплекса МР-48 входит, помимо манипулятора, пульт оператора с ЭВМ и органами управления, источники питания, усилительно-преобразующие модули, соединительные кабели. Структурная схема робототехнического комплекса представлена на рис. 3. Внешний вид манипулятора МР-48 и его пульта управления представлен на рис. 4, 5.

Рис. 3. Структурная схема робототехнического комплекса МР-48

Рис. 4. Внешний вид манипулятора МР-48

Рис. 5. Внешний вид пульта управления

Описание системы управления

Ядром системы управления (СУ) является ЭВМ пульта оператора, сопряженная с органами управления, датчиками и исполнительными устройствами посредством модулей ввода-вывода, также являющимися аппаратно-программными компонентами системы управления.

Входными и промежуточными сигналами системы управления манипулятора являются:

  • 1.    Воздействия оператора на органы управления M i ;

  • 2.    Мгновенные углы поворота (ориентации) звеньев q i ;

  • 3.    Мгновенные угловые скорости поворота звеньев ω i ;

  • 4.    Требуемые значения углов и угловых скоростей q i уст , ω i уст , формируемые в контурах системы управления.

Выходными сигналами системы управления являются токи I i ( i = 1…6, т. е. для каждого исполнительного электродвигателя в составе звена), формируемые в каждый момент времени таким образом, чтобы манипулятор осуществлял требуемый характер движения.

В целом система управления является дискретной, с периодом формирования управляющих воздействий 20 мс. В силу специфики объекта управления (манипулятора) и режимов его работы СУ реализована в виде нескольких вложенных контуров управления, реализованных на аппаратном, аппаратно-программном либо программном уровнях.

Функциональная схема системы управления представлена на рис. 6.

Рис. 6. Функциональная схема системы управления манипулятора

На функциональной схеме обозначены:

  • КК 1 – корректирующий контур (регулятор) стабилизации скорости вращения звеньев манипулятора;

  • УМ    – усилитель мощности, преобразующий широтно-модулированые сигналы управления в выходной ток исполнительных органов манипулятора;

  • КК 2 – корректирующий контур (регулятор) положения звеньев манипулятора;

  • qi    – мгновенные углы ориентации звеньев манипулятора;

  • ω i    – мгновенные угловые скорости поворота звеньев манипулятора;

  • I i    – токи в исполнительных электродвигателях манипулятора;

Следует отметить, что управление манипулятором осуществляется в одном из трех основных режимов:

  • 1.    Режим ручного управления, при котором оператор с помощью отклонения двух многоосевых джойстиков от нейтрального положения задает уставки скоростей поворота звеньев манипулятора ω i уст рр , контролируя конфигурацию манипулятора визуально либо по показаниям датчиков углов на пульте управления;

  • 2.    Режим управления в заданной системе координат, при котором оператор с помощью отклонения двух многоосевых джойстиков задает линейную скорость и направление движения точки схвата манипулятора ( О 7 , рис. 2).

  • 3.    Режим формирования и последующего автоматического воспроизведения траектории движения манипулятора. В режиме воспроизведения траектории система управления автоматически формирует новые векторы углов ориентации звеньев в зависимости от времени q i уст = f ( t ) .

Типовым местом установки манипулятора при его эксплуатации является потолок герметичной защищенной рабочей камеры с вертикальным исходным положением МР-48, при этом, в за-

Управление в технических системах

висимости от типа рабочей камеры и ее линейных размеров, возможно частичное превышение рабочего пространства манипулятора над рабочей зоной камеры.

В ходе испытаний и опытной эксплуатации манипулятора, проводимых в течении 2016 года на предприятии заказчика, были выявлены случаи касания и ударов схвата манипулятора о стенки и внутренние элементы камеры, что может привести к возможным механическим повреждениям внутрикамерного оборудования и собственно манипулятора. В связи с этим был предложен вариант усовершенствования системы управления путем ввода дополнительного контура контроля нахождения схвата манипулятора в безопасной рабочей области (рис. 7).

Рис. 7. Функциональная схема системы управления с контуром контроля рабочей области

Блок контроля рабочей области на основе информации о параметрах движения манипулятора с использованием классических методов решения прямой кинематической задачи вычисляет линейные координаты схвата манипулятора и далее сравнивает их с подпространством допустимых либо недопустимых координат (в простейшем варианте – из заранее сформированных массивов допустимых положений), формируя при этом необходимый набор выходных сигналов, используемых для коррекции или полной блокировки движения манипулятора.

В общем случае безопасная рабочая область (БРО) может иметь достаточно сложную конфигурацию и соответственно сложное геометрическое описание. Для составления такого описания зачастую требуются большие временные затраты высококвалифицированного персонала.

Одним из возможных путей решения задачи является применение искусственных нейронных сетей (ИНС) для задания БРО и контроля за выходом схвата манипулятора из нее. Как известно, ИНС обладает хорошими классификационными характеристиками, что можно использовать для выделения БРО из общего объема камеры [2]. Данный способ не требует предварительного геометрического описания БРО, так как оно автоматически формируется в процессе обучения (как на этапе начального обучения ИНС, так и в ходе эксплуатации при переобучении). Кроме того, нейросетевой алгоритм обладает высокой численной эффективностью, что немаловажно с учетом его встраивания в контур системы управления.

С целью проверки возможности использования ИНС для контроля выхода за границы БРО проведено компьютерное моделирование системы управления. С учетом того, что имеющееся управляющее программное обеспечение (ПО) разработано в системе NI LabView, для моделирования также использовалась данная среда. Дополнительно использованы программные пакеты расширения среды разработки NI Robotics (моделирование кинематики и динамики движения манипуляторов) и NI Super Simple Neural Networks (работа с ИНС).

В общем виде модель функционирования ИНС описывается выражением

Y = F^w^) = F(5) = F(WXT),                                     (1)

где W = (w1, w2,..., wn ) - вектор весовых коэффициентов;

X = (x1, x2,..., xn) - вектор входных сигналов;

  • 5 = Е =1 W j X j - взвешенная сумма;

  • F - оператор нелинейного преобразования или функция активации.

Сигмоидальная ИНС (персептрон) с одним скрытым слоем имеет структуру, представленную на рис. 8.

Рис. 8. Структура сигмоидальной ИНС с одним скрытым слоем

Выходное значение ИНС такого типа рассчитывается по формуле

  • У (ф, р, а) = S^ i а ; tanhQ^ i P i./ Ф у ) + а „+ь                                          (2)

где N – количество нейронов в скрытом слое;

  • n – количество входных данных (входной слой);

ϕ = [φ 1 , …, φ n , 1]T – входной слой (исходные данные);

  • β – матрица весовых коэффициентов;

  • α – вектор весовых коэффициентов выходного слоя;

tanh – гиперболический тангенс.

В общем случае в персептроне может быть несколько скрытых слоев, тогда выход предыдущего слоя k

  • Vp^tanh^+X-Vy)                                       (3)

рассматривается как вход скрытого слоя k + 1.

Входной слой ИНС формируется из текущих координат X , Y , Z схвата в базовой системе координат (точка O 7 на рис. 2). На выходном слое формируется значение K упр ИНС в диапазоне [0; 1], где 0 – выход за границы БРО, 1 – нахождение в пределах БРО. На данном этапе разделение областей производится по пороговому значению 0,5. При фиксации выхода за границы БРО коэффициент передачи положений органов управления резко снижается до некоторого минимального значения и оператору подается звуковой сигнал. Таким образом, ИНС выполняет роль контролера, но полностью не блокирует действия оператора, которому по-прежнему остается доступным весь объем камеры.

В процессе моделирования имитируется движение манипулятора по обучающей траектории, которая по возможности равномерно заполняет БРО. По ходу движения по обучающей траектории с тактом работы системы управления производится накопление массива данных о координатах X , Y , Z схвата (рис. 9).

Для формирования обучающего и проверочного набора данных полная рабочая область манипулятора покрывается сетью допустимых точек (в соответствии с его кинематической схемой и возможными углами поворота по осям) по методу Монте-Карло. Точкам, входящим в зону ε – трубки вокруг обучающей траектории, приписывается выходное значение 1 ( ε подбирается с таким расчетом, чтобы полностью «заполнить» БРО). К обучающему набору присоединяются также все точки обучающей траектории с выходным сигналом 1. Всем оставшимся точкам обучающего и проверочного набора приписывается выходное значение 0. Подмножество обучающего набора с выходом, равным 1 для объёма набора 10 000 точек и ε = 0,05, представлено на рис. 10.

Управление в технических системах

Рис. 9. Обучающая траектория

Рис. 10. Обучающий набор

Стандартным этапом работы с ИНС является этап обучения, в ходе которого ИНС настраивает матрицы весовых коэффициентов и другие внутренние переменные в соответствии с обучающим набором данных (известными векторами входных и выходных сигналов). Полный проход ИНС по всем векторам входных сигналов называется эпохой обучения. Цель обучения ИНС – последующее адекватное формирование выходного сигнала при эксплуатации ИНС с минимальным его отклонением от требуемого значения при любых возможных векторах входных сигналов. В пакете NI Super Simple Neural Networks настройка процесса обучения и этапы обучения представлены в виде диалогового окна в удобном для пользователя виде (рис. 11).

Рис. 11. Процесс обучения ИНС в пакете NI Super Simple Neural Networks

Обучение ИНС проводится путем минимизации среднеквадратической ошибки выхода методом градиентного спуска (алгоритм Левенберга – Марквардта)[3].

На рис. 12 приведено визуальное представление проверочного набора данных, на котором выполнялась верификация работы ИНС.

Рис. 12. Проверочный набор для верификации ИНС

Выводы

Проведенное моделирование СУ с контуром контроля положения схвата манипулятора подтверждает принципиальную пригодность использования ИНС для детектирования БРО достаточно сложной формы, для чего можно использовать однослойный либо двухслойный персептрон с 20–30 нейронами.

Аналогичным образом может быть реализована многоконтурная ИНС для контроля за положением промежуточных точек манипулятора (например, точек O 3 , O 5 ) с логическим объединением выходов независимых контуров контроля.

В целом по результатам математического моделирования принято решение о внедрении ИНС в рабочий образец робототехнического комплекса МР-48.

Список литературы Система управления роботом-манипулятором с использованием нейросетевых алгоритмов ограничения рабочей области схвата

  • Юревич, Е.И. Основы робототехники/Е.И. Юревич -СПб.: БХВ-Петербург, 2005. -416 с.
  • Назаров, А.В. Нейросетевые алгоритмы прогнозированиия и оптимизации систем/А.В. Назаров, А.И. Лоскутов. -СПб.: Наука и техника, 2003. -384 с.
  • Application of Neural Networks and Other Learning Technologies in Process Engineering/I.M. Mujtaba, M.A. Hussain (eds.). -Imperial College Press, 2001. -405 p.
Статья научная