Бипедальная локомоция с эвристическим планированием шагов для поддержания целевой скорости движения: переосмысление роли модельных априорных знаний

Автор: Сулиман В., Чайковская Е.М., Давыденко Е.В., Горбачев Р.А.

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Информатика и управление

Статья в выпуске: 4 (68) т.17, 2025 года.

Бесплатный доступ

В работе представлена расширенная схема обучения контроллера ходьбы антропоморфного робота, основанная на эвристическом подходе к планированию шагов, использующая отслеживание желаемой скорости движения торса робота. Такая схема позволяет обеспечивать более точное взаимодействие антропоморфного робота с окружающей средой — в частности, преодолевать такие препятствия, как ступени и разрывы, и точно подходить к целевым объектам. В отличие от методов, основанных на полной или упрощенной динамике, предложенное решение не требует использования сложных планировщиков шагов робота и не опирается на аналитические модели. Планирование шагов осуществляется с помощью простых эвристик Raibert-типа и реализуется через обратную связь между планировщиком и обучаемой политикой. Проведено сравнение с двумя распространенными модельно-ориентированными подходами к планированию шагов: методом на основе модели линейного обратного маятника (Linear Inverted Pendulum Model, LIPM) и контроллером на основе гибридной нулевой динамики (Hybrid Zero Dynamics, HZD). Эксперименты демонстрируют сопоставимую или превосходящую точность удержания заданной скорости (до 80%) и существенно более высокую устойчивость на пересеченной местности (более чем на 50%) при сохранении аналогичного уровня энергоэффективности. Эти результаты свидетельствуют о том, что включение сложных компонентов, основанных на аналитических моделях, в архитектуру обучения может быть избыточным для задач устойчивой двуногой ходьбы, в том числе и на пересеченной местности.

Еще

Обучение с подкреплением, двуногая ходьба, бипедальная локомоция, планирование шагов

Короткий адрес: https://sciup.org/142247121

IDR: 142247121   |   УДК: 004.852