Применение нейронной сети DDRNet для повышения устойчивости VSLAM-решения ORB-SLAM2 путем маскирования на снимках подвижных объектов

Автор: Я. Мурхиж, Дм.В. Учаев, Д.В. Учаев, Д.А. Гаврилов, Е.А. Татаринова

Журнал: Научное приборостроение @nauchnoe-priborostroenie

Рубрика: Информатика, вычислительная техника и управление

Статья в выпуске: 1, 2026 года.

Бесплатный доступ

В работе проиллюстрирована возможность использования глубокой нейронной сети с двойным разрешением (DDRNet — Deep Dual-Resolution Networks) для решения в режиме реального времени задачи обнаружения на изображениях подвижных объектов (пешеходов, велосипедистов, автомобилей и др.). В работе представлено также программное решение DDR-SLAM в области VSLAM (Visual Simultaneous Localization and Mapping) в динамических средах. Данное VSLAM-решение представляет собой, по сути, улучшенную реализацию фреймворка ORB-SLAM2, в которой с помощью нейросети DDRNet производится маскирование подвижных объектов. Результаты экспериментальной апробации DDR-SLAM на последовательностях изображений из наборов данных KITTI и Cityscapes демонстрируют, что DDR-SLAM обеспечивает получение низких значений ошибок позиционирования в следующих сценариях: движение транспортного средства (ТС) в плотном потоке машин, длительное пребывание ТС в пробке, замедление движения ТС перед перекрестком, к которому приближаются также и иные ТС, и др. Показано также, что DDR-SLAM уверенно превосходит по точности позиционирования VSLAM-решение ORB-SLAM2 в тех сценариях, где присутствует большое число подвижных объектов. Исходный код DDR-SLAM доступен по ссылке: (https://github.com/YznMur/DDRSLAM.git).

Еще

Глубокое обучение, одновременная локализация и построение карт (SLAM), семантическая сегментация, динамическая среда

Короткий адрес: https://sciup.org/142247140

IDR: 142247140   |   УДК: 004.896

Using DDRNet to enhance VSLAM stability in a moving scene

The paper illustrates the possibility of using a deep dual-resolution neural network (DDRNet) for solving the problem of real-time detection of moving objects (pedestrians, cyclists, cars, etc.) in images. The paper also presents a DDR-SLAM software solution in the field of VSLAM (Visual Simultaneous Localization and Mapping) in dynamic environments. This VSLAM solution is, in fact, an improved implementation of the ORBSLAM2 framework, in which the DDRNet neural network is used to mask moving objects. The results of experimental testing of DDR-SLAM on image sequences from the KITTI and Cityscapes datasets demonstrate that DDR-SLAM ensures low positioning error values in the following scenarios: vehicle movement in dense traffic; long-term stay of a vehicle in a traffic jam; slowing down the movement of a vehicle before an intersection, to which other vehicles are also approaching, etc. It is also shown that DDR-SLAM confidently outperforms the VSLAM solution ORB-SLAM2 in terms of positioning accuracy in scenarios where there is a large number of moving objects. The source code of DDR-SLAM is available at the link (https://github.com/YznMur/DDRSLAM.git).

Еще