Применение нейронной сети DDRNet для повышения устойчивости VSLAM-решения ORB-SLAM2 путем маскирования на снимках подвижных объектов
Автор: Я. Мурхиж, Дм.В. Учаев, Д.В. Учаев, Д.А. Гаврилов, Е.А. Татаринова
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
В работе проиллюстрирована возможность использования глубокой нейронной сети с двойным разрешением (DDRNet — Deep Dual-Resolution Networks) для решения в режиме реального времени задачи обнаружения на изображениях подвижных объектов (пешеходов, велосипедистов, автомобилей и др.). В работе представлено также программное решение DDR-SLAM в области VSLAM (Visual Simultaneous Localization and Mapping) в динамических средах. Данное VSLAM-решение представляет собой, по сути, улучшенную реализацию фреймворка ORB-SLAM2, в которой с помощью нейросети DDRNet производится маскирование подвижных объектов. Результаты экспериментальной апробации DDR-SLAM на последовательностях изображений из наборов данных KITTI и Cityscapes демонстрируют, что DDR-SLAM обеспечивает получение низких значений ошибок позиционирования в следующих сценариях: движение транспортного средства (ТС) в плотном потоке машин, длительное пребывание ТС в пробке, замедление движения ТС перед перекрестком, к которому приближаются также и иные ТС, и др. Показано также, что DDR-SLAM уверенно превосходит по точности позиционирования VSLAM-решение ORB-SLAM2 в тех сценариях, где присутствует большое число подвижных объектов. Исходный код DDR-SLAM доступен по ссылке: (https://github.com/YznMur/DDRSLAM.git).
Глубокое обучение, одновременная локализация и построение карт (SLAM), семантическая сегментация, динамическая среда
Короткий адрес: https://sciup.org/142247140
IDR: 142247140 | УДК: 004.896