Применение нейронных сетей для автономной навигации беспилотных летательных аппаратов в условиях городской среды
Автор: Карабаев С.Э., Омаралиева Г.А., Абдумиталип уулу К.
Журнал: Бюллетень науки и практики @bulletennauki
Рубрика: Технические науки
Статья в выпуске: 6 т.11, 2025 года.
Бесплатный доступ
Для обеспечения полной автономной навигации беспилотных летательных аппаратов (БПЛА) в сложных городских условиях в данной статье предлагается методология, основанная на объединении перцептивных возможностей сверточных нейронных сетей и способности принятия решений алгоритмов обучения с подкреплением. В статье описываются архитектура системы, процедуры обучения, используемая среда моделирования и метрики оценки, применяемые при разработке и проверке предлагаемого подхода. Архитектура предлагаемой системы условно разделена на два основных модуля: модуль восприятия и модуль принятия решений. Модуль восприятия основан на глубокой CNN, которая обрабатывает необработанные визуальные данные, полученные с фронтальных камер, установленных на БПЛА. Модуль принятия решений использует алгоритм Deep Q-Network, который получает карту препятствий, сгенерированную модулем восприятия. Выходные данные модуля состоят из управляющих сигналов — изменений тангажа, крена и рыскания, — необходимых для коррекции траектории в зависимости от текущей ситуации. Модель сверточной нейронной сети, используемая в модуле восприятия, состоит из пяти сверточных слоев с активацией ReLU и операциями максимального пула, за которыми следуют два полностью связанных слоя. Конечным результатом модели является бинарная карта препятствий, показывающая наличие и относительное положение как статических, так и динамических объектов. Модель обучается на маркированном наборе данных, который включает аэрофотоснимки городской среды с различными конфигурациями препятствий и условиями освещения. Модуль DQN взаимодействует с моделируемой средой, изучая оптимальную стратегию навигации, направленную на максимизацию накопленных вознаграждений. Функция вознаграждения предназначена для поощрения движения вперед по маршруту, одновременно штрафуя за близость к препятствиям и резкие изменения траектории. Моделирование проводилось с использованием платформы Microsoft AirSim, настроенной для воспроизведения условий городской среды, включая высокие здания, узкие переулки и движущиеся объекты. Виртуальные сценарии включали как статические, так и динамические препятствия, различные условия освещения и ухудшение сигнала GPS. Модуль DQN обучался в течение многих эпизодов, в течение которых БПЛА исследовал различные маршруты и получал обратную связь, оценивающую безопасность и эффективность его действий. Обучение системы существенно улучшило ее способность адаптироваться и принимать решения в режиме реального времени, что подтверждают результаты тестирования в городских условиях.
Беспилотные летательные аппараты, искусственные нейронные сети, городская среда, интеллектуальные системы
Короткий адрес: https://sciup.org/14132793
IDR: 14132793 | DOI: 10.33619/2414-2948/115/19
Текст научной статьи Применение нейронных сетей для автономной навигации беспилотных летательных аппаратов в условиях городской среды
Бюллетень науки и практики / Bulletin of Science and Practice Т. 11. №6 2025
УДК 004.832
Беспилотные летательные аппараты (БПЛА), обычно называемые дронами, в последние годы демонстрируют впечатляющий рост как с точки зрения технологического развития, так и практического применения в различных отраслях — от логистики, наблюдения и мониторинга инфраструктуры до сельского хозяйства и реагирования на чрезвычайные ситуации. Их универсальность, экономичность и способность работать в труднодоступных или опасных условиях делают БПЛА привлекательным решением для широкого спектра современных задач. Однако с ростом масштабов использования БПЛА, особенно в городских условиях, все более актуальной становится проблема обеспечения безопасной, надежной и автономной навигации. Современные алгоритмы позволяют БПЛА учитывать погодные условия, турбулентность и неожиданные препятствия. Искусственный интеллект играет ключевую роль в изменении системы ориентации изменяющейся среды. Городская среда представляет собой чрезвычайно сложное пространство для навигации дронов из-за высокой плотности архитектурных объектов и динамических, часто непредсказуемых условий, возникающих в результате деятельности человека и движения транспортных средств [1].
В отличие от открытых или сельских территорий, где достаточно полета по заранее заданным маршрутам с использованием GPS, города требуют гораздо более высокого уровня интеллектуальной адаптации от бортовых систем БПЛА. Эффективная навигация в таких условиях требует, чтобы дроны могли воспринимать окружающую среду в реальном времени. Традиционные навигационные системы обычно полагаются на данные глобальных навигационных спутниковых систем (GPS), инерциальных измерительных блоков (IMU) и простых алгоритмов реактивного управления. Хотя эти инструменты обеспечивают базовую ориентацию и движение, они не способны гарантировать полную автономность в нестандартных и динамических ситуациях. Более того, сигналы GPS в густонаселенных городских районах подвержены отражениям, экранированию и многолучевым искажениям, что еще больше усложняет автономный полет.
В ответ на эти проблемы все чаще используется интеграция методов искусственного интеллекта (ИИ), в частности искусственных нейронных сетей (ИНС). ИНС могут обрабатывать сложные данные датчиков, распознавать закономерности и принимать решения на основе накопленного опыта. В контексте навигации БПЛА модели глубокого обучения, особенно сверточные нейронные сети (СНС), успешно применяются для обработки визуальной информации в реальном времени для таких задач, как обнаружение препятствий, понимание сцены и локализация. Кроме того, обучение с подкреплением (RL), процесс, в котором агент обучается методом проб и ошибок, взаимодействуя с окружающей средой, оказалось весьма эффективным в задачах динамического планирования траектории и управления. Сочетание СНС для обработки данных датчиков с RL для принятия решений позволяет создавать полностью автономные системы управления, которые могут не только понимать окружающую среду, но и реагировать на нее в реальном времени для достижения поставленных целей [2].
Проблема автономной навигации для БПЛА в городских условиях остается одной из наиболее актуальных и быстро развивающихся областей исследований за последнее десятилетие. Недавние научные разработки демонстрируют качественный переход от традиционных реактивных и основанных на правилах систем управления к интеллектуальным моделям, которые используют возможности методов искусственного интеллекта. В этом разделе представлен аналитический обзор ключевых исследований в области обнаружения препятствий, планирования траектории и интеграции СНС и алгоритмов обучения с подкреплением в навигационные системы БПЛА с акцентом на их научную значимость и инновационность [1].
Ранние подходы опирались на классические бортовые датчики, такие как LiDAR, ультразвуковые датчики и GPS, в сочетании с жестко предопределенными эвристиками для избегания препятствий. Хотя эти методы давали удовлетворительные результаты в структурированных средах, они демонстрировали ограниченную адаптивность и нестабильность в плотной и динамичной городской инфраструктуре. Значительным прорывом в этой области стало внедрение методов глубокого обучения, в частности СНС, в системы восприятия БПЛА. Чжан и др. [3], например, продемонстрировали, что СНС позволяют обнаруживать в реальном времени различные типы статических и динамических препятствий, тем самым значительно повышая ситуационную осведомленность БПЛА. Это достижение открывает возможности для более гибкой и контекстно-зависимой навигации.
Кроме того, алгоритмы обучения с подкреплением оказались эффективными инструментами для разработки стратегий адаптивного управления. Важной вехой стало введение Deep Q-Network (DQN) Мнихом и др. [4], которая заложила основу для интеграции RL с глубокими нейронными сетями. Современные алгоритмы, такие как Proximal Policy Optimization (PPO) и Advantage Actor-Critic (A2C), еще больше повышают надежность и эффективность обучения в реальном времени в условиях высокой изменчивости и неопределенности.
Одно из наиболее перспективных направлений включает гибридные архитектуры, которые объединяют СНС и RL в единую замкнутую систему.
Исследования, использующие среды моделирования, такие как AirSim и Gazebo [5], также имеют значительную научную ценность. Эти платформы позволяют безопасно и эффективно обучать и тестировать модели нейронных сетей в условиях, приближенных к реальным, без риска повреждения оборудования или проблем с безопасностью. Они также облегчают создание обширных синтетических наборов данных с высокой изменчивостью.
Несмотря на достигнутый прогресс, остается несколько проблем. К ним относятся проблема переноса сим-в-реальный, высокие вычислительные требования глубоких моделей и необходимость повышения энергоэффективности. Будущие направления исследований включают сжатие моделей, методы переноса обучения и слияние данных мультисенсоров. Интеграция методов СНС и RL предлагает принципиально новый уровень возможностей, открывая многообещающие перспективы для создания устойчивых систем, способных эффективно работать в сложных и динамически меняющихся городских условиях. Для обеспечения полностью автономной навигации беспилотных летательных аппаратов в сложных городских условиях в этом исследовании предлагается методология, основанная на сочетании перцептивных возможностей сверточных нейронных сетей и сильных сторон алгоритмов обучения с подкреплением в принятии решений. В этом разделе представлена архитектура системы, процедуры обучения, среда моделирования и метрики оценки, используемые при разработке и проверке предлагаемого подхода. Архитектура предлагаемой системы концептуально разделена на два основных модуля: модуль восприятия и модуль принятия решений. Модуль восприятия реализован с использованием глубокой СНС, которая обрабатывает необработанные визуальные входные данные, полученные с фронтальных камер, установленных на БПЛА. Модуль принятия решений основан на алгоритме DQN, который принимает в качестве входных данных карту препятствий, сгенерированную модулем восприятия. Выходные данные этого модуля состоят из управляющих сигналов — корректировки тангажа, крена и рыскания, — необходимых для коррекции траектории БПЛА на основе текущего контекста окружающей среды.
Сверточная нейронная сеть, используемая в модуле восприятия, состоит из пяти сверточных слоев с активацией ReLU и максимальным пулом, за которыми следуют два полностью связанных слоя. Модель выводит бинарную карту препятствий, указывающую наличие и относительное положение как статических, так и динамических объектов. Обучение выполняется на маркированном наборе данных городских аэрофотоснимков с различными конфигурациями препятствий и условиями освещения.
Модуль DQN взаимодействует с имитируемой средой для изучения оптимальной навигационной политики, которая максимизирует кумулятивные вознаграждения. Функция вознаграждения поощряет движение вперед по маршруту, штрафуя близость к препятствиям и резкие изменения траектории. Обучение проводится в течение нескольких эпизодов, в течение которых БПЛА исследует различные маршруты и получает обратную связь о безопасности и эффективности своих действий (Рисунок 1).

Рисунок 1. Блок-схема архитектуры системы, демонстрирующая взаимодействие между входными данными с камеры, СНС, DQN и выходами управления БПЛА
Моделирование проводилось с использованием Microsoft AirSim, настроенного для имитации городских условий с высокими зданиями, узкими переулками, движущимися объектами, изменяющимся освещением и периодическим ухудшением GPS. На Рисунке 2 показан интерфейс симуляционной платформы, использованной для обучения и тестирования навигационной системы. На сцене визуализированы различные типы препятствий, включая статические и подвижные объекты, характерные для городской среды. Отмеченные области служат эталонными зонами, используемыми для оценки точности распознавания системой.

Рисунок 2. Снимок симуляционной среды с отмеченными областями препятствий
Оценка эффективности работы системы проводилась по следующим ключевым показателям: точность обнаружения препятствий (ODA, Obstacle Detection Accuracy): процент правильно идентифицированных препятствий по сравнению с эталонными метками; частота столкновений (CR, Collision Rate): Количество столкновений, зафиксированных на
Бюллетень науки и практики / Bulletin of Science and Practice Т. 11. №6 2025 каждые 100 эпизодов полёта; задержка принятия решения (DL, Decision Latency): Среднее время, необходимое для вычисления одного управляющего действия; индекс оптимальности маршрута (POI, Path Optimality Index): оценка, отражающая соотношение длины и плавности фактической траектории относительно теоретически оптимальной.
Представленная методологическая структура обеспечивает не только теоретическую обоснованность системы, но и её практическую применимость для задач автономной навигации БПЛА в условиях городской среды в режиме реального времени. В следующем разделе приводится описание экспериментальной установки и анализ результатов моделирования.
Экспериментальные результаты
Для оценки эффективности предложенной навигационной системы на основе нейронных сетей была проведена серия симуляционных экспериментов в среде AirSim. Эти симуляции моделировали сложные городские условия, включая узкие переулки, скопления высотных зданий, перекрёстки с движущимися транспортными средствами, а также участки с переменным уровнем освещённости и помехами сигнала. Беспилотному летательному аппарату была поставлена задача достичь заранее заданных контрольных точек, избегая столкновений и одновременно оптимизируя маршрут движения.
Эксперименты были разбиты на три основных категории сценариев:
— Навигация при наличии статических препятствий — БПЛА должен был пролетать через участки с фиксированными объектами, такими как здания, уличные фонари и рекламные щиты.
— Обход динамических препятствий — в этих сценариях БПЛА сталкивался с движущимися транспортными средствами и пешеходами.
— Условия с ухудшением сигнала — моделировались ситуации с нарушением GPS-сигнала и изменяющимися условиями освещённости, что позволяло оценить устойчивость системы в неблагоприятных условиях.
Каждый тип сценариев был воспроизведён в 100 независимых эпизодах с произвольным размещением препятствий и изменением условий, что обеспечило разнообразие тестов и достоверность полученных результатов (Рисунок 3).

Рисунок 3. Примеры траекторий полёта в каждом типе сценариев
-•— Target
Observer
S> 'Ihreat
На иллюстрации представлены характерные маршруты движения БПЛА, полученные в результате симуляций при навигации через статические препятствия, при взаимодействии с динамическими объектами и в условиях деградации сигнала. Эти траектории демонстрируют адаптивность системы и её способность корректировать маршрут в зависимости от текущей обстановки. Количественная оценка эффективности системы представлена в Таблице 1.
Таблица 1
СВОДНЫЕ РЕЗУЛЬТАТЫ ПО ВСЕМ ТИПАМ СИМУЛЯЦИОННЫХ СЦЕНАРИЕВ
Метрика |
Значение |
Улучшение по сравнению с базовой системой |
Точность обнаружения препятствий |
95,7 % |
+17,4% |
Частота столкновений (на 100 запусков) |
2,1 |
-68 % |
Задержка принятия решения |
83 мс |
-42 % |
Индекс оптимальности маршрута |
0,87 |
+22 % |
Полученные результаты демонстрируют, что интегрированная система на основе свёрточных нейронных сетей и обучения с подкреплением значительно превосходит традиционные навигационные методы, основанные на правилах, по всем основным показателям. Существенное улучшение наблюдается в точности обнаружения препятствий, при этом траектории полёта остаются плавными и близкими к оптимальным даже в условиях непредсказуемой среды. Кроме того, время отклика системы (задержка принятия решений) было снижено до значения менее 100 мс, что удовлетворяет требованиям работы в реальном времени для автономных БПЛА.
На Рисунке 4 представлено сравнение ключевых метрик навигации между предлагаемой системой на основе CNN-RL и традиционным (базовым) методом управления. Видно, что по всем параметрам — от точности распознавания препятствий до скорости принятия решений — новая система демонстрирует значительное превосходство. Полученные результаты подтверждают, что предложенное решение обеспечивает высокий уровень безопасности и эффективности даже в условиях сложной и переменчивой городской среды. В следующем разделе рассматриваются более широкие последствия этих выводов, а также обозначаются перспективные направления для дальнейшего развития системы.

Рисунок 4. Сравнительная диаграмма показателей
Обсуждение
Результаты моделирования убедительно подтверждают жизнеспособность предлагаемой навигационной системы на основе нейронной сети для автономного управления БПЛА в городских условиях. Ключевым достижением является способность системы поддерживать высокую производительность в сложных сценариях, демонстрируя адаптивность, устойчивость и надежность.
Модуль восприятия на основе СНС значительно повысил точность обнаружения препятствий, подтвердив свою роль в качестве эффективного сенсорного ядра. Понимание сцены в реальном времени позволило принимать более безопасные и обоснованные решения, что критически важно в плотных городских условиях, где даже незначительные ошибки восприятия могут поставить под угрозу миссии.
Модуль принятия решений с подкреплением также показал высокую эффективность. Низкая частота столкновений и выбор пути, близкий к оптимальному, указывают на то, что агент успешно научился ориентироваться как в стабильных, так и в динамических средах. Это во многом было обусловлено хорошо продуманной функцией вознаграждения, которая способствовала плавному, целенаправленному поведению, а не реактивным действиям.
Однако некоторые ограничения остаются. Имитационные среды, такие как AirSim, хотя и полезны, не могут полностью воспроизвести реальную городскую сложность. Перенос политик в реальные условия может выявить такие проблемы, как шум датчика, эффекты ветра или аппаратные задержки (разрыв между симуляцией и реальностью). Кроме того, высокие вычислительные требования к СНС могут препятствовать развертыванию на легких или энергоограниченных платформах.
Будущие усовершенствования должны быть сосредоточены на методах оптимизации моделей, таких как обрезка, квантование и ускорение периферийного оборудования для снижения вычислительных затрат. Кроме того, хотя задержка принятия решений в реальном времени была приемлемой, масштабируемость системы для координации нескольких БПЛА или высокоскоростной навигации остается открытым направлением исследований.
В заключение следует отметить, что объединение глубокого обучения и обучения с подкреплением показывает большой потенциал для интеллектуальных навигационных систем БПЛА. При дальнейшей доработке и проверке в реальных условиях такие системы могут сыграть решающую роль в развитии городской воздушной мобильности, интеллектуальной логистики и операций по реагированию на чрезвычайные ситуации.
Заключение
В рамках данного исследования предложен и апробирован новый подход к обеспечению автономной навигации БПЛА в условиях сложной городской среды, основанный на сочетании СНС и алгоритмов обучения с подкреплением. Интеграция визуального восприятия в реальном времени с адаптивной системой принятия решений позволила достичь высокого уровня автономности, продемонстрировав значительное улучшение показателей по точности обнаружения препятствий, оптимизации траектории и времени отклика в динамических условиях. Результаты моделирования, проведённого в различных сценариях городской среды, подтвердили надёжность и эффективность предложенной архитектуры. Система обеспечивала низкий уровень столкновений и стабильную задержку принятия решений менее 100 миллисекунд, что соответствует требованиям к навигации в реальном времени. Эти данные свидетельствуют о высоком потенциале синергии визуального распознавания на основе СНС и управления, реализованного через RL, для создания более интеллектуальных, безопасных и эффективных
Бюллетень науки и практики / Bulletin of Science and Practice Т. 11. №6 2025 систем управления БПЛА в условиях плотной городской застройки. Вместе с тем, несмотря на достигнутые успехи, исследование выявило и определённые ограничения, в частности, связанные с высокой вычислительной нагрузкой и сложностями переноса обученных моделей из симуляционной среды в реальные условия. Будущие исследования должны быть сосредоточены на проведении полевых испытаний, оптимизации системы для встроенного исполнения и расширении сенсорного восприятия путём интеграции дополнительных модальностей данных. Таким образом, полученные результаты вносят вклад в развитие технологий автономной аэронавигации и создают основу для практического применения интеллектуальных БПЛА в таких областях, как системы доставки, мониторинг транспортных потоков и реагирование на чрезвычайные ситуации.