Сравнительный анализ нейросетевых моделей для задачи обнаружения беспилотных летательных аппаратов
Автор: Вычегжанин Сергей Владимирович, Татаринова Александра Геннадьевна, Мышкин Роман Евгеньевич
Журнал: Компьютерная оптика @computer-optics
Рубрика: Численные методы и анализ данных
Статья в выпуске: 2 т.50, 2026 года.
Бесплатный доступ
В статье проведен сравнительный анализ моделей YOLO и вариантов их тонкой настройки для задачи обнаружения беспилотных летательных аппаратов в реальном времени. Представлены оценки качества и вычислительной производительности различных семейств моделей от YOLOv3 до YOLO12 и версий от нано- до сверхбольшой. Проанализированы их преимущества и недостатки на основе широкого спектра мер, включая точность, полноту, F1-меру, среднюю точность, время вывода и размер модели. Исследованы варианты тонкой настройки предварительно обученных на корпусе CommonObjectsinContextмоделей при разных разрешениях входных изображений и скорости обучения. Выполнен анализ ошибок обнаружения беспилотных летательных аппаратов малых размеров в сложных условиях с использованием специализированных наборов данных. Исследование показало, что семейство YOLO11 является оптимальным по совокупности оцениваемых параметров, обеспечивая баланс между качеством и вычислительной производительностью. Наиболее высокие оценки качества обнаружения беспилотных летательных аппаратов на тестовом наборе данных были получены с использованием тонко настроенной модели yolo11m с увеличенным разрешением входных изображений и достигли значений F1 = 0,970, AP50 = 0,981, AP50-95 = 0,765.
Обработка изображений, обнаружение объектов, нейросетевые алгоритмы, глубокое обучение, трансферное обучение
Короткий адрес: https://sciup.org/140314853
IDR: 140314853 | DOI: 10.18287/COJ1728
Comparative analysis of neural network models for detecting unmanned aerial vehicles
The paper presents a comparative analysis of YOLO models and their fine-tuning options for the task of real-time unmanned aerial vehicles detection. The quality and computational performance of different model families from YOLOv3 to YOLO12 and versions ranging from nano to extra-large are estimated. Their advantages and disadvantages are analyzed based on a wide range of measures, including precision, recall, F1-measure, average precision, inference time, and model size. Fine-tuning options for pre-trained models trained on the Common Objects in Context dataset are investigated for different input image resolutions and learning rates. We analyze detection errors of small unmanned aerial vehicles in complex environments using specialized datasets. The study showed that the YOLO11 family is the optimal in terms of the set of evaluated parameters, providing a balance between quality and computational performance. The highest quality scores for unmanned aerial vehicles detection on the test dataset were obtained using the fine-tuned yolo11m model with increased input image resolution and achieved values of F1=0.970, AP50=0.981, AP50-95=0.765.