Повышение эффективности детектирования объектов с использованием потерь с отступом

Бесплатный доступ

Статья предлагает использование модифицированной функции потерь для повышения эффективности нейросетевых классификаторов и детекторов. Новизной является применение такой функции потерь при обработке рентгеновских изображений. В частности, в работе рассмотрена задача автоматической обработки снимков досмотра авиационной безопасности. Особое внимание уделяется методам классификации запрещенных предметов на рентгеновских изображениях багажа и ручной клади. Предложено использовать модифицированные функции потерь при обучении. Показано, что такой подход обеспечивает выигрыш по сравнению с традиционным обучением на 2-4%. Более того, разработана каскадная модель обнаружения объектов на базе нейронной сети YOLOv8 и бинарного классификатора. Исследования показали, что применение дополнительного классификатора улучшает качество работы нейросети YOLO на 2-3%. Следует отметить также, что в ходе данного исследования использовался собственный набор данных, подготовленный совместно с Ульяновским институтом гражданской авиации. Также был выполнен анализ производительности для различных версий детектора YOLO, который показал, что наилучшее сочетание точности и скорости обеспечивает модель среднего размера (YOLOv8m). Основной результат работы заключается в повышении эффективности обнаружения и классификации запрещенных предметов за счет применения модифицированной функции потерь и каскадного детектора.

Еще

Авиационная безопасность, обнаружение объектов, распознавание образов, функция потерь, нейронные сети

Короткий адрес: https://sciup.org/148330127

IDR: 148330127   |   УДК: 004.932   |   DOI: 10.37313/1990-5378-2024-26-4(3)-340-346

Improving object detection efficiency using backspacing loss

The paper considers the problem of automatic processing of aviation security screening images. Special attention is paid to methods of classification of prohibited items on X-ray images of luggage and hand luggage. It is proposed to use modified training loss functions. It is shown that this approach provides a gain of 2-4% over traditional training. Moreover, a cascade object detection model based on YOLOv8 neural network and binary classifier is developed. Studies have shown that the application of an additional classifier improves the performance of YOLO neural network by 2-3%. It should also be noted that this study used an in-house dataset prepared jointly with the Ulyanovsk Institute of Civil Aviation. Performance analysis was also performed for different versions of the YOLO detector, which showed that the best combination of accuracy and speed is provided by the medium-sized model (YOLOv8m). The main result of the work is to improve the efficiency of detection and classification of prohibited items by using a modified loss function and cascade detector.

Еще

Список литературы Повышение эффективности детектирования объектов с использованием потерь с отступом

  • Hofer F., Schwaninger A. Using threat image projection data for assessing individual screener performance // WIT Trans. Built Environ. 2005, vol. 82, pp. 417–426.
  • Skorupski J., Uchroński P. A Human Being as a Part of the Security Control System at the Airport // Procedia Eng. 2016, vol. 134, pp. 291–300.
  • Meuter R.F.I., Lacherez P.F. When and Why Threats Go Undetected: Impacts of Event Rate and Shift Length on Threat Detection Accuracy during Airport Baggage Screening // Hum. Factors 2016, 58, 218–228.
  • Andriyanov N. Deep Learning for Detecting Dangerous Objects in X-rays of Luggage // Eng. Proc. 2023, v. 33, id 20. DOI: 10.3390/engproc2023033020.
  • Sterchi Y., Hättenschwiler N., Schwaninger A. Detection measures for visual inspection of X-ray images of passenger baggage // Atten Percept Psychophys 2019, vol. 81, pp. 1297–1311. DOI: 10.3758/s13414-018-01654-8.
  • Волков, А.К. Применение двухпараметрической модели IRT для оценки вероятностных характеристик обнаружения запрещенных предметов операторами досмотровой техники / А.К. Волков, Д.В. Айдаркин, А.К. Волков // Научный вестник Московского государственного технического университета гражданской авиации. – 2017. – Т. 20. – №3. – С. 100-109.
  • Andriyanov N.A., Volkov Al. K., Volkov An. K., Gladkikh A.A., Danilov S.D. Automatic x-ray image analysis for aviation security within limited computing resources // IOP Conference Series: Materials Science and Engineering 2020, vol. 862, id 052009, pp. 1-5. doi:10.1088/1757-899X/862/5/052009.
  • Andriyanov N., Dementiev V., Gladkikh A. Analysis of the Pattern Recognition Effi ciency On Non-Optical Images // 2021 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology (USBEREIT), Yekaterinburg, Russia, 2021, pp. 0319-0323, DOI: 10.1109/USBEREIT51232.2021.9455097.
  • Andriyanov N., Kamalova Y., Dementiev V. Comparison of MS Custom Vision Auto Machine Learning with Algorithms Implementation Methods // 2023 Wave Electronics and its Application in Information and Telecommunication Systems (WECONF), St. Petersburg, Russian Federation, 2023, pp. 1-4. DOI: 10.1109/WECONF57201.2023.10148043.
  • Andriyanov N.A., Dementiev V.E., Tashlinskiy A.G. Detection of objects in the images: from likelihood relationships towards scalable and effi cient neural networks // Computer Optics 2022; 46(1): 139-159. DOI: 10.18287/2412-6179-CO-922.
  • Xu, M., Zhang, H., Yang, J. (2018). Prohibited Item Detection in Airport X-Ray Security Images via Attention Mechanism Based CNN. In: Lai, JH., et al. Pattern Recognition and Computer Vision. PRCV 2018. Lecture Notes in Computer Science, vol 11257. Springer, Cham. DOI: 10.1007/978-3-030-03335-4_37.
  • Андриянов, Н.А. Обнаружение объектов на изображении: от критериев Байеса и Неймана–Пирсона к детекторам на базе нейронных сетей Effi cientDet / Н.А. Андриянов, В.Е. Дементьев, А.Г. Ташлинский // Компьютерная оптика. – 2022. – Т. 46, № 1. – С. 139-159. – DOI: 10.18287/2412-6179-CO-922.
  • Good I. J. Rational Decisions // Journal of the Royal Statistical Society. Series B (Methodological), vol. 14, no. 1, 1952, pp. 107–114.
  • Лопаткин, И.М. Применение функции активации ArcFace для повышения эффективности решения задачи распознавания лиц / И.М. Лопаткин, Н.И. Матусков, Н.А. Андриянов // В сборнике: Радио- электронные устройства и системы для инфокоммуникационных технологий («РЭУС-ИТ 2023»). Доклады Всероссийской конференции, посвященной дню радио. – М.: 2023. – С. 196-199.
  • Sebastian Bruch, Xuanhui Wang, Mike Bendersky, Marc Najork An Analysis of the Softmax Cross Entropy Loss for Learning-to-Rank with Binary Relevance // Proceedings of the 2019 ACM SIGIR International Conference on the Theory of Information Retrieval (ICTIR 2019), pp. 75-78.
  • Reis D., Kupec J., Hong J., Daoudi A. Real-Time Flying Object Detection with YOLOv8 // arXiv preprints 2023, URL: https://arxiv.org/abs/2305.09972 (дата обращения: 01.06.2024).
  • Андриянов, Н.А. Мониторинг состояния металлических изделий на основе систем компьютерного зрения / Н.А. Андриянов, А.А. Волненко, В.Е. Дементьев // Нейрокомпьютеры: разработка, применение – 2023. – T. 25. – № 5. – С. 50-57. – DOI: 10.18127/j19998554-202305-07.
Еще