Архитектуры сегментации изображений и их практическое применение для беспилотной посадки летательного аппарата
Автор: Кузьмин Олег Викторович, Лавлинский Максим Викторович
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Функциональный анализ и дифференциальные уравнения
Статья в выпуске: 1, 2023 года.
Бесплатный доступ
В данной работе рассматриваются архитектуры сегментации изображений и их практическое применение для беспилотной посадки, примеры реализованных систем доставки товаров дронами. Выбрана и реализована оптимальная посадка дрона с использованием сегментации изображения нейронной сетью. Выбран и модифицирован набор данных для обучения, путем отзеркаливания изображения и разворота изображения. Создана дополнительная выборка данных с использованием приложения, симулирующего полёт дрона в настраиваемом окружении. Найден способ быстрой разметки видеозаписи приземления дрона. Представлены результаты тестирования нейронных сетей различных архитектур для выявления оптимальной для решаемой задачи. Были применены две разные метрики точности нейронной сети для получения достоверных данных о распознавании. Были выбраны наиболее точно узнаваемые классы окружения. Для этого было создано три варианта нейронных сетей с разным набором классов. Результаты были проанализированы и выбраны наиболее узнаваемые классы. Создана финальная нейронная сеть на основе архитектуры LinkNet. Исходя из высоты дрона выбрана зона приземления и зона для последующей сегментации. Найдена оптимальная высота полета над поверхностью для начала процедуры приземления.
Нейронная сеть, сегментация изображения, беспилотный дрон, безопасная посадка, дистанционное управление
Короткий адрес: https://sciup.org/148326133
IDR: 148326133 | DOI: 10.18101/2304-5728-2023-1-37-46
Список литературы Архитектуры сегментации изображений и их практическое применение для беспилотной посадки летательного аппарата
- Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5) // UC Berkeley, arXiv:1311.2524v5. URL: https://arxiv.org/abs/1311.2524 (дата обращения: 10.02.2023).
- George Vosselman, Gui-Song Xia, Alper Yilmaz, Michael Ying Yang. UAVid: A Semantic Segmentation Dataset for UAV Imagery, arXiv:1810.10438v2. URL: https://arxiv.org/abs/1810.10438 (дата обращения: 9.02.2023).
- Shafaei, A., Little, J.J., Schmidt, M.: Play and learn: Using video games to train computer vision models, arXiv:1608.01745v2. URL: https://arxiv.org/abs/1608.01745 (дата обращения: 11.02.2023).
- Tsung-Yi Lin, Piotr Dollar', Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature Pyramid Networks for Object Detection, arXiv:1612.03144v2. URL: https://arxiv.org/abs/1612.03144 (дата обращения: 11.02.2023).
- Abhishek Chaurasia, Eugenio Culurciello. LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation, arXiv:1707.03718v1. URL: https://arxiv.org/abs/1707.03718. (дата обращения: 12.02.2023).
- Olaf Ronneberger, Philipp Fischer, and Thomas Brox. U-Net: Convolutional Networks for Biomedical Image Segmentation, arXiv:1505.04597v1. URL: https://arxiv.org/abs/1505.04597 (дата обращения: 12.02.2023).
- Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, Jiaya Jia, Pyramid Scene Parsing Network, arXiv:1612.01105. URL: https://arxiv.org/abs/1612.01105 (дата обращения: 12.02.2023).
- Keiron O'Shea, and Ryan Nash. An Introduction to Convolutional Neural Networks, arXiv: 1511.08458v2. URL: https://arxiv.org/abs/1511.08458 (дата обращения: 12.02.2023).
- Dor Bank, Noam Koenigstein, Raja Giryes. Autoencoders, arXiv:2003.05991. URL: https://arxiv.org/abs/2003.05991 (дата обращения: 12.02.2023).
- Sibylle Hess, Wouter Duivesteijn, Decebal Mocanu. Softmax-based Classification is k-means Clustering: Formal Proof, Consequences for Adversarial Attacks, and Improvement through Centroid Based Tailoring, arXiv:2001.01987v1. URL: https://arxiv.org/abs/2001.01987 (дата обращения: 12.02.2023).
- Zhilu Zhang, Mert Sabancu. Generalized Cross Entropy Loss for Training Deep Neural Networks with Noisy Labels, arXiv: 1805.07836v4. URL: https://arxiv.org/abs/1805.07836 (дата обращения: 12.02.2023).
- Hamid Rezatofighi, Nathan Tsoi JunYoung Gwak Amir Sadeghian, Ian Reid Silvio Savarese. Generalized Intersection over Union, arXiv: 1902.09630. URL: https://arxiv.org/abs/1902.09630. (дата обращения: 8.02.2023).
- Marina Sokolova, Nathalie Japkowicz, Stan Szpakowicz. Beyond Accuracy, F-score and ROC:a Family of Discriminant Measures for Performance Evaluation, Advances in Artificial Intelligence. Lecture Notes in Computer Science. 2006. Vol. 4304. P. 1015-1021.
- Ayoub Benali Amjoud, Mustapha Amrouch, Convolutional Neural Networks Backbones for Object Detection, Image and Signal Processing: 9th International Conference, ICISP 2020, Marrakesh, Morocco, June 4-6, 2020, Proceedings, Jun 2020. 282-289.
- Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications, arXiv: 1704.04861. https://arxiv.org/abs/1704.04861 (дата обращения: 12.02.2023).
- Обнаружение лесных пожаров с помощью беспилотных летательных аппаратов / О. В. Кузьмин, А. А. Лавлинская, Г. А. Филь, М. Д. Камнев // Математика, ее приложения и математическое образование (МПМО'20): материалы конференции. 2020. С. 134-136.
- Лавлинская А. А., Филь Г. А., Камнев М. Д. Создание модели квадрокоп-тера-эколога // Прикладные вопросы дискретного анализа: сб. науч. тр. / под редакцией О. В. Кузьмина. Иркутск: Изд-во ИГУ, 2020. Вып. 6. С. 78-83.
- Проектирование БПЛА для мониторинга лесных массивов и водных пространств / О. В. Кузьмин, А. А. Лавлинская, Б. А. Тараканов [и др.] // Прикладные проблемы дискретного анализа: сб. науч. тр. / под редакцией О. В. Кузьмина. Иркутск: Изд-во ИГУ, 2021. Вып. 7. С. 66-72.
- Кузьмин О. В., Лавлинский М. В. Создание модели беспилотного летательного аппарата для помощи в решении проблемы пожаров в Иркутской области // Современные технологии. Системный анализ. Моделирование. 2020. № 2 (66). С. 136-143. DOI: 10.26731/1813-9108.2020.2(66).136-143.
- Кузьмин О. В., Лавлинский М. В. Создание модели беспилотного летательного аппарата типа биплан, использующей генетический алгоритм в полете, для помощи в решении проблемы пожаров в Иркутской области // Современные технологии. Системный анализ. Моделирование. 2021. № 3 (71). С. 185-192. DOI: 10.26731/1813-9108.2021.3(71).185-192.