Разработка алгоритма семантической сегментации аэрофотоснимков реального времени
Автор: Блохинов Юрий Борисович, Горбачев Вадим Александрович, Ракутин Юрий Олегович, Никитин Андрей Дмитриевич
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений, распознавание образов
Статья в выпуске: 1 т.42, 2018 года.
Бесплатный доступ
Статья посвящена разработке эффективного алгоритма семантической сегментации изображений для работы в реальном времени, обладающего наилучшей точностью в своем классе. На основе сравнительного анализа методов предварительной сегментации, методов вычисления признаков по сегментам изображения, а также различных алгоритмов машинного обучения выявлены наиболее эффективные из них как по точности, так и по быстродействию. По результатам исследования построен модульный алгоритм семантической сегментации со временем выполнения, близким к реальному. Обучение и тестирование проводились на коллекции ISPRS «Vaihingen» аэрофотоснимков видимого и инфракрасного диапазонов, к которым прилагается пиксельная карта высот изображенной местности. Предложен оригинальный способ получения нормализованной матрицы высот по исходной цифровой модели рельефа.
Анализ изображений, распознавание образов, детектирование, классификация, аэрофотоснимки, матрица высот, суперпиксели, набор признаков, семантическая сегментация, машинное обучение, условные случайные поля
Короткий адрес: https://sciup.org/140228700
IDR: 140228700 | DOI: 10.18287/2412-6179-2018-42-1-141-148
A real-time semantic segmentation algorithm for aerial imagery
We propose a novel effective algorithm for real-time semantic segmentation of images that has the best accuracy in its class. Based on a comparative analysis of preliminary segmentation methods, methods for calculating attributes from image segments, as well as various algorithms of machine learning, the most effective methods in terms of their accuracy and performance are identified. Based on the research results, a modular near real-time algorithm of semantic segmentation is constructed. Training and testing is performed on the ISPRS Vaihingen collection of aerial photos of the visible and IR ranges, to which a pixel map of the terrain heights is attached. An original method for obtaining a normalized nDSM for the original DSM is proposed.
Список литературы Разработка алгоритма семантической сегментации аэрофотоснимков реального времени
- Горбачев, В.А. Плотная реконструкция рельефа местности на основе модифицированного алгоритма полуглобального стереоотождествления/В.А. Горбачев//Известия РАН. Теория и системы управления. -2014. -№ 2. -С. 68-79. - DOI: 10.7868/S0002338814020103
- Веркеенко, М.С. Построение плотных моделей поверхности земли на основе метода полуглобального отождествления для случая множественного перекрытия снимков/М.С. Веркеенко, В.А. Горбачев//Известия РАН. Теория и системы управления. -2017. -№ 6. -С. 100-111. - DOI: 10.7868/S0002338817060087
- Long, J. Fully convolutional networks for semantic segmentation/J. Long, E. Shelhamer, T. Darrell//IEEE Conference on Computer Vision and Pattern Recognition. -2015. -P. 3431-3440. - DOI: 10.1109/CVPR.2015.7298965
- 2D Semantic labeling contest. -URL: http://www2.isprs.org/commissions/comm3/wg4/semantic-labeling.html (дата обращения 8.09.2017).
- Achanta, R. SLIC superpixels compared to state-of-the-art superpixel methods/R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk//IEEE Transactions on Pattern Analysis and Machine Intelligence. -2012. -Vol. 34, Issue 11. -P. 2274-2281. - DOI: 10.1109/TPAMI.2012.120
- Malik, J. Contour and texture analysis for image segmentation/J. Malik, S. Belongie, T. Leung, J. Shi//International Journal of Computer Vision. -2001. -Vol. 43(1). -P. 7-27. - DOI: 10.1023/A:1011174803800
- Ojala, T. Comparative study of texture measures with classification based on feature distributions/T. Ojala, M. Pietikäinen, D.A. Harwood//Pattern Recognition. -1996. Vol. 29, Issue 1. -P. 51-59. - DOI: 10.1016/0031-3203(95)00067-4
- Papageorgiou, C.P. A general framework for object detection/C.P. Papageorgiou, M. Oren, T. Poggio//Proceedings of International Conference on Computer Vision. -1998. -P. 555-562. - DOI: 10.1109/ICCV.1998.710772
- Машинное обучение (курс лекций, К.В. Воронцов). -URL: http://www.machinelearning.ru/wiki/index.php? title=Машиное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 (дата обращения 8.09.2017).
- Finley, T. Training structural SVMs when exact inference is intractable/T. Finley, T. Joachims//Proceedings of the 25th International Conference on Machine Learning (ICML '08). -2008. -P. 304-311. - DOI: 10.1145/1390156.1390195
- Kolmogorov, V. Minimizing non-submodular functions with graph cuts -A review/V. Kolmogorov, C. Rother//IEEE Transactions on Pattern Analysis and Machine Intelligence. -2007. -Vol. 29(7). -P. 1274-1279. - DOI: 10.1109/TPAMI.2007.1031
- Müller, A.C. PyStruct Structured prediction in Python/A.C. Müller, S. Behnke//Journal of Machine Learning Research. -2014. -Vol. 15, Issue 1. -P. 2055-2060.
- Cramer, M. The DGPF -Test on digital aerial camera evaluation overview and test design/M. Cramer//Photogrammetrie -Fernerkundung -Geoinformation. -2010. -Vol. 2. -P. 73-82. - DOI: 10.1127/1432-8364/2010/0041
- Evaluierung digitaler photogrammetrischer luftbildkamerasysteme. -URL: http://www.ifp.uni-stuttgart.de/dgpf/DKEP-Allg.html (дата обращения 8.09.2017).