Применение современных алгоритмов компьютерного зрения для решения задачи подсчета объектов на изображении
Автор: Альгашев Г.А., Солдатова О.П.
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Новые информационные технологии
Статья в выпуске: 2 (82) т.21, 2023 года.
Бесплатный доступ
Данная статья посвящена исследованию архитектур сверточных нейронных сетей для решения задачи подсчёта объектов на изображении. В настоящее время для решения этой задачи применяют набирающие все большую популярность методы, использующие регрессию. В работе для решения задачи подсчета объектов как задачи с использованием регрессии были применены модификации эталонных сверточных нейронных сетей AlexNet, VGG16 и ResNet 50, которые предназначены для классификации изображений. Модификация заключалась в замене второй части нейронной сети, которая классифицирует изображения, на один полносвязный слой, состоящий из одного нейрона без функции активации. В экспериментах измененные архитектуры эталонных сверточных сетей инициализировались двумя способами: с помощью случайной инициализации весов и с помощью заранее подготовленных весов, обученных на наборе данных ImageNet. Представлены результаты экспериментов, в которых подтверждается работоспособность предложенных моделей и применения метода нейропластичности для решения задачи с использованием регрессии. В качестве данных для обучения и тестирования применялась база изображений бактериальных клеток.
Сверточная нейронная сеть, регрессия, инициализация весов, нейропластичность, подсчет объектов, компьютерное зрение, анализ изображения
Короткий адрес: https://sciup.org/140303632
IDR: 140303632 | DOI: 10.18469/ikt.2023.21.2.07
Список литературы Применение современных алгоритмов компьютерного зрения для решения задачи подсчета объектов на изображении
- Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. 1072 с.
- Segmentation end Classification of SAR Data with Co-Occurance Matrix for Texture Features / N.G. Kasapoglu [et al.] // Proceedings EUSAR 2002. Germany: Cologue, 2002. P. 717–720.
- Fang S., Wen H., Shiyi M. Classification of SAR images Based on Simplified Segmentation // Proccedings EUSAR 2002. Germany: Cologue, 2002. P. 705–708.
- Миронов Б.М., Малов А.Н. Сегментация изображений кластерным методом и алгоритмом случайных скачков: сравнительный анализ // Компьютерная оптика. 2010. Т. 34, №1. С. 132–137.
- Белим С.В., Ларионов С.Б. Алгоритм сегментации изображений, основанный на поиске сообществ на графах // Компьютерная оптика. 2016. Т. 40, № 6. С. 904–910.
- Shneier M. Road sign detection and recognition // Proceedings IEEE Computer Society International Conference on Computer Vision and Pattern Recognition. 2005. P. 215–222.
- Распознавание тест-объектов на тепловизионных изображениях / А.В. Мингалев [и др.] // Компьютерная оптика. 2019. Т. 43, № 3. С. 402–411.
- Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. 2001. no. 57(2). P. 137–154.
- Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // IEEE Conference on Computer Vision and Pattern Recognition. 2001. Vol. 1. P. 511–518.
- Rich feature hierarchies for accurate object detection and semantic segmentation / R. Girshick [et al.] // 2014 IEEE Conference on Computer Vision and Pattern Recognition. 2014. P. 580–587.
- Estimating pedestrian counts in groups / P. Kilambi [et al.] // Computer Vision and Image Understarding. 2008. Vol. 110. P. 43–59.
- Crowd counting using group tracked and local features / D. Ryan [et al.] // 7th IEEE International Conference on Advanced Video and Signal Based Surveillance. 2010. P. 218–224.
- Estimating crowd density with Minlowski fractal dimension / A.N. Marana [et al.] // 1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. 1999. Vol. 6. P. 3521–3524.
- Feature mining for localized crowd counting / K. Chen [et al.] // Proceedings of British Machine Conference. 2012. Vol. 21. P. 1–11.
- Ma W., Huang L., Liu C. Crowd density analysis using co-occurrence texture features // Proceedings of International Conference on Computer Sciences and Convergence Information Technologies. 2010. P. 170–175.
- Automatic estimation of crowd density using texture / A.N. Marana [et al.] // Safety Science. 1998. Vol. 28. P. 165–175.
- Rahmalan H., Nixon M., Carter J. On crowd density estimation for surveillance // The Institution of Engineering and Technology Conference on Crime and Security. 2006. P. 540–545.
- Backpropagation Appiled to Handwritten Zip Code Recognition / Y. LeCun [et al.] // Neural Computation. 1989. Vol. 1, no. 4. P. 541–551.
- Cell Counting by Regression Using Convolutional Neural Network / Y. Xue [et al.]. Springer International Publishing, 2016. 17 p.
- Deep Spatial Regression Model for Image Crowd Counting / H. Yao [et al.]. URL: https:// https://arxiv.org/pdf/1710.09757.pdf (дата обращения: 26.08.2020).
- Krizhevsky A., Sutskever I., Hinton G.E. Image Net classification with deep convolution neural networks // Advances in neural information processing systems (NIPS). 2012. P. 1097–1105.
- Accelerating very deep convolutional networks for classification and detection / X. Zhang [et al.] // IEEE transactions on pattern analysis and machine intelligence. 2016. no. 38. P. 1943–1955.
- Deep Residual Learning for Image Recognition / K. He [et al.] // 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 770–778.
- Bishop C.M. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer, 2006. 738 p.
- Lempitsky V., Zisserman A. Learning to count objects in images // Neural Information Processing Systems Foundation. 2010. P. 1324–1332.
- Kingma D.P., Ba J. Adam: A Method for Stochastic Optimization // International Conference on Learning Representations. 2015. P. 1–13.
- Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolution neural networks // Advances in neural information processing systems. 2012. P. 1097–1105.
- Альгашев Г.А., Солдатова О.П. Нейропластичность сверточных нейронных сетей // Перспективные информационные технологии (ПИТ-2018): материалы Международной научно-технической конференции. Самара: СНЦ РАН, 2018. С. 385–389.
- Альгашев Г.А., Солдатова О.П. Исследование эффективности использования свойства нейропластичности в сверточных сетях // Информационные технологии и нанотехнологии (ИТНТ-2019): материалы V Международной конференции и молодежной школы. Самара: Новая техника, 2019. C. 711–720.