Применение современных алгоритмов компьютерного зрения для решения задачи подсчета объектов на изображении

Автор: Альгашев Г.А., Солдатова О.П.

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Новые информационные технологии

Статья в выпуске: 2 (82) т.21, 2023 года.

Бесплатный доступ

Данная статья посвящена исследованию архитектур сверточных нейронных сетей для решения задачи подсчёта объектов на изображении. В настоящее время для решения этой задачи применяют набирающие все большую популярность методы, использующие регрессию. В работе для решения задачи подсчета объектов как задачи с использованием регрессии были применены модификации эталонных сверточных нейронных сетей AlexNet, VGG16 и ResNet 50, которые предназначены для классификации изображений. Модификация заключалась в замене второй части нейронной сети, которая классифицирует изображения, на один полносвязный слой, состоящий из одного нейрона без функции активации. В экспериментах измененные архитектуры эталонных сверточных сетей инициализировались двумя способами: с помощью случайной инициализации весов и с помощью заранее подготовленных весов, обученных на наборе данных ImageNet. Представлены результаты экспериментов, в которых подтверждается работоспособность предложенных моделей и применения метода нейропластичности для решения задачи с использованием регрессии. В качестве данных для обучения и тестирования применялась база изображений бактериальных клеток.

Еще

Сверточная нейронная сеть, регрессия, инициализация весов, нейропластичность, подсчет объектов, компьютерное зрение, анализ изображения

Короткий адрес: https://sciup.org/140303632

IDR: 140303632   |   DOI: 10.18469/ikt.2023.21.2.07

Список литературы Применение современных алгоритмов компьютерного зрения для решения задачи подсчета объектов на изображении

  • Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. 1072 с.
  • Segmentation end Classification of SAR Data with Co-Occurance Matrix for Texture Features / N.G. Kasapoglu [et al.] // Proceedings EUSAR 2002. Germany: Cologue, 2002. P. 717–720.
  • Fang S., Wen H., Shiyi M. Classification of SAR images Based on Simplified Segmentation // Proccedings EUSAR 2002. Germany: Cologue, 2002. P. 705–708.
  • Миронов Б.М., Малов А.Н. Сегментация изображений кластерным методом и алгоритмом случайных скачков: сравнительный анализ // Компьютерная оптика. 2010. Т. 34, №1. С. 132–137.
  • Белим С.В., Ларионов С.Б. Алгоритм сегментации изображений, основанный на поиске сообществ на графах // Компьютерная оптика. 2016. Т. 40, № 6. С. 904–910.
  • Shneier M. Road sign detection and recognition // Proceedings IEEE Computer Society International Conference on Computer Vision and Pattern Recognition. 2005. P. 215–222.
  • Распознавание тест-объектов на тепловизионных изображениях / А.В. Мингалев [и др.] // Компьютерная оптика. 2019. Т. 43, № 3. С. 402–411.
  • Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. 2001. no. 57(2). P. 137–154.
  • Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // IEEE Conference on Computer Vision and Pattern Recognition. 2001. Vol. 1. P. 511–518.
  • Rich feature hierarchies for accurate object detection and semantic segmentation / R. Girshick [et al.] // 2014 IEEE Conference on Computer Vision and Pattern Recognition. 2014. P. 580–587.
  • Estimating pedestrian counts in groups / P. Kilambi [et al.] // Computer Vision and Image Understarding. 2008. Vol. 110. P. 43–59.
  • Crowd counting using group tracked and local features / D. Ryan [et al.] // 7th IEEE International Conference on Advanced Video and Signal Based Surveillance. 2010. P. 218–224.
  • Estimating crowd density with Minlowski fractal dimension / A.N. Marana [et al.] // 1999 IEEE International Conference on Acoustics, Speech, and Signal Processing. 1999. Vol. 6. P. 3521–3524.
  • Feature mining for localized crowd counting / K. Chen [et al.] // Proceedings of British Machine Conference. 2012. Vol. 21. P. 1–11.
  • Ma W., Huang L., Liu C. Crowd density analysis using co-occurrence texture features // Proceedings of International Conference on Computer Sciences and Convergence Information Technologies. 2010. P. 170–175.
  • Automatic estimation of crowd density using texture / A.N. Marana [et al.] // Safety Science. 1998. Vol. 28. P. 165–175.
  • Rahmalan H., Nixon M., Carter J. On crowd density estimation for surveillance // The Institution of Engineering and Technology Conference on Crime and Security. 2006. P. 540–545.
  • Backpropagation Appiled to Handwritten Zip Code Recognition / Y. LeCun [et al.] // Neural Computation. 1989. Vol. 1, no. 4. P. 541–551.
  • Cell Counting by Regression Using Convolutional Neural Network / Y. Xue [et al.]. Springer International Publishing, 2016. 17 p.
  • Deep Spatial Regression Model for Image Crowd Counting / H. Yao [et al.]. URL: https:// https://arxiv.org/pdf/1710.09757.pdf (дата обращения: 26.08.2020).
  • Krizhevsky A., Sutskever I., Hinton G.E. Image Net classification with deep convolution neural networks // Advances in neural information processing systems (NIPS). 2012. P. 1097–1105.
  • Accelerating very deep convolutional networks for classification and detection / X. Zhang [et al.] // IEEE transactions on pattern analysis and machine intelligence. 2016. no. 38. P. 1943–1955.
  • Deep Residual Learning for Image Recognition / K. He [et al.] // 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 770–778.
  • Bishop C.M. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer, 2006. 738 p.
  • Lempitsky V., Zisserman A. Learning to count objects in images // Neural Information Processing Systems Foundation. 2010. P. 1324–1332.
  • Kingma D.P., Ba J. Adam: A Method for Stochastic Optimization // International Conference on Learning Representations. 2015. P. 1–13.
  • Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolution neural networks // Advances in neural information processing systems. 2012. P. 1097–1105.
  • Альгашев Г.А., Солдатова О.П. Нейропластичность сверточных нейронных сетей // Перспективные информационные технологии (ПИТ-2018): материалы Международной научно-технической конференции. Самара: СНЦ РАН, 2018. С. 385–389.
  • Альгашев Г.А., Солдатова О.П. Исследование эффективности использования свойства нейропластичности в сверточных сетях // Информационные технологии и нанотехнологии (ИТНТ-2019): материалы V Международной конференции и молодежной школы. Самара: Новая техника, 2019. C. 711–720.
Еще
Статья научная