Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей

Автор: Шахуро Владислав Игоревич, Конушин Антон Сергеевич

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений, распознавание образов

Статья в выпуске: 1 т.42, 2018 года.

Бесплатный доступ

В работе исследуется применимость порождающих конкурирующих нейронных сетей для синтеза обучающих выборок на примере задачи классификации дорожных знаков. Рассматриваются порождающие нейронные сети, обучаемые с помощью метрики Васерштейна. В качестве базового метода для сравнения используется метод генерации синтетических изображений дорожных знаков по иконке. Проводится экспериментальное сравнение нейросетевых классификаторов, обученных на реальных данных, двух видах синтетических данных, а также смеси реальных и синтетических данных. Эксперименты показывают, что современные порождающие нейронные сети позволяют создавать реалистичные обучающие выборки для классификации автодорожных знаков, которые превосходят по качеству методы генерации знаков по иконкам, но немного уступают по качеству реальным данным.

Еще

Классификация дорожных знаков, синтетические обучающие выборки, порождающие нейронные сети

Короткий адрес: https://sciup.org/140228695

IDR: 140228695   |   DOI: 10.18287/2412-6179-2018-42-1-105-112

Список литературы Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей

  • Russakovsky, O. ImageNet large scale visual recognition challenge/O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A. Berg, L. Fei-Fei//International Journal of Computer Vision. -2015. -Vol. 115, Issue 3. -P. 211-252. - DOI: 10.1007/s11263-015-0816-y
  • Lin, T. Microsoft COCO: Common objects in context/T. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Doll'ar, L. Zitnick. -In book: Computer Vision -ECCV 2014/ed. by D. Fleet, T. Pajdla, B. Schiele, T. Tuytelaars. -Switzerland: Springer International Publishing; 2014. -P. 740-755. -ISBN: 978-3-319-10592-5.
  • Cordts, M. The cityscapes dataset for semantic urban scene understanding/M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, B. Schiele//Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. -2016. -P. 3213-3223. - DOI: 10.1109/CVPR.2016.350
  • Shotton, J. Real-time human pose recognition in parts from single depth images/J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio, A. Blake, M. Cook, R. Moore//Communications of the ACM. -2013. -Vol. 56, Issue 1. -P. 116-124. - DOI: 10.1145/2398356.2398381
  • Richter, S.R. Playing for data: Ground truth from computer games/S.R. Richter, V. Vineet, S. Roth, V. Koltun. -In book: Computer Vision -ECCV 2016/ed by B. Leibe, J. Matas, N. Sebe, M. Welling. -Cham, Switzerland: Springer, 2016. -P. 102-118. - DOI: 10.1007/978-3-319-46475-6_7
  • Moiseyev, B. Evaluation of traffic sign recognition methods trained on synthetically generated data/B. Moiseyev, A. Konev, A. Chigorin, A. Konushin//Proceedings of the 15th International Conference on Advanced Concepts for Intelligent Vision Systems. -2013. -P. 576-583. - DOI: 10.1007/978-3-319-02895-8_52
  • Chigorin, A. A system for large-scale automatic traffic sign recognition and mapping/A. Chigorin, A. Konushin//CMRT13 -City Models, Roads and Traffic 2013. ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences. -2013. -Vol. II-3/W3. -P. 13-17. - DOI: 10.5194/isprsannals-II-3-W3-13-2013
  • Fischer, P. Flownet: Learning optical flow with convolutional networks/P. Fischer, A. Dosovitskiy, E. Ilg, P. Hausser, C. Hazirbas, V. Golkov, P. van der Smagt, D. Cremers, T. Brox//arXiv preprint arXiv:1504.06852. -2015.
  • Goodfellow, I. Generative adversarial nets/I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio//Proceedings of the 27th International Conference on Neural Information Processing Systems. -2014. -Vol. 2. -P. 2672-2680.
  • Radford, A. Unsupervised representation learning with deep convolutional generative adversarial networks /A. Radford, L. Metz, S. Chintala//arXiv preprint arXiv:1511.06434. -2015. -URL: arxiv.org/abs/1511.06434. (date request 24.11.2017).
  • Denton, E.L. Deep generative image models using a Laplacian pyramid of adversarial networks/E.L. Denton, S. Chintala, A. Szlam, R. Fergus//Proceedings of the 28th International Conference on Neural Information Processing Systems (NIPS). -2015. -Vol. 1. -P. 1486-1494.
  • Mirza, M. Conditional generative adversarial nets /M. Mirza, S. Osindero//arXiv preprint arXiv:1411.1784. -2014. -URL: arxiv.org/abs/1411.1784 (date request 24.11.2017).
  • Zheng, Z. Unlabeled samples generated by GAN improve the person re-identification baseline in vitro /Z. Zheng, L. Zheng, Y. Yang//arXiv preprint arXiv:1701.07717. -2017. -URL: arxiv.org/abs/1701.07717 (date request 24.11.2017).
  • Arjovsky, M. Wasserstein gan /M. Arjovsky, S. Chintala, L. Bottou//arXiv preprint arXiv:1701.07875. -2017. -URL: arxiv.org/abs/1701.07875 (date request 24.11.2017).
  • Stallkamp, J. Man vs. computer: Benchmarking machine learning algorithms for traffic sign recognition/J. Stallkamp, M. Schlipsing, J. Salmen, C. Igel//Neural networks. -2012. -Vol. 32. -P. 323-332. - DOI: 10.1016/j.neunet.2012.02.016
  • Шахуро, В.И. Российская база изображений автодорожных знаков/В.И. Шахуро, А.С. Конушин//Компьютерная оптика. -2016. -Т. 40, № 2. -С. 294-300. - DOI: 10.18287/2412-6179-2016-40-2-294-300
  • Лисицын, С.О. Распознавание дорожных знаков с помощью метода опорных векторов и гистограмм ориентированных градиентов/С.О. Лисицын, О.А. Байда//Компьютерная оптика. -2012. -Т. 36, № 2. -С. 289-295.
  • Ciresan, D. Multi-column deep neural network for traffic sign classification/D. Ciresan, U. Meier, J. Masci, J. Schmidhuber//Neural Networks. -2012. -Vol. 32. -P. 333-338. - DOI: 10.1016/j.neunet.2012.02.023
Еще
Статья научная