Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей

Автор: Савченко Андрей Валентинович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений, распознавание образов

Статья в выпуске: 3 т.41, 2017 года.

Бесплатный доступ

Исследована задача распознавания изображений в условиях малых выборок наблюдений на основе метода ближайшего соседа, в котором сопоставляются векторы признаков высокой размерности, выделенные с помощью глубокой свёрточной нейронной сети. Предложен новый алгоритм распознавания на основе метода максимального правдоподобия (совместной плотности вероятности) рассогласований между входным и всеми эталонными изображениями. Для оценки правдоподобия используется известное асимптотически нормальное распределение рассогласования Йенсена-Шеннона между векторами значений признаков изображений, что согласовывается с известными экспериментальными оценками закона распределения мер близости между векторами высокой размерности. В рамках экспериментального исследования для базы данных фотографий лиц Labeled Faces in the Wild и набора видеоданных YouTube Faces показано, что предлагаемый алгоритм позволяет на 1-5 % повысить точность распознавания изображений и видеопоследовательностей по сравнению с традиционными методами классификации.

Еще

Статистическое распознавание образов, обработка изображений, глубокие свёрточные нейронные сети, метод максимально правдоподобного перебора, распознавание лиц

Короткий адрес: https://sciup.org/140228780

IDR: 140228780   |   DOI: 10.18287/2412-6179-2017-41-3-422-430

Список литературы Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей

  • LeCun, Y. Deep learning/Y. LeCun, Y. Bengio, G. Hinton//Nature. -2015. -Vol. 521(7553). -P. 436-444. - DOI: 10.1038/nature14539
  • Prince, S.J. Computer vision: models, learning, and inference/S.J. Prince. -New York: Cambridge University Press, 2012. -598 p. -ISBN: 978-1-107-01179-3.
  • Goodfellow, I. Deep learning (Adaptive computation and machine learning series)/I. Goodfellow, Y. Bengio, A. Courville. -Cambridge, London: MIT Press, 2016. -800 p. -ISBN: 978-0-262-03561-3.
  • Savchenko, A.V. Search techniques in intelligent classification systems/A.V. Savchenko. -Switzerland: Springer In-ternational Publishing, 2016. -83 p. -ISBN 978-3-319-30513-4.
  • Zhao, Y. Face recognition from a single registered image for conference socializing/Y. Zhao, Y. Liu, S. Zhong, K.A. Hua//Expert Systems with Applications. -2015. -Vol. 42(3). -P. 973-979. - DOI: 10.1016/j.eswa.2014.08.016
  • Raudys, S.J. Small sample size effects in statistical pattern recognition: Recommendations for practitioners/S.J. Radys, A.K. Jain//IEEE Transactions on Pattern Analysis and Machine Intelligence. -1991. -Vol. 13, Issue 3. -P. 252-264. - DOI: 10.1109/34.75512
  • Мокеев, В.В. О решении проблемы выборки малого размера при использовании линейного дискриминантного анализа в задачах распознавания лиц/В.В. Мокеев, С.В. Томилов//Бизнес-информатика.-2013. -№1(23). -С. 37-43.
  • Фурсов, В.А. Построение опорных подпространств в задачах распознавания фрактальных изображений/В.А. Фурсов, Е.Ю. Минаев//Информационные технологии и нанотехнологии (ИТНТ-2016). -2016. -С. 530-537.
  • Фурсов, В.А. Адаптивная идентификация по малому числу наблюдений/В.А. Фурсов//Приложение к журналу «Информационные технологии». -2013. -№ 9.-С. 1-32.
  • Лапко, А.В. Непараметрические модели распознавания образов в условиях малых выборок/А.В. Лапко, С.В. Ченцов, В.А. Лапко//Автометрия. -1999.-№ 6.-С. 105-113.
  • Савченко, В.В. Решение проблемы малых выборок на основе информационной теории восприятия речи/В.В. Савченко//Известия высших учебных заведений России. Радиоэлектроника. -2008.-Вып. 5.-С. 33-44.
  • Tan, X. Face recognition from a single image per person: a survey/X. Tan, S. Chen, Z.H. Zhou, F. Zhang//Pattern Recognition.-2006.-Vol. 39, Issue 9.-P. 1725-1745. - DOI: 10.1016/j.patcog.2006.03.013
  • Bertinetto, L. Learning feed-forward one-shot learners/L. Bertinetto, J.F. Henriques, J. Valmadre, P. Torr, A. Vedaldi//Advances in Neural Information Processing Systems 29: Annual Conference on Neural Information Processing Systems 2016. -2016. -P. 523-531.
  • Parkhi, O.M. Deep face recognition/O.M. Parkhi, A. Vedaldi, A. Zisserman//Proceedings of the British Machine Vision. -2015. -P. 6-17.
  • Liu, J. Targeting ultimate accuracy: Face recognition via deep embedding/J. Liu, Y. Deng, C. Huang//arXiv preprint arXiv:1506.07310. -2015.
  • Szegedy, C. Going deeper with convolutions/C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A. Rabinovich//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2015. -P. 1-9. - DOI: 10.1109/CVPR.2015.7298594
  • Russakovsky, O. Imagenet large scale visual recognition challenge/O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A.C. Berg, F.-F. Li//International Journal of Computer Vision. -2015. -Vol. 115(3). -P. 211-252. - DOI: 10.1007/s11263-015-0816-y
  • Taigman, Y. DeepFace: Closing the gap to human-level performance in face verification/Y. Taigman, M. Yang, M. Ranzato, L. Wolf//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2014. -P. 1701-1708. - DOI: 10.1109/CVPR.2014.220
  • Savchenko, A.V. Maximum-likelihood approximate nearest neighbor method in real-time image recognition/A.V. Savchenko//Pattern Recognition. -2017. -Vol. 61. -P. 459-469. - DOI: 10.1016/j.patcog.2016.08.015
  • Савченко, А.В. Метод максимально правдоподобного перебора в задаче классификации кусочно-однородных объектов/А.В. Савченко//Автоматика и телемеханика.-2016.-№ 3.-С. 99-108. -ISSN 0005-2310.
  • Savchenko, A.V. Statistical testing of segment homogeneity in classification of piecewise-regular objects/A.V. Savchenko, N.S. Belova//International Journal of Applied Mathematics and Computer Science. -2015. -Vol. 25(4). -P. 915-925. - DOI: 10.1515/amcs-2015-0065
  • Dalal, N. Histograms of oriented gradients for human detection/N. Dalal, B. Triggs//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2005. -P. 886-893. - DOI: 10.1109/CVPR.2005.177
  • Lowe, D. Distinctive image features from scale-invariant keypoints/D. Lowe//International Journal of Computer Vision. -2004. -Vol. 60(2). -P. 91-110. - DOI: 10.1023/B:VISI.0000029664.99615.94
  • Ahonen, T. Face recognition with local binary patterns/T. Ahonen, A. Hadid, M. Pietikainen//Proceedings of the European Conference on Computer Vision (ECCV 2004). -2004. -P. 469-481. - DOI: 10.1007/978-3-540-24670-1_36
  • Савченко, А.В. Распознавание изображений на основе вероятностной нейронной сети с проверкой однородности/А.В. Савченко//Компьютерная оптика.-2013. -Т. 37, № 2.-С. 254-262.
  • Kullback, S. Information theory and statistics/S. Kullback. -Mineola, New York: Dover Publications, Inc., 1997. -408 p. -ISBN: 978-0-486-69684-7.
  • Burghouts, G.J. The distribution family of similarity distances/G.J. Burghouts, A.W.M. Smeulders, J.-M. Geusebroek//Proceedings of the 20th International Conference on Neural Information Processing Systems (NIPS’07). -2007. -P. 201-208.
  • Best-Rowden, L. Unconstrained face recognition: identifying a person of interest from a media collection/L. Best-Rowden, H. Han, C. Otto, B.F. Klare, A.K. Jain//IEEE Transactions on Information Forensics and Security. -2014. -Vol. 9(12). -P. 2144-2157. - DOI: 10.1109/TIFS.2014.2359577
  • Wolf, L. Face recognition in unconstrained videos with matched background similarity/L. Wolf, T. Hassner, I. Maoz//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2011. -P. 529-534. - DOI: 10.1109/CVPR.2011.5995566
  • Jia, Y. Caffe: Convolutional architecture for fast feature embedding/Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, T. Darrell//Proceedings of the 22nd ACM International Conference on Multimedia (MM’14). -2014. -P. 675-678. - DOI: 10.1145/2647868.2654889
  • Wu, X. A lightened CNN for deep face representation/X. Wu, R. He, Z. Sun//arXiv preprint arXiv:1511.02683v1. -2015.
  • Yi, D. Learning Face Representation from Scratch/D. Yi, Z. Lei, S. Liao, S.Z. Li//arXiv preprint arXiv:1411.7923. -2014.
  • Система распознавания лиц на видео . -URL: https://github.com/HSE-asavchenko/HSE_FaceRec/tree/master/src/caffe_models (дата обращения 01.04.2017).
  • Learned-Miller, E. Labeled faces in the wild: A survey/E. Learned-Miller, G.B. Huang, A. RoyChowdhury, H. Li, G. Hua//In book: Advances in Face Detection and Facial Image Analysis/Ed. by M. Kawulok, M.E. Celebi, B. Smolka. -Springer International Publishing Switzerland, 2016. -P. 189-248. - DOI: 10.1007/978-3-319-25958-1_8
  • Wang, H. Video-based face recognition: a survey/H. Wang, Y. Wang, Y. Cao//World Academy of Science. Engineering and Technologies. -2009. -Vol. 60. -P. 293-302.
Еще
Статья научная