Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей
Автор: Савченко Андрей Валентинович
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений, распознавание образов
Статья в выпуске: 3 т.41, 2017 года.
Бесплатный доступ
Исследована задача распознавания изображений в условиях малых выборок наблюдений на основе метода ближайшего соседа, в котором сопоставляются векторы признаков высокой размерности, выделенные с помощью глубокой свёрточной нейронной сети. Предложен новый алгоритм распознавания на основе метода максимального правдоподобия (совместной плотности вероятности) рассогласований между входным и всеми эталонными изображениями. Для оценки правдоподобия используется известное асимптотически нормальное распределение рассогласования Йенсена-Шеннона между векторами значений признаков изображений, что согласовывается с известными экспериментальными оценками закона распределения мер близости между векторами высокой размерности. В рамках экспериментального исследования для базы данных фотографий лиц Labeled Faces in the Wild и набора видеоданных YouTube Faces показано, что предлагаемый алгоритм позволяет на 1-5 % повысить точность распознавания изображений и видеопоследовательностей по сравнению с традиционными методами классификации.
Статистическое распознавание образов, обработка изображений, глубокие свёрточные нейронные сети, метод максимально правдоподобного перебора, распознавание лиц
Короткий адрес: https://sciup.org/140228780
IDR: 140228780 | DOI: 10.18287/2412-6179-2017-41-3-422-430
Maximum-likelihood dissimilarities in image recognition with deep neural networks
In this paper we focus on the image recognition problem in the case of a small sample size based on the nearest neighbor rule and matching high-dimensional feature vectors extracted with a deep convolutional neural network. We propose a novel recognition algorithm based on the maximum likelihood method for the joint density of dissimilarities between the observed image and available instances in a training set. This likelihood is estimated using the known asymptotically normally distribution of the Jensen-Shannon divergence between image features, if the latter can be treated as probability density estimates. This asymptotic behavior is in agreement with the well-known experimental estimates of the distributions of dissimilarity distances between the high-dimensional vectors. The experimental study in unconstrained face recognition for the LFW (Labeled Faces in the Wild) and YTF (YouTube Faces) datasets demonstrated that the proposed approach makes it possible to increase the recognition accuracy by 1-5% when compared with conventional classifiers.
Список литературы Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей
- LeCun, Y. Deep learning/Y. LeCun, Y. Bengio, G. Hinton//Nature. -2015. -Vol. 521(7553). -P. 436-444. - DOI: 10.1038/nature14539
- Prince, S.J. Computer vision: models, learning, and inference/S.J. Prince. -New York: Cambridge University Press, 2012. -598 p. -ISBN: 978-1-107-01179-3.
- Goodfellow, I. Deep learning (Adaptive computation and machine learning series)/I. Goodfellow, Y. Bengio, A. Courville. -Cambridge, London: MIT Press, 2016. -800 p. -ISBN: 978-0-262-03561-3.
- Savchenko, A.V. Search techniques in intelligent classification systems/A.V. Savchenko. -Switzerland: Springer In-ternational Publishing, 2016. -83 p. -ISBN 978-3-319-30513-4.
- Zhao, Y. Face recognition from a single registered image for conference socializing/Y. Zhao, Y. Liu, S. Zhong, K.A. Hua//Expert Systems with Applications. -2015. -Vol. 42(3). -P. 973-979. - DOI: 10.1016/j.eswa.2014.08.016
- Raudys, S.J. Small sample size effects in statistical pattern recognition: Recommendations for practitioners/S.J. Radys, A.K. Jain//IEEE Transactions on Pattern Analysis and Machine Intelligence. -1991. -Vol. 13, Issue 3. -P. 252-264. - DOI: 10.1109/34.75512
- Мокеев, В.В. О решении проблемы выборки малого размера при использовании линейного дискриминантного анализа в задачах распознавания лиц/В.В. Мокеев, С.В. Томилов//Бизнес-информатика.-2013. -№1(23). -С. 37-43.
- Фурсов, В.А. Построение опорных подпространств в задачах распознавания фрактальных изображений/В.А. Фурсов, Е.Ю. Минаев//Информационные технологии и нанотехнологии (ИТНТ-2016). -2016. -С. 530-537.
- Фурсов, В.А. Адаптивная идентификация по малому числу наблюдений/В.А. Фурсов//Приложение к журналу «Информационные технологии». -2013. -№ 9.-С. 1-32.
- Лапко, А.В. Непараметрические модели распознавания образов в условиях малых выборок/А.В. Лапко, С.В. Ченцов, В.А. Лапко//Автометрия. -1999.-№ 6.-С. 105-113.
- Савченко, В.В. Решение проблемы малых выборок на основе информационной теории восприятия речи/В.В. Савченко//Известия высших учебных заведений России. Радиоэлектроника. -2008.-Вып. 5.-С. 33-44.
- Tan, X. Face recognition from a single image per person: a survey/X. Tan, S. Chen, Z.H. Zhou, F. Zhang//Pattern Recognition.-2006.-Vol. 39, Issue 9.-P. 1725-1745. - DOI: 10.1016/j.patcog.2006.03.013
- Bertinetto, L. Learning feed-forward one-shot learners/L. Bertinetto, J.F. Henriques, J. Valmadre, P. Torr, A. Vedaldi//Advances in Neural Information Processing Systems 29: Annual Conference on Neural Information Processing Systems 2016. -2016. -P. 523-531.
- Parkhi, O.M. Deep face recognition/O.M. Parkhi, A. Vedaldi, A. Zisserman//Proceedings of the British Machine Vision. -2015. -P. 6-17.
- Liu, J. Targeting ultimate accuracy: Face recognition via deep embedding/J. Liu, Y. Deng, C. Huang//arXiv preprint arXiv:1506.07310. -2015.
- Szegedy, C. Going deeper with convolutions/C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A. Rabinovich//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2015. -P. 1-9. - DOI: 10.1109/CVPR.2015.7298594
- Russakovsky, O. Imagenet large scale visual recognition challenge/O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A.C. Berg, F.-F. Li//International Journal of Computer Vision. -2015. -Vol. 115(3). -P. 211-252. - DOI: 10.1007/s11263-015-0816-y
- Taigman, Y. DeepFace: Closing the gap to human-level performance in face verification/Y. Taigman, M. Yang, M. Ranzato, L. Wolf//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2014. -P. 1701-1708. - DOI: 10.1109/CVPR.2014.220
- Savchenko, A.V. Maximum-likelihood approximate nearest neighbor method in real-time image recognition/A.V. Savchenko//Pattern Recognition. -2017. -Vol. 61. -P. 459-469. - DOI: 10.1016/j.patcog.2016.08.015
- Савченко, А.В. Метод максимально правдоподобного перебора в задаче классификации кусочно-однородных объектов/А.В. Савченко//Автоматика и телемеханика.-2016.-№ 3.-С. 99-108. -ISSN 0005-2310.
- Savchenko, A.V. Statistical testing of segment homogeneity in classification of piecewise-regular objects/A.V. Savchenko, N.S. Belova//International Journal of Applied Mathematics and Computer Science. -2015. -Vol. 25(4). -P. 915-925. - DOI: 10.1515/amcs-2015-0065
- Dalal, N. Histograms of oriented gradients for human detection/N. Dalal, B. Triggs//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2005. -P. 886-893. - DOI: 10.1109/CVPR.2005.177
- Lowe, D. Distinctive image features from scale-invariant keypoints/D. Lowe//International Journal of Computer Vision. -2004. -Vol. 60(2). -P. 91-110. - DOI: 10.1023/B:VISI.0000029664.99615.94
- Ahonen, T. Face recognition with local binary patterns/T. Ahonen, A. Hadid, M. Pietikainen//Proceedings of the European Conference on Computer Vision (ECCV 2004). -2004. -P. 469-481. - DOI: 10.1007/978-3-540-24670-1_36
- Савченко, А.В. Распознавание изображений на основе вероятностной нейронной сети с проверкой однородности/А.В. Савченко//Компьютерная оптика.-2013. -Т. 37, № 2.-С. 254-262.
- Kullback, S. Information theory and statistics/S. Kullback. -Mineola, New York: Dover Publications, Inc., 1997. -408 p. -ISBN: 978-0-486-69684-7.
- Burghouts, G.J. The distribution family of similarity distances/G.J. Burghouts, A.W.M. Smeulders, J.-M. Geusebroek//Proceedings of the 20th International Conference on Neural Information Processing Systems (NIPS’07). -2007. -P. 201-208.
- Best-Rowden, L. Unconstrained face recognition: identifying a person of interest from a media collection/L. Best-Rowden, H. Han, C. Otto, B.F. Klare, A.K. Jain//IEEE Transactions on Information Forensics and Security. -2014. -Vol. 9(12). -P. 2144-2157. - DOI: 10.1109/TIFS.2014.2359577
- Wolf, L. Face recognition in unconstrained videos with matched background similarity/L. Wolf, T. Hassner, I. Maoz//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). -2011. -P. 529-534. - DOI: 10.1109/CVPR.2011.5995566
- Jia, Y. Caffe: Convolutional architecture for fast feature embedding/Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, T. Darrell//Proceedings of the 22nd ACM International Conference on Multimedia (MM’14). -2014. -P. 675-678. - DOI: 10.1145/2647868.2654889
- Wu, X. A lightened CNN for deep face representation/X. Wu, R. He, Z. Sun//arXiv preprint arXiv:1511.02683v1. -2015.
- Yi, D. Learning Face Representation from Scratch/D. Yi, Z. Lei, S. Liao, S.Z. Li//arXiv preprint arXiv:1411.7923. -2014.
- Система распознавания лиц на видео . -URL: https://github.com/HSE-asavchenko/HSE_FaceRec/tree/master/src/caffe_models (дата обращения 01.04.2017).
- Learned-Miller, E. Labeled faces in the wild: A survey/E. Learned-Miller, G.B. Huang, A. RoyChowdhury, H. Li, G. Hua//In book: Advances in Face Detection and Facial Image Analysis/Ed. by M. Kawulok, M.E. Celebi, B. Smolka. -Springer International Publishing Switzerland, 2016. -P. 189-248. - DOI: 10.1007/978-3-319-25958-1_8
- Wang, H. Video-based face recognition: a survey/H. Wang, Y. Wang, Y. Cao//World Academy of Science. Engineering and Technologies. -2009. -Vol. 60. -P. 293-302.