Алгоритмы распознавания рукописных символов на основе построения структурных моделей
Автор: Хаустов Павел Александрович
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений: Распознавание образов
Статья в выпуске: 1 т.41, 2017 года.
Бесплатный доступ
Статья посвящена разработке алгоритмов распознавания рукописных символов на основе построения структурных моделей, существенным преимуществом которых является возможность работы в условиях малого количества эталонных изображений. В том числе был предложен подход к скелетизации бинарного представления изображения символа, основанный на совместном применении алгоритмов Зонга-Суня и Ву-Цая. Эффективность данного подхода к утоньшению бинарного представления символа была подтверждена результатами проведённых экспериментов. Работа содержит подробное описание всех стадий алгоритма построения структурных моделей и описание подходов к оценке степени их схожести. Приведены результаты апробации предложенных алгоритмов. Выполнено сравнение полученных результатов с результатами аналогов, способных функционировать в условиях малого количества эталонных изображений.
Распознавание символов, структурные составляющие, структурные модели, компьютерное зрение, скелетизация, бинаризация
Короткий адрес: https://sciup.org/14059541
IDR: 14059541 | DOI: 10.18287/2412-6179-2017-41-1-67-78
Algorithms for handwritten character recognition based on constructing structural models
The article is devoted to the development of algorithms for handwritten character recognition based on constructing structural models. These algorithms do not require a large number of reference images for the correct functioning. Also, an approach to a thinning of the binary character representation based on the joint use of Zhang-Suen and Wu-Tsai algorithms has been proposed. The effectiveness of the proposed approach is confirmed by the results of experiments. The article includes a detailed description of all steps of the algorithm for constructing structural models. Results of the proposed algorithm's verification are provided, as well as their comparison with other character recognition algorithms. Algorithms that can operate under a limited number of reference images were used for the comparison.
Список литературы Алгоритмы распознавания рукописных символов на основе построения структурных моделей
- Mori, Sh. Historical review of OCR research and development/Sh. Mori, Ch.Y. Suen, K. Yamamoto//Proceedings of the IEEE. -1992. -Vol. 80, Issue 7. -P. 1029-1058. - DOI: 10.1109/5.156468
- Heliński, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines. Technical report/M. Heliński, M. Kmieciak, T. Parkoła. -Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. -24 p.
- Спицын, В.Г. Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума/В.Г. Спицын, Ю.А. Болотова, Н.Х. Фан, Т.Т.Ч. Буй//Компьютерная оптика. -2016. -Т. 40, № 2. -C. 249-257. - DOI: 10.18287/2412-6179-2016-40-2-249-257
- Breuel, T.M. High-performance ocr for printed english and fraktur using LSTM networks/T.M. Breuel, A. UlHasan, M.Al Azawi, F. Shafait//Proceedings of 12th International Conference on Document Analysis and Recognition. -2013. -P. 683-687. - DOI: 10.1109/ICDAR.2013.140
- Jaderberg, M. Reading text in the wild with convolutional neural networks/M. Jaderberg, K. Simonyan, A. Vedaldi, A. Zisserman//International Journal of Computer Vision. -2016. -Vol. 116, Issue 1. -P. 1-20. - DOI: 10.1007/s11263-015-0823-z
- Wang, T. End-to-end text recognition with convolutional neural networks/T. Wang, D.J. Wu, A. Coates, A.Y. Ng//Proceedings of the 21st International Conference on Pattern Recognition. -2012. -P. 3304-3308.
- Lotfi, M. Combining wavelet transforms and neural networks for image classification/M. Lotfi, A. Solimani, A. Dargazany, H. Afzal, M. Bandarabadi//41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. -2009. -P. 44-48. - DOI: 10.1109/SSST.2009.4806819
- Wang, P.S.P. An improved structural approach for automated recognition of handprinted characters/P.S.P. Wang, A. Gupta//International Journal of Pattern Recognition and Artificial Intelligence. -1991. -Vol. 05, Issue 01n02. -P. 97-121. - DOI: 10.1142/S0218001491000089
- Otsu, N. A Threshold Selection Method From Gray-level Histograms./N. Otsu//IEEE Transactions on Systems, Man, and Cybernetics. -1979. -Vol. SMC-9(1). -P. 62-66.
- Widiarti, A.R. Comparing Hilditch, Rosenfeld, Zhang-Suen, and Nagendraprasad-Wang-Gupta Thinning/A.R. Widiarti//International Journal of Computer, Electrical, Automation, Control and Information Engineering -2011 -Vol. 5(6). -P. 20-24.
- Zhang, T.Y. A Fast Parallel Algorithm for Thinning Digital Patterns/T.Y. Zhang, C.Y. Suen//Communications of the ACM. -1984. -Vol. 27, Issue 3. -P. 236-239. - DOI: 10.1145/357994.358023
- Wu, R.-Y. A new one-pass parallel thinning algorithm for binary images/R.-Y. Wu, W.-H. Tsai//Pattern Recognition Letters. -1992. -Vol. 13, Issue 10. -P. 715-723. - DOI: 10.1016/0167-8655(92)90101-5
- Lee, C.Y. An Algorithm for Path Connections and Its Applications./C.Y. Lee//IRE Transactions on Electronic Computers. -1961. -Vol. EC-10, Issue 3. -P. 346-365. - DOI: 10.1109/TEC.1961.5219222
- Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений/И.С. Градштейн, И.М. Рыжик. -4-е изд. -М.: Наука, 1963 -1108 с.
- Кристофидес, Н. Теория графов. Алгоритмический подход/Н. Кристофидес. -Пер. с англ. -М.: Мир, 1978. -432 с.
- Хаустов, П.А. Генетический алгоритм поиска множества кривых для оптического распознавания символов с использованием метода пересечений/П.А. Хаустов, В.Г. Спицын, Е.И. Максимова//Современные проблемы науки и образования. -2014. -№ 6.
- Vapnik, V.N. Support Vector Networks/V. Vapnik, C. Cortes//Machine Learning. -1995. -№ 20(3). -P. 273-297. - DOI: 10.1023/A:1022627411411
- Хаустов, П.А. Разработка системы оптического распознавания символов на основе совместного применения вероятностной нейронной сети и вейвлет-преобразования/П.А. Хаустов, Д.С. Григорьев, В.Г. Спицын//Известия Томского политехнического университета. -2013 -Т. 323, № 5. -C. 101-105.
- LeCun, Y. Gradient-Based Learning Applied to Document Recognition/Y. LeCun, L. Bottou, Y. Bengio, P. Haffner//Proceedings of the IEEE. -1998. -Vol. 86, Issue 11. -P. 2278-2324. - DOI: 10.1109/5.726791