Алгоритмы распознавания рукописных символов на основе построения структурных моделей
Автор: Хаустов Павел Александрович
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений: Распознавание образов
Статья в выпуске: 1 т.41, 2017 года.
Бесплатный доступ
Статья посвящена разработке алгоритмов распознавания рукописных символов на основе построения структурных моделей, существенным преимуществом которых является возможность работы в условиях малого количества эталонных изображений. В том числе был предложен подход к скелетизации бинарного представления изображения символа, основанный на совместном применении алгоритмов Зонга-Суня и Ву-Цая. Эффективность данного подхода к утоньшению бинарного представления символа была подтверждена результатами проведённых экспериментов. Работа содержит подробное описание всех стадий алгоритма построения структурных моделей и описание подходов к оценке степени их схожести. Приведены результаты апробации предложенных алгоритмов. Выполнено сравнение полученных результатов с результатами аналогов, способных функционировать в условиях малого количества эталонных изображений.
Распознавание символов, структурные составляющие, структурные модели, компьютерное зрение, скелетизация, бинаризация
Короткий адрес: https://sciup.org/14059541
IDR: 14059541 | DOI: 10.18287/2412-6179-2017-41-1-67-78
Список литературы Алгоритмы распознавания рукописных символов на основе построения структурных моделей
- Mori, Sh. Historical review of OCR research and development/Sh. Mori, Ch.Y. Suen, K. Yamamoto//Proceedings of the IEEE. -1992. -Vol. 80, Issue 7. -P. 1029-1058. - DOI: 10.1109/5.156468
- Heliński, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines. Technical report/M. Heliński, M. Kmieciak, T. Parkoła. -Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. -24 p.
- Спицын, В.Г. Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума/В.Г. Спицын, Ю.А. Болотова, Н.Х. Фан, Т.Т.Ч. Буй//Компьютерная оптика. -2016. -Т. 40, № 2. -C. 249-257. - DOI: 10.18287/2412-6179-2016-40-2-249-257
- Breuel, T.M. High-performance ocr for printed english and fraktur using LSTM networks/T.M. Breuel, A. UlHasan, M.Al Azawi, F. Shafait//Proceedings of 12th International Conference on Document Analysis and Recognition. -2013. -P. 683-687. - DOI: 10.1109/ICDAR.2013.140
- Jaderberg, M. Reading text in the wild with convolutional neural networks/M. Jaderberg, K. Simonyan, A. Vedaldi, A. Zisserman//International Journal of Computer Vision. -2016. -Vol. 116, Issue 1. -P. 1-20. - DOI: 10.1007/s11263-015-0823-z
- Wang, T. End-to-end text recognition with convolutional neural networks/T. Wang, D.J. Wu, A. Coates, A.Y. Ng//Proceedings of the 21st International Conference on Pattern Recognition. -2012. -P. 3304-3308.
- Lotfi, M. Combining wavelet transforms and neural networks for image classification/M. Lotfi, A. Solimani, A. Dargazany, H. Afzal, M. Bandarabadi//41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. -2009. -P. 44-48. - DOI: 10.1109/SSST.2009.4806819
- Wang, P.S.P. An improved structural approach for automated recognition of handprinted characters/P.S.P. Wang, A. Gupta//International Journal of Pattern Recognition and Artificial Intelligence. -1991. -Vol. 05, Issue 01n02. -P. 97-121. - DOI: 10.1142/S0218001491000089
- Otsu, N. A Threshold Selection Method From Gray-level Histograms./N. Otsu//IEEE Transactions on Systems, Man, and Cybernetics. -1979. -Vol. SMC-9(1). -P. 62-66.
- Widiarti, A.R. Comparing Hilditch, Rosenfeld, Zhang-Suen, and Nagendraprasad-Wang-Gupta Thinning/A.R. Widiarti//International Journal of Computer, Electrical, Automation, Control and Information Engineering -2011 -Vol. 5(6). -P. 20-24.
- Zhang, T.Y. A Fast Parallel Algorithm for Thinning Digital Patterns/T.Y. Zhang, C.Y. Suen//Communications of the ACM. -1984. -Vol. 27, Issue 3. -P. 236-239. - DOI: 10.1145/357994.358023
- Wu, R.-Y. A new one-pass parallel thinning algorithm for binary images/R.-Y. Wu, W.-H. Tsai//Pattern Recognition Letters. -1992. -Vol. 13, Issue 10. -P. 715-723. - DOI: 10.1016/0167-8655(92)90101-5
- Lee, C.Y. An Algorithm for Path Connections and Its Applications./C.Y. Lee//IRE Transactions on Electronic Computers. -1961. -Vol. EC-10, Issue 3. -P. 346-365. - DOI: 10.1109/TEC.1961.5219222
- Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений/И.С. Градштейн, И.М. Рыжик. -4-е изд. -М.: Наука, 1963 -1108 с.
- Кристофидес, Н. Теория графов. Алгоритмический подход/Н. Кристофидес. -Пер. с англ. -М.: Мир, 1978. -432 с.
- Хаустов, П.А. Генетический алгоритм поиска множества кривых для оптического распознавания символов с использованием метода пересечений/П.А. Хаустов, В.Г. Спицын, Е.И. Максимова//Современные проблемы науки и образования. -2014. -№ 6.
- Vapnik, V.N. Support Vector Networks/V. Vapnik, C. Cortes//Machine Learning. -1995. -№ 20(3). -P. 273-297. - DOI: 10.1023/A:1022627411411
- Хаустов, П.А. Разработка системы оптического распознавания символов на основе совместного применения вероятностной нейронной сети и вейвлет-преобразования/П.А. Хаустов, Д.С. Григорьев, В.Г. Спицын//Известия Томского политехнического университета. -2013 -Т. 323, № 5. -C. 101-105.
- LeCun, Y. Gradient-Based Learning Applied to Document Recognition/Y. LeCun, L. Bottou, Y. Bengio, P. Haffner//Proceedings of the IEEE. -1998. -Vol. 86, Issue 11. -P. 2278-2324. - DOI: 10.1109/5.726791