Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума

Спицын Владимир Григорьевич; Болотова Юлия Александровна; Фан Нгок Хоанг; Буй Тхи Тху Чанг; Spitsyn Vladimir Grigorievich; Bolotova Yuliya Alexandrovna; Phan Ngoc Hoang; Bui Thi Thu Trang

doi:10.18287/2412-6179-2016-40-2-249-257

Научные статьи \ Общие вопросы науки и культуры \ Информационные технологии. Вычислительная техника. Обработка данных \ Прикладные информационные (компьютерные) технологии. Методы основанные на применении компьютеров

Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума

Автор: Спицын Владимир Григорьевич, Болотова Юлия Александровна, Фан Нгок Хоанг, Буй Тхи Тху Чанг

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений: Восстановление изображений, выявление признаков, распознавание образов

Статья в выпуске: 2 т.40, 2016 года.

Бесплатный доступ

В работе предложен новый алгоритм распознавания символов в условиях импульсного шума на основе применения вейвлет-преобразования, метода главных компонент и нейронных сетей. В предлагаемом алгоритме для устранения шума и извлечения признаков из исходного изображения и его отдельных частей с помощью вейвлет-преобразования Хаара выделяются низкочастотные компоненты. Сокращение размерности извлечённых признаков осуществляется методом главных компонент. В качестве классификатора используется многослойная нейронная сеть, на входы которой подаётся сокращённый набор признаков. Одной из ключевых особенностей предлагаемого подхода является создание отдельной нейронной сети для каждого типа символа. Результаты экспериментов показывают, что разработанный алгоритм сравним по точности распознавания с системами ABBYY FineReader и Tesseract в условиях импульсного шума.

Распознавание символов, вейвлет-преобразование, метод главных компонент, нейронные сети

Короткий адрес: https://sciup.org/14059460

IDR: 14059460 | DOI: 10.18287/2412-6179-2016-40-2-249-257

Using a Haar wavelet transform, principal component analysis and neural networks for OCR in the presence of impulse noise

In this paper we propose a novel algorithm for optical character recognition in the presence of impulse noise by applying a wavelet transform, principal component analysis, and neural networks. In the proposed algorithm, the Haar wavelet transform is used for low frequency components allocation, noise elimination and feature extraction. The principal component analysis is used to reduce the dimension of the extracted features. We use a set of different multi-layer neural networks as classifiers for each character; the inputs are represented by a reduced set of features. One of the key features of the proposed approach is creating a separate neural network for each type of character. The experimental results show that the proposed algorithm can effectively recognize the characters in images in the presence of impulse noise; the results are comparable with ABBYY FineReader and Tesseract OCR.

Список литературы Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума

Bolotova, Yu.A. License plate recognition with hierarchical temporal memory model/Yu.A. Bolotova, A.A. Druki, V.G. Spitsyn. -In: Proceedings of 9th International Forum on Strategic Technology (IFOST-2014), Chittagong, October 21-23, 2014. -Chittagong: CUET, 2014. -P. 121-124.
Болотова, Ю.А. Распознавание автомобильных номеров на основе метода связных компонент и иерархической временной сети/Ю.А. Болотова, В.Г. Спицын, М.Н. Рудомёткина//Компьютерная оптика. -2015. -Т. 39, № 2. -С. 275-280.
Болотова, Ю.А. Распознавание символов на цветном фоне на основе иерархической временной модели с предобработкой фильтрами Габора/Ю.А. Болотова, А.К. Кермани, В.Г. Спицын//Электромагнитные волны и электронные системы. -2012. -Т. 16, № 8.-С. 14-19.
Казанский, Н.Л. Распределённая система технического зрения регистрации железнодорожных составов/Н.Л. Казанский, С.Б. Попов//Компьютерная оптика. -2012. -Т. 36, № 3.-С. 419-428.
Изотов, П.Ю. Технология реализации нейросетевого алгоритма в среде CUDA на примере распознавания рукописных цифр/П.Ю. Изотов, С.В. Суханов, Д.Л. Головашкин//Компьютерная оптика. -2010. -Т. 34, № 2.-С. 243-251.
Breuel, T.M. High-Performance OCR for Printed English and Fraktur using LSTM Networks/T.M. Breuel, A. Ul-Hasan, M.Al Azawi, F. Shafait//Proceedings of 12th International Conference on Document Analysis and Recognition. -2013. -P. 683-687.
Heliński, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines/M. Heliński, M. Kmieciak, T. Parkoła. -Technical report. -Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. -24 p.
Mori, Sh. Historical review of OCR research and development/Sh. Mori, Ch.Y. Suen, K. Yamamoto//Proceedings of the IEEE. -1992. -Vol. 80, Issue 7. -P. 1029-1058.
Smith, R. An overview of the Tesseract OCR Engine/R. Smith//Proceedings of 9th International Conference on Document Analysis and Recognition (ICDAR2007). -2007. -Volume II. -P. 629-633.
Крупин, А. ABBYFineReader: взгляд изнутри /А. Крупин. -URL: http://www.3dnews.ru/software/632560/.
Breuel, T.M. The OCRopus Open Source OCR System Tech/T.M. Breuel//Proceedings of SPIE. -2008. -Vol. 6815. -68150F. - DOI: 10.1117/12.783598
Mehdi, L. Combining wavelet transforms and neural networks for image classification/L. Mehdi, A. Solimani, A. Dargazany. -In: 41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. -Tullahoma, TN, USA: 2009. -P. 44-48.
Буй, Т.Т.Ч. Распознавание лиц на основе применения метода Виолы-Джонса, вейвлет-преобразования и метода главных компонент/Т.Т.Ч. Буй, Н.Х. Фан, В.Г. Спицын//Известия Томского политехнического университета. -2011. -Т. 320, № 5. -С. 54-59.
Turk, M.A. Face Recognition Using Eigenfaces/M.A. Turk, A.P. Pentland//Proceedings of the IEEE. -1991. -P. 586-591.
Лукьяница, А.А. Цифровая обработка видеоизображений/А.А. Лукьяница, А.Г. Шишкин. -М.: Ай-Эс-Эс Пресс, 2009. -518 с.
Спицын, В.Г. Интеллектуальные системы: учебное пособие/В.Г. Спицын, Ю.Р. Цой. -Томск: Изд-во Томского политехнического университета, 2012. -176 с.
Хайкин, С. Нейронные сети. Полный курс:/С. Хайкин; пер. с англ. -2-е изд. -М.: Издательский дом «Вильямс», 2006. -1104 с.
LeCun, Y. Gradient based learning applied to document recognition/Y. LeCun, L. Bottou, Y. Bengio, P. Haffner//Proceedings of the IEEE. -1998. -Vol. 86, Issue 11. -P. 2278-2324.
LeCun, Y. Convolutional networks and applications in vision/Y. LeCun, K. Kavukcuoglu, C. Farabet.//International Symposium on Circuits and Systems. -Paris: 2010. -P. 253-256.
Bolotova, Yu.A. Analysis of hierarchically-temporal dependencies for handwritten symbols and gesture recognition/Yu.A. Bolotova, V.G. Spitsyn//7th International Forum on Strategic Technology (IFOST-2012), Tomsk. -2012. -Vol. 1. -P. 596-601.

Еще