Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума
Автор: Спицын Владимир Григорьевич, Болотова Юлия Александровна, Фан Нгок Хоанг, Буй Тхи Тху Чанг
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений: Восстановление изображений, выявление признаков, распознавание образов
Статья в выпуске: 2 т.40, 2016 года.
Бесплатный доступ
В работе предложен новый алгоритм распознавания символов в условиях импульсного шума на основе применения вейвлет-преобразования, метода главных компонент и нейронных сетей. В предлагаемом алгоритме для устранения шума и извлечения признаков из исходного изображения и его отдельных частей с помощью вейвлет-преобразования Хаара выделяются низкочастотные компоненты. Сокращение размерности извлечённых признаков осуществляется методом главных компонент. В качестве классификатора используется многослойная нейронная сеть, на входы которой подаётся сокращённый набор признаков. Одной из ключевых особенностей предлагаемого подхода является создание отдельной нейронной сети для каждого типа символа. Результаты экспериментов показывают, что разработанный алгоритм сравним по точности распознавания с системами ABBYY FineReader и Tesseract в условиях импульсного шума.
Распознавание символов, вейвлет-преобразование, метод главных компонент, нейронные сети
Короткий адрес: https://sciup.org/14059460
IDR: 14059460 | DOI: 10.18287/2412-6179-2016-40-2-249-257
Список литературы Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума
- Bolotova, Yu.A. License plate recognition with hierarchical temporal memory model/Yu.A. Bolotova, A.A. Druki, V.G. Spitsyn. -In: Proceedings of 9th International Forum on Strategic Technology (IFOST-2014), Chittagong, October 21-23, 2014. -Chittagong: CUET, 2014. -P. 121-124.
- Болотова, Ю.А. Распознавание автомобильных номеров на основе метода связных компонент и иерархической временной сети/Ю.А. Болотова, В.Г. Спицын, М.Н. Рудомёткина//Компьютерная оптика. -2015. -Т. 39, № 2. -С. 275-280.
- Болотова, Ю.А. Распознавание символов на цветном фоне на основе иерархической временной модели с предобработкой фильтрами Габора/Ю.А. Болотова, А.К. Кермани, В.Г. Спицын//Электромагнитные волны и электронные системы. -2012. -Т. 16, № 8.-С. 14-19.
- Казанский, Н.Л. Распределённая система технического зрения регистрации железнодорожных составов/Н.Л. Казанский, С.Б. Попов//Компьютерная оптика. -2012. -Т. 36, № 3.-С. 419-428.
- Изотов, П.Ю. Технология реализации нейросетевого алгоритма в среде CUDA на примере распознавания рукописных цифр/П.Ю. Изотов, С.В. Суханов, Д.Л. Головашкин//Компьютерная оптика. -2010. -Т. 34, № 2.-С. 243-251.
- Breuel, T.M. High-Performance OCR for Printed English and Fraktur using LSTM Networks/T.M. Breuel, A. Ul-Hasan, M.Al Azawi, F. Shafait//Proceedings of 12th International Conference on Document Analysis and Recognition. -2013. -P. 683-687.
- Heliński, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines/M. Heliński, M. Kmieciak, T. Parkoła. -Technical report. -Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. -24 p.
- Mori, Sh. Historical review of OCR research and development/Sh. Mori, Ch.Y. Suen, K. Yamamoto//Proceedings of the IEEE. -1992. -Vol. 80, Issue 7. -P. 1029-1058.
- Smith, R. An overview of the Tesseract OCR Engine/R. Smith//Proceedings of 9th International Conference on Document Analysis and Recognition (ICDAR2007). -2007. -Volume II. -P. 629-633.
- Крупин, А. ABBYFineReader: взгляд изнутри /А. Крупин. -URL: http://www.3dnews.ru/software/632560/.
- Breuel, T.M. The OCRopus Open Source OCR System Tech/T.M. Breuel//Proceedings of SPIE. -2008. -Vol. 6815. -68150F. - DOI: 10.1117/12.783598
- Mehdi, L. Combining wavelet transforms and neural networks for image classification/L. Mehdi, A. Solimani, A. Dargazany. -In: 41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. -Tullahoma, TN, USA: 2009. -P. 44-48.
- Буй, Т.Т.Ч. Распознавание лиц на основе применения метода Виолы-Джонса, вейвлет-преобразования и метода главных компонент/Т.Т.Ч. Буй, Н.Х. Фан, В.Г. Спицын//Известия Томского политехнического университета. -2011. -Т. 320, № 5. -С. 54-59.
- Turk, M.A. Face Recognition Using Eigenfaces/M.A. Turk, A.P. Pentland//Proceedings of the IEEE. -1991. -P. 586-591.
- Лукьяница, А.А. Цифровая обработка видеоизображений/А.А. Лукьяница, А.Г. Шишкин. -М.: Ай-Эс-Эс Пресс, 2009. -518 с.
- Спицын, В.Г. Интеллектуальные системы: учебное пособие/В.Г. Спицын, Ю.Р. Цой. -Томск: Изд-во Томского политехнического университета, 2012. -176 с.
- Хайкин, С. Нейронные сети. Полный курс:/С. Хайкин; пер. с англ. -2-е изд. -М.: Издательский дом «Вильямс», 2006. -1104 с.
- LeCun, Y. Gradient based learning applied to document recognition/Y. LeCun, L. Bottou, Y. Bengio, P. Haffner//Proceedings of the IEEE. -1998. -Vol. 86, Issue 11. -P. 2278-2324.
- LeCun, Y. Convolutional networks and applications in vision/Y. LeCun, K. Kavukcuoglu, C. Farabet.//International Symposium on Circuits and Systems. -Paris: 2010. -P. 253-256.
- Bolotova, Yu.A. Analysis of hierarchically-temporal dependencies for handwritten symbols and gesture recognition/Yu.A. Bolotova, V.G. Spitsyn//7th International Forum on Strategic Technology (IFOST-2012), Tomsk. -2012. -Vol. 1. -P. 596-601.