Экспериментальное сравнение алгоритмов классификации символов в стенографических документах

Автор: Гиппиев Михаил Борисович, Рогов Александр Александрович

Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu

Рубрика: Физико-математические науки

Статья в выпуске: 4 (149), 2015 года.

Бесплатный доступ

При дешифровке исторических стенографических документов относительное местоположение символа влияет на его значение. Определяют три позиции: основная, надстрочная или подстрочная. В работе приводятся результаты сравнения четырех алгоритмов классификации символов по их положению методом одинарной аппроксимации, методом двойной аппроксимации, методом одинарной аппроксимации с уменьшением ошибки и методом двойной аппроксимации с уменьшением ошибки. Параметры алгоритмов выбирались экспериментально, используя обучающую выборку. Качество работы алгоритмов определяется пятью показателями: корректность, точность, полнота, F-мера и обобщенная F-мера. На основании обобщенной F-меры лучший результат показал алгоритм классификации символов методом двойной аппроксимации с уменьшением ошибки. Кроме того, для каждого алгоритма классификации определены оптимальные настроечные параметры, при которых среднее значение обобщенной F-меры на контрольной выборке является максимальным, и для каждого алгоритма определена длительность его обучения.

Еще

Стенографический документ, алгоритм классификации символов, надстрочные и подстрочные символы, метод аппроксимации

Короткий адрес: https://sciup.org/14750892

IDR: 14750892

Список литературы Экспериментальное сравнение алгоритмов классификации символов в стенографических документах

  • Гиппиев М. Б., Жуков А. В., Рогов А. А., Скабин А. В. Распознавание строк в стенографических документах//Современные проблемы науки и образования. 2013. № 4 . Режим доступа: www.science-education.ru/110-9725
  • Гиппиев М. Б., Рогов А. А. Классификация символов в стенографических документах на основные, надстрочные и подстрочные//Ученые записки Петрозаводского государственного университета. Сер. «Естественные и технические науки». 2014. № 8 (145). Т. 2. С. 115-118.
  • Местецкий Л. М. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. М.: Физматлит, 2009. 227 c.
  • Рогов А. А., Скабин А. В., Штеркель И. А. Автоматизированная информационная система распознавания исторических рукописных документов//Информационная среда ВУЗА XXI века: Материалы VI Междунар. науч. конф. Куопио (Финляндия), 4-10 декабря 2012. Петрозаводск, 2012. С. 127-130.
  • Bar -Yosef I., Hagbi N., Kedem K., Dinstein I. Line segmentation for de-graded handwritten historical documents//Proceedings of the 2009 International Conference on Document Analysis and Recognition (ICDAR). 2009. P. 1161-1165.
  • Du X., Pan W., Bui T. D. Text line segmentation in handwritten documents using Mumford-Shah model//Online Conference Proceedings for the 11th International Conference on Frontiers in Handwriting Recognition. 2008. Available at: http://www.iapr-tc11.org/archive/icfhr2008/Proceedings/papers/cr1132.pdf
  • Gao Y., Ding X., Liu C. A multi-scale text line segmentation method in freestyle handwritten documents//Proceedings of the 2011 International Conference on Document Analysis and Recognition (ICDAR). 2011. P. 643-647.
  • Katsouros V., Papavassiliou V. Segmentation of handwritten document images into text lines//Image Segmentation. 2011. Available at: http://www.intechopen.com/books/image-segmentation/segmentation-of-handwritten-document-images-into-text-lines
  • Likforman-Sulem L., Zahour A., Taconet B. Text line segmentation of historical documents: a survey//International Journal of Document Analysis and Recognition (IJDAR). 2007. Vol. 9 (2-4). P. 123-138.
  • Papavassiliou V., Stafylakis T., Katsouros V., Carayannis G. Handwritten document image segmentation into text lines and words//Pattern Recognition. 2010. Vol. 43 (1). P. 369-377.
  • Yin F., Liu C.-L. Handwritten text line segmentation by clustering with distance metric learning//Online Conference Proceedings for the 11th International Conference on Frontiers in Handwriting Recognition. 2008. Available at: http://www. iapr-tc11.org/archive/icfhr2008/Proceedings/papers/cr1022.pdf
Еще
Статья научная