Бинаризация и выделение символов исторической стенограммы

Автор: Скабин Артем Викторович, Рогов Александр Александрович

Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu

Рубрика: Физико-математические науки

Статья в выпуске: 4 (133), 2013 года.

Бесплатный доступ

Рассматривается проблема бинаризации исторических рукописных документов с целью выделения графики символов. От точности и правильности бинаризации текста зависит правильность результата дешифровки исторического документа. В качестве объекта взяты исторические стенограммы XIX века. Проводится анализ различных методов бинаризации (методы Отсу, Бернсена, Эйквиля, Ниблэка, разнообразные пороговые методы). Проведенное исследование выявило, что предлагаемый модифицированный пороговый метод показал лучший результат на основании F-меры. Данный метод применен в программном комплексе для получения оригинальной графики символов. При помощи разработанного программного комплекса были разобраны 29 листов стенограмм. На них было выделено более 6800 график символов.

Еще

Методы бинаризации, исторические рукописные документы, стенограммы

Короткий адрес: https://sciup.org/14750422

IDR: 14750422

Список литературы Бинаризация и выделение символов исторической стенограммы

  • Горский Н., Анисимов В., Горская Л. Распознавание рукописного текста: от теории к практике. СПб.: Политехника, 1997. 126 с.
  • Маннинг К. Д., Рагхаван П., Шютце Х. Введение в информационный поиск: Пер. с англ. М.: ООО «И. Д. Вильямс», 2011. 528 с.
  • Порев В. Н. Компьютерная графика. СПб.: БХВ-Петербург, 2002. 432 с.
  • Рогов А. А., Скабин А. В., Штеркель И. А. О дешифровке исторических рукописных документов//Информационные технологии и письменное наследие El’Manuscript 2012: Материалы IV Междунар. науч. конф. Петрозаводск, 3-8 сентября 2012. Петрозаводск, 2012. С. 230-233.
  • Талбонен А. Н., Рогов А. А. Анализ машинописных подписей к фотографиям в цифровом историческом альбоме//Ученые записки Петрозаводского государственного университета. Сер. «Естественные и технические науки». 2012. № 2 (123). С. 109-113.
  • Belongie S., Malik J., Puzicha J. Shape matching and object recognition using shape contexts//IEEE Transactions on Pattern Analysis and Machine Intelligence. 2002. Vol. 24. № 4. P. 509-522.
  • Bernsen J. Dynamic thresholding of grey-level images//Proc. 8th International Conference on Pattern Recognition (ICPR8). Paris, 1986. P. 1251-1255.
  • Eikvil L., Taxt T., Moen K. A fast adaptive method for binarization of document images//Proc. 1st Int. Conf. Document Analysis and Recognition. Saint-Malo, 1991. P. 435-443.
  • Niblack W. An Introduction to Digital Image Processing. Englewood Cliffs, N. J.: Prentice Hall, 1986. P. 115-116.
  • Otsu N. A threshold selection method from gray-level histograms//IEEE Transactions on Systems, Man, and Cybernetics. 1979. Vol. SMC-9. P. 62-66.
Еще
Статья научная