О прецедентной идентификации фрагментов изображений сканированного рукописного текста

Автор: Жиляков Е.Г., Заливин А.Н., Белов С.П., Черноморец Д.А., Васильева Н.В.

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Технологии компьютерных систем и сетей

Статья в выпуске: 3 т.19, 2021 года.

Бесплатный доступ

В настоящее время накоплены большие хранилища данных, полученных при сканировании рукописных текстов. Существенное место в них занимают сканированные напечатанные документы, которые содержат рукописные подписи должностных лиц. Полученные в процессе сканирования изображения текстов часто подвергаются компьютерному анализу в связи с той или иной необходимостью. Существенный интерес представляет поиск в этих изображениях фрагментов, содержащих заданные словоформы, например в филологии при исследовании частоты использования одним и тем же автором некоторых слов. Можно также указать случаи поиска слов с позиций обеспечения безопасности социально-экономических процессов. Важным примером является обнаружение фальсификаций подписей должностных лиц и т. п. Особенностью автоматического поиска идентичных словных фрагментов на изображениях сканированных документов является возможность их идентификации с использованием только одного образца текста (прецедента), что требует создания специальной методики машинного обучения. В представленной статье разработана решающая процедура отнесения словных фрагментов изображений сканированного рукописного текста к классу идентичных заданному прецеденту. В качестве элементов признакового пространства предложено использовать проекции векторов на соответствующие ненулевым собственным числам собственные векторы субполосных матриц. Обоснован способ формирования суммарных субполосных матриц на основе введенного понятия информационных субполос в области пространственных частот. Предложена процедура обучения на основе одного прецедента. В основе этой процедуры используется разработанный метод формирования векторов, совокупность которых моделирует обучающую выборку. Сформирован алгоритм обработки изображений при поиске идентичных заданному фрагменту.

Еще

Изображения сканированного рукописного текста, поиск фрагментов, идентичных заданному, субполосный анализ

Короткий адрес: https://sciup.org/140290760

IDR: 140290760   |   DOI: 10.18469/ikt.2021.19.3.07

Список литературы О прецедентной идентификации фрагментов изображений сканированного рукописного текста

  • Арлазаров В.Л., Славин О.А. Алгоритмы распознавания и технологии ввода текстов в ЭВМ // Информационные технологии и вычислительные системы. 1996. № 1. С. 48-54.
  • Горошкин А.Н. Обработка изображений в системах распознавания рукописного текста // Цифровая обработка сигналов и ее применение: материалы 10-й Международной конференции и выставки. 2008. С. 489-491.
  • Мерков А.Б. Основные методы, применяемые для распознавания рукописного текста // Лаборатория распознавания образов МЦНМО. 2004.
  • Хаустов П.А. Алгоритм сегментации рукописного текста на основе построения структурных моделей // Фундаментальные исследования. 2017. № 4-1. С. 88-93. URL: http://fundamental-research.ru/ru/article/view?id=41440 (дата обращения: 16.04.2021).
  • Хаустов П.А. Алгоритмы распознавания рукописных символов на основе построения структурных моделей // Компьютерная оптика. 2017. Т. 41, № 1. С. 67-78. DOI: https://doi.org/10.18287/2412-6179-2017-41-1-67-78
Статья научная