Распознавание исторических рукописных документов с применением методов глубокого машинного обучения

Бесплатный доступ

Настоящая работа посвящена разработке и анализу нейросетевых подходов и методов к решению задачи распознавания рукописных документов. Для решения данной задачи в работе предлагается использовать модели глубоких нейронных сетей. Рассматриваются вопросы конфигурации и обучения рассматриваемых моделей, также описываются и анализируются возможные их усовершенствования. Приводятся результаты численного исследования всех предложенных подходов и сравнение их эффективности в решении поставленной задачи.

Распознавание образов, глубокое обучение, рекуррентные нейронные сети, трансформеры

Короткий адрес: https://sciup.org/14131512

IDR: 14131512

Список литературы Распознавание исторических рукописных документов с применением методов глубокого машинного обучения

  • Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks / A. Graves, S. Fernandez, F. Gomez, J. Schmidhuber //Proceedings of the 23rd international conference on Machine learning. - 2006. - С. 369-376.
  • Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Information Processing Systems (NIPS'08). - 2008. - С. 545-552.
  • Convolve, attend and spell: An attention-based sequence-to-sequence model for handwritten word recognition / L. Kang [et al.] //Pattern Recognition: 40th German Conference, GCPR 2018, Stuttgart, Germany, October 9-12, 2018, Proceedings 40. - Springer International Publishing, 2019. - С. 459-472.
  • TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li [et al.] // Proceedings of the AAAI Conference on Artificial Intelligence. - 2023. - Т. 37. - №. 11. - С. 13094-13102.
  • IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks / L. Cheng et al. // Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics. - 2022. - Vol. 1. - С. 2277-2287.
  • Ba J. Layer Normalization /j. Ba, J. Kiros, G. Hinton // arXive.org e-Print archive. - 2016. -. DOI: 10.48550/arXiv.1607.06450
  • Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel [et al.] //Journal of machine learning research. - 2020. - Т. 21. - №. 140. - С. 1-67. - URL: http://jmlr.org/papers/v21/20-074.html.
  • ICFHR 2014 competition on handwritten keyword spotting (H-KWS 2014) / I. Pratikakis [et al.] // 2014 14th International Conference on Frontiers in Handwriting Recognition. - IEEE, 2014. - С. 814-819. -. DOI: 10.1109/ICFHR.2014.142
Еще
Статья научная