Распознавание исторических рукописных документов с применением методов глубокого машинного обучения
Автор: Мамедов Т.Р., Ершов Н.М.
Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse
Рубрика: Моделирование и анализ данных
Статья в выпуске: 3, 2024 года.
Бесплатный доступ
Настоящая работа посвящена разработке и анализу нейросетевых подходов и методов к решению задачи распознавания рукописных документов. Для решения данной задачи в работе предлагается использовать модели глубоких нейронных сетей. Рассматриваются вопросы конфигурации и обучения рассматриваемых моделей, также описываются и анализируются возможные их усовершенствования. Приводятся результаты численного исследования всех предложенных подходов и сравнение их эффективности в решении поставленной задачи.
Распознавание образов, глубокое обучение, рекуррентные нейронные сети, трансформеры
Короткий адрес: https://sciup.org/14131512
IDR: 14131512
Список литературы Распознавание исторических рукописных документов с применением методов глубокого машинного обучения
- Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks / A. Graves, S. Fernandez, F. Gomez, J. Schmidhuber //Proceedings of the 23rd international conference on Machine learning. - 2006. - С. 369-376.
- Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Information Processing Systems (NIPS'08). - 2008. - С. 545-552.
- Convolve, attend and spell: An attention-based sequence-to-sequence model for handwritten word recognition / L. Kang [et al.] //Pattern Recognition: 40th German Conference, GCPR 2018, Stuttgart, Germany, October 9-12, 2018, Proceedings 40. - Springer International Publishing, 2019. - С. 459-472.
- TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li [et al.] // Proceedings of the AAAI Conference on Artificial Intelligence. - 2023. - Т. 37. - №. 11. - С. 13094-13102.
- IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks / L. Cheng et al. // Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics. - 2022. - Vol. 1. - С. 2277-2287.
- Ba J. Layer Normalization /j. Ba, J. Kiros, G. Hinton // arXive.org e-Print archive. - 2016. -. DOI: 10.48550/arXiv.1607.06450
- Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel [et al.] //Journal of machine learning research. - 2020. - Т. 21. - №. 140. - С. 1-67. - URL: http://jmlr.org/papers/v21/20-074.html.
- ICFHR 2014 competition on handwritten keyword spotting (H-KWS 2014) / I. Pratikakis [et al.] // 2014 14th International Conference on Frontiers in Handwriting Recognition. - IEEE, 2014. - С. 814-819. -. DOI: 10.1109/ICFHR.2014.142