Распознавание кадастровых координат с использованием свёрточно-рекуррентных нейронных сетей

Бесплатный доступ

В статье исследуется применение свёрточно-рекуррентных нейронных сетей (CRNN) для распознавания изображений кадастровых координат объектов на отсканированных документах ППК «Роскадастр». Комбинированная архитектура CRNN, объединяющая свёрточные нейронные сети (CNN) и рекуррентные нейронные сети (RNN), позволяет использовать преимущества каждой из них для обработки изображений и распознавания содержащихся в них непрерывных цифровых последовательностей. При проведении экспериментальных исследований были формированы изображения, состоящие из заданного количества цифр, построена и исследована CRNN модель. Формирование изображений цифровых последовательностей заключалось в предобработке и конкатенации изображений образующих их цифр из собственного набора данных. Анализ значений функции потерь и метрик Accuracy, Character Error Rate (CER) и Word Error Rate (WER) показал, что использование предложенной CRNN модели позволяет достичь высокой точности распознавания кадастровых координат на их отсканированных изображениях.

Еще

Свёрточно-рекуррентная нейронная сеть, crnn, распознавание изображений, цифровые последовательности, глубокое обучение, keras, python

Короткий адрес: https://sciup.org/143182402

IDR: 143182402   |   DOI: 10.25209/2079-3316-2024-15-1-3-30

Список литературы Распознавание кадастровых координат с использованием свёрточно-рекуррентных нейронных сетей

  • Shi B., Bai X., Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition, IEEE Transactions on Pattern Analysis and Machine Intelligence.– 2017.– Vol. 39.– No. 11.– Pp. 2298–2304. arXivarXiv 1507.05717 [cs.CV] https://doi.org/10.1109/TPAMI.2016.2646371
  • Hochreiter S., Schmidhuber J. Long short-term memory // Neural Computation.– 1997.– Vol. 9.– No. 8.– Pp. 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735
  • Chung J., Gulcehre C., Cho K., Bengio Y. Gated feedback recurrent neural networks // Proceedings of Machine Learning Research.– 2015.– Vol. 37.– Pp. 2067–2075. arXivarXiv 1502.02367 [cs.NE] UhtRtpL://proceedings.mlr.press/v37/chung15.pdf
  • Винокуров И. В. Использование свёрточной нейронной сети для распознавания элементов текста на отсканированных изображениях плохого качества // Программные системы: теория и приложения.– 2022.– Т. 13.– №3(54).– С. 29–43. https://doi.org/10.2520[9Р/И20Н7Ц9-]3316-2022-13-3Uh-tR2t9pL-:4/3/psta.psiras.ru/read/psta2022_3_29-43.pdf
  • Винокуров И. В. Распознавание табличной информации с использованием свёрточных нейронных сетей // Программные системы: теория и приложения.– 2023.– Т. 14.– №1(56).– С. 3–30. https://doi.org/10.2520[9Р/И20Н7Ц9-]3316-2023-14-1hU-tR3t-pL3s0://psta.psiras.ru/read/psta2023_1_3-30.pdf
  • Винокуров И. В. Распознавание цифровых последовательностей с использованием свёрточных нейронных сетей // Программные системы: теория и приложения.– 2023.– Т. 14.– №3(58).– С. 3–36. https://doi.org/10.2520[9Р/И20Н7Ц9-]3316-2023-14-3hU-tR3t-pL3s6://psta.psiras.ru/read/psta2023_3_3-36.pdf
  • He P., Huang W., Qiao Y., Change Loy C., Tang X. Reading scene text in deep convolutional sequences, AAAI’16: Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (Phoenix, Arizona, USA, February 12–17, 2016) // Proceedings of the AAAI Conference on Artificial Intelligence.– 2016.– Vol. 30 1.– Pp. 3501–3508. https://doi.org/10.1609/aaai.v30i1.10465
  • Shi B.,Wang X., Lv P., Yao C., Bai X. Robust scene text recognition with automatic rectification, 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (Las Vegas, NV, USA, June 27–30, 2016).– 2016.– Pp. 4168–4176. https://doi.org/10.1109/CVPR.2016.452 arXivarXiv 1603.03915 [cs.CV]
  • Yin F., Wu Y. -C., Zhang X. -Y., Liu C. -L. Scene text recognition with sliding convolutional character models.– 2017.– 10 pp. arXivarXiv 1709.01727 [cs.CV]
  • Nirmalasari D. A., Suciati N., Navastara D. A. Handwritten text recognition using fully convolutional network // IOP Conference Series: Materials Science and Engineering.– 2021.– Vol. 1077.– No. 1.– id. 012030.– 9 pp. https://doi.org/10.1088/1757-899X/1077/1/012030
  • Liu X., Deng Y., Sun Y., Zhou Y. Multi-digit recognition with convolutional neural network and long short-term memory // 2018 14th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD) (Huangshan, China, July 28–30, 2018).– IEEE.– 2018.– Pp. 1187–1192. https://doi.org/10.1109/FSKD.2018.8686963
  • Madakannu A., Selvaraj A. DIGI-Net: a deep convolutional neural network for multi-format digit recognition // Neural Computing and Applications.– 2020.– Vol. 32.– Pp. 11373–11383. https://doi.org/10.1007/s00521-019-04632-9
  • Zou L., He Z., Wang K., Wu Z., Wang Y., Zhang G., Wang X. Text recognition model based on multi-scale fusion CRNN // Sensors.– 2023.– Vol. 32.– No. 16.– id. 7034.– 18 pp. https://doi.org/10.3390/s23167034
  • Agrawal V., Jagtap J. Convolutional vision transformer for handwritten digit recognition.– Research Square.– 2022.– 11 pp. https://doi.org/10.21203/rs.3.rs-1984839/v1
  • Cheng L., Khalitov R., Yu T., Yang Z. Classification of long sequential data using circular dilated convolutional neural networks.– 2022.– 16 pp. arXivarXiv 2201.02143 [cs.LG]
  • Bhat R. S. Text recognition with CRNN-CTC network.– W&B Fully Connected.– 2022. hUtRtpLs://wandb.ai/authors/text-recognition-crnn-ctc/reports/Text-Recognition-With-CRNN-CTC-Network–VmlldzoxNTI5NDI
  • Khamekhem S., Sourour A., Kessentini Y. Domain and writer adaptation of offline Arabic handwriting recognition using deep neural networks // Neural Computing and Applications.– 2022.– Vol. 34.– Pp. 2055–2071. https://doi.org/10.1007/s00521-021-06520-7
Еще
Статья научная