Использование интеллектуальных микросервисов в современных системах электронного документооборота

Автор: Аверьянова А.Н., Атанов В.В., Кеся М.С., Можнов Е.С.

Журнал: Форум молодых ученых @forum-nauka

Статья в выпуске: 5 (81), 2023 года.

Бесплатный доступ

Данная научная статья исследует преимущества и ограничения использования интеллектуальных микросервисов на базе искусственного интеллекта в системе электронного документооборота. Рассмотрен функционал интеллектуальных микросервисов, а также выявлены положительные и отрицательные стороны микросервисов. Рассмотрена архитектура AI-микросервисов. Сформулированы выводы о сокращении рабочего времени благодаря технологиям искусственного интеллекта. Результаты исследования подчеркивают значимость и потенциал таких микросервисов для улучшения эффективности и качества обработки документов в современных СЭД.

Искусственный интеллект (ии), система элетронного документооборота (сэд), машинное обучение, интеллектуальные микросервисы, автоматизация, маршрутизация

Короткий адрес: https://sciup.org/140299595

IDR: 140299595   |   УДК: 004.8

The use of intelligent microservices in modern electronic document management systems

This scientific article explores the advantages and limitations of using intelligent microservices based on artificial intelligence in an electronic document management system. The functionality of intelligent microservices is considered, as well as the positive and negative sides of microservices are revealed. The architecture of AI microservices is considered. Conclusions about the reduction of working time due to artificial intelligence technologies are formulated. The results of the study emphasize the importance and potential of such microservices to improve the efficiency and quality of document processing in modern EDMS.

Текст научной статьи Использование интеллектуальных микросервисов в современных системах электронного документооборота

Современные организации активно используют СЭД для обработки и управления цифровыми документами. В связи с развитием технологий ИИ, интеллектуальные микросервисы становятся перспективным решением для расширения функциональных возможностей СЭД. Их использование в СЭД обещает значительно улучшить эффективность и качество обработки документов. Они автоматизируют процессы, улучшают обработку, увеличивают скорость и эффективность работы. Используя ИИ, они распознают, классифицируют и анализируют документы, что ускоряет и облегчает процесс обработки. Такие микросервисы также повышают безопасность и улучшают пользовательский опыт. Внедрение интеллектуальных микросервисов требует учета специфических потребностей организации и управления рисками данных. Они могут иметь ограничения и требовать оптимизации. В целом, использование интеллектуальных микросервисов представляет перспективное решение для оптимизации и автоматизации процессов обмена и управления документами в СЭД, при условии тщательного анализа требований и учета рисков. Микросервисы могут легко интегрироваться в любую СЭД, приложения и облачные сервисы как по отдельности, так и вместе. Исследование применения ИИ в СЭД является актуальной задачей в свете возможности оптимизации процессов управления документами в организациях с помощью интеллектуальных микросервисов. В статье использован аналитический подход, основанный на анализе существующей литературы и источников, чтобы рассмотреть перспективы использования интеллектуальных микросервисов в системе электронного документооборота (СЭД). Были изучены научные статьи, книги и электронные ресурсы, связанные с применением ИИ и микросервисов в управлении документами. Кроме того, был проведен анализ практических примеров исследований и внедрений интеллектуальных микросервисов в СЭД. Были изучены преимущества и недостатки такого подхода, а также рассмотрены вопросы интеграции, настройки и зависимости от качества данных.

Функциональность интеллектуальных микросервисов

Интеллектуальные микросервисы, применяемые в СЭД, обладают широким спектром функций, способствующих повышению эффективности процессов управления документами. Они обеспечивают автоматическую классификацию и категоризацию документов на основе их содержания или других признаков. С использованием алгоритмов машинного обучения, микросервисы могут определить типы документов, такие как контракты, счета-фактуры или письма. Это позволяет эффективно распределять документы между различными отделами и сотрудниками, а также облегчает маршрутизацию и управление знаниями в организации.

Интеллектуальные микросервисы также обладают способностью проверять наличие необходимых полей или подписей в документе, а также осуществлять проверку на соответствие правилам оформления. Например, они могут извлекать данные, такие как название организации, даты, суммы и другие ключевые элементы, из различных типов документов. Это упрощает процессы маршрутизации документов и управления знаниями в организации. Кроме того, интеллектуальные микросервисы обладают высокой точностью в распознавании текста и способностью извлекать данные из отсканированных документов, изображений и рукописного текста. Это упрощает редактирование, поиск и индексирование документов, значительно расширяя возможности поиска в СЭД.

Они также предоставляют возможность для автоматизированной обработки документов, такой как удаление пустых страниц, исправление орфографических ошибок и улучшение качества изображений. Например, микросервисы могут автоматически удалять пустые страницы из отсканированных документов, что упрощает их последующую обработку и архивирование.

Кроме того, интеллектуальные микросервисы способны автоматически создавать отчеты и проводить анализ данных на основе информации, содержащейся в документах. Например, они могут генерировать сводные отчеты о количестве и типах документов, сроках их обработки и других показателях. Это позволяет руководству принимать информированные решения и оптимизировать процессы управления документами в организации.

Примеры конкретных интеллектуальных микросервисов, применяемых в СЭД, включают:

  •    Abbyy FlexiCapture: Сервис автоматической классификации документов, который позволяет автоматически классифицировать и категоризировать документы на основе их содержания и других признаков, используя методы машинного обучения.

  •    Rossum Elis: Микросервис для извлечения структурированных данных из документов. Он использует нейронные сети для извлечения информации о клиентах или товарах из счетов-фактур и других документов.

  •    Google Cloud Vision OCR: Распознавание оптического текста (OCR) сервис, который предоставляет API для точного

распознавания текста с изображений и отсканированных документов на различных языках.

  •    Grammarly: Сервис для автоматической проверки и исправления орфографических ошибок, грамматики, пунктуации и стилистики текстов, включая документы. Он использует алгоритмы ИИ для обеспечения качества текстовых материалов.

  •    Microsoft Power BI: Сервис для автоматического создания отчетов и анализа данных на основе содержимого документов. Он позволяет создавать интерактивные отчеты и дашборды, используя данные из документов, для визуализации и аналитики, необходимых для принятия решений.

Это лишь некоторые примеры продуктов, демонстрирующих, как интеллектуальные микросервисы в СЭД могут улучшить процессы обработки документов, облегчить поиск информации и повысить эффективность управления документами в организации.

Архитектура интеллектуальных микросервисов

В настоящее время существует систематизация микросервисных архитектур, которая охватывает четыре поколения. Первое поколение микросервисов характеризовалось тем, что каждый сервис имел информацию о местоположении других сервисов, а обработка отказов была встроена в их исходный код. Однако с увеличением количества подобных сервисов возникли проблемы с обнаружением и вызовом необходимых служб, повторным использованием кода, обнаружением ошибок и обработкой отказов. Для преодоления этих проблем были разработаны интеллектуальные микросервисы, включающие компоненты для обнаружения и повторного использования отказоустойчивых коммуникационных библиотек. В этой модели регистрируются функции в централизованной службе обнаружения, а клиентские сервисы динамически находят и вызывают эти функции без явного указания расположения целевых служб. Вся коммуникация и обработка отказов осуществляются соответствующей коммуникационной библиотекой.

Второе поколение микросервисных архитектур внедряет стандартные сервисные посредники (sidecar). В этом случае функции коммуникации и механизмы обнаружения изолируются в отдельном sidecar-сервисе, работающем параллельно с основными микросервисами. Sidecar обеспечивает независимость от языка программирования и упрощает повторное использование коммуникационного кода в различных сервисах. Такой подход упрощает обновление и поддержку коммуникационных библиотек, а также обеспечивает мониторинг взаимодействий микросервисов.

Третье поколение микросервисных архитектур включает концепцию сервисных mesh-сетей. Эти сети предоставляют интегрированное решение для управления межсервисными коммуникациями. Sidecar-подобные функции, интегрированные в сеть, осуществляют мониторинг и управление поведением распределенного набора sidecar-сервисов. Операторы приложений получают возможность детального контроля над различными аспектами межсервисной коммуникации, включая их обнаружение, балансировку нагрузки, обеспечение отказоустойчивости, маршрутизацию сообщений и обеспечение безопасности. Это позволяет эффективно управлять сложными микросервисными архитектурами и масштабировать их.

Четвертое поколение микросервисных архитектур переносит концепцию на новый уровень, используя современные технологии FaaS (Function as a Service) и бессерверные вычисления, такие как AWS Lambda. В такой архитектуре микросервисные приложения представляют собой набор "эфемерных" функций, которые могут быть быстро созданы, обновлены, заменены и удалены по необходимости. Переход к бессерверной архитектуре значительно упрощает разработку и развертывание микросервисов.

Однако в бессерверной архитектуре возникают вопросы о необходимости коммуникационно-ориентированных технологий, таких как посредники и mesh-сети. На данный момент платформы FaaS еще не предоставляют все необходимые функции для связи и управления трафиком. Возможный сценарий включает возможности, аналогичные sidecar, которые выполняют роль посредников для взаимодействия между операциями в бессерверном приложении. Высокоуровневая функция управляющей плоскости может осуществлять мониторинг и управление поведением этих посреднических элементов, создавая новый тип сервисной (или функциональной) mesh-сети.

Таким образом, развитие архитектур интеллектуальных микросервисов проходит через эволюцию от управления местоположением сервисов до внедрения стандартных сервисных посредников, mesh-сетей и бессерверных вычислений. Эти технологии позволяют эффективно управлять коммуникацией, обеспечивать отказоустойчивость и масштабируемость микросервисных систем, упрощая разработку и обслуживание сложных приложений электронного документооборота. Способы организации и управления микросервисными архитектурами продолжают развиваться, и новые технологии, такие как бессерверные вычисления, добавляют новые возможности и гибкость в разработке и эксплуатации микросервисных систем.

Преимущества и недостатки интеллектуальных микросервисов

Современные СЭД включают использование интеллектуальных микросервисов на основе ИИ, которые основываются на технологиях машинного обучения, машинного зрения и распознавания естественного языка. Интервью с Георгием Зуевым, основателем компании "Биорг" и разработчиком платформы для оцифровки документов и распознавания изображений Beorg Smart Vision, подтверждает, что применение ИИ в системах документооборота значительно упрощает рутинные задачи.

Современное развитие технологий и внедрение ИИ в СЭД является важным аспектом современного бизнеса. Российский рынок СЭД продолжает демонстрировать устойчивый рост, и компании все больше осознают преимущества перехода от бумажного документооборота к электронному. Однако использование интеллектуальных микросервисов в СЭД может значительно упростить процессы обработки документов, сократить затраты времени и ресурсов, а также повысить эффективность взаимодействия между участниками.

Статистические данные аналитиков подтверждают, что объем электронных документов в России достиг 1,1 млрд в 2021 году и продолжает увеличиваться. [2] Спрос на электронные документы и сертификаты электронных подписей растет, и компании все больше стремятся автоматизировать рутинные задачи, связанные с документооборотом, с помощью интеллектуальные микросервисов, ведь их использование в СЭД может существенно оптимизировать рабочий процесс и улучшить производительность по сравнению с ручной обработкой документов. Вот несколько аспектов повышения производительности с помощью интеллектуальных микросервисов:

Скорость обработки: Интеллектуальные микросервисы могут обрабатывать документы гораздо быстрее, чем человек. Они способны автоматически классифицировать и категоризировать документы, извлекать информацию и выполнять другие задачи обработки данных в режиме реального времени, что ускоряет процессы обработки документов. В результате сокращается время, затрачиваемое на выполнение рутинных операций, и ускоряется весь рабочий процесс. Например, в области страхования время обработки документов может быть сокращено с 20-45 минут до 5-7 минут, а в банковской сфере — до 10-12 минут. [3]

Точность и надежность: Интеллектуальные микросервисы обладают высокой точностью и надежностью в сравнении с человеческим фактором. Они не подвержены усталости, ошибкам и отвлечениям, что снижает вероятность ошибок в обработке документов. Более того, они могут использовать алгоритмы машинного обучения для постоянного улучшения своей точности и адаптации к изменяющимся условиям. Предобученные нейросети анализируют смысловые сущности и различают различные категории документов, обеспечивая более точные результаты и снижение числа отказов или приостановок регистраций прав на недвижимость, как в случае с системой «Ева» для Росреестра. Это позволяет предотвратить потенциальные проблемы и улучшить качество документооборота.

Масштабируемость: Интеллектуальные микросервисы могут легко масштабироваться и обрабатывать большие объемы документов без ухудшения производительности. В отличие от человека, которому может потребоваться больше времени и ресурсов для обработки большого количества документов, микросервисы могут работать параллельно и эффективно обрабатывать большие потоки информации.

Снижение затрат: Автоматическая обработка документов на основе ИИ позволяет сократить затраты на ручную обработку и перенос данных в систему. Например, ручная обработка кадровых документов может обходиться около 300-400 рублей за комплект, тогда как технологии оцифровки с применением ИИ снижают эту стоимость до 120-150 рублей.

Автоматизация процессов: ИИ позволяет автоматизировать множество рутинных задач, связанных с обработкой и передачей документов. Это сокращает затраты времени и ресурсов на выполнение этих задач и позволяет сотрудникам компаний сосредоточиться на более важных и творческих аспектах своей работы. ИИ может быть обучен распознавать и классифицировать различные типы документов автоматически. Это значительно упрощает процесс сортировки и поиска документов, что повышает эффективность работы с ними.

Повышение безопасности: Использование ИИ в СЭД позволяет повысить уровень безопасности документов. Алгоритмы ИИ могут автоматически обнаруживать и предотвращать попытки мошенничества, подделки или несанкционированного доступа к документам.

Улучшение пользовательского опыта: Использование интеллектуальных микросервисов позволяет создавать удобные и интуитивно понятные пользовательские интерфейсы. Это упрощает работу с СЭД и повышает удовлетворенность пользователей.

Однако, несмотря на такое большое количество преимуществ, при использовании интеллектуальных микросервисов в СЭД, основанных на ИИ, могут возникать следующие недостатки:

Интеграция и настройка: Необходимость интеграции микросервисов в существующую систему электронного документооборота может потребовать времени и усилий. Необходима правильная настройка и настройка параметров работы микросервисов. Интеграция интеллектуальных микросервисов требует дополнительных усилий и ресурсов. Необходимо провести анализ и настройку системы под конкретные потребности и документы организации. Это может потребовать времени и экспертизы специалистов.

Зависимость от качества данных: Работа интеллектуальных микросервисов напрямую зависит от качества входных данных. Если документы плохо структурированы или содержат ошибки, это может повлиять на точность и результаты обработки микросервисов. Необходимость большого объема данных: Для обучения и настройки интеллектуальных микросервисов требуется большое количество размеченных данных. В случае отсутствия достаточного объема данных или их некачественности, результаты работы системы могут быть менее точными и надежными.

Ограниченность в распознавании сложных документов: Интеллектуальные микросервисы могут иметь ограничения в распознавании сложных или нестандартных документов. В случае, если документы имеют нетипичный формат, разметку или содержат сложные таблицы, система может испытывать трудности в их правильном анализе.

Заключение

Использование интеллектуальных микросервисов на базе ИИ в СЭД обладает значительными преимуществами, включая автоматизацию процессов, улучшение качества обработки документов, повышение скорости и эффективности, повышение безопасности и улучшение пользовательского опыта. Это позволяет организациям сократить затраты времени и ресурсов, повысить эффективность и качество работы, а также обеспечить безопасный и удобный процесс обмена документами.

Однако, при использовании таких микросервисов необходимо учитывать специфические потребности организации, а также управлять рисками. Тщательный анализ и оценка требований и возможностей являются важными аспектами внедрения таких систем. Несмотря на преимущества, интеллектуальные микросервисы также могут столкнуться с ограничениями и требованиями дальнейшей оптимизации и развития.

Интеллектуальные микросервисы представляют перспективное решение, способное существенно улучшить эффективность и качество обработки документов в современных СЭД. Развитие и инновации в этой области подчеркивают их значимость и потенциал в улучшении процессов обработки и взаимодействия с документами. Использование интеллектуальных микросервисов становится ключевым фактором, ведь они обеспечивают более эффективное и точное выполнение задач по обработке документов.

Список литературы Использование интеллектуальных микросервисов в современных системах электронного документооборота

  • Агафонов В. Н. Логическое программирование: сборник статей.- Москва: МИР, 1988. - 368 с.
  • Выручка группы компаний СКБ Контур по итогам 2021 года выросла на 25 %, до 22,6 млрд рублей [Электронный ресурс]// Официальный сайт компании "Контур". URL: https://kontur.ru/press/news/company/2022/2/8131 (дата обращения: 13.05.2023).
  • Интервью основателя "Биорг" Георгия Зуева для Sk.ru [Электронный ресурс]// "Биорг"- URL: https://beorg.ru/news/interview-zuev-skru/(дата обращения: 12.05.2023).
  • Лебедев В.А., Соколова Е.И. "Применение машинного обучения в системах электронного документооборота" // "Вычислительные машины, системы и сети". - 2021. - №9. - С. 6.
  • Новиков М.С., Соколов А.В. Интеллектуальные микросервисы в системах электронного документооборота: технологии и применение. - 1 изд. - Москва: "Техника", 2022. - 200 с.
  • Смирнов О.Н., Иванов В.П. "Развитие систем электронного документооборота с использованием искусственного интеллекта" // "Информационные технологии и вычислительные системы". - 2020. - №2.