Автоматизация распределения информации в адаптивных системах электронного документооборота с применением машинного обучения

Бесплатный доступ

Введение. Системы электронного документооборота (СЭД) используются для хранения, обработки и передачи больших объемов информации. Автоматизация данных процессов является актуальной проблемой, требующей комплексного решения. Ее решение позволит снизить временные и материальные затраты на проектирование и осуществить переход к более совершенным, адаптивным СЭД. Статья посвящена разработке новых методов автоматизации процесса распределения информации в СЭД.Целью работы является повышение точности распределения информации в СЭД за счет перехода от аналитических или алгоритмических решений к использованию новых методов, функционирующих на основе технологий машинного обучения. Использование нейронных сетей для достижения поставленной цели также позволит повысить эффективность разработки программного обеспечения за счет автоматизации процессов анализа и обработки информации.Материалы и методы. Предложен новый метод автоматизированного распределения информации на основе технологий машинного обучения, включающий математическое описание правил распределения информации. Сформулированный перечень условий распределения информации позволяет реализовать программное обеспечение на основе нейронных сетей для решения задачи автоматического распределения данных в СЭД.Результаты исследования. Метод автоматизированного распределения информации апробирован на примере предметной области СЭД при решении задачи анализа правильности информации, введенной пользователем. В ходе экспериментальных исследований получено, что предложенный метод, функционирующий на основе технологий машинного обучения, обеспечивает лучшую точность (на 8 % выше) и более эффективен (в соответствии с метриками Джилба и цикломатической сложности)Обсуждение и заключения. Полученные результаты подтверждают эффективность и точность предложенного метода. Представленные результаты могут использоваться для автоматизации процессов распределения и проверки информации в адаптивных СЭД, а также других информационных системах. На основе разработанного метода также возможно решение связанных задач: поиск дубликатов и похожих документов, классификация и размещение по категориям файлов.

Еще

Системы электронного документооборота, распределение информации, автоматизация, адаптивность, машинное обучение

Короткий адрес: https://sciup.org/142225520

IDR: 142225520   |   DOI: 10.23947/2687-1653-2020-20-4-430-436

Список литературы Автоматизация распределения информации в адаптивных системах электронного документооборота с применением машинного обучения

  • Кузнецова, Е. В. Актуальные проблемы электронного документооборота в органах власти / Е. В. Кузнецова // Вопросы управления. - 2013. - №. 4. - С. 73-77.
  • Zhong, R. Y. Intelligent manufacturing in the context of industry 4.0: a review / R. Y. Zhong// Engineering. - 2017. -Vol. 3 (5). - P. 616-630. DOI: 10.1016/J.ENG.2017.05.015
  • Xu, D. Enhancing e-learning effectiveness using an intelligent agent-supported personalized virtual learning environment: An empirical investigation / D. Xu// Information & Management. - 2014. - Vol. 51 (4). - P. 430-440. DOI: 10.1016/j.im.2014.02.009
  • Кузнецов, С. Д. Распределенные горизонтально масштабируемые решения для управления данными / С. Д. Кузнецов, А. В. Посконин // Труды Института системного программирования РАН. - 2013. - Т. 24. - С. 327-358.
  • Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения / М. Н. Краснянский, А. Д. Обухов, Е. М. Соломатина, А. А. Воякина // Вестник ВГУ, Серия: Системный анализ и информационные технологии. - 2018. - № 3. - С. 173-182.
  • Karampidis, K. File type identification-computational intelligence for digital forensics / K. Karampidis, G. Papadourakis // Journal of Digital Forensics, Security and Law. - 2017. - Vol. 12 (2). - P. 6.
  • DOI: 10.15394/jdfsl.2017.1472
  • Kim, D. Multi-co-training for document classification using various document representations: TF-IDF, LDA, and Doc2Vec / D. Kim// Information Sciences. - 2019. - Vol. 477. - P. 15-29.
  • Zheng, J. Hierarchical neural representation for document classification / J. Zheng// Cognitive Computation. - 2019. - Vol. 11 (2). - P. 317-327.
  • DOI: 10.1007/s12559-018-9621-6
  • Bodstrom, T. State of the art literature review on network anomaly detection with deep learning / T. Bodstrom, T. Hamalainen // In book: Internet of Things, Smart Spaces, and Next Generation Networks and Systems. Springer, Cham, 2018. - P. 64-76.
  • DOI: 10.1007/978-3-030-01168-0_7
  • Datta, S. Near-Bayesian support vector machines for imbalanced data classification with equal or unequal misclassification costs / S. Datta, S. Das // Neural Networks. - 2015. - Vol. 70. - P. 39-52.
  • DOI: 10.1016/j.neunet.2015.06.005
  • Irolla, P. The duplication issue within the Drebin dataset / P. Irolla, A. Dey // Journal of Computer Virology and Hacking Techniques. - 2018. - Vol. 14 (3). - P. 245-249.
  • DOI: 10.1007/s11416-018-0316-z
  • Goldberg, Y. Neural network methods for natural language processing / Y. Goldberg // Synthesis Lectures on Human Language Technologies. - 2017. - Vol. 10 (1). - P. 1-309.
  • DOI: 10.2200/S00762ED1V01Y201703HLT037
  • Beleites, C. Sample size planning for classification models / C. Beleites// Analytica chimica acta. - 2013. - Vol. 760. - P. 25-33.
  • DOI: 10.1016/j.aca.2012.11.007
  • Obukhov, A. Algorithm of adaptation of electronic document management system based on machine learning technology / A. Obukhov, M. Krasnyanskiy, M. Nikolyukin // Progress in Artificial Intelligence. - 2020. - Vol. 9. - P. 287-303.
  • DOI: 10.1007/s13748-020-00214-2
  • Bazgir, O. Representation of features as images with neighborhood dependencies for compatibility with convolutional neural networks / O. Bazgir// Nature Communications. - 2020. - Vol. 11 (1). - P. 1-13.
  • DOI: 10.1038/s41467-020-18197-y
  • Luo, A. A Structural Complexity Metric Method for Complex Information Systems / A. Luo// JSW. - 2019. - Vol. 14 (7). - P. 332-339.
  • DOI: 10.17706/jsw.14.7.332-339
  • Смирнов, А. В. Методы оценки и управления качеством программного обеспечения / А. В. Смирнов // Известия СПбГЭТУ "ЛЭТИ". - 2019. - № 2. - С. 20-25.
Еще
Статья научная