Интеллектуальная система вопросов-ответов: интеграция баз знаний и языковых моделей для повышения эффективности обработки информации

Автор: И. М. Яхонтова, Н. М. Нетребин, А. Д. Стрелецкий

Журнал: Современные инновации, системы и технологии.

Рубрика: Управление, вычислительная техника и информатика

Статья в выпуске: 5(1), 2025 года.

Бесплатный доступ

В статье рассматриваются современные подходы к созданию интеллектуальных систем вопросов-ответов (Q&A), ориентированных на повышение эффективности обработки информации за счет интеграции баз знаний и языковых моделей. Основное внимание уделяется методу Retrieval Augmented Generation (RAG), который объединяет извлечение данных из базы знаний с генерацией ответов с использованием мощных языковых моделей. Данный метод позволяет улучшить качество ответов, повышая их релевантность за счет обработки предварительно найденной информации. В статье анализируются и сравниваются различные методы векторизации текста, включая One-hot encoding, TF-IDF, Word2Vec и BERT, с целью их адаптации к системам Q&A. Отдельное внимание уделено отечественным языковым моделям, таким как YandexGPT и GigaChat, которые демонстрируют высокую точность и производительность в условиях отечественного рынка и в контексте тенденций импортозамещения. В рамках работы проведены эксперименты на основе конфигурации 1С:Бухгалтерия предприятия 8, в ходе которых оценивались точность, релевантность и производительность различных систем вопросов-ответов. Результаты экспериментов показали, что предложенные подходы способны значительно повысить качество обработки запросов и предоставления информации. Новизна работы заключается в интеграции современных языковых моделей с базами знаний для создания эффективных систем Q&A, что открывает новые возможности для автоматизации бизнес-процессов и улучшения взаимодействия с информационными системами.

Еще

Retrieval Augmented Generation (RAG), языковые модели, векторизация текста, YandexGPT, GigaChat, 1С:Бухгалтерия, интеллектуальные системы вопросов-ответов, базы знаний

Короткий адрес: https://sciup.org/14133004

IDR: 14133004   |   DOI: 10.47813/2782-2818-2025-5-1-1020-1026

Статья