Методы и технологии полуавтоматического структурирования и оценки текста научной статьи: обзор и перспективы разработки информационной системы

Автор: Александр Александрович Толстенко, Екатерина Владимировна Исаева

Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi

Рубрика: Компьютерные науки и информатика

Статья в выпуске: 1 (72), 2026 года.

Бесплатный доступ

В статье описывается проблема получения своевременной и качественной обратной связи по научной статье от рецензентов и рассматривается целесообразность применения ИИ для ее решения. Приводится системное описание существующих коммерческих и исследовательских решений для структурирования и оценки качества текста (Writefull, Grammarly, Quillbot, ChatGPT и др.), анализируются их преимущества и недостатки. Изучаются различные подходы и архитектуры и выполняется сравнение эффективности их использования в задаче структурирования и оценки текста научной работы. В качестве целевой структуры научной статьи выбрана IMRAD, обладающая универсальностью, гибкостью и возможностью применения в различных областях. На основе выполненного анализа сформулированы требования к системе структурирования и оценки текста научной статьи. Предлагается модульная секционно-ориентированная архитектура информационной системы, интегрируемой в текстовый редактор. Система состоит из четырех модулей: "Шаблоны предложений", "Оценка структуры текста", "Оценка стиля текста" и "Оценка понятности и логичности текста". Особенностью архитектуры является использование ИИ-агентов (экземпляры большой языковой модели) для анализа отдельных аспектов текста с сохранением контекста каждого раздела структуры IMRAD (введение, методы, результаты, обсуждение). Обсуждаются технические и методологические ограничения реализации подобных систем. Представленное исследование может стать основой для разработки информационной системы, которая может быть полезна образовательным учреждениям для обучения академическому письму.

Еще

Структурирование и оценка качества текста, , обработка естественного языка, NLP, большие языковые модели, LLM, академическое письмо, искусственный интеллект

Короткий адрес: https://sciup.org/147253758

IDR: 147253758   |   УДК: 004.89   |   DOI: 10.17072/1993-0550-2026-1-131-143

Methods and Techniques for Semi-Automatic Structuring and Evaluation of the Text of a Scientific Article: Review and Prospects for the Development of Information System

The article describes the problem of obtaining timely and high-quality feedback on scientific articles from peer-reviewers and considers the feasibility of using AI to solve it. A systematic description of existing commercial and research solutions for structuring and text quality evaluation (Writefull, Grammarly, Quillbot, ChatGPT, etc.) is provided, their advantages and disadvantages are analyzed. Various approaches and architectures are studied, and their effectiveness in structuring and evaluating scientific texts is compared. IMRAD was chosen as the target structure for scientific articles due to its versatility, flexibility, and applicability in various fields. Based on the analysis, requirements for a system for structuring and evaluation of the scientific article text were formulated. A modular section-based architecture of an information system integrated into a text editor is proposed. The system includes four modules: "Sentence Templates", "Text Structure Evaluation", "Text Style Evaluation", and "Text Clarity and Logic Evaluation". A distinctive feature of the proposed architecture is the use of AI agents (instances of a large language model) to analyze individual aspects of the text while taking into an account the context between sections of the IMRAD structure (introduction, methods, results, discussion). Technical and methodological limitations of implementing such systems are discussed. The presented study can serve as a basis for the development of an information system.

Еще