К вопросу о применении методов экстрактивной суммаризации для составления резюме научного текста

Автор: Медяник Ю.В., Сабирова Л.А.

Журнал: Международный журнал гуманитарных и естественных наук @intjournal

Рубрика: Филологические науки

Статья в выпуске: 8 (107), 2025 года.

Бесплатный доступ

Автоматическая суммаризация научных текстов для создания их кратких версий, содержащих важные предложения и значимую информацию из исходного документа, является перспективным направлением обработки естественного языка. Автоматизация работы с научными текстами позволяет существенно упростить и облегчить работу исследователей по извлечению ключевой информации из текстов научных работ. В статье рассматриваются основные компоненты научного текста и структура научных статей, существующие подходы автоматической суммаризации текстов и наиболее широко используемые методы экстрактивной суммаризации (TF-IDF и TextRank), которые по-разному подходят к извлечению информации из текста, учитывают структурные связи между предложениями и выбор ключевых слов, что может потребовать доработки алгоритмов с учетом специфики текстов научных статей.

Еще

Экстрактивная суммаризация текста, научный текст, аннотация, методы суммаризации, TF-IDF, TextRank

Короткий адрес: https://sciup.org/170210890

IDR: 170210890   |   DOI: 10.24412/2500-1000-2025-8-268-272

On the application of extractive summarization methods for preparing scientific text abstracts

This study provides an overview of automatic summarization of scientific texts as a means of generating concise versions that retain key sentences and essential information from the original document. Automatic processing of scholarly texts has the potential to substantially streamline the work of researchers by facilitating the extraction of core information from scientific publications. The paper outlines the main components of scientific texts and the typical structure of research articles, reviews existing approaches to automatic text summarization, and discusses the most widely applied extractive methods, namely TF-IDF and TextRank. These methods employ different strategies for information extraction, taking into account structural relationships between sentences and the selection of keywords. However, their effective application to scientific texts may require further refinement to address domain- specific characteristics.

Еще