Автоматизированное резюмирование: от методов извлечения к абстрактному обобщению

Бесплатный доступ

В статье представлен обзор моделей автоматизированного резюмирования текста, основанных на технологиях искусственного интеллекта и использующих два основных подхода: экстрактивный (извлекающий) и абстрактивный (обобщающий). Цель исследования заключается в оценке компрессионных возможностей этих моделей и их языковой компетентности. Степень сжатия оценивается при помощи количественных показателей: количество страниц, слов и символов. Для оценки языковой компетентности принимается во внимание способность моделей применять разнообразные грамматические и лексические конструкции без искажения смысла и содержания. Для оценки потенциала автоматизированного резюмирования были выбраны модели OpenAI Summate.it, WordTune, SciSummary, Scholarcy и OpenAI ChatGPT-4, материалом для анализа послужили тексты публикаций по разным научным дисциплинам. Результаты позволили установить, что выбранные модели с опорой на гибридную стратегию интегрируют как экстрактивные, так и абстрактивные технологии. Тексты, созданные этими инструментами, варьировались по степени полноты и точности, при этом степень сжатия страниц составила от 50 до 95 %, а сокращение количества символов достигло 98 %. Качественная оценка показала, что, хотя модели в целом обладают способностью точно передавать основные идеи исходных текстов, некоторые резюме отличаются излишним упрощением или неверными смысловыми акцентами. Несмотря на эти ограничения, модели автоматического резюмирования обладают значительным потенциалом не только как инструменты для сжатия текста, но и как генераторы нового контента, который может стать ценным объектом для лингвистического анализа, способствуя изучению процессов машинного порождения языка и смысловой переработки текстов.

Еще

Автоматизированное резюмирование, экстрактивное резюмирование, абстрактивное резюмирование, искусственный интеллект, нейронные сети, междисциплинарные исследования

Короткий адрес: https://sciup.org/149147496

IDR: 149147496   |   DOI: 10.15688/jvolsu2.2024.5.4

Статья научная