Адаптация медийных текстов с помощью ChatGPT-4 для освоения лексических единиц немецкого языка

Бесплатный доступ

Рассматривается процесс адаптации медийных текстов на немецком языке с помощью модели ChatGPT-4 для облегчения усвоения лексики. Анализируются два метода промптинга с целью определения их эффективности при создании текстов, соответствующих уровням владения языком A1–B1 по шкале CEFR. В ходе исследования было проведено сравнение адаптированных текстов по уровню сложности и грамматическим характеристикам.

Адаптация текстов, ChatGPT-4, изучение лексики, немецкий язык, искусственный интеллект, промптинг, Zero-ShotPrompting, Few-ShotPrompting, автоматизированное обучение, уровни владения языком CEFR

Короткий адрес: https://sciup.org/148332009

IDR: 148332009

Текст научной статьи Адаптация медийных текстов с помощью ChatGPT-4 для освоения лексических единиц немецкого языка

Изучение лексики – неотъемлемая часть освоения иностранного языка. На сегодняшний день существует множество способов запоминания нового лексического материала, в том числе с применением цифровых технологий [1]. Следует упомянуть использование онлайн-словарей, которые не только дают перевод нужной лексемы, но и предоставляют другие возможности: получить транскрипцию, озвученное произношение, другие варианты перевода и примеры его использования в конкретных речевых ситуациях. Также нельзя обойти вниманием способ изучения иноязычной лексики на основе корпуса параллельных текстов: студенты запоминают новую лексику в процессе чтения иноязычных текстов на заданную тему [5]. Такой способ освоения новой лексики встречается наиболее часто: обучающийся запоминает лексемы на примере конкретной речевой ситуации и в определенном контексте. Для облегчения процесса усвоения лексических единиц в этом случае широко применяется адаптация текстов на иностранном языке [3].

Процесс изучения лексики на основе адаптированных текстов имеет свои преимущества. Одним из главных является градация текстов по уровню сложности, соответствующему языковой компетенции обучающегося. Это способствует плавному и эффективному усвоению новых слов и фраз и позволяет сосредоточиться на изучении ключевой лексики, не затрачивая дополнительное время на понимание неизвестных грамматических конструкций, что повышает эффективность обучения.

На данный момент существует множество способов адаптации текстов [4] в зависимости от компонентов коммуникативного акта: инструментальная, адресатная, субъектная, референциальная [2]. Способы адаптации можно разделить на две группы по методам: количественный (удаление) и качественный (замена) [6]. Количественный метод заключается в удалении несущественных частей текста, затрудняющих понимание основной его темы. Качественный метод представляет собой замену сложных лексем и грамматических конструкций на более простые, уже знакомые обучающимся.

Процесс любой адаптации текста предполагает анализ и обработку значительного количества данных, что логично влечет временные затраты. В связи с этим возникает потребность в более эффективных инструментах и методах адаптирования. Настоящее исследование посвящено вопросу адаптации медиатекстов на немецком языке с помощью ChatGPT с моделью GPT-4.

Таблица 1

Описание уровней владения языком

А1

Может понимать и использовать знакомые, повседневные выражения и очень простые предложения, направленные на удовлетворение конкретных потребностей. Может представиться, представить других и задавать людям вопросы о них самих (например, где они живут, кого они знают или какие вещи у них есть) и может отвечать на подобные вопросы. Может общаться на простом языке, если собеседники говорят медленно, четко и готовы помочь.

А2

Понимает предложения и часто употребляемые выражения, которые связаны с темами непосредственного значения (например, личная информация, семья, покупки, работа, ближайшее окружение). Может объясняться в простых, обыденных ситуациях, когда требуется обмен информацией на знакомые и повседневные темы. Способен простыми словами рассказать о своем происхождении, образовании, ближайшем окружении.

B1

Понимает основные моменты, если используется четкий литературный язык, если речь идет о знакомых темах, связанных с работой, учебой, отдыхом и т.д. Способен справляться с большинством ситуаций, возникающих при путешествиях в страны, где говорят на этом языке. Может просто и последовательно выражать свои мысли на знакомые темы и обсуждать личные интересы. Способен рассказывать о своем опыте и событиях, описывать мечты, надежды и цели, а также кратко объяснять или обосновывать свои планы и взгляды.

Практически для любого человека, начинающего работать с чатом, основную сложность представляет составление правильного запроса к нейросети для получения корректного результата, то есть, составление промпта. В нашем случае это промпт для получения текста, адаптированного до нужного языкового уровня. Для адаптации немецкоязычных текстов отобрано два вида промптинга: Zero-Shot Prompting и Few-Shot Prompting. Zero-Shot Prompting – это метод промптинга с нулевым примером, то есть модель не получает примеров требуемого результата. Few-Shot Prompting – метод пром-птинга, в котором модели предоставляются несколько примеров желаемого результата. Сравнение результатов адаптации текстов для каждого языкового уровня в рамках настоящего исследования поможет определить и выбрать оптимальный метод промптин-га для адаптации текстов, что является важным элементом при создании качественных обучающих материалов, которые соответствуют уровню языковых компетенций обучающихся.

Для адаптации отобраны немецкоязычные тексты на тему «Спорт», поскольку эта тема актуальна на всех уровнях изучения иностранного языка, соответственно, освоение новых лексических единиц также происходит на всех уровнях изучения иностранного языка. Для исследования отобраны три текста, посвященные различным спортивным событиям и характеризующиеся разнообразием лексических единиц и грамматических конструкций. Исходные тексты прошли предварительный анализ для определения уровня сложности. Выбор текстов осуществлялся на сайтах и , поскольку новостные издания Frankfurter Allgemeine Zeitung и Süddeutsche Zeitung представляют качественные медиа, вследствие чего сохраняется высокий уровень публикаций в соответствии с принципами качественных изданий. Это находит отражение не только в тщательной проверке публикуемого фактического материала, но и его проработке в лингвистическом аспекте. Более того, изда-

Таблица 2

Клише для промптинга

Zero-Shot Prompting

Few-Shot Prompting

Отвечай как преподаватель немецкого языка. Нужно адаптировать аутентичный текст на немецком языке для уровня N. Вот критерии для этого уровня: *Описание критериев из таблицы*. Под текстом перечислены слова и выражения. Вся перечисленная лексика должна остаться в тексте.

Отвечай, как преподаватель немецкого языка. Нужно адаптировать аутентичный текст на немецком языке для уровня N. Вот критерии для этого уровня: *Описание критериев из таблицы*. Под текстом перечислены слова и выражения. Вся перечисленная лексика должна остаться в тексте. Вот пример адаптированного текста уровня N: *Пример текста с языковым уровнем N*.

Таблица 3

Текст Ссылка Текст №1 Zero-shot prompting А1 Текст №1 Zero-shot prompting А2 Текст №1 Zero-shot prompting B1 Текст №1 Few-shot prompting А1 Текст №1 Few-shot prompting А2 Текст №1 Few-shot prompting B1 Текст №2 Zero-shot prompting А1 Текст №2 Zero-shot prompting А2 Текст №2 Zero-shot prompting B1 Текст №2 Few-shot prompting А1 Текст №2 Few-shot prompting А2 Текст №2 Few-shot prompting B1 Текст №3 Zero-shot prompting А1 Текст №3 Zero-shot prompting А2 Текст №3 Zero-shot prompting B1 Текст №3 Few-shot prompting А1 Текст №2 Few-shot prompting А2 Текст №2 Few-shot prompting B1 ния ориентированы на носителей языка, а также не используют leichte Sprache (упрощенный язык). Соответственно, языковой уровень текстов таких публикаций не может быть уровня А (начинающий).

Адаптация текстов осуществлялась с использованием ChatGPT на базе GPT-4 с применением двух методов промптинга. Для каждого исходного текста сформированы три отдельные адаптированные версии, соответствующие уровням владения языком от A1 до B1. При использовании Zero-Shot Prompting промпт не содержал примеров ожидаемого результата, что требовало от модели самостоятельно адаптировать текст, используя исключительно исходные данные. Критерии языковых уровней взяты по международным стандартам владения языком и его понимания Common European Framework of References for Languages (CEFR). В этот стандарт входит 6 различных уровней: A1, A2, B1, B2, C1 и C2. Критерии уровней А1–В1, актуальные для настоящего исследования, представлены в таблице 1 (таб. 1 на стр. 142).

Запросы к чату формировались при помощи клише для Zero-Shot Prompting и FewShot Prompting, указанных в таблице 2 (таб. 2 на стр. 143).

Далее в таблице 3 даны ссылки на диалоги с чат-ботом, содержащие итоговые адаптивные версии текстов. Данные представлены для анализа и оценки ответов, выявления закономерностей и их зависимостей от различных видов промптинга, возможности разработки рекомендаций по улучшению качества взаимодействия пользователя и чат-бота для адаптации медиатекстов на основе этих данных (таб. 3 на стр. 143).

Для анализа и оценки полученных адаптированных текстов привлекался преподаватель немецкого языка как иностранного (обучение базовой грамотности – уровень B2), сертифицированный экзаменатор ÖIF (Deutsch trainerin von Alphabetisierung bis B2, lizenzierte ÖIF Prüferin), Австрия. Результаты сравнительного анализа показали следующее.

Текст №1, адаптированный с помощью Zero-Shot Prompting до уровня А1, не соответствует требуемому уровню. В адаптивной версии текста есть глаголы с управлением, причастные обороты и придаточные предложения. Эти грамматические темы обучающиеся осваивают на более высоких уровнях владения немецким языком. Адаптивная версия текста для уровня А2 в целом соответствует критериям, однако экспертом отмечается, что в тексте недостаточно придаточных конструкций для конечного этапа освоения этого уровня. Текст B1 соответствует начальному этапу освоения данного уровня, поскольку также содержит недостаточно придаточных предложений, необходимых для демонстрации синтаксического разнообразия.

Перейдем к тексту №2 того же промпта. Вариант, адаптированный до уровня A1, демонстрирует синтаксическую и лексическую простоту, характерную для данного уровня. Используются простые предложения, что обеспечивает ясность и доступность высказывания для понимания. Текст с заданным уровнем A2 отвечает критериям A2 за счет более широкого разнообразия грамматических конструкций и развернутых фразовых оборотов. Особое внимание привлекает употребление конъюнктива, который оживляет высказывание и придает ему оттенок гипотетичности и вежливости, что выходит за рамки элементарного владения языком. Вариант B1 соответствует ожиданиям начального уровня самостоятельного владения языком: в тексте наблюдается более сложная синтаксическая структура, включающая сочетание причинно-следственных связок, относительных оборотов и разнообразных союзов. Это позволяет выстраивать логически связное и аргументированное повествование, что является характерным признаком уровня B1.

Для текста №3 при использовании Zero-Shot Prompting получены следующие результаты. Вариант A1 не соответствует уровню: наличие сравнительной и превосходной степени прилагательных, а также употребление родительного падежа превышают требуемые умения обучающихся. Вариант A2 более соответствует конечному этапу ос- воения уровня: в тексте наблюдается употребление прошедшего времени Präteritum и причастий, что свидетельствует о владении более сложной грамматикой, которая используется на конечном этапе освоения уровня А2. Вариант текста, адаптированный до B1, соответствует начальному этапу освоения уровня, поскольку отмечается недостаточное количество придаточных предложений.

Перейдем к адаптации медиатекстов с помощью Few-Shot Prompting.

Результат анализа адаптивной версии текста №1 для А1 показал, что итоговый вариант скорее соответствует конечному этапу освоения уровня, поскольку в нем использованы глаголы с управлением, склонение прилагательных и отрицание с помощью аффиксов. Вариант A2 также соответствует конечному этапу освоения уровня: в тексте употребляется Genitiv и форма прошедшего времени Präteritum. Вариант B1 соответствует начальному этапу освоения уровня B1 в связи с использованием слишком простой лексики и грамматических конструкций.

При анализе текста №2, адаптированного с помощью Few-Shot Prompting, варианты текстов уровней A1 и А2 показали полное соответствие критериям. Вариант B1 соответствует начальному этапу освоения уровня B1, поскольку в тексте используется недостаточное количество сложных предложений.

При анализе текста №3 с использованием Few-Shot Prompting варианты текста с заданным уровнем A1, А2 и В1 подтвердили соответствие критериям.

Таким образом, по результатам сравнительного анализа адаптированных текстов можно сделать следующие выводы:

  • 1.    Метод Zero-Shot Prompting оказался менее эффективным для адаптации медиатекстов, поскольку не обеспечивает достаточного снижения до начальных уровней (A1, A2), оставляя сложные грамматические конструкции и лексику. В то же время не происходит адекватного усложнения текста до уровня B1, что приводит к несоответствию адаптированного материала требованиям языкового уровня и, соответственно, либо нивелирует ценность работы с текстом, либо затрудняет усвоение лексических единиц.

  • 2.    Метод Few-Shot Prompting показывает более высокий уровень соответствия адаптированных текстов заданным критериям, обеспечивая применение синтаксических конструкций разной степени сложности.

  • 3.    С учетом выявленных различий, наиболее эффективным методом для автоматической адаптации текстов может быть рекомендован Few-Shot.

Результаты задают дальнейший вектор движения: представляется перспективным расширить исследование за счет анализа использования других методов промптинга, таких как Chain-of-Thought Prompting. Полученные данные могут способствовать разработке более эффективных методов автоматической адаптации текстов.