Потенциал машинного перевода в медиадискурсе музеев: анализ современных браузерных систем

Бесплатный доступ

Статья посвящена актуальным проблемам оптимизации нейронного машинного перевода, которые обусловлены включением многоязычия в функционал онлайн-ресурсов. Описаны результаты анализа машинного перевода англо-, немецко- и франкоязычного контента медиадискурса музеев на русский язык с применением встроенных браузерных систем от Яндекс, Google и Microsoft. Выбор фрагментов для сравнительного анализа осуществлялся с учетом рандомного предпочтения исходного языка пользователями. Определено, что функциональные возможности систем машинного перевода, оптимизированных нейросетевыми технологиями, в основном обеспечивают его денотативную эквивалентность, корректно передают большинство имен собственных и адекватно актуализируют значения лексических единиц с опорой на контекст. Выявлены ситуации, когда браузерные переводчики используют соответствия без учета контекста, лингвокультурной традиции, прагматического значения языковых единиц, что демонстрирует ограниченные возможности этих систем создавать адекватный, стилистически и дискурсивно оформленный перевод. Установлено, что наибольшую сложность представляет перевод изолированных номинаций (названий разделов, кнопок выбора языков и т. п.), что свидетельствует о высоком уровне задействованного в системах машинного перевода искусственного интеллекта, имитирующего человека в его обязательном стремлении получить контекст, актуализирующий значение слова. В.А. Митягиной предложена концепция работы и дана общая характеристика актуальных исследований нейросетевого этапа развития машинного перевода, А.А. Новожиловой проанализированы англо- и немецкоязычные публикации по машинному переводу и контент Пергамского музея, А.П. Наумовой - публикации на французском языке и контент Музея Орсе.

Еще

Нейронный машинный перевод, искусственный интеллект, многоязычие, браузерные системы автоматизированного перевода, медиадискурс музея

Короткий адрес: https://sciup.org/149147500

IDR: 149147500   |   УДК: 81’322.4:069   |   DOI: 10.15688/jvolsu2.2024.5.7

Текст научной статьи Потенциал машинного перевода в медиадискурсе музеев: анализ современных браузерных систем

DOI:

В современном мире искусственный интеллект (далее – ИИ) играет ключевую роль во многих сферах деятельности общества, различные автоматизированные системы повсеместно используются как на бытовом уровне, так и в профессиональных областях. Весьма активно технологии ИИ задействованы в переводе: создаются и активно внедряются комплексные системы автоматизированного перевода, которые реализуют технологии переводческой памяти, статистического анализа текста, проверки качества, а также инструменты управления терминологией и системы машинного перевода. Всего несколько лет назад качество автоматического перевода, выполняемого, прежде всего, веб-сервисами на основе технологий машинного перевода, резко улучшилось, и короткая эпоха шуток и анекдотов, рожденных онлайн-пере-водчиками, закончилась. Актуальные возможности веб-переводчиков позволяют не только понять общее содержание оригинала, но и получить относительно адекватный текст. Оптимизация автоматического перевода связа- на с успехами в области искусственных нейронных сетей и искусственного интеллекта в целом. Вычислительные возможности суперкомпьютеров в сочетании с Большими данными (Big Data) реализуют идею, рожденную в 1940-е гг.: соединить многомиллиардную систему искусственных нейронов, аналогичных клеткам человеческого мозга с высокими мощностями ЭВМ. Отметим, что «глубокое обучение» (Deep Learning) как подход к «тренировке» нейросетей, придал динамичную, экстенсивную форму программам машинного перевода, которые изначально строились на заданных правилах трансформаций единиц исходного языка и языка перевода, использовании их структур и правил. Появились перспективы «вывести принципы, которые позволят нейронным сетям имитировать нейролингвистические процессы» [Дукаль-ская, Бараковская, 2022, с. 90].

Сегодня нейронный машинный перевод активно применяется в различных программах и сервисах, таких как переводчики в мобильных приложениях, онлайн-переводчики для веб-страниц, голосовые помощники с функцией распознавания речи и другие. Несмот- ря на значительный прогресс в этой области, машинный перевод все еще далек от идеального и может содержать ошибки или неточности. Однако информативная функция нейросетевого перевода используется активно и широко: многие ресурсы, на которых доступен автоматизированный перевод, стали частью инклюзивности общества, предлагающего равные права и возможности всем включенным в актуальное социокоммуникативное пространство [Mityagina, Volkova, Walter, 2022]. Не-владение иностранными языками в информационную эпоху перестало быть глобальным барьером. Согласимся с Крюгером в том, что непосредственное общение без переводчика остается недоступным вне иноязыковых компетенций, но уже преодолена ситуация, когда человек, по меткому выражению Уорфа, заключен в тюрьму своего языка [Krüger, 2018].

Таким образом, можно говорить об обусловленном растущей глобализацией и взаимосвязанностью мира переходе от одноязычного к многоязычному ИИ, который формируется как большая языковая модель (Large Language Model, LLM). Эта модель использует алгоритмы машинного обучения, определяющие в пространстве больших текстовых данных вероятностное сочетание слов и их значения в заданном контексте. Сегодня основное применение LLM находят в поисковых системах, чат-ботах, в написании маркетинговых текстов, электронных писем, а также в устном, письменном, аудиовизуальном переводе.

Многоязычный ИИ становится решающим фактором для транснациональных компаний, позволяет им охватить более широкую аудиторию, предлагать поддержку клиентов на нескольких языках и выходить на новые рынки. Многоязычие стало «новым этапом развития коммуникации в веб-пространстве, который пришел на смену кратким периодам господства английского языка и становления сегментов Интернета на национальных языках» [Митягина, Наумова, Новожилова, 2023, c. 5].

Интерес к научному анализу технологий машинного перевода растет с каждым годом как среди зарубежных, так и среди российских ученых. Основные направления исследований в области программ машинного перевода включают обоснование алгоритма постредактирования машинного перевода [Волкова, 2021;

Popovich, Bortnikov, 2023], оценку его качества [Коканова, Поротова, 2023; Sennrich, Haddow, Birch, 2016; Knaus, 2023], сравнение переводов, созданных профессиональными переводчиками и машинными программами [Нарбут, Шерстнева, 2022; Кузнецова, 2020; Welnitzova, Jakubickova, Králik, 2021; Yonghui et al., 2016], описание и сопоставление статистических и нейронных программ машинного перевода [Мурзабекова, Алиев, 2020; Денисова, 2018], а также осмысление правовых аспектов применения машинного перевода. Лингвистическое и переводоведческое осмысление феномена многоязычного ИИ началось совсем недавно. В обзорной статье М.Б. Раренко представлено его поэтапное развитие [Рарен-ко, 2021]. В работе «Искусственный интеллект в технологиях машинного перевода» авторы из ФИЦ Института управления (ИУ) РАН исследуют взаимосвязь машинного перевода с моделированием процессов понимания и генерации текстов на естественном языке и делают вывод о функционировании соответствующих переводческих программ в рамках грамматически согласованного перевода последовательностей слов [Колин и др., 2021]. В работе П. Кон-стантайна анализируется качество машинного перевода художественных текстов в системе Google Translate, в частности, его адекватность воспроизведения стилистических особенностей оригинала [Constantine, 2019]. Особое внимание уделяется изменению концепции перевода в контексте технологического развития и появлению новых ролей и компетенций переводчиков. Исследователи Р. Эсени, K. Беднарова-Гибова, Р. Эдина предпринимают анализ преимуществ и угроз искусственного интеллекта для лингвистов и предлагают теоретическая модель новых ролей переводчика [Eszenyi, Bednárová-Gibová, Edina, 2023]. Ш. Кастило и ее коллеги описывают разнообразные подходы к оценке качества машинного перевода и указывают на необходимость дополнительных методик для решения актуальных проблем в практике перевода [Castilho et al., 2018].

Разноплановый характер исследований ИИ в аспекте перевода связан со сложностью феномена ИИ во всех его проявлениях: нейросетевая программа перевода являет собой искусственный мозг, самостоятельно создающий текст перевода на основе огромного массива доступных данных, однако зачастую результат может не соответствовать оригиналу в полной мере, потому что естественные языки плохо поддаются абсолютному раз-, де- и перекодированию.

Следует отметить, что скорость развития нейросети увеличивается в геометрической прогрессии, и исследования не успевают за этим бурным развитием, которое является ответом на растущий объем контента, требующего не только перевода на множество языков, но и лингвокультурной и прагматической адаптации в условиях ограниченного времени. Автоматизация процесса перевода, позволяющая ускорить его выполнение, становится неотъемлемой частью работы переводчиков во многих профессиональных сферах. В связи с этим важно исследовать передовые технологии нейронного машинного перевода, включая оценку качества перевода, выполненного системами искусственного интеллекта с использованием усовершенствованных нейросетевых алгоритмов (например, Promt Neural, ChatGPT, Cloud Translation API, Яндекс Переводчик, DeepL, Google Переводчик, Microsoft Translator), а также изучение способности этих систем к самоисправлению в процессе обучения или по запросу об исправлении ошибок.

Наряду с этими позитивными процессами использование ИИ в общем и машинных переводчиков в частности в сферах, предполагающих присутствие творческого и интеллектуального потенциала человека, к которым относятся тексты музейного медиадискурса, накладывает некоторые ограничения: существуют опасения, что использование многоязычного контента путем его задействования в генерировании текста создает как риск плагиата, так и возможность мультиплицирования ошибок (см. о ней: [Knaus, 2023]).

Настоящее исследование посвящено изучению работы нейронных систем машинного перевода в пространстве медиадискурса, его актуальность определяется широким использованием сервисов машинного перевода для перевода контента веб-сайтов как разработчиками, так и пользователями, особенно с учетом сложности и высокой стоимости создания локализованных версий. Лингвистическое, транслатологическое осмысление информационно-технологических новаций в сфере пере- вода соответствует Национальной стратегии развития искусственного интеллекта в Российской Федерации до 2030 г., которая предусматривает повышение квалификации специалистов различных отраслей, что требует разработки и актуализации научных представлений о системах искусственного интеллекта в этих областях. Кроме того, улучшение информационнокоммуникационных технологий способствует формированию новых социоэкономических и социокультурных моделей, обеспечивая равный доступ граждан к многоязычным интернет-ресурсам, что особенно важно в условиях глобализации и интенсификации миграционных процессов.

Материал и методы исследования

Цель исследования – оценить возможности современных систем искусственного интеллекта на основе анализа результатов автоматического перевода текстов медиадискурса, что позволит определить текущий уровень развития машинного перевода, определить преимущества и недостатки для использования многоязычной аудиторией и способствовать дальнейшей оптимизации процесса машинного перевода.

Материалом послужил вербальный контент медиапространства музеев на немецком, английском, французском языках и его перевод-транслят на русский язык встроенными браузерными машинными переводчиками от сервисов Яндекс, Google, Microsoft, которые в настоящее время являются наиболее популярными автоматическими инструментами преодоления языковых барьеров. За единицу исследования принимались отдельные текстовые фрагменты, состоящие из нескольких предложений или номинативных единиц, обозначающих, например, названия рубрик или прочих иконок переключения на сайте.

Результаты и обсуждение

Информационный поиск, направленный на изучение сайтов памятников культуры, истории и архитектуры, музеев, выставок и других туристических достопримечательностей стал обязательной частью подготовки и организации путешествия. Версии на разных языках предлагают многие крупные туристические интернет-порталы, посвященные городу или региону в целом, и потенциальные туристы не испытывают проблем с предварительным знакомством с заданной локацией, но могут рассчитывать лишь на общие сведения об имеющихся достопримечательностях. Сайты, посвященные отдельным объектам, зачастую ограничиваются языковой версией на родном языке и версией на глобальном английском, которая изначально в большинстве случаев создается при помощи автоматических систем перевода без привлечения профессиональных переводчиков. Создается ситуация коммуникативного неравенства для пользователей, не владеющих ни государственным языком страны, в которую они направляются, ни английским языком, и машинный перевод необходимого контента становится единственным способом преодолеть языковой барьер.

Сначала обратимся к контенту сайта одного из самых известных музеев Германии – Пергамского музея (Pergamonmuseum). Сайт представлен в двух языковых версиях – немецкоязычной и англоязычной, сопоставительный анализ которых позволяет констатировать, что текст на английском – это сокращенный, прагматически адаптированный под возможности глобального получателя перевод. В целях анализа машинного перевода на русский язык для сравнения отобраны фрагменты, совпадающие по содержанию в немецкоязычной и англоязычных версиях (пользователи могут самостоятельно выбрать одну из доступных).

Автоматические переводчики Microsoft Translator, Google Translate и Яндекс Переводчик быстро и без смысловых ошибок выполнили перевод, но результаты их работы различаются в синтаксическом, лексическом и стилистическом аспектах.

В сообщении об изменении графика работы музея с кнопкой для получения дополнительной информации на главной странице сразу видим:

Пергамский музей

  • (1)    Bitte beachten Sie die geänderten Öffnungszeiten ab 16. April 2024. Mehr

  • (2)    Please note the changed opening hours from 16 April 2024. More

Microsoft Translator

  • (1)    Обратите внимание на изменение графика работы с 16 апреля 2024 года. Подробнее

  • (2)    Обратите внимание на изменение графика работы с 16 апреля 2024 года. Больше

Google Translate

  • (1)    Обратите внимание, что часы работы изменились с 16 апреля 2024 года. Подробнее

  • (2)    Обратите внимание, что часы работы изменились с 16 апреля 2024 года. Подробнее

Яндекс Переводчик

  • (1)    Пожалуйста, обратите внимание на изменение часов работы с 16 апреля 2024 года. Более

  • (2)    Пожалуйста, обратите внимание на измененные часы работы с 16 апреля 2024 года. Еще

    Приведенные примеры показывают, что все системы машинного перевода дают разные варианты для кнопки получения дополнительной информации (1) Mehr (2) More , передавая ее эквивалентами Подробнее , Более , Больше , Еще , из которых наиболее употребительным и контекстуально корректным для русскоязычных сайтов является вариант Подробнее . Остальные три эквивалента – контекстуальные аналоги, возможные в другом лексическом окружении. При сравнении переводов первого предложения с английского и немецкого обнаруживается полное совпадение переводов у переводчиков Google Translate и Microsoft Translator, а Яндекс Переводчик предложил для каждого языка свой вариант. Кроме того, переводчик Google допустил грамматическую неточность и выбрал глагол в форме прошедшего времени, хотя в момент проведения анализа (март 2024) речь шла о будущем времени и в оригинальных предложениях на немецком и английском языках на это указывают предлоги ab и from . Наиболее корректным из трех вариантов представляется перевод, предложенный Microsoft Translator, так как Яндекс использовал частицу пожалуйста , употребление которой в русском языке в подобных контекстах нетипично, в отличие от немецкого и английского языков. Опущение частицы вежливости пожалуйста при переводе двумя другими автоматическими переводчиками наглядно демонстрирует работу ИИ и анализ нейросетями данного контекста и сравнение его с подобными контекстами.

У всех онлайн-переводчиков возникли трудности при передаче сокращений, обозначающих кнопки переключения на доступные языковые версии DE и EN. Так Яндекс при переводе с английского оставил эти сокращения без изменений, при переводе с немецкого предложил вариант де / RU, Microsoft использовал прием транслитерации ДЕ / ЭН для английского языка и ЭН / ЭН для немецкого языка, а Google выбрал латинские сокращения RU / RU для немецкого и DE / RU для английского. Сокращения DE и EN, являются общепринятыми для обозначения данных языков, но у автоматических переводчиков возникла путаница при их передаче, несмотря на то что другие широкоупотребительные сокращения переводчики перевели без ошибок. Например, сокращенные обозначения дней недели были переданы верно при переводе с обеих языковых версий всеми анализируемыми переводчиками, также система распознала немецкие сокращения z.B., bzw., z.Z и т. п.

Машинные переводчики зачастую допускают ошибки при переводе имен собственных, и предпринятый анализ дал этому наблюдению подтверждение. Фамилия современного немецкого художника иранского происхождения Яде-гара Азизи , как показывает проверка в поисковых системах, передается в русскоязычных источниках при помощи приема транскрипции, согласно которому s , произносящийся звонко перед гласными, передается как з . Ни один из машинных переводчиков не перевел ее корректно. В большинстве случаев был использован прием транслитерации, в результате чего фамилия имеет написание Асиси , а переводчик Google при переводе с немецкого предложил в одном и том же тексте разные версии – Асиси и Асизи . Microsoft Translator использовал везде вариант Асиси , а в одном предложении при переводе с английского оставил оригинальное написание Yadegar Asisi . Такую нестабильность в передаче имени можно объяснить малой известностью этого художника в русскоязычном медиапространстве и тем, что нейросети еще не способны проводить тщательный поиск и анализ наравне с человеком. Однако следует отметить, что более известные имена собственные, например, Геракл , Афина , Парфенон , Прометей , Адриан , были переданы без искажения и в соответствии со сложившейся традицией их именования в русском языке.

Еще одной проблемой при автоматизированном переводе текстов музейного медиапространства оказываются иноязычные вкрапле- ния из другого языка. Например, немецкие слова Antikensammlung или Pergamonmuseum, das Panorama в английском тексте, функционирующие как названия, остались при переводе либо без изменения на немецком языке, либо переданы транслитерацией и склоняются по правилам русского языка, что не способствует адекватному восприятию: дас Панорама, Пергам-ский музей. Das Panorama; Уникальное партнерство между Антикензамлунгом Государственного музея Берлина; из фондов Анти-кенсаммлунга; с командой Antikensammlung. Таким образом, можно утверждать, что при переводе искусственный интеллект с подключением одного языка не всегда может учитывать иноязычные вкрапления, автоматически распознавать их и для перевода обращаться к ресурсам на другом языке, что обычно делает профессиональный переводчик.

При анализе текстов-транслятов данного сайта выявляются синтаксические и стилистические нарушения, лексическая несоче-таемость, эквиваленты, подобранные без учета контекста и т. п. В целом использование систем автоматического перевода может быть пригодным для информирования и формирования общего представления о музее. В текстах-транслятах довольно много примеров вполне корректных трансформаций:

Пергамский музей

  • (1)    Das Panorama führt die Besucherinnen und Besucher zurück in das Jahr 129 n. Chr. und zeigt ihnen die antike Stadt Pergamon an der kleinasiatischen Westküste.

Microsoft Translator

  • (1)    Панорама переносит посетителей в 129 год нашей эры и показывает древний город Пергам на западном побережье Малой Азии.

Пергамский музей

  • (2)    Yadegar Asisi reconstructs the city as it was during the time of the High Roman Empire under the rule of the Emperor Hadrian (AD 117–138).

Яндекс Переводчик

  • (2)    Ядегар Асиси реконструирует город таким, каким он был во времена Великой Римской империи под властью императора Адриана (117– 138 гг. н.э.).

Пергамский музей

  • (3)    In preparation for the show, the originals underwent extensive conservation and restoration.

This is especially true of the large statues of women from the courtyard of the Pergamon Altar, and the sculptures from its roof.

Google Translate

  • (3)    При подготовке к выставке оригиналы подверглись обширной консервации и реставрации. Особенно это касается больших статуй женщин из двора Пергамского алтаря и скульптур с его крыши.

В приведенных примерах (1–2) нейронные машинные переводчики верно передали смысл, синтаксически и стилистически корректно оформили предложения – при таком соблюдении дискурсивных конвенций (нормированных правил создания текстов с использованием заданных языковых средств) получатель перевода может легко и без необходимости дальнейшей интерпретации воспринимать информацию.

Далее проанализируем работу искусственного интеллекта при переводе текстов медиапространства музеев с французского языка на русский на примере сайта Музея Орсе (Musée d’Orsay). Данное учреждение культуры является вторым по популярности после Лувра и входит в десятку крупнейших музеев мира. Сайт представлен в четырех языковых версиях: на французском, английском, испанском и итальянском языках. Исключение составляют разделы, ориентированные на «внутренних», французских посетителей и отсутствующие в переводе на иностранные языки. Данные информационные блоки в наше исследование включены не были.

Перевод на русский язык названий ключевых разделов сайта был осуществлен автоматическими системами неоднородно. Отмечается использование однозначных и вариантных соответствий, не искажающих исходное значение:

Музей Орсе

  • (1)    LES COLLECTIONS

  • (2)    VISITE

  • (3)    RESSOURCES

Microsoft Translator

  • (1)    КОЛЛЕКЦИИ

  • (2)    ВИЗИТ

  • (3)    РЕСУРСЫ

Google Translate

  • (1)    КОЛЛЕКЦИИ

  • (2)    ПОСЕЩАТЬ

  • (3)    РЕСУРСЫ

Яндекс Переводчик

  • (1)    КОЛЛЕКЦИИ

  • (2)    ПОСЕЩЕНИЕ

  • (3)    РЕСУРСЫ

В приведенных примерах названия двух разделов (1) и (3) были переведены с помощью эквивалентов: коллекции (1) и ресурсы (3), а номинация раздела (2), содержащего общую информацию о часах работы, месторасположении и стоимости билетов, передана с помощью вариантных соответствий визит / посещение / посещать (2).

Иногда вариативность соответствий приводит к затруднениям в понимании текста:

Музей Орсе

  • (1)    VOUS ÊTES

  • (2)    AGENDA

  • (3)    BILLETTERIE

Microsoft Translator

  • (1)    ВЫ

  • (2)    ПОВЕСТКА ДНЯ

  • (3)    БИЛЕТНАЯ КАССА

Google Translate

  • (1)    ТЫ

  • (2)    ДНЕВНИК

  • (3)    НАЧИСЛЕНИЕ ОПЛАТЫ

Яндекс Переводчик

  • (1)    ВЫ

  • (2)    ПОВЕСТКА ДНЯ

  • (3)    ПРОДАЖА БИЛЕТОВ

Раздел (1) Vous êtes дословно переводится как «вы есть». В данном случае имеются в виду разные категории посетителей музея и специальные условия посещения для каждой из них. Очевидно, что все три системы машинного перевода выбрали дословный вариант без учета содержания раздела, название которого «живой» профессиональный переводчик перевел бы как Посетителям . Аналогичная ситуация прослеживается с единицей (2) Agenda , которая имеет следующие лексические значения: повестка дня ; записная книжка , ежедневник. Однако ни один из указанных вариантов наряду с дневником не передает информации о предстоящих мероприятиях, хотя посвященный им раздел может быть номинирован в тексте перевода как Выставки и события. При переводе названия раздела (3) Billetterie (рус. продажа билетов ; билетная касса ) системой перевода Google

Translate допущена лексическая ошибка и выбран неподходящий контекстуально вариант (3) начисление оплаты , который может вводить в заблуждение посетителей.

На сайте Музея Орсе, как и на сайте Пергамского музея, возникли трудности при переводе кнопок переключения между языковыми версиями:

Музей Орсе

  • (1)    FR

  • (2)    EN

  • (3)    ES

  • (4)    IT

Microsoft Translator

  • (1)    ФР

  • (2)    В

  • (3)    АР

  • (4)    ОНО

Google Translate

  • (1)    ПТ

  • (2)    В

  • (3)    ЯВЛЯЮТСЯ

  • (4)    ЭТО

На странице сайта музея после перевода системой Яндекс Переводчик перестал отображаться список доступных языковых версий. Для приведенных примеров, представленных в системах Microsoft Translator и Google Translate, характерно следующее:

  • 1)    перевод сокращений (1–4) выполнялся с английского языка, несмотря на аутентичный язык сайта – французский, а также фиксированные буквенные сочетания, обозначающие языки мира в соответствии со стандартом ISO 639;

  • 2)    в двух случаях машинные переводчики передали «транскрипционный» вариант оригиналов. Например, единица (2) EN , указывающая на английскую языковую версию сайта, по-английски звучит как [ин]. При этом данный звуковой комплекс созвучен предлогу in , который переводится на русский как в. Таким образом, вместо варианта Англ. системой был выбран неверный «омофонный» вариант перевода в. В случае с испанской языковой версией сайта, обозначаемой единицей (3) ES и произносимой по-английски как [из], системы машинного перевода предложили неверный вариант является вместо Исп. Транскрипция [из] в английском соответствует глаголу-связ-

  • ке to be в личной форме 2, 3 лица, единственного числа is, что переводится на русский как является, существует, есть;
  • 3)    в двух случаях использовались некорректные эквиваленты / вариантные соответствия: местоимение (4) it – оно / это, существительное (1) FR ПТ ( пятница ). В одном случае правильный эквивалент FR – ФР ( французский ). Основания для варианта перевода АР установить не удалось, так как в английском языке отсутствует лексическая единица, которая переводилась бы таким образом.

Анализ перевода имен собственных свидетельствует о преимущественном соблюдении норм и правил перевода данной разновидности лексических единиц. Музей Орсе является одним из крупнейших собраний европейской живописи и скульптуры, поэтому проблем в машинном переводе имен известных художников, скульпторов не возникает: Monet – Моне , Renoir – Ренуар , Edgar Degas – Эдгар Дега , Berthe Morisot – Берта Моризо .

Несмотря на вполне приемлемое качество транслятов с французского на русский язык, ни одна из исследуемых систем нейронного перевода не обеспечивает качество перевода, полностью готового к опубликованию. Рассмотрим отрывок описания картины Огюста Ренуара «Бал в Мулен де ла Галетт»:

Музей Орсе

(1) Cette oeuvre est sans doute la plus importante de Renoir au milieu des années 1870 et fut exposée à l’exposition du groupe impressionniste de 1877.

Microsoft Translator

(1) Эта работа, возможно , является самой важной работой Ренуара середины 1870-х годов и была выставлена на групповой выставке импрессионистов 1877 года.

Google Translate

(1) Эта работа, несомненно, является самой важной работой Ренуара середины 1870-х годов и была выставлена на выставке группы импрессионистов в 1877 году.

Яндекс Переводчик

(1) Эта работа, возможно , является самой важной работой Ренуара середины 1870-х годов и была выставлена на выставке группы импрессионистов 1877 года.

Все три примера требуют редактирования. В вариантах Microsoft и Яндекс словосо- четание sans doute (рус. несомненно) передано с ошибкой как возможно. Во всех примерах отмечается тавтология выставлена на выставке, которую можно убрать, заменив глагол на была представлена / экспонировалась. При передаче словосочетания l’exposition du groupe impressionniste (рус. досл. выставка группы импрессионистов) была допущена лексическая неточность: групповая выставка импрессионистов.

Заключение

Результаты проведенного анализа перевода отдельных фрагментов текстов медиадискурсов музеев, выполненного браузерными системами автоматического перевода, которые используют технологии нейронных сетей, показывают, что качество функциональных возможностей современных систем машинного перевода в большинстве случаев позволяет решать повседневные задачи, обеспечивая приемлемый уровень адекватности и эквивалентности:

– многоязычный ИИ в основном правильно передает имена собственные на языке перевода; номинативные и контекстуальные ошибки и неточности связаны с транскрипционной передачей имен собственных, известных в отдельных лингвокультурных пространствах;

– сложность представляют лишь изолированные номинации разделов и аббревиатуры кнопок переключения доступных языков, что свидетельствует о высоком уровне искусственного интеллекта, имитирующего человека в его обязательном стремлении получить контекст, актуализирующий значение слова;

– автоматические системы выбирают первое, самое частотное из многих возможных соответствий, не способны редактировать тексты и допускают тавтологию.

Таким образом, корректный, стилистически и дискурсивно оформленный перевод сегодня может быть выполнен только с участием человека. Специалистам необходимо далее осуществлять оптимизацию нейронных систем автоматизированного перевода.

Список литературы Потенциал машинного перевода в медиадискурсе музеев: анализ современных браузерных систем

  • Волкова И. Д., 2021. Постредактирование машинного перевода научной статьи // Homo Loquens: Вопросы лингвистики и транслятологии. Вып. 14. С. 13–25.
  • Денисова Д. С., 2018. Современные системы машинного перевода. Статический машинный перевод // Синергия наук. № 19. С. 1425–1434.
  • Дукальская И. В., Бараковская Е. В., 2022. Нейронные сети в машинном переводе // Инфокоммуникационные технологии. Т. 20, № 2 (78). С. 90–95. DOI: 10.18469/ikt.2022.20.2.10
  • Коканова Е. С., Поротова П. В., 2023. Автоматическая метрика оценка качества машинного перевода BLEU // Профессия переводчика: вызовы и перспективы. Вып. 2. С. 44–47.
  • Колин К. К., Хорошилов Ал-др А., Никитин Ю. В., Пшеничный С. И., Хорошилов Ал-й А., 2021. Искусственный интеллект в технологиях машинного перевода // Социальные новации и социальные науки. № 2. С. 64–80. DOI: 10.31249/snsn/2021.02.05
  • Кузнецова Э. В., 2020. Машинный перевод vs человеческий перевод с точки зрения передачи воздействующего потенциала рекламного банковского текста // Проблемы языка и перевода в трудах молодых ученых. № 19. С. 99–105.
  • Митягина В. А., Наумова А. П., Новожилова А. А., 2023. Транслатологическое обоснование создания многоязычных ресурсов Интернета // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 22, № 3. С. 5–18. DOI: https://doi.org/10.15688/jvolsu2.2023.3.1
  • Мурзабекова А. Р., Алиев З. Г., 2020. Машинный перевод: системы машинного перевода, их недостатки и преимущества // Инновационное развитие науки и техники: сб. ст. VI Междунар. науч.-практ. конф. С. 4–9.
  • Нарбут Е. В., Шерстнева Е. С., 2022. Машинный перевод vs. человеческий перевод: сравнительный метод // Вестник Северо-Восточного государственного университета. № 38. С. 20–27.
  • Раренко М. Б., 2021. Машинный перевод: от перевода «по правилам» к нейронному переводу // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Серия 6. Языкознание. № 3. С. 70–79. DOI: 10.31249/ling/2021.03.05
  • Castilho S., Doherty S., Gaspari F., Moorkens J., 2018. Approaches to Human and Machine Translation Quality Assessment: From Principles to Practice // Technologies and Applications. Springer. Vol. 1. P. 9–38. DOI: 10.1007/978-3-319-91241-7_2
  • Constantine P. 2019. Google Translate Gets Voltaire: Literary Translation and the Age of Artificial Intelligence // Contemporary French and Francophone Studies. Vol. 23, iss. 4. P. 471–479. DOI: 10.1080/17409292.2019.1694798
  • Eszenyi R., Bednárová-Gibová K., Edina R., 2023. Artificial Intelligence, Machine Translation & Cyborg Translators: A Clash of Utopian and Dystopian Visions // Orbis Linguarum. Vol. 21, iss. 22. P. 102–113. DOI: 10.37708/ezs.swu.bg.v21i2.13
  • Knaus Th., 2023. Künstliche Intelligenz und Bildung: Was sollen wir wissen? Was können wir tun? Was dürfen wir hoffen? Und was ist diese KI? Ein kollaborativer Aufklärungsversuch // Ludwigsburger Beiträge zur Medienpädagogik. Ausgabe 23. S. 1–42. DOI: 10.21240/lbzm/23/19
  • Krüger R., 2018. Mehrsprachigkeit im Licht der Maschinenübersetzung // Magazin Sprache. URL: https://www.goethe.de/ins/dk/de/spr/mag/21250571.html
  • Mityagina V. A., Volkova I. D., Walter S., 2022. Multilinguality of Digital Platforms as a Factor of Inclusive Growth in the Global Economic Space // New Technology for Inclusive and Sustainable Growth. Smart Innovation, Systems and Technologies / ed. by E. I. Inshakova, A. O. Inshakova. Singapore: Springer. Vol. 287. P. 267–276. DOI: 10.1007/978-981-16-9804-0_23
  • Popovich S. G., Bortnikov V. I., 2023. Machine Translation: On the Problem of Post-Editing // Язык в сфере профессиональной коммуникации: сб. материалов Междунар. науч.-практ. конф. (Екатеринбург, 20 апреля 2023 г.). С. 469–473.
  • Sennrich R., Haddow B., Birch A., 2016. Improving Neural Machine Translation Models with Monolingual Data. Edinburgh: School of Informatics University of Edinburgh. 245 p.
  • Strube J., 2023. Im Austausch mit künstlicher Intelligenz: Neues Forschungsprojekt rückt mehrsprachige Frage-Antwort-Systeme in den Fokus). URL: https://www.sitefusion.de/news/imaustausch-mit-kuenstlicher-intelligenz-neuesforschungsprojekt-rueckt-mehrsprachige-frageantwort-systeme-in-den-fokus/
  • Welnitzova K., Jakubickova B., Králik R., 2021. Human-Computer Interaction in Translation Activity: Fluency of Machine Translation // RUDN Journal of Psychology and Pedagogics. Vol. 18, № 1. P. 217–234. DOI: 10.22363/2313-1683-2021-18-1-217-234
  • Yonghui W., Schuster M., Chen Z., V Le Q., Norouzi M., Macherey W., Krikun M., Cao Y., Gao Q., Macherey K. et al., 2016. Google’s Neural Machine Translation System: Bridging the Gap Between Human and Machine Translation. DOI: 10.48550/arXiv.1609.08144
Еще