Трудности машинного перевода: контекстная языковая неопределенность
Автор: Суховерхов Антон Владимирович, Де Витт Дороти, Манасиди Иоаннис Игоревич, Нитта Кейко, Крстич Владимир
Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics
Рубрика: Межкультурная коммуникация и сопоставительное изучение языков
Статья в выпуске: 4 т.18, 2019 года.
Бесплатный доступ
В статье изучаются актуальные проблемы, связанные с семантическими, грамматическими, стилистическими и техническими трудностями машинного перевода, сравниваются 4 основных метода такого перевода: 1) на основе правил (RBMT); 2) на основе корпусов текстов (CBMT); 3) нейронный (NMT); 4) гибридный (HMT). Описываются некоторые «открытые системы» перевода, которые позволяют самим пользователям исправлять или дополнять содержание перевода («краудсорсинговый», или «коллективный, перевод»). Коллективом авторов статьи, носителями языка разных стран (России, Греции, Малайзии, Японии и Сербии), проведено тестирование качества перевода наиболее показательных фраз на английском, русском, греческом, малайском и японском языках с использованием различных систем машинного перевода: PROMT (RBMT), Яндекс.Переводчик (HMT) и Google Translate (NMT). В результате тестирования выявлен недостаток учета семантического, лингвистического и прагматического контекстов переводимого текста (А. Суховерхов), неверный перевод редкой или лингвоспецифичной лексики (К. Нитта), смысловой перевод имен собственных (И. Манасиди), низкое распознавание идиоматических выражений и метафор (Д. де Витт). Авторами статьи показано, что для совершенствования современных систем машинного перевода требуется объединение буквальной, концептуальной и контентно-контекстной форм обработки смыслов текста, улучшение корпусов метафор и контекстологических словарей (Д. де Витт), разработка различных типов и стилей перевода, включающих специфические диалекты и идиолекты пользователей, а также гендерные особенности языка (К. Нитта). На материале сербского языка В. Крстичем переосмыслена с точки зрения машинного перевода проблема непереводимости («языковой относительности») понятий, уникальных для определенной культуры. И. Манасиди показано, что без участия человека невозможен перевод бурно развивающегося интернет-сленга, характеризующегося смешением национальных языков с английским.
Машинный перевод, непереводимость, контекстуальный перевод, лингвистическая относительность, лексическая многозначность, синтаксическая многозначность
Короткий адрес: https://sciup.org/149130004
IDR: 149130004 | DOI: 10.15688/jvolsu2.2019.4.10