Использование систем машинного перевода при работе с языком denglish
Автор: Крашенинникова Наталья Александровна
Журнал: Симбирский научный Вестник @snv-ulsu
Рубрика: Филология
Статья в выпуске: 2 (2), 2010 года.
Бесплатный доступ
В статье дан краткий анализ проблем, возникающих при использовании систем машинного перевода со смешанными языками. Представлены результаты проведенного исследования, целью которого было выяснить, как системы машинного перевода справляются с переводом слов смешанных языков (на примере языка Denglish).
Машинный перевод, смешанные языки, англо-американизация немецкого языка, заимствования
Короткий адрес: https://sciup.org/14113530
IDR: 14113530
Текст научной статьи Использование систем машинного перевода при работе с языком denglish
Вот уже больше полувека мир оперирует таким понятием, как «машинный перевод». Машинный перевод был главной целью компьютерной лингвистики в 50-х и 60-х годах, и по сей день совершенствование существующих систем машинного перевода и разработка новых программ остается актуальной задачей компьютерной лингвистики.
Разработчики «научили» компьютер переводить слова, словосочетания, фразы и даже целые предложения с одного языка на другой. А как быть, когда в один язык проникают слова другого языка? Ведь границы между языками условны, а заимствование лексики одного языка другим является закономерным следствием языковых контактов, имеющихся в истории развития и существования любого языка. С какими проблемами может столкнуться машина при переводе таких предложений? И можно ли в таких случаях получить более или менее адекватный перевод?
Данная работа посвящена переводу англо-американских заимствований в немецком языке с помощью программ машинного перевода. Тема английских заимствований в немецком языке достаточно популярна и становилась объектом изучения для многих как отечественных, так и зарубежных лингвис- тов. Тем не менее интерес к данной проблеме с течением времени не ослабевает, что свидетельствует о ее многоаспектности и неисчерпаемости. Язык как явление многогранное и находящееся в постоянном развитии, не перестает удивлять лингвистов, непрерывно поставляя им новый материал для исследования.
В данной статье представлены результаты проведенного исследования, целью которого было выяснить, как системы машинного перевода справляются с переводом слов смешанных языков (на примере языка Denglish). Объектом исследования является выборка англо-американских заимствованных слов в немецком языке.
Все англо-американизмы в немецком языке можно разделить на несколько групп в зависимости от того, какой критерий брать за основу.
В зависимости от тематики лексики можно сказать, что англоязычные заимствования проникают в различные сферы жизни немецкого общества:
-
• в область моды и внешнего вида;
-
• в область музыки;
-
• в область кино и театра;
-
• в область литературы;
-
• в область спорта;
-
• в область компьютеров, мобильных устройств и телекоммуникации;
-
• в область экономики и управления;
-
• в область работы и трудоустройства;
-
• в область путешествий;
-
• в область питания;
-
• в область интерьера и устройства дома;
-
• в область медицины и здравоохранения.
В зависимости от особенностей ассимиляции англоязычных заимствований в немецком языке можно выделить 3 группы англо-американизмов:
-
1) слова и выражения, сохраняющие английское написание: T-shirt-painter, simple, different, small-talk;
-
2) слова, частично ассимилированные немецким языком, – употребление существительного с артиклем, написание с прописной буквы, приобретение заимствованным словом немецких грамматических форм: die Edition, das TV-Magazin, die Software, der Event, boomen – boomende;
-
3) заимствования, включенные в состав композитов и дающие гибридные образования: Service-Dienst, Servicwe-Selte, Top-Lage, Inter-CityZug, Euri-CityZug, Durch-Ticket, Topfset, Business-Gast [1].
-
В дальнейшем в данной работе мы будем обращаться именно к этой классификации.
Для проведения исследования были выбраны 5 программ-переводчиков: 3 online-переводчика (Google, Pragma online и Worldlingo) и 2 программы машинного перевода (Promt 8.0 и IMTranslator 3.0).
В переводчике Google (http://translate. для построения модели перевода применяются методы самообучения на основе статистического анализа.
В переводчике Pragma online нет никаких отдельных тематических словарей. В главном переводном словаре отмечены некоторые многозначные слова. Имеется только дополнительный (необязательный) словарь специальной терминологии, где собраны слова из соответствующих областей, например: медицина, химия, математика, нефтегазовая и т. п. Программа подгружает все требуемые словари автоматически.
Переводчик Worldlingo (http://www2. переводит предложения и тек- сты более 20 различных тематик. Качество перевода (по данным сайта хорошее.
В программе Promt 8.0 можно подключать пользовательские словари и онлайновые словарные базы, а использование базы переведенных текстов позволяет экономить время при работе с типовыми документами.
Программа IMTranslator 3.0 осуществляет быстрый перевод сообщений в наиболее популярных программах для обмена мгновенными сообщениями – ICQ, AIM, MSN Messenger и Yahoo! Messenger. Одной из особенностей данной программы является поддержка транслитерации русского текста.
Для оценки результатов исследования были выдвинуты следующие критерии:
-
1. Корректность/адекватность перевода. Здесь мы оцениваем точность найденных программой-переводчиком переводных эквивалентов отдельных слов и словосочетаний.
-
2. Использование приема транслитера-ции/транскрипции.
-
3. Невыполнение перевода, т. е. программа-переводчик оставляет слово без изменения, так как она не находит его ни в одном из подключенных словарей.
-
4. Частичное выполнение перевода (прежде всего это относится к заимствованиям третьей группы, которую составляют заимствования, включенные в состав композитов и дающие гибридные образования). Программа-переводчик выполняет перевод лишь одного (или нескольких) компонентов «гибридного» слова, а остальные компоненты остаются в переводе без изменений, так как программа не находит его ни в одном из подключенных словарей.
-
5. Точность перевода. Здесь мы оцениваем, насколько хорошо программа-переводчик выбирает наиболее подходящее по смыслу значение многозначного слова.
-
6. Наличие орфографических и грамматических ошибок в переводе (значение этого показателя высчитывается отдельно).
Для проведения данного исследования были отобраны англо-американские заимствования в немецком языке общим объемом в 120 лексических единиц. Эта выборка была составлена путем сплошного просмотра немецкоязычных периодических изданий, посвященных различным тематикам, а также научно-популярных статей из сети Интернет.
Для оценки полученных результатов исследования мы рассмотрим по 5 примеров для каждой группы заимствований. Весь список состоял из 120 примеров употребления англо-американизмов в немецком языке.
Заимствования 1 группы: слова и выражения, сохраняющие английское написание (табл. 1). Оценка полученных результатов исследования данных примеров представлена в таблице 2.
Таблица 1
Перевод англо-американизмов 1 группы
№ |
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
1 |
Anytime ist partytime |
Anytime partytime |
В любое время является участником время |
Anytime есть partytime |
В любое время время партии |
Анютиме является партютиме |
2 |
Butterzart geschmorte Lammschulter mit Rüben etwa oder köstliche Desserts wie apple pie oder Reispudding mit Pflaumen – einfach, aber gut |
Нежно маслом тушеное плечо ягненка с корнеплодами, например, или превосходные десерты как apple pie или рисовый пудинг со сливами – просто, но хорошо |
Тушеная баранина плечу с репой Butterzart например, или десерты, как яблочный п+ ирог или рисовый пудинг со сливами – простой, но хороший |
Butterzart geschmorte плеча ягненка со свеклой разве или прекрасные десерты как apple pie или Reispudding со сливами – просто, однако хорошо |
Масло-неж палило плечо овечки с морко-вами около или delicious десертами как расстегай яблока или пудинг риса с сливами – просто, но хороше |
Нежно маслом тушеное плечо ягненка с корнеплодами, например, или превосходные десерты как аппле пи или рисовый пудинг со сливами – просто, но хорошо |
3 |
Junge Männer und Frauen laufen Hand in Hand oder sitzen in CoffeeShops – neben «Starbucks» haben sich längst lokale Ketten wie das «Kofe-Haus» etabliert |
Молодые мужчины и женщины бегут рука об руку или сидят в магазинах Coffee – наряду с «Starbucks» давно локальные цепи устроились как «дом Kofe» |
Молодые мужчины и женщины идут рука об руку или посидеть в кафе – рядом с «Starbucks» уже давно местные сети, такие, как «Дом Кофе-установлена» |
Молодые мужчины и женщины идут рука об руку или посидеть в кафе – рядом с «Starbucks» уже давно местные сети, такие, как «Дом Кофе-установлена» |
Молодые человеки и женщины, котор побежали hand in hand или сидят в кофейнях – около приковывать «Starbucks» длинний местный как «дом Kofe» установил |
Молодые мужчины и женщины бегут Рука об руку или сидят в магазинах Coffee – наряду с «Штарбукс» давно локальные цепи устроились как «дом Kofe» |
4 |
Wieder so empty feeling |
Снова таким образом empty feeling |
Опять же, чувствую себя таким пустым |
Опять так empty feeling |
Опять настолько пустое ощупывание |
Снова таким образом эмптю феелинг |
5 |
T rip geht nach Süden, holidays in Italy |
Поездка идет на юг, holidays в Italy |
Поездка находится на юге, отдых в Италии |
Trip идет после юга, holidays в Italy |
Отключение идет к югу, праздникам в Италию |
Поездка идет на юг, холи-дайс в Италию |
Таблица 2
Результаты перевода англо-американизмов 1 группы (%)
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTransl ator 3.0 |
|
Корректный/адекватный перевод англо-американизмов в немецком предложении |
20 |
80 |
50 |
30 |
|
Транслитерация/транскрипция |
60 |
||||
Невыполнения перевода |
70 |
90 |
|||
Частичный перевод |
10 |
10 |
|||
Неправильный выбор значения многозначного слова |
20 |
10 |
50 |
||
Орфографические и грамматические ошибки в переводе |
7,7 |
10 |
20 |
50 |
Таким образом, мы видим, что при переводе англо-американизмов 1 группы программы-переводчики показывают не очень хорошие результаты. Лучшие результаты показал переводчик Google (80 %), а наихудшие результаты – переводчик Pragma online (90 % непереведенных лексических единиц). Это связано с тем, что программы-переводчики в большинстве случаев не воспринимают неассимилированные англо-америка-низмы. При этом следует отметить, что про- цент ошибок при переводе сравнительно невелик, за исключением программы-переводчика IMTranslator 3.0. Орфографические ошибки связаны в первую очередь с ошибочной транслитерацией и транскрипцией англо-американизмов.
Заимствования 2 группы: слова, частично ассимилированные немецким языком (табл. 3). Оценка полученных результатов исследования данных примеров представлена в таблице 4.
Таблица 3
Перевод англо-американизмов 2 группы
№ |
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
1 |
Den Hit «Who's Afraid of Detroit?» ließ er so lange remixen , bis jeder seiner Kollegen mal dran war |
Хит «Who's Afraid of Детройт?» он оставлял так долго remixen, до каждого из его коллег был на очереди однажды |
Хит «Кто боится Детройт? он так долго ремикс, пока каждый из его коллег имели в виду |
Хит «Who's Afraid of Detroit»? он пока позволил remixen, вплоть до был каждых его коллег раз на этом |
Удар «испуганн Detroit?» оно препятствовал remixen настолько длиной, до тех пор пока каждый из своих коллегаов не быть временами к |
Хит «ехо'с Afraid оф Детройт?» он оставлял так долго ремик-сен, до каждого из его коллег был однажды на этом |
2 |
Haymarket Hotel: Mitten im Theatre District , ideale Lage zum Shoppen |
Haymarket отель: Посреди театра District, идеальное положение к хождению по магазинам с целью совершения покупок |
Haymarket Hotel: Отель расположен в районе театра, идеально расположен для шоппинга |
Haymarket гостиница: середины в Тре Теи District, идеальное положение к Shoppen |
Гостиница Haymarket: В середине в заречье театра, идеально ситуация к Shoppen |
Гаймаркет отель: Посреди Театре District, идеальное положение к хождению по магазинам с целью совершения покупок |
3 |
und Hampstead können leicht zu Fuß erreicht werden |
Swiss коттедж станцию метро находится на удалении немногих пешеходных минут а также Shopping-Centren от Camden со знаменитым Camden Market и Hampstead легко могут достигать пешком |
Swiss Cottage станция метро находится в нескольких минутах ходьбы и торговых центрах Камден с известным Камден рынка, Hampstead, откуда легко добраться пешком |
Swiss Cottage U-Bahn-Station некоторые Gehminuten и также Shopping-Centren Camden со знаменитым Camden достигнутый легко пешком отдален снабжения опознавательными знаками и Hampstead могут становятся |
Станцией швейцарского коттеджа подземной будет немногие идя минуты дистантные и также покупка Centren Camden с известной чон-сервной банкой рынка и Hampstead Camden легко к ноге была дос-тигана |
Свисс коттедж станцию метро находится на удалении немного пешеходных минут а также Схоп-пинг-еентрен от еамнен с известным еамнен Market и Гампштеан легко могут достигать пешком |
4 |
Doch ein cooles Image genügt Markus und seinen Kumpels nicht |
Все же, классный имидж не хватает Маркусу и его приятелям |
Но прохладном изображение не является достаточным Марк и его друзья |
Cooles имидж все-таки не удовлетворяет Маркусу и его горняка |
Но холодное изображение не достаточно для Markus и своего buddy |
Все же, первоклассный имидж не хватает Маркусу и его приятелям |
5 |
Lorenzo spielt relaxte Musik für den Dancefloor |
Лоренцо играет музыка отдыхала для танцевального зала |
Лоренцо играет расслабляю щая музыка для танцполов |
Lorenzo играет relaxte музыку для Dancefloor |
Lorenzo играет нот relaxte для Dancefloor |
Лоренцо играет музыка отдыхала для танцевального зала |
Таблица 4
Результаты перевода англо-американизмов 2 группы (%)
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
Корректный/адекватный перевод англо-американизмов в немецком предложении |
44,5 |
66,67 |
22,2 |
44,45 |
|
Транслитерация/транскрипция |
22,2 |
||||
Невыполнения перевода |
22,2 |
44,45 |
|||
Частичный перевод |
11,1 |
11,1 |
11,1 |
||
Неправильный выбор значения многозначного слова |
22,2 |
33,33 |
77,3 |
44,45 |
22,2 |
Орфографические и грамматические ошибки в переводе |
11,1 |
11,1 |
11,1 |
22,2 |
Таким образом, можно сделать следующие выводы: при переводе слов 2 группы программы-переводчики также испытывают некоторые затруднения. Некоторые программы-переводчики справляются с переводом слов 2 группы значительно лучше, чем с переводом слов 1 группы (например, Pragma online – 22,2 % по сравнению с 0 % или Promt – 44,5 % по сравнению с 20 %). Некоторым программам-переводчикам, напротив, сложнее работать с англо-американизмами 2 группы (например, Worldlingo, где процент невыполнения перевода составляет 44,45 %). Также увеличился процент орфографических и грамматических ошибок при переводе.
Заимствования 3 группы: заимствования, включенные в состав композитов и дающие гибридные образования (табл. 5). Оценка полученных результатов исследования данных примеров представлена в таблице 6.
Таблица 5
Перевод англо-американизмов 3 группы
№ |
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
1 |
Der DJ spannt einen schönen Bogen für seinen Mix, von reduzierten Techno-Entwürfen bis zu den housigeren Tracks des Endes |
Ди-джей натягивает прекрасный лист для его смеси, от сокращенных техно-проектов до housigeren Tracks конца |
DJ обращает хороший обмен на его сочетание сокращения конструкций техно треки на конец housy |
DJ пряли красивую дугу для его смешивания, от сокращенных Techno-Entwürfen до housigeren Tracks исхода |
DJ протягивает красивейший локоть для своих смешиваний, от уменьшенных проектов Techno к housigeren следы конца |
Ди-джей натягивает прекрасный лист для его смеси, от сокращенных проектов Techno до хоусигерен Тракс конца |
2 |
Aber es gibt auch Highlights. So verfügt das m888a über zwei Sim-Kartenslots , kann sich also bei zwei Providern gleichzeitig einbuchen |
Но имеются также кульминационные моменты. Таким образом располагает m888a более 2 лотов карт Сима, умеет себя в 2 провайдерах одновременно einbuchen |
Но Есть также подчеркивается. Таким образом, вы m888a два слота SIM-карты, поэтому бронирование в то же время две поставщиков |
Но Есть также подчеркивается. Таким образом, вы m888a два слота SIM-карты, поэтому бронирование в то же время две поставщиков |
Но будут также highlights. Таким образом m888a имеет 2 Sim Kartenslots, может в-книга сама таким образом с 2 Providern в то же самое время |
Но имеются также кульминационные моменты. Таким образом располагает m888a более 2 лотов карт Сима, умеет себя в 2 провайдерах одновременно айн-бухен |
3 |
Reagiert der Kunde nicht, soll der Anbieter die Daten-Roaming-Dienste sperren |
Если клиент не реагирует, продавец должен блокировать службы данных Roaming |
Не отвечает, то клиент данных поставщика услуг роуминга блок |
Если не будет реагировать известие, должен заградить Anbieter Daten-Roaming-Dienste |
Если клиент не реагирует, то offerer должен закрыть обслуживания данных кочуя |
Если клиент не реагирует, продавец должен блокировать службы данных Roaming |
№ |
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
4 |
Dabei haben sich die Software-Entwickler redlich Mühe gegeben, den Apple-Look nachzuahmen |
При этом программные разработчики постарались добросовестно подражать AppleLook |
Эти разработчики программного обеспечения были честные усилия, чтобы имитировать Apple-смотреть |
Software-Entwickler при этом честно дались заботы подражать Apple-Look |
Проявители средства программирования дали справедливо тревогу для того чтобы скопировать взгляд Apple |
При этом программные разработчики постарались добросовестно подражать Аппле-Лоок |
5 |
Die Kölner HipHop-Crew kann auf einschlägige Erfahrungen mit deutschen Show-Geschäft zurückblicken |
Кельнский экипаж хип-хопа может оглядываться назад на специальные опыты с немецким делом шоу |
Кельн экипажа хип-хоп может оглянуться на соответствующий опыт немецкого шоу-бизнеса |
Kölner Hip-HopCrew может оглянуться на специализированные опыты с немецким Show-Geschäft |
Экипаж хмеля вальмы Cologne может посмотреть назад на уместных опытах с немецким сфера развлечений |
Кельнский экипаж хип-хопа может оглядываться назад на специальные опыты с немецким делом шоу |
Таблица 6
Результаты перевода англо-американизмов 3 группы (%)
PROMT |
Google переводчик |
PRAGMA online |
Worldlingo |
IMTranslator 3.0 |
|
Корректный/адекватный перевод англо-американизмов в немецком предложении |
16,66 |
66,7 |
16,66 |
||
Транслитерация/транскрипция |
16,66 |
||||
Невыполнения перевода |
16,66 |
16,66 |
83,34 |
33,34 |
|
Частичный перевод |
16,66 |
16,66 |
33,34 |
||
Неправильный выбор значения многозначного слова |
50 |
16,66 |
50 |
50 |
|
Орфографические и грамматические ошибки в переводе |
Как видно из представленной выше таблицы, все переводчики испытывают проблемы при переводе заимствований 3 группы. В большинстве случаев программы-переводчики выбирают неверное значение многозначного слова. Также высок процент невыполнения перевода (83,34 % у PRAGMA online и 33,34 % у Worldlingo). Но все же почти все программы-переводчики пытаются хоть частично, но перевести англо-американизмы 3 группы (PROMT – 16,66 %, Worldlingo – 16,66 %, IMTranslatr 3.0 – 33,34 %).
В ходе исследования и оценки полученных результатов были сделаны следующие выводы.
Программы-переводчики не воспринимают англо-американизмы 1 группы. Соответственно, процент корректного/адекватного перевода сравнительно невелик (за исключением переводчика Google и Worldlingo).
При переводе заимствований 2 группы программы-переводчики имеют некоторые затруднения. Основная проблема – выбор неправильного значения многозначного слова. Также при переводе англо-американизмов 2 группы увеличивается число орфографических и грамматических ошибок.
При переводе англо-американизмов 3 группы программы-переводчики испытывают серьезные затруднения. Процент корректно-го/адекватного перевода существенно ниже по сравнению с переводом заимствований 1 группы. Также увеличивается и процент невыполнения перевода.
1. Тимашева О. В. Угроза американизации и современная художественная литература Франции // Западная Европа и культурная экспансия «американизмов»: сб. научных тр. / сост. Ю. М. Каграманов. М., 1985. С. 213-226.
Список литературы Использование систем машинного перевода при работе с языком denglish
- Тимашева О. В. Угроза американизации и современная художественная литература Франции//Западная Европа и культурная экспансия «американизмов»: сб. научных тр./сост. Ю. М. Каграманов. М., 1985. С. 213-226.