Использование систем машинного перевода при работе с языком denglish

Автор: Крашенинникова Наталья Александровна

Журнал: Симбирский научный Вестник @snv-ulsu

Рубрика: Филология

Статья в выпуске: 2 (2), 2010 года.

Бесплатный доступ

В статье дан краткий анализ проблем, возникающих при использовании систем машинного перевода со смешанными языками. Представлены результаты проведенного исследования, целью которого было выяснить, как системы машинного перевода справляются с переводом слов смешанных языков (на примере языка Denglish).

Машинный перевод, смешанные языки, англо-американизация немецкого языка, заимствования

Короткий адрес: https://sciup.org/14113530

IDR: 14113530

Текст научной статьи Использование систем машинного перевода при работе с языком denglish

Вот уже больше полувека мир оперирует таким понятием, как «машинный перевод». Машинный перевод был главной целью компьютерной лингвистики в 50-х и 60-х годах, и по сей день совершенствование существующих систем машинного перевода и разработка новых программ остается актуальной задачей компьютерной лингвистики.

Разработчики «научили» компьютер переводить слова, словосочетания, фразы и даже целые предложения с одного языка на другой. А как быть, когда в один язык проникают слова другого языка? Ведь границы между языками условны, а заимствование лексики одного языка другим является закономерным следствием языковых контактов, имеющихся в истории развития и существования любого языка. С какими проблемами может столкнуться машина при переводе таких предложений? И можно ли в таких случаях получить более или менее адекватный перевод?

Данная работа посвящена переводу англо-американских заимствований в немецком языке с помощью программ машинного перевода. Тема английских заимствований в немецком языке достаточно популярна и становилась объектом изучения для многих как отечественных, так и зарубежных лингвис- тов. Тем не менее интерес к данной проблеме с течением времени не ослабевает, что свидетельствует о ее многоаспектности и неисчерпаемости. Язык как явление многогранное и находящееся в постоянном развитии, не перестает удивлять лингвистов, непрерывно поставляя им новый материал для исследования.

В данной статье представлены результаты проведенного исследования, целью которого было выяснить, как системы машинного перевода справляются с переводом слов смешанных языков (на примере языка Denglish). Объектом исследования является выборка англо-американских заимствованных слов в немецком языке.

Все англо-американизмы в немецком языке можно разделить на несколько групп в зависимости от того, какой критерий брать за основу.

В зависимости от тематики лексики можно сказать, что англоязычные заимствования проникают в различные сферы жизни немецкого общества:

  •    в область моды и внешнего вида;

  •    в область музыки;

  •    в область кино и театра;

  •    в область литературы;

  •    в область спорта;

  •    в область компьютеров, мобильных устройств и телекоммуникации;

  •    в область экономики и управления;

  •    в область работы и трудоустройства;

  •    в область путешествий;

  •    в область питания;

  •    в область интерьера и устройства дома;

  •    в область медицины и здравоохранения.

В зависимости от особенностей ассимиляции англоязычных заимствований в немецком языке можно выделить 3 группы англо-американизмов:

  • 1)    слова и выражения, сохраняющие английское написание: T-shirt-painter, simple, different, small-talk;

  • 2)    слова, частично ассимилированные немецким языком, – употребление существительного с артиклем, написание с прописной буквы, приобретение заимствованным словом немецких грамматических форм: die Edition, das TV-Magazin, die Software, der Event, boomen – boomende;

  • 3)    заимствования, включенные в состав композитов и дающие гибридные образования: Service-Dienst, Servicwe-Selte, Top-Lage, Inter-CityZug, Euri-CityZug, Durch-Ticket, Topfset, Business-Gast [1].

  • В    дальнейшем в данной работе мы будем обращаться именно к этой классификации.

Для проведения исследования были выбраны 5 программ-переводчиков: 3 online-переводчика (Google, Pragma online и Worldlingo) и 2 программы машинного перевода (Promt 8.0 и IMTranslator 3.0).

В переводчике Google (http://translate. для построения модели перевода применяются методы самообучения на основе статистического анализа.

В переводчике Pragma online нет никаких отдельных тематических словарей. В главном переводном словаре отмечены некоторые многозначные слова. Имеется только дополнительный (необязательный) словарь специальной терминологии, где собраны слова из соответствующих областей, например: медицина, химия, математика, нефтегазовая и т. п. Программа подгружает все требуемые словари автоматически.

Переводчик Worldlingo (http://www2. переводит предложения и тек- сты более 20 различных тематик. Качество перевода (по данным сайта хорошее.

В программе Promt 8.0 можно подключать пользовательские словари и онлайновые словарные базы, а использование базы переведенных текстов позволяет экономить время при работе с типовыми документами.

Программа IMTranslator 3.0 осуществляет быстрый перевод сообщений в наиболее популярных программах для обмена мгновенными сообщениями – ICQ, AIM, MSN Messenger и Yahoo! Messenger. Одной из особенностей данной программы является поддержка транслитерации русского текста.

Для оценки результатов исследования были выдвинуты следующие критерии:

  • 1.    Корректность/адекватность перевода. Здесь мы оцениваем точность найденных программой-переводчиком переводных эквивалентов отдельных слов и словосочетаний.

  • 2.    Использование приема транслитера-ции/транскрипции.

  • 3.    Невыполнение перевода, т. е. программа-переводчик оставляет слово без изменения, так как она не находит его ни в одном из подключенных словарей.

  • 4.    Частичное выполнение перевода (прежде всего это относится к заимствованиям третьей группы, которую составляют заимствования, включенные в состав композитов и дающие гибридные образования). Программа-переводчик выполняет перевод лишь одного (или нескольких) компонентов «гибридного» слова, а остальные компоненты остаются в переводе без изменений, так как программа не находит его ни в одном из подключенных словарей.

  • 5.    Точность перевода. Здесь мы оцениваем, насколько хорошо программа-переводчик выбирает наиболее подходящее по смыслу значение многозначного слова.

  • 6.    Наличие орфографических и грамматических ошибок в переводе (значение этого показателя высчитывается отдельно).

Для проведения данного исследования были отобраны англо-американские заимствования в немецком языке общим объемом в 120 лексических единиц. Эта выборка была составлена путем сплошного просмотра немецкоязычных периодических изданий, посвященных различным тематикам, а также научно-популярных статей из сети Интернет.

Для оценки полученных результатов исследования мы рассмотрим по 5 примеров для каждой группы заимствований. Весь список состоял из 120 примеров употребления англо-американизмов в немецком языке.

Заимствования 1 группы: слова и выражения, сохраняющие английское написание (табл. 1). Оценка полученных результатов исследования данных примеров представлена в таблице 2.

Таблица 1

Перевод англо-американизмов 1 группы

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator

3.0

1

Anytime ist partytime

Anytime partytime

В любое время является участником время

Anytime есть partytime

В любое время время партии

Анютиме является партютиме

2

Butterzart geschmorte Lammschulter mit Rüben etwa oder köstliche Desserts wie apple pie oder Reispudding mit Pflaumen – einfach, aber gut

Нежно маслом тушеное плечо ягненка с корнеплодами, например, или превосходные десерты как apple pie или рисовый пудинг со сливами – просто, но хорошо

Тушеная баранина плечу с репой Butterzart например, или десерты, как яблочный п+ ирог или рисовый пудинг со сливами – простой, но хороший

Butterzart geschmorte плеча ягненка со свеклой разве или прекрасные десерты как apple pie или Reispudding со сливами – просто, однако хорошо

Масло-неж палило плечо овечки с морко-вами около или delicious десертами как расстегай яблока или пудинг риса с сливами – просто, но хороше

Нежно маслом тушеное плечо ягненка с корнеплодами, например, или превосходные десерты как аппле пи или рисовый пудинг со сливами – просто, но хорошо

3

Junge Männer und Frauen laufen Hand in Hand oder sitzen in CoffeeShops – neben «Starbucks» haben sich längst lokale Ketten wie das «Kofe-Haus» etabliert

Молодые мужчины и женщины бегут рука об руку или сидят в магазинах Coffee – наряду с «Starbucks» давно локальные цепи устроились как «дом Kofe»

Молодые мужчины и женщины идут рука об руку или посидеть в кафе – рядом с «Starbucks» уже давно местные сети, такие, как «Дом Кофе-установлена»

Молодые мужчины и женщины идут рука об руку или посидеть в кафе – рядом с «Starbucks» уже давно местные сети, такие, как «Дом Кофе-установлена»

Молодые человеки и женщины, котор побежали hand in hand или сидят в кофейнях – около приковывать «Starbucks» длинний местный как «дом Kofe» установил

Молодые мужчины и женщины бегут Рука об руку или сидят в магазинах Coffee – наряду с «Штарбукс» давно локальные цепи устроились как «дом Kofe»

4

Wieder so empty feeling

Снова таким образом empty feeling

Опять же, чувствую себя таким пустым

Опять так empty feeling

Опять настолько пустое ощупывание

Снова таким образом эмптю феелинг

5

T rip geht nach Süden, holidays in Italy

Поездка идет на юг, holidays в Italy

Поездка находится на юге, отдых в Италии

Trip идет после юга, holidays в Italy

Отключение идет к югу, праздникам в Италию

Поездка идет на юг, холи-дайс в Италию

Таблица 2

Результаты перевода англо-американизмов 1 группы (%)

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTransl ator 3.0

Корректный/адекватный перевод англо-американизмов в немецком предложении

20

80

50

30

Транслитерация/транскрипция

60

Невыполнения перевода

70

90

Частичный перевод

10

10

Неправильный выбор значения многозначного слова

20

10

50

Орфографические и грамматические ошибки в переводе

7,7

10

20

50

Таким образом, мы видим, что при переводе англо-американизмов 1 группы программы-переводчики показывают не очень хорошие результаты. Лучшие результаты показал переводчик Google (80 %), а наихудшие результаты – переводчик Pragma online (90 % непереведенных лексических единиц). Это связано с тем, что программы-переводчики в большинстве случаев не воспринимают неассимилированные англо-америка-низмы. При этом следует отметить, что про- цент ошибок при переводе сравнительно невелик, за исключением программы-переводчика IMTranslator 3.0. Орфографические ошибки связаны в первую очередь с ошибочной транслитерацией и транскрипцией англо-американизмов.

Заимствования 2 группы: слова, частично ассимилированные немецким языком (табл. 3). Оценка полученных результатов исследования данных примеров представлена в таблице 4.

Таблица 3

Перевод англо-американизмов 2 группы

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator

3.0

1

Den Hit «Who's Afraid of Detroit?» ließ er so lange remixen , bis jeder seiner Kollegen mal dran war

Хит «Who's Afraid of Детройт?» он оставлял так долго remixen, до каждого из его коллег был на очереди однажды

Хит «Кто боится Детройт? он так долго ремикс, пока каждый из его коллег имели в виду

Хит «Who's Afraid of Detroit»? он пока позволил remixen, вплоть до был каждых его коллег раз на этом

Удар «испуганн Detroit?» оно препятствовал remixen настолько длиной, до тех пор пока каждый из своих коллегаов не быть временами к

Хит «ехо'с Afraid оф Детройт?» он оставлял так долго ремик-сен, до каждого из его коллег был однажды на этом

2

Haymarket Hotel: Mitten im Theatre District , ideale Lage zum Shoppen

Haymarket отель: Посреди театра District, идеальное положение к хождению по магазинам с целью совершения покупок

Haymarket Hotel: Отель расположен в районе театра, идеально расположен для шоппинга

Haymarket гостиница: середины в Тре Теи District, идеальное положение к Shoppen

Гостиница Haymarket: В середине в заречье театра, идеально ситуация к Shoppen

Гаймаркет отель: Посреди Театре District, идеальное положение к хождению по магазинам с целью совершения покупок

3

und Hampstead können leicht zu Fuß erreicht werden

Swiss коттедж станцию метро находится на удалении немногих пешеходных минут а также Shopping-Centren от Camden со знаменитым Camden Market и Hampstead легко могут достигать пешком

Swiss Cottage станция метро находится в нескольких минутах ходьбы и торговых центрах Камден с известным Камден рынка, Hampstead, откуда легко добраться пешком

Swiss Cottage U-Bahn-Station некоторые Gehminuten и также Shopping-Centren Camden со знаменитым Camden достигнутый легко пешком отдален снабжения опознавательными знаками и Hampstead могут становятся

Станцией швейцарского коттеджа подземной будет немногие идя минуты дистантные и также покупка Centren Camden с известной чон-сервной банкой рынка и Hampstead Camden легко к ноге была дос-тигана

Свисс коттедж станцию метро находится на удалении немного пешеходных минут а также Схоп-пинг-еентрен от еамнен с известным еамнен Market и Гампштеан легко могут достигать пешком

4

Doch ein cooles Image genügt Markus und seinen Kumpels nicht

Все же, классный имидж не хватает Маркусу и его приятелям

Но прохладном изображение не является достаточным Марк и его друзья

Cooles имидж все-таки не удовлетворяет Маркусу и его горняка

Но холодное изображение не достаточно для Markus и своего buddy

Все же, первоклассный имидж не хватает Маркусу и его приятелям

5

Lorenzo spielt relaxte Musik für den Dancefloor

Лоренцо играет музыка отдыхала для танцевального зала

Лоренцо играет расслабляю щая музыка для танцполов

Lorenzo играет relaxte музыку для Dancefloor

Lorenzo играет нот relaxte для Dancefloor

Лоренцо играет музыка отдыхала для танцевального зала

Таблица 4

Результаты перевода англо-американизмов 2 группы (%)

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator

3.0

Корректный/адекватный перевод англо-американизмов в немецком предложении

44,5

66,67

22,2

44,45

Транслитерация/транскрипция

22,2

Невыполнения перевода

22,2

44,45

Частичный перевод

11,1

11,1

11,1

Неправильный выбор значения многозначного слова

22,2

33,33

77,3

44,45

22,2

Орфографические и грамматические ошибки в переводе

11,1

11,1

11,1

22,2

Таким образом, можно сделать следующие выводы: при переводе слов 2 группы программы-переводчики также испытывают некоторые затруднения. Некоторые программы-переводчики справляются с переводом слов 2 группы значительно лучше, чем с переводом слов 1 группы (например, Pragma online – 22,2 % по сравнению с 0 % или Promt – 44,5 % по сравнению с 20 %). Некоторым программам-переводчикам, напротив, сложнее работать с англо-американизмами 2 группы (например, Worldlingo, где процент невыполнения перевода составляет 44,45 %). Также увеличился процент орфографических и грамматических ошибок при переводе.

Заимствования 3 группы: заимствования, включенные в состав композитов и дающие гибридные образования (табл. 5). Оценка полученных результатов исследования данных примеров представлена в таблице 6.

Таблица 5

Перевод англо-американизмов 3 группы

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator 3.0

1

Der DJ spannt einen schönen Bogen für seinen Mix, von reduzierten Techno-Entwürfen bis zu den housigeren Tracks des Endes

Ди-джей натягивает прекрасный лист для его смеси, от сокращенных техно-проектов до housigeren Tracks конца

DJ обращает хороший обмен на его сочетание сокращения конструкций техно треки на конец housy

DJ пряли красивую дугу для его смешивания, от сокращенных Techno-Entwürfen до housigeren Tracks исхода

DJ протягивает красивейший локоть для своих смешиваний, от уменьшенных проектов Techno к housigeren следы конца

Ди-джей натягивает прекрасный лист для его смеси, от сокращенных проектов Techno до хоусигерен Тракс конца

2

Aber es gibt auch Highlights. So verfügt das m888a über zwei Sim-Kartenslots , kann sich also bei zwei Providern gleichzeitig einbuchen

Но имеются также кульминационные моменты. Таким образом располагает m888a более 2 лотов карт Сима, умеет себя в 2 провайдерах одновременно einbuchen

Но Есть также подчеркивается. Таким образом, вы m888a два слота SIM-карты, поэтому бронирование в то же время две поставщиков

Но Есть также подчеркивается. Таким образом, вы m888a два слота SIM-карты, поэтому бронирование в то же время две поставщиков

Но будут также highlights. Таким образом m888a имеет 2 Sim Kartenslots, может в-книга сама таким образом с 2 Providern в то же самое время

Но имеются также кульминационные моменты. Таким образом располагает m888a более 2 лотов карт Сима, умеет себя в 2 провайдерах одновременно айн-бухен

3

Reagiert der Kunde nicht, soll der Anbieter die Daten-Roaming-Dienste sperren

Если клиент не реагирует, продавец должен блокировать службы данных Roaming

Не отвечает, то клиент данных поставщика услуг роуминга блок

Если не будет реагировать известие, должен заградить Anbieter Daten-Roaming-Dienste

Если клиент не реагирует, то offerer должен закрыть обслуживания данных кочуя

Если клиент не реагирует, продавец должен блокировать службы данных Roaming

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator 3.0

4

Dabei haben sich die Software-Entwickler redlich Mühe gegeben, den Apple-Look nachzuahmen

При этом программные разработчики постарались добросовестно подражать AppleLook

Эти разработчики программного обеспечения были честные усилия, чтобы имитировать Apple-смотреть

Software-Entwickler при этом честно дались заботы подражать Apple-Look

Проявители средства программирования дали справедливо тревогу для того чтобы скопировать взгляд Apple

При этом программные разработчики постарались добросовестно подражать Аппле-Лоок

5

Die Kölner HipHop-Crew kann auf einschlägige Erfahrungen mit deutschen Show-Geschäft zurückblicken

Кельнский экипаж хип-хопа может оглядываться назад на специальные опыты с немецким делом шоу

Кельн экипажа хип-хоп может оглянуться на соответствующий опыт немецкого шоу-бизнеса

Kölner Hip-HopCrew может оглянуться на специализированные опыты с немецким Show-Geschäft

Экипаж хмеля вальмы Cologne может посмотреть назад на уместных опытах с немецким сфера развлечений

Кельнский экипаж хип-хопа может оглядываться назад на специальные опыты с немецким делом шоу

Таблица 6

Результаты перевода англо-американизмов 3 группы (%)

PROMT

Google переводчик

PRAGMA online

Worldlingo

IMTranslator

3.0

Корректный/адекватный перевод англо-американизмов в немецком предложении

16,66

66,7

16,66

Транслитерация/транскрипция

16,66

Невыполнения перевода

16,66

16,66

83,34

33,34

Частичный перевод

16,66

16,66

33,34

Неправильный выбор значения многозначного слова

50

16,66

50

50

Орфографические и грамматические ошибки в переводе

Как видно из представленной выше таблицы, все переводчики испытывают проблемы при переводе заимствований 3 группы. В большинстве случаев программы-переводчики выбирают неверное значение многозначного слова. Также высок процент невыполнения перевода (83,34 % у PRAGMA online и 33,34 % у Worldlingo). Но все же почти все программы-переводчики пытаются хоть частично, но перевести англо-американизмы 3 группы (PROMT – 16,66 %, Worldlingo – 16,66 %, IMTranslatr 3.0 – 33,34 %).

В ходе исследования и оценки полученных результатов были сделаны следующие выводы.

Программы-переводчики не воспринимают англо-американизмы 1 группы. Соответственно, процент корректного/адекватного перевода сравнительно невелик (за исключением переводчика Google и Worldlingo).

При переводе заимствований 2 группы программы-переводчики имеют некоторые затруднения. Основная проблема – выбор неправильного значения многозначного слова. Также при переводе англо-американизмов 2 группы увеличивается число орфографических и грамматических ошибок.

При переводе англо-американизмов 3 группы программы-переводчики испытывают серьезные затруднения. Процент корректно-го/адекватного перевода существенно ниже по сравнению с переводом заимствований 1 группы. Также увеличивается и процент невыполнения перевода.

1. Тимашева О. В. Угроза американизации и современная художественная литература Франции // Западная Европа и культурная экспансия «американизмов»: сб. научных тр. / сост. Ю. М. Каграманов. М., 1985. С. 213-226.

Список литературы Использование систем машинного перевода при работе с языком denglish

  • Тимашева О. В. Угроза американизации и современная художественная литература Франции//Западная Европа и культурная экспансия «американизмов»: сб. научных тр./сост. Ю. М. Каграманов. М., 1985. С. 213-226.
Статья научная