Компьютерно-опосредованная коммуникация: потенциал металексической значимости

Автор: Баркович Александр Аркадьевич

Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu

Рубрика: Филология

Статья в выпуске: 7 (152), 2015 года.

Бесплатный доступ

В контексте динамичного развития компьютерно-опосредованной коммуникации особую значимость приобретает метаязыковая специфика ее текстовой базы. Научное сопровождение расширяющегося высокими темпами интернет-контента предполагает комплексную, дискурсивную имплементацию обобщений и моделей теоретического аппарата языка. Активное развитие вторичных семиотических систем, формализация естественных и создание искусственных языков обусловливают безальтернативность задействования в информационной сфере широкой лингвистической парадигмы - для системной и последовательной репрезентации семантики и решения прикладных проблем. Современная лингвистическая парадигма обладает ярко выраженной прикладной целесообразностью, обогащаясь интердисциплинарными, мультидисциплинарными и кроссдисциплинарными моделями. Специфика компьютерно-опосредованного дискурса, обусловленная содержанием лингвоинформационного формата современной коммуникации, предполагает не только перманентную формализацию семантики эмпирического материала, но и развитие металингвистических категорий. Обладая существенным метаязыковым потенциалом, универсалия значимости в среде компьютерно-опосредованного дискурса приобрела динамику, заметную даже на консервативном грамматическом уровне. Металексическое моделирование языковых отношений в среде компьютерно-опосредованной коммуникации востребовано практикой и актуально в теоретическом аспекте синкретичного знания.

Еще

Компьютерно-опосредованная коммуникация, компьютерно-опосредованный дискурс, лингвоинформационный формат, метаязык, семантика, лексема, категория, металексическая значимость

Короткий адрес: https://sciup.org/14751408

IDR: 14751408

Текст научной статьи Компьютерно-опосредованная коммуникация: потенциал металексической значимости

В контексте динамичного развития насыщенной вторичными семиотическими системами сферы компьютерно-опосредованной коммуникации (далее – КОК) усиливается ее зависимость от метаязыкового сопровождения речевой практики. Перманентное усложнение современных информационных инструментов основывается на их корреляции с понятийной репрезентацией освоенных фреймов знания, что, в принципе, отражается в лингвистической парадигме. Вместе с тем практика компьютерно-опосредованной речи потребовала развития категориального аппарата метаязыкового сопровождения, адаптированного к новым технологическим реалиям функционирования языка. В сфере КОК методологически актуальными доминантами являются компьютерно-опосредованный дискурс (далее – КОД) и лингвоинформационный формат коммуникации. В контексте данных метаязыковых реалий несомненным потенциалом обладает феномен мета-лексической значимости.

Семантическая специфика лексического уровня языковой системы

Э. Бенвенист так определил семантическую проблематику: «Соотношение формы и значения многие лингвисты хотели бы свести только к понятию формы, но им не удалось избавиться от ее коррелята – значения. Чего только ни

делалось, чтобы не принимать во внимание значение, избежать его и отделаться от него. Напрасные попытки – оно, как голова Медузы, всегда в центре языка, завораживает тех, кто его созерцает» [4; 136].

Фрагментарность и оторванность традиционной точки зрения на слово как автономную от ткани коммуникации единицу речи была замечена достаточно давно: «...слово, несмотря на все трудности, связанные с определением этого понятия, есть единица, неотступно представляющаяся нашему уму как нечто центральное в механизме языка; одной этой темы было бы достаточно для целого тома. Далее следовало бы перейти к классификации единиц низшего уровня, затем более крупных единиц и т. д. Таким образом, наша наука, определив элементы, которыми она оперирует, выполнила бы свою задачу полностью, сведя все входящие в ее ведение явления к их основному принципу. Нельзя сказать, что в лингвистике эта центральная проблема когда-нибудь уже ставилась и что все ее значение и трудность ее решения вполне осознано; до сих пор в области языка всегда довольствовались операциями над единицами, как следует не определенными» [13; 143]. «Как следует не определенными» единицами Ф. де Соссюр справедливо называл слова.

Опора на «привычный» языковой феномен, основанный на «иллюзиях» языковой картины мира, – слово – неудивительна в контексте повышенного интереса к перспективам формализации языковой системы. Однако общеизвестно, что, являясь безусловно лингвистической абстракцией, слово , точнее лексическая единица, в метаязыковом контексте не является самодостаточным языковым артефактом, питаясь жизненной силой единого семантического поля языка, что справедливо отмечалось Ю. Д. Апресяном [1] и другими исследователями.

Моделирование КОД и формализация структуры языковых отношений, несомненно, перспективны в аспекте металексической семантики. Терминологичность металексической категори-альности, не имея широкой представительности в лингвистической практике, стала востребованной в практике информационной презентации языковой специфики, где богатство металекси-ческой (англ. metalexical , варианты: meta-lexical , metalexical ) структуры требует практически-ори-ентированной терминологии, опирающейся на базовую семантику соответствующих единиц. Неудивительно, что подобные исследования стали характерной чертой исследований в областях компьютерной лингвистики, машинного перевода, машинного обучения и т. д., где, например, «эта метаструктура [металексическая] позволяет связать функциональность косвенной речи с лексическими элементами как таковыми» ( This metastructure [ meta-lexical ] permits one to link the functionality of reported speech with the lexical entries themselves ) [17; 156].

Подобный разрыв между практикой использования метаязыка и его металингвистической интерпретацией стал приметой времени, приведя к созданию параллельной «лингвоинформационной» терминологии: семантика, синтаксис и т. д., например, в классической лингвистике (и лексикографии) и информатике – понятия разного плана. Таким образом, актуальность репрезентации металексической значимости в лингвистической системе координат вполне очевидна.

Динамика значимости в аспекте компьютерно-опосредованной коммуникации

Неисчерпаемость живого языка обеспечивается его дискурсом – речевой деятельностью, развернутой во времени и пространстве, обусловленной широким экстралингвистическим контекстом и коммуникационной спецификой. Специфику КОД обусловливает лингвоинформационный формат современной коммуникации [3; 386]. Характерно, что речевая практика в сфере КОК развивается более высокими темпами, чем лингвистическая теория. Впрочем, и имеющийся потенциал метаязыкового обеспечения КОК используется весьма избирательно.

Известны примеры, когда необеспеченные всей совокупностью лингвистической парадигмы попытки «привить» формальную, основанную на компьютерной лексикографии, семантику данным информационной среды не дали ощутимых результатов. Так, отрицательным был признан результат эксперимента Э. Брауна из IBM с программой «Watson», в которую не удалось «механически» встроить словарь жаргона «Urban Dictionary» [19]. Ни практика интернет-адапта-ции проблемы значимости в виде попыток «сходу» создать Семантическую паутину (заявленную Т. Бернерсом-Ли как «апгрейд» Всемирной паутины), ни практика автоматизации межъязыкового взаимодействия в процессе нескончаемого совершенствования «машинного перевода» не позволили исключить из КОК человека. Человеческая пред- и постобработка формальных кодовых систем не только не стала менее актуальной, а скорее, наоборот, потребовала широкой имплементации научного сопровождения КОД на металингвистическом уровне.

Рассмотрим практику «собственно-лексической» репрезентации семантики в речи в контексте возможностей КОД. Актуальным примером оказывается Библия, сохранившая аутентичный речевой материал с почти двухтысячелетней историей (для Нового Завета), активно воспроизводимый сегодня.

Известно, что даже доступный для исследования, письменный, материал таких определяющих для современности языков, как старославянский, латинский, старогреческий, не обладает статистически актуальным объемом, который позволял бы делать уверенные выводы о том или ином языковом факте. Сфера изучения подобных праязыков ограничена наличием закрытой совокупности письменных памятников, которая не может отразить все богатство языковых систем, работавших несколько веков или тысячелетий тому назад. При этом наличие текстов и словарей вовсе не гарантирует адекватное восприятие отдельных понятий и слов. Тем не менее сравнение дискурсивной реализации отдельных языковых единиц в широком контексте является, безусловно, значимым.

Например, лексема λόγος по данным древнегреческо-русского словаря имеет 34 значения, и на первом месте, разумеется, значение ‘слово, речь’ [8]. В современном «Новогреческо-русском словаре» значений лексемы λόγος представлено уже значительно меньше – 11 [15]. Однако здесь по-прежнему на первом месте значение ‘слово’; при этом представлен отсутствующий в «Древнегреческо-русском словаре» вариант значения – ‘причина’, на 9-м месте из 11 [8], [15].

В каком значении единица λόγος использована в библейском тексте, например Евангелии от Иоанна, – вопрос, на который сегодня не даст однозначного ответа ни один переводчик. Спросить у автора или его первых и непосредственных читателей, которым текст адресовался, уже нельзя: прошло около двух тысяч лет. А, исходя из последующего контекста, вариантов перевода может быть чуть ли не половина из списка возможных: «1Ἐν ἀρχῇ ἦν ὁ Λόγος, καὶ ὁ Λόγος ἦν πρὸς τὸν Θεόν, καὶ Θεὸς ἦν ὁ Λόγος. 2Οὗτος ἦν ἐν ἀρχῇ πρὸς τὸν Θεόν. 3πάντα δι’ αὐτοῦ ἐγένετο, καὶ χωρὶς αὐτοῦ ἐγένετο οὐδὲ ἕν ὃ γέγονεν. 4ἐν αὐτῷ ζωὴ ἦν, καὶ ἡ ζωὴ ἦν τὸ φῶς τῶν ἀνθρώπων. 5καὶ τὸ φῶς ἐν τῇ σκοτίᾳ φαίνει, καὶ ἡ σκοτία αὐτὸ οὐ κατέλαβεν» [6].

На русском языке в каноническом переводе цитата будет выглядеть следующим образом: « 1В начале было Слово , и Слово было у Бога, и Слово было Бог. 2Оно было в начале у Бога. 3Все чрез Него начало быть, и без Него ничто не начало быть, что начало быть. 4В Нем была жизнь, и жизнь была свет человеков. 5И свет во тьме светит, и тьма не объяла его » [5].

Перевод текста на другие языки, например белорусский, украинский, польский, не выделяется из общеевропейской переводческой практики оригинальностью интерпретации лексемы λόγος :

« 1У пачатку было́ Слова , і Слова было́ ў Бога, і Богам было́ Слова . 2Яно было ў пачатку ў Бога; 3усё праз Яго пачало́ быць, і без Яго нішто не пачало́ быць, што пачало́ быць. 4У Ім было жыццё, і жыццё было святлом для людзей́ ; 5і святло ў це́мры све́ціць, і це́мра не агарну́ла яго » [12].

« 1Споконвіку було Слово , а Слово в Бога було, і Бог було Слово . 2Воно в Бога було споконвіку. 3Усе через Нього повстало, і ніщо, що повстало, не повстало без Нього. 4І життя було в Нім, а життя було Світлом людей. 5А Світло у темряві світить, і темрява не обгорнула його » [7].

« 1Na początku było Słowo , a ono Słowo było u Boga, a Bogiem było ono Słowo . 2To było na początku u Boga. 3Wszystkie rzeczy przez nie się stały, a bez niego nic się nie stało, co się stało. 4W niem był żywot, a żywot był oną światłością ludzką. 5A ta światłość w ciemnościach świeci, ale ciemności jej nie ogarnęły » [20].

Из приведенных примеров явствует, что именно семантика ‘слово’ выбрана за основу при переводе текста с единицей λόγος с греческого на русский, белорусский, украинский, польский (и другие) языки.

Эпический стиль евангелий Библии значительно сужает широкий круг возможных соответствий, оставляя тем не менее вопрос об особенностях «дословного» перевода открытым. Характерен в данном контексте относительно недавний и не столь зависимый от сложившейся европейской переводческой клишированности перевод Библии на китайский язык. В переводе Библии на китайский язык лексеме λόγος соответствует иероглиф ‘дао’ (кит. – ‘путь’), что не сделало Евангелие от Иоанна менее «логичным»: « 1 太初有 , 与神同在, 就是神。 …» [21; 1].

Конечно, у переводчика Библии на китайский язык были и другие варианты интерпретации древнего текста, учитывая, что в китайско-рус- ском словаре, например, представлены 13 групп значений для перевода на русский язык 道 только как существительного. Тем не менее на первых четырех позициях – разные варианты лексемы ‘путь’:

  • 1)    ‘ путь, дорога, тракт; путевой, дорожный; по дороге, на пути ’;

  • 2)    ‘ путь, маршрут; тракт; астр., путь небесного тела, орбита; анат., мед. тракт ’;

  • 3)    ‘ путь; расстояние, дистанция; курс, направление [движения] ’;

  • 4)    ‘ пути, направление деятельности; путь, способ, метод; подход; средство; правило, обычай ’… [11].

На данном примере можно видеть, насколько неоднозначна лексическая интерпретация даже такого хорошо известного, практически прецедентного текста, как Библия.

Характерно, что в соответствии с компьютерной лексикографической практикой и статистическими показателями интернет-дискурса (электронные переводчики, зачастую, переводят по «статистической модели», отдающей предпочтение наиболее распространенным вариантам) сегодня лексеме λόγος лучше всего соответствует лексема ‘причина’. Это актуально для русского языка, аналогичная лексикографическая семантика задействуется в белорусском – прычына , украинском – причина , македонском – причина , болгарском – причината , сербском – разлог , хорватском – razlog , словенском – razlog , словацком – dôvod , чешском – důvod , польском – powód и других славянских и неславянских языках (англ. – reason , нем. – grund и т. д.).

Показательна в данном контексте практика КОК с привлечением компетенции создателей машинных переводчиков Google Translate , Bing Translator и Яндекс. Переводчик , работающих с греческим и русским языками. Запросы в перечисленных (и других) системах машинного перевода относительно лексемы λόγος последовательно выдают приоритетный – но не в соответствии с классическими образцами дискурсивной практики – эквивалент: причина.

Рассмотрим особенности переводческой интерпретации вышеприведенного текста, содержащего в первой строке три словоупотребления λόγος (см. выше). Выделяется здесь работающий по статистической модели переводчик Google Translate, четко идентифицировавший распространенный в Интернете русскоязычный текст: 322 000 раз «поисковиком» Google предложение В начале было Слово, и Слово было у Бога, и Слово было Бог было найдено в готовом виде, не оставляя выбора машинному переводчику. Однако уже переводчики Bing Translator и Яндекс. Переводчик, работающие с привлечением более сложных технологий перевода по «модели, основанной на правилах» (англ. rule-based model), показали совсем другие результаты, учитывающие формализованные грамматику и семантику. Так, Яндекс. Переводчик дважды перевел λόγος как почему и один раз – как причина. Bing Translator – по одному разу перевел λόγος как причина и как почему, пропустив третье словоупотребление.

Перевод на английский язык в КОК осуществляется аналогичным образом. «Узнавая» текст, Google Translate переводит лексему λόγος как word (‘слово’): 1 In the beginning was the Word, and the Word was with God, and the Word was God. Однако из списка найденных «языковых» соответствий лексемы λόγος reason, cause, ratio, word, speech, consideration, oration и spiel – вне контекста на первое место машинный переводчик ставит вариант reason – ‘причина’.

Уровень несоответствия уже созданных «правил» – пусть и своеобразного, как в рассмотренном примере, религиозного дискурса – реальной речи достаточно очевиден [2]. Очевидна и ограниченность практики формализации категорий языка с опорой на лексический уровень языковой системы: для преимущественно аналитического английского языка счет подобных правил пошел уже на сотни моделей, для преимущественно синтетического русского языка таких моделей зафиксированы уже тысячи – но ни для английского, ни для русского, ни для других живых языков универсальной компьютерно-опосредованной грамматики не создано. Наметившиеся в компьютерной лингвистике тенденции к учету коллокаций (например, по методике выявления и учета n -грамм) и возможностей дискурсивного метаязыкового моделирования как раз и свидетельствуют о потенциале лингвистической парадигмы в аспекте металексической значимости.

В данном аспекте уже существует значительная несогласованность между лексикографическими данными традиционного дискурса и КОД, возрастающая пропорционально развитию КОК. Если изначально компьютерная лексикография ориентировалась на имеющиеся словари и попросту дублировала их, являясь базой для компьютерной метаязыковой обработки речи, – сегодня все наоборот: сфера речевого функционирования диктует лексикографическую моду. Именно таковы современные словарные проекты, опирающиеся на корпусы и онлайн-краудсорсинг (например, [16]).

Таким образом, семантика текста и дискурса в аспекте КОК приобретает особую чувствительность к прецизионности и верифицированности составляющих текст элементов. Интерпретация элементов с опорой на лексическую семантику словоупотреблений не позволяет достигнуть необходимой дискретности КОД. Классическими аргументами в данном контексте стали нарекания на несовершенство машинного перевода, во многом основанного на «традиционной» лексикографии и собственно-лексической семантике метаязыковых описаний языка. Однако в кон- тексте КОК необходимо отметить тенденцию к имплементации металексической значимости.

Имплементация металексической значимости в контексте компьютерно-опосредованной коммуникации

Понимание сложности сферы речевого функционирования, конечно же, не является гносеологической проблемой: «Однако, несомненный факт – в том, что количество предложений родного языка, которые человек сразу поймет, не чувствуя затруднения или необычности, является астрономическим, и что количество моделей, которые лежат в основе нормального использования языка и соответствующих осмысленным и легко воспринимаемым предложениям на нашем родном языке, является величиной на несколько порядков большей, чем число секунд в жизни человека» [14; 23]. Высказанное Н. Хомским мнение более чем актуально в аспекте совершенствования КОК.

Перспективность металексической интерпретации семантики КОД основывается на возможности перехода от уровня содержательной интерпретации лексем к уровню металексической интерпретации семантики текста и в более широком контексте – дискурса. Практика метаязыковых описаний языка подтверждает оправданность модификации и развития категориальной семантики. Одной из ключевых характеристик лингвистической категориальности является универсалия значимости языка. Целесообразность широкой, в том числе металексической, репрезентации значимости в КОК обусловлена лингвоинформационной спецификой самой сферы.

Характерно, что специфика лингвоинформационного формата КОД уже существенно влияет на институт грамматического значения: расширение категориальности существительных и глаголов в морфологической разметке Национального корпуса русского языка – только первый шаг в процессе обусловленного развитием КОК процесса [9]. Подобное развитие категориальной семантики языка стало возможным именно в контексте КОК, где главным критерием успешности метаописаний стала адекватность формализации языковых данных с учетом статистически бесспорного материала, измеряемого не рукописными картотеками, а гига- и терабайтами лингвистических корпусов.

До формирования КОД лексикографическая результативность изучения семантики позволяла, конечно, решать проблемы поверхностной интерпретации дискурса. При этом игнорирование дискурсивных, гипертекстовых и даже «теоретически обоснованных синтаксических структур» было вполне привычным делом в исследовании языка: «Синтаксиса, который давал бы такую возможность, до сих пор ни для одного языка нет, и светлое будущее “автономного синтаксиса” просматривается с трудом. Переход от порожде- ния к интерпретации вводит в законные теоретические рамки работу с отдельными словами и конструкциями, а задачи, ориентированные на глобальную синтаксическую структуру, можно отложить на потом» [10; 13]. С появлением эффективных инструментов КОК подобные задачи стали не только актуальными, но и выполнимыми.

Одним из очевидных резервов совершенствования релевантного КОД категориального аппарата языка является развитие металексических моделей дискурса. Несомненно, традиции изучения семантики лексического уровня обусловили определенную инерцию метаязыковой практики. Тем не менее в контексте КОК стали очевидными и потенции «менее» и «более» сложных единиц языка – фонем, морфем, граммем, дериватем, лемм, номинатем, синтаксем, контекстем, ин-форматем и иных «старых» и «новых» реалий функционирования языка. Этих и подобных перечисленным логических моделей языковой практики для достоверной систематизации КОД явно не хватает – поэтому они и создаются [2]. Безусловно востребовано лингвистическое освоение металексической значимости, обусловленное практикой КОК. Металексическую значимость можно представить как существенную характеристику дискурса, выражающую его семантическую идентичность и функциональность за счет комплекса собственно-лексических, суб- и гиперлексических значений языковых единиц.

Практическая реализация категории мета-лексической значимости актуальна для дискур- сивного моделирования, например построения концептуально-доминантной модели дискурса, гипердискурсивной модели и при создании других метаописаний сферы речевого функционирования. В лексикографической практике функциональность металексической значимости востребована, например для репрезентации контекстуальных возможностей той или иной языковой единицы как структурного элемента словарной статьи и при машинном переводе – для расширенной интерпретации семантического, грамматического, деривационного и иного потенциала дискурса.

Именно потребностями развития КОК обусловлен сдвиг фокуса метаязыковых описаний от традиционной категориальности собственнолексической значимости в малоисследованную среду «менее» или «более» сложноорганизованной металексической семантики (морфемной, синтаксической и т. д.). Развитие метаязыкового категориального потенциала безусловно востребовано для решения важнейших прикладных проблем современности, в том числе для создания искусственного интеллекта. В контексте интердисциплинарности современной науки избирательная реализация лингвистического потенциала недостаточна и малопродуктивна. Как показывает проведенное исследование, для полноценной интерпретации КОД важное значение имеет лингвистическая, в том числе дискурсивная и контекстная, имплементация металексиче-ской значимости.

COMPUTER-MEDIATED COMMUNICATION: POTENTIAL OF METALEXICAL SIGNIFICANCE

Список литературы Компьютерно-опосредованная коммуникация: потенциал металексической значимости

  • Апресян Ю. Д. Избранные труды: В 2 т. М.: Языки русской культуры, 1995. Т. I: Лексическая семантика. Синонимические средства языка. 767 с.
  • Баркович А. А. Интернет-дискурс: компьютерно-опосредованная коммуникация. М.: Флинта: Наука, 2015. 288 с.
  • Барковiч А. А. Металiнгвiстьiчная iндзксацьiя ў камп’ютарна-апасродкаваным дыскурсе//Беларуская лiнгвiстьїка. Мн.: Беларуская навука, 2015. Вып. 74. С. 79-87.
  • Бенвенист Э. Общая лингвистика . М.: Прогресс, 1974. 447 с.
  • Библия: Книги священного писания Ветхого и Нового Завета. М.: Изд. Моск. Патриархии, 1983. 1371 с.
  • Библия на греческом языке . Режим доступа: http://magister.msk.ru/library/bible/greek/grknt04.htm
  • Вiд Iвана, роздiл 1 -Библия онлайн . Режим доступа: http://holybible.by/john-ua/3388-1.html
  • Древнегреческо-русский словарь: около 70 000 слов: В 2 т./Сост. И. Х. Дворецкий. М.: Гос. изд-во иностранных и национальных словарей, 1958. 1904 с.
  • Национальный корпус русского языка . Режим доступа: http://www.ruscorpora.ru
  • Падучева Е. В. Динамические модели в семантике лексики. М.: Языки славянской культуры, 2004. 609 с.
  • Панасюк В. А., Суханов В. Ф. Большой китайско-русский словарь: В 4 т. М.: Главная редакция восточной литературы издательства «Наука», 1983. 3822 с.
  • Святое Евангелле паводле Iаана . Режим доступа: http://knihi.com/none/Sviatoje_Jevanhielle_ pavodle_Iaana.html
  • Соссюр Ф. де. Курс общей лингвистики//Соссюр Ф. де. Труды по языкознанию. М.: Прогресс, 1977. С. 31-273.
  • Хомский Н. Язык и мышление. М.: Изд-во Московского ун-та, 1972. 126 с.
  • Хориков И. П., Малев М. Г. Новогреческо-русский словарь . М.: Культура и традиции, 1993. 854 с.
  • About the Collins Corpus and the Bank of English™. Available at: http://www.mycobuild.com/about-collins-corpus.aspx
  • Bergler S. Generative Lexicon Principles for Machine Translation: A Case for Meta-Lexical Structure//Machine Translation. 1995. Vol. 9. Issue 3^. P. 155-182.
  • Brown corpus manual. Available at: http://khnt.aksis.uib.no/icame/manuals/brown
  • Madrigal A. IBM’s Watson Memorized the Entire ’Urban Dictionary’,Then His Overlords Had to Delete It//The Atlantic. 2013. January 10.
  • POLSKIE Biblia -Polish Bible/Nowy Testament -New Testament/Jana/John 1. Available at: http://www.wordplanet.org/pl/43/1.htm
  • 约翰福音1 I线上圣经I《新世界译本》.URL: http://www.jw.org/zh-hans.
Еще
Статья научная