Метаязык как инструмент моделирования семантики предметной области

Автор: Журавлев Александр Павлович, Савицкий Владимир Михайлович

Журнал: Известия Самарского научного центра Российской академии наук. Социальные, гуманитарные, медико-биологические науки @izvestiya-ssc-human

Рубрика: Филология

Статья в выпуске: 2-4 т.16, 2014 года.

Бесплатный доступ

В данной статье анализируется роль и потенциал естественного языка в сфере информационных технологий. Рассматриваются качественные изменения в языкознании и предпосылки для появления прикладной лингвистики. Выявляется важная роль моделирования и метаязыка как его основного инструмента.

Прикладная лингвистика, метаязык, язык-объект, предметная область, квалиметрия

Короткий адрес: https://sciup.org/148101793

IDR: 148101793

Текст научной статьи Метаязык как инструмент моделирования семантики предметной области

Во второй половине 20-го века в языкознании наметилась тенденция к переходу этой науки на качественно иной уровень – речь шла о переходе от дескриптивного метода (простого наблюдения за фактами языка) к анализу и объяснению языковых закономерностей. Хорошую характеристику этому явлению да ё т Ю.Н.Караулов в своей работе «Лингвистическое конструирование и тезаурус литературного языка»: «Лишь в последнее время … появились основания для пересмотра устоявшегося взгляда, поскольку намечается особое направление исследовательской деятельности – построение новых лингвистических объектов с заданными свойствами. Реализация этих задач и должна осуществляться на принципах лингвистического конструирования (ЛК).»1.

Ключевое слово – «конструирование». Очевидно, Караулов пишет о давно назревшей необходимости изучения механизмов функционирования языка, и большую роль в этом процессе он отводит конструированию, т.е. моделированию. Помимо прочего, важную роль сыграло стремительное развитие компьютерных технологий, набиравшее обороты ещ ё с 50-х годов прошлого века. Именно тогда сложились объективные предпосылки для перехода языкознания в иное качество, поскольку велась активная работа в области применения естественного языка в сфере информационных технологий2.

М.Б.Бергельсон писал: «Взаимодействие человека и ЭВМ усиливает прикладное начало в языкознании»3. Так появилось понятие «прикладная лингвистика». А.Н.Баранов в своей книге «Введение в прикладную лингвистику» пишет: «В СССР термин прикладная лингвистика стал широко употребляться в 50-е гг. в связи с разработкой компьютерных технологий и появлением систем автоматической обработки информации»4.

В.А.Звегинцев пишет, что «под прикладной лингвистикой чаще всего понимают все виды автоматической обработки речевой информации (Language-data Processing) – машинное распознавание устной речи, машинный перевод, автоматическую классификацию технических и иных документов, автоматическое аннотирование текстов, автоматическое кодирование и пр.». Он подч ё ркивает важную роль прикладной лингвистики в развитии компьютерных технологий, говоря, что «автоматическая обработка речевой информации составляет в настоящее время основную исследовательскую проблематику прикладной лингвистики».

Вернёмся к обработке речевой информации. Работы в этой области начались, как уже говорилось ранее, во второй половине 20-го века, а в 80-х годах вышли на новый уровень. Не нужно углубляться в тонкости информатики, чтобы понимать, что работа систем распознавания текста и речи основана на сравнении вводимой в систему информации с неким эталоном или моделью. Именно заложенная в программе модель структуры в компьютерных учебных средах. Национальная академия наук Украины. Ин-т кибернетики им. В.М.Глушкова. – Киев: 1994. – С. 22.

языка (степень проработки такой модели определяется функционалом программы) да ё т принципиальную возможность проводить анализ текстовой или голосовой информации. Если же речь ид ё т о машинном синтезе текста или речи (а такие системы уже существуют), то необходимость наличия порождающей, или синтетической модели не вызывает никаких сомнений.

Помимо упомянутых выше систем анализа и синтеза текста и речи, существуют и другие точки приложения традиционной лингвистики в сфере информационных технологий. Так, в последние годы набирает обороты разработка квалиметрических систем – компьютерных программ для оценки уровня знаний учащихся и специалистов. Одним из примеров такого рода работ в нашей стране является диссертация С.А.Никаева «Модели и информационная система для оценки профессиональных знаний специалистов промышленного производства»5. Излишне говорить, что оценка качества знаний специалистов невозможна без эталонной модели этих знаний. Построение такой модели является первоочередной задачей при создании программ подобного рода.

Т.о., мы вновь возвращаемся к тому, с чего начали – к необходимости перехода от описания языковых фактов к целенаправленной деятельности по созданию действующих моделей языковых процессов.

В.М.Савицкий да ё т три определения для термина «моделирование» в отношении языковых единиц. Наиболее подходящим для нас представляется третье, характеризующее моделирование как «научное описание знакового строения, образования и функционирования языковых единиц средствами метаязыка». Автор добавляет: «Этот смысл отражает «связь знака как объекта исследования и метаязыка его описания»6.

Караулов характеризует объяснение языковых закономерностей как «описание “второго порядка”»7. Такая формулировка практически полностью совпадает с определением метаязыка: «В самом общем смысле метаязык – любой естественный или искусственный язык (язык «второго уровня»), на котором описывается другой язык (язык «первого уровня»), служащий для описания предметов, свойств и си- туации окружающего мира либо тех или иных его областей или сфер»8.

Отметим, что мы затронули лишь малую часть всего массива определений моделирования, а понятие «метаязык» в том или ином виде было упомянуто уже дважды. На наш взгляд, данный факт свидетельствует о чрезвычайно важной роли метаязыка в процессе моделирования языковых объектов.

В настоящее время термин «метаязык» употребляется во многих научных дисциплинах – от математики до философии. При этом его основное, общее значение оста ё тся неизменным: «… общепризнано, что метаязык должен быть богаче соответствующего языка-объекта, так как он должен содержать не только обозначения для всех имен и выражений последнего, но и фиксировать с помощью своих специфических средств их свойства и устанавливать различного рода отношения и связи между ними»9.

Согласно этому определению, метаязык хорошо подходит на роль основного (или одного из основных) инструмента для построения лексико-семантической модели предметной области. Эта роль, по нашему мнению, заключается в упорядочивании массива лексических единиц (терминов и эквивалентных им нетерминологических единиц), формирующих предметную область, в иерархически упорядоченную структуру. Наиболее подходящий методом моделирования нам представляется идеографический метод, разработанный Ю.Н.Карауловым10 на основе теории гра-фов11. Соответственно, модель лексико-семантической структуры предметной области мы будем изображать в виде графа.

Граф как модель предметной области будет составлен из вершин двух видов. Первый вид – это вершины, репрезентирующие лексические единицы, или единицы языка-объекта (т.н. «листья графа» или «листья дерева»12). Эти вершины будут объединяться по принципу аддитивности в оппозиционные группы, со- стоящие из двух (бинарные оппозиции13) или более элементов. Критерии, на основании которых формируются эти группы, будут считаться единицами метаязыка, и для их репрезентации служат вершины второго вида. Это идеальная схема. В реальности же для адекватной репрезентации лексико-семантической структуры требуется несколько уровней метаязыка. Возьмём, к примеру, такую грамматическую категорию имени существительного как число. В эту категорию, как известно, входят два элемента – «единственное число» и «множественное число». На графе структура этой грамматической категории будет представлена следующим образом: вершина «Категория числа», относящаяся к метаязыку, будет материнской и образует первый уровень иерархии. Дочерними вершинами будут «единственное число» и «множественное число». Эти дочерние вершины также являются элементами метаязыка и формируют второй уровень иерархии. Каждая из них, в свою очередь, описывает лексические единицы следующего, конечного уровня иерархии. Эти конечные вершины («листья») графа будут относиться к языку-объекту: вершине «единственное число» соответствует весь массив существительных в единственном числе, а вершине «множественное число» – во множественном. Т.о., мы получаем лексико-семантическую модель грамматической категории числа, которая состоит из двух уровней метаязыка и одного уровня языка-объекта.

Аналогично можно представить и другие грамматические категории существительного – лицо, род и т.д., поскольку все они подчиня- ются принципу аддитивности. В итоге можно построить модель, репрезентирующую все грамматические категории существительного в виде иерархически упорядоченного графа. Этот способ моделирования универсален и одинаково эффективно и наглядно сработает при построении лексико-семантических моделей самых разных предметных областей. Более того, такой способ репрезентации структуры предметной области является удобной базой для создания квалиметрических программ, где модель в виде графа идеально подходит для качественной и количественной оценки профессиональных знаний специалистов.

В заключение осталось отметить, что работа по созданию лексико-семантических моделей предметных областей представляет собой огромный пласт исследований, которые требуют совместных усилий специалистов из разных областей науки. «Междисциплинарные исследования функционирования языка оказывают решающее влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания»14. Бергельсон также отмечает междисциплинарный характер данной проблемы, решение которой требует совместных усилий специалистов гуманитарных и естественных наук15.

METALANGUAGE AS MEANS OF THE FIELD SEMANTICS MODELING

Список литературы Метаязык как инструмент моделирования семантики предметной области

  • Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка. -М.: 1981. -С. 16.
  • Попов Э.В. Общение в ЭВМ на естественном языке. -М.: 1982. -С. 57.
  • Андрусенко Т.Б. Лингвистические структуры в компьютерных учебных средах. Национальная академия наук Украины. Ин-т кибернетики им. В.М.Глушкова. -Киев: 1994. -С. 22.
  • Бергельсон М.Б. и др. Моделирование языковой деятельности в интеллектуальных системах/под ред. А.Е.Кибрика и А.С.Нариньяни. -М.: 1987. -С.5.
  • Баранов А.Н. Введение в прикладную лингвистику: Учеб. пособ. -М.: 2001. -С. 6.
  • Никаев С.А. Модели и информационная система для оценки профессиональных знаний специалистов промышленного производства: автореф. дисс. …. канд. техн.н. -Самара: 2004. -20 с.
  • Савицкий В.М. Английская фразеология: проблемы моделирования. -Самара: 1993. -С. 13.
  • Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка. -М.: 1981. -С. 15.
  • Национальная энциклопедическая служба. Метаязык -Режим доступа: http://www.terme.ru/dictionary/879/word/metajazyk (24.04.14).
  • Караулов Ю.Н. Общая и русская идеография. Ин-т. языкознания АН СССР. Отделение литературы и языка. -М.: 1976. -С. 16
  • Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка. -М.: 1981. -С. 31.
  • Теория графов. БСЭ -Режим доступа: http://slovari.yandex.ru/теория%20графов/БСЭ/Графов%20теория/(29.04.14).
  • Словарь_терминов_теории_графов. Википедия -Режим доступа: http://ru.wikipedia.org/wiki/(29.04.14).
  • Бинарная оппозиция -Режим доступа: http://eurasialand.ru/txt/post/38.htm/(29.04.14)
Еще
Статья научная