Информационно-терминологический базис как совокупность лексически связанных компонентов

Автор: Ковалев Игорь Владимирович, Карасева Маргарита Владимировна, Лесков Виталий Олегович

Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau

Рубрика: Математика, механика, информатика

Статья в выпуске: 1-1 (22), 2009 года.

Бесплатный доступ

Рассмотрены вопросы реорганизации структуры базисного информационного компонента мультилингвис-тической адаптивно-обучающей технологии для применения методики обучения иностранной лексике посредством построения внутриязыковых ассоциативных полей.

Мультилингвистическая адаптивно-обучающая технология, информационно-терминологический базис, частотные словари, внутриязыковые ассоциативные поля

Короткий адрес: https://sciup.org/148175805

IDR: 148175805

Текст научной статьи Информационно-терминологический базис как совокупность лексически связанных компонентов

В работе [1] были сформулированы основные положения методики обучения иностранным языкам, которая обеспечивает организованное построение групп ассоциативных связей между лексемами целевого языка непосредственно в процессе обучения. Данная методика развивается, опираясь на мультилингвистическую адаптивно-обучающую технологию (МЛ-технологии), поэтому структуру языкового материала, который она будет использовать, рационально разрабатывалась, отталкиваясь от информационно-терминологического базиса (ИТБ) МЛ-технологии [2].

Также, в работе [1] было предложено использование ИТБ как совокупности лексически связанных компонентов (ЛС-компоентов). В соотнесении с МЛ-технологией такой подход вызывает ряд вопросов и требует более подробного описания.

Итак, от грамотно разработанной и соответствующим образом описанной структуры ИТБ, в данном случае, будет зависеть возможность и целесообразность применения настоящей методики обучения в рамках МЛ-технологии.

Информационно-терминологическое обеспечение МЛ-технологии . Информационно-терминологическая база МЛ-технологии строится на основе результатов анализа языкового материала. Под языковым материалом здесь следует понимать некоторое множество текстов интересующей разработчика предметной области изучаемого языка [3]. Размер языкового материала может варьироваться в зависимости от средств анализа, наличия оригинальных текстов и необходимого количества терминов.

Основу построения информационно-терминологической базы составляют частотные словари, по данным которых определяется приоритетность изучения тех или иных терминов. Использование таких словарей, полученных путем анализа языкового материала, качественно улучшает процесс обучения иностранной лексике [4].

В работе [2] была разработана структура информационно-терминологической базы МЛ-технологии с учетом частотных характеристик ее элементов.

Терминологическое множество, соответствующее базисному информационному компоненту МЛ-техноло-гии, описывалось следующим образом:

МЛ-компонент = {термин яз_1, термин яз_2,..., термин яз_N, частота яз_1, частота яз_2,..., частота яз_N}.

Методология DSSD (Data-Structured Systems Development), предложенная Варнье Орром и ориентированная на разработку систем со структурными данными, использует аналогичную нотацию, а именно множественную скобку (рис. 1).

МЛ - компонент

термин яз_1 термин яз_2

термин яз_К частота яз_1 частота яз_2

частота яз_И

Рис. 1. Описание базисного информационного компонента с использованием нотации DSSD

Применение МЛ-компонентов в построении информационно-терминологического базиса . В работе [1] рассматриваются системные аспекты методики обучения иностранной лексике посредством построения внутриязыковых ассоциативных полей . Одним из таких аспектов является модификация структуры ИТБ, а именно, его базисного информационного компонента.

Предположим, дан полностью сформированный мультилингвистический ИТБ нейросетевой структуры [5]. Необходимо, посредством некоторого критерия, выделить элементы в совокупности их лексических связей наиболее значимые для обучения. Предположим, что такой критерий сформулирован, и для каждого элемента определено оптимальное количество лексических связей.

Таким образом, ИТБ будет представлен совокупностью объектов, структура которых схематически представлена на рис. 2.

Рис. 2. Лексически связанный компонент ИТБ: лексемы: 1 – основная лексема; 2 , 3 , 4 , 5 – связанные лексемы; лексические связи: 1–2, 1–3, 1–4, 1–5; количе ственные характеристики: ν i – абсолютная частота i -й лексемы; µ ik – абсолютная частота сочетания i -й и k -й лексем

Такие комплексные объекты называются лексически связанными компонентами ИТБ.

Лексема, связанная со всеми без исключения лексемами ЛС-компонента ИТБ называется основной лексемой; лексемы, имеющие только одну связь, – связанными лексемами.

Таким образом, мультилингвистический компонент, описанный в работе [6], уже не будет играть роль базисного информационного компонента. Его место теперь займет разработанный нами ЛС-компонент. Опишем его структуру, ориентируясь на данные. Для простоты воспользуемся уже известным нам описанием МЛ-компо-нента:

ЛС-компонент = {МЛ-компонент (основная лексема), CМЛ-компонент (связанная лексема № 1), СМЛ-компо-нент (связанная лексема № 2), СМЛ-компонент (связанная лексема № N)}.

В нотации DSSD ЛС-компонент будет выглядеть следующим образом (см. рис. 3):

ЛС - компонент

ОМЛ-компонент

СМЛ-компонент 1

СМЛ-компонент 2

СМЛ-компонент N

Рис. 3. Описание базисного информационного компонента с использованием нотации DSSD

Но при этом структура МЛ-компонента, базирующегося на основной лексеме должна быть изменена, иначе теряется информация о лексических связях, а значит и смысл всей методики обучения.

Структура основного МЛ-компонента (ОМЛ-компо-нента) будет выглядеть следующим образом:

ОМЛ-компонент = {термин яз_1, термин яз_2, ..., термин яз_N, частота яз_1, частота яз_2, ..., частота яз_N, сочетание 1_яз_1, сочетание 1_яз_2, ..., сочетание 2_яз_1, сочетание 2_яз_2, …, сочетание K_яз_N, частота 1_яз_1, частота 1_яз_2, …, частота 2_яз_1, частота 2_яз_2, …, частота K_яз_N}.

Или, используя нотацию DSSD, иначе (рис. 4).

На первый взгляд структура ОМЛ-компонента выглядит громоздкой. Возникает вопрос о том, насколько ресурсоемко будет формирование и эксплуатация таких компонентов. Но при ближайшем рассмотрении становится очевидным, что ОМЛ-компоненты включили в себя МЛ-компоненты, образованные от словосочетаний. Таким образом, исходный объем ИТБ нисколько не изменился. Также не изменилась ресурсоемкость его формирования. Ресурсоемкость использования в процессе обучения увеличится незначительно, так как сам процесс обучения носит итеративный характер, а на каждой итерации подачи материала такой элемент всего один. Структура остальных МЛ-компонентов (связанных) не претерпела изменений [6].

Лексические сочетания и их частотные характеристики, полученные путем анализа нейросетевого ИТБ, были включены в структуру ОМЛ-компонента затем, чтобы сохранить принцип мультилингвистичности обучения.

Дело в том, что при изучении словосочетания на иностранном языке (момент установления ассоциативного поля) обучаемый, согласно данной методике, должен получить подсказку на другом, уже изученном, иностранном языке. Эта подсказка есть не что иное, как языковой аналог данного словосочетания. Но ввиду различного синтаксиса языков, входящих в ИТБ, генерировать такие языковые аналоги простой комбинацией лексем совершенно недопустимо. Поэтому для сохранения принципа мультилингвистичности обучения необходимо иметь точные языковые аналоги лексических сочетаний как отдельных понятий предметно й области.

термин яз_1 термин яз_2

термин яз_К частота яз_1 частота яз_2

частота яз_N сочетание 1 яз_1 сочетание 1 яз_2

сочетание 1 яз_К

МЛ - компонент               сочетание 2 яз_1

(основная лексема) -------- сочетание 2 яз_2

сочетание К яз N частота 1 яз_1 частота 1 яз_2

частота 1 яз_N частота 2 яз_1 частота 2 яз_2

частота К яз N

Рис. 4. Описание ОМЛ-компонента с использованием нотации DSSD

Таким образом, в статье были рассмотрены некоторые аспекты совместного применения МЛ-технологии и методики обучения, посредством наведения внутриязыковых ассоциативных полей. В том числе осуществлены следующие действия:

  • –    детализирована структура ИТБ как совокупности ЛС-компонентов;

  • –    разработан базисный информационный компонент ИТБ;

  • –    проведено ориентированное на данные описание ЛС-компонента как базисного информационного компонента ИТБ.

Разработанная структура ИТБ является основой совместного использования МЛ-технологии и методики обучения на основе ЛС-компонентов (ЛСК-методики). Именно структурные особенности ИТБ позволяют этим двум подходам «безвозмездно» усиливать друг друга в процессе обучения.

Статья научная