Типология БД как лексикографического продукта: основные характеристики и преимущества

Бесплатный доступ

Публикация посвящена проблеме отбора и типологии лексикографических баз данных. Приведена классификация БД, перечислены основные характеристики, оптимальные для преподавания иностранного языка и перевода. Проанализирована методическая концепция работы с данным форматом, сформулированы образовательные задачи.

Типология баз данных, лексикографическая база данных, хранилище информации, текстовый проект, системы перевода, ключ, гипертекст

Короткий адрес: https://sciup.org/170188379

IDR: 170188379   |   DOI: 10.24412/2500-1000-2021-10-2-71-74

Текст научной статьи Типология БД как лексикографического продукта: основные характеристики и преимущества

В условиях доступности и открытости информации на иностранных языках линг-водидактика встала перед проблемой выбора адекватного аутентичного текстового дидактического материала для ведения образовательной деятельности в режиме онлайн, а также самостоятельной работы студентов оффлайн.

Важно отметить, что помимо ознакомления с оцифрованными источниками информации, наиболее продуктивными видами деятельности является продукция, т.е. самостоятельная разработка баз данных текстов на иностранном языке и лексикографических баз данных.

Для студентов, изучающих иностранный язык как язык специальности в данной образовательной парадигме, всемирная сеть рассматривается как один из наиболее перспективных инструментов для обеспечения межкультурного взаимодействия, сотрудничества и информационного обмена. Эффективными средствами развития письменной речи, совершенствования навыков художественного и спецпе-ревода являются цифровые технологии, а активное использование в учебном процессе вуза электронных ресурсов на иностранном языке позволяет не только развить аудитивные и фонетические умения, но также и выработать схему коммуникации с представителями современной культуры страны изучаемого языка – носителями языка.

Изучение иностранных языков и практики перевода предполагает ежедневную работу с лексикографическими базами данных (ЛБД) как в устном, так и в письменном режимах. По типологии известного лингвиста В.Н. Шевчука ЛБД следует относить к информационным системам, которые «обеспечивают автоматический поиск лингвистической и экстралингви-стической информации в Интернете, а также управление информационными потоками (энциклопедии, электронные библиотечные каталоги, банки терминов, серверы поиска и т. д.)» [3, с. 18].

Современные базы данных можно разделить на следующие виды:

  • 1.    Простейшие (простые структуры БД)

  • 2.    Иерархические

  • 3.    Сетевые

  • 4.    Реляционные

  • 5.    «Ключ-значение»

  • 6.    Документоориентированные

  • 7.    Графовые

  • 8.    Колоночные

  • 9.    Комбинированные

  • 10.    Многомодульные

С появлением мультимедийных ресурсов студентам и преподавателям стали доступны как ЛБД на дисковых носителях, являющиеся электронной версией толковых, переводных и энциклопедических словарей, так и сетевые и онлайн версии данных продуктов.

Вне зависимости от вида, объектом описания ЛБД является лексическая единица, сопровожденная словарной статьей и входящая в состав машиночитаемого сло- варного массива. Среди основных типов ЛБД следует перечислить следующие:

  • 1.    Рубрикаторы

  • 2.    Тезаурусы

  • 3.    Классификаторы

  • 4.    Терминологические словари

  • 5.    Тематические словари

  • 6.    Иллюстрированные и визуальные словари

Конкретизируем понятие гипертекста, поскольку в информатике, лингвистике и литературоведении данный термин трактуется по-разному: и с точки зрения технологии, и как текстовый формат, и как структура баз данных: «гипертекст – текст, устроенный таким образом, что он превращается в систему, иерархию текстов, одновременно составляя единство и множество текстов. Простейший пример гипертекста – любой словарь или энциклопедия, где каждая статья имеет отсылки к другим статьям этого же словаря. В результате читать такой текст можно по-разному: от одной статьи к другой, по мере надобности, игнорируя гипертекстовые отсылки; читать статьи подряд, справляясь с отсылками; наконец, пуститься в гипертекстовое плавание, то есть от одной отсылки переходить к другой. Гипертекст это нелинейный лабиринт, своеобразная картина мира, и выйти из него, войдя один раз, труднее, чем может показаться на первый взгляд» [2, с. 46].

Как правило, все лингвистические базы данных словарного типа основаны на жестком структурировании и нуждаются в регулярном редактировании и обновлении в связи с возникновением в языке и в конкретной области деятельности человека новых лексических единиц, терминов и терминированных понятий. В этой связи используемые технологии при разработке ЛБД на иностранных языках по своей сути представляют собой тезаурусы и классификаторы, а по структуре чаще всего являются колоночными, комбинированными и реляционными.

Для многомодульных ЛБД характерна опция конвертации при работе в системах перевода с целью ведения терминологической, тематической и проектной баз данных перевода. В этом случае лексическая единица также выступает структурной единицей БД, связывающей по технологии гипертекста различные модули системы. В МЛБД используются различные представления для разных типов данных и объединены функциональные возможности нескольких видов БД. Например, в случае работы группы переводчиков над одним текстовым проектом навигация МЛБД позволяет управлять всеми элементами в рамках одного запроса.

Следует отметить, что данная функция особенно важна при переводе объемного корпуса текстов, т.к. она обеспечивает согласованные действия в случае обновления, редактирования и изменения хранящейся лексической информации. Основными преимуществами МЛБД для ведения переводческой деятельности с крупными проектами можно считать следующие: непрерывный доступ, простое распределение данных, постоянство базовой инфраструктуры, расширение за счет добавочных модулей, снижение нагрузки на СУБД.

Безусловно, для грамотного изучения и освоения иностранного языка, а также активизации лексического запаса студентов необходимо постоянное пополнение БД дидактическими материалами и текстами разнообразной тематики.

Данную задачу решают документоори-ентированнные БД, совместно использующие базовую семантику доступа и поиска хранилищ ключей и значений. Накопитель текстовых проектов или хранилище документов имеет ключ для уникальной идентификации данных ДОБД. Необходимо отметить, что в данном случае семантика предполагает однозначное значение лексической единицы, являющейся структурной единицей системы в том числе.

В обязательном порядке единообразно структурирован текстовый проект ДОБД, что требует от студентов определенной лингвистической обработки при внесении того или иного текстового проекта в ДОБД. Среди неоспоримых преимуществ данного вида ЛБД следует назвать такие, как: наличие собственной внутренней структуры, оперативность разработки, возможность изменения свойств при по- стоянной структуре, сохранение данных в стандартном формате по заданной схеме.

Для обучения переводу как письменному, так и устному, ДОБД является ценным дидактическим материалом преподавателя, к которому можно неоднократно обращаться в случае необходимости при дальнейшей работе, а студенты, создав ДОБД приобретают привычку работы с лексическим материалом в формате текстовых проектов и корпусов на постоянной основе.

Следует упомянуть о визуализации данных как одного из эффективных методов изучения иностранного языка и присвоения иноязычной информации. При размещении лексики в реляционные базы данных студенты приобретают авыки построения логико-семантических схем. РБД в основном структурированы в виде таблицы, где каждый столбец в таблице имеет имя и тип, а каждая строка представляет отдельную запись или элемент данных в таблице, который содержит значения для каждого из столбцов.

Как и в ДОБД, в РБД связи между данными организованы с помощью табличного гипертекста. Основными функциями данного вида ЛБД являются: высокоорганизованная структура и гибкость, возможность адаптации к различным типам данных, наличие нескольких полей (ключей) в формате внешней и внутренней ссылки, возможность ссылочного соединения с полями других таблиц.

При редактировании стандартной ЛБД словарного типа (в первую очередь, переводных словарей) закономерно применения такого формата, как колоночные базы данных. КБД следует отнести, скорее всего, к нереляционным колоночным хранилищам или БД с широкими столбцами. Как и РБД, КБД хранят данные, используя строки и столбцы, но с иной связью между элементами. Например, все строки РБД соотнесены по фиксированной схеме, определяющей назначение столбцов, типы данных и другие критерии.

В КБД используются так называемые «колоночные семейства», которые, в отличие от таблиц, содержат строки, каждая из которых определяет собственный формат.

Функция поиска осуществляется уникальным идентификатором, определяющим значения и имена.

Строка состоит из уникального идентификатора, используемого для поиска, за которым следуют наборы имён и значений столбцов. В качестве преимуществ КБД для разработки и редактирования словаря укажем высокую производительность, доступность по одному идентификатору, гарантированное размещение всех данных строки в одном кластере, что упрощает сегментацию и масштабирование данных.

Высокая образовательная ценность вышеперечисленных ЛБД как для преподавателя иностранного языка и его научной деятельности, так и для студента, изучающего язык и культуру зарубежных стран, зависит от типа контента и формата навигации.

Разработка и редактирование студентами ЛБД направлены на выполнение креативных заданий как удаленно, не выходя из дома, так и в компьютерном классе, в аудиторном режиме.

Перечислим образовательные задачи при работе ЛБД:

  • 1.    ознакомить со спецификой чтения и перевода источников гипертекстового формата на иностранном языке;

  • 2.    выработать умение применять полученные теоретические знания в практической деятельности при дискурсивном и поисковом чтении материалов и аргументировано обосновывать собственные переводческие решения;

  • 3.    научить проводить лингвистический и лингвостилистический анализ посредством аналитического чтения;

  • 4.    научить анализировать структуру текстовых материалов при размещении в ЛБД;

  • 5.    совершенствовать навыки работы в сетевых средах профессиональных приложениях переводчика с целью разработки и поддержки ЛБД.

В заключение отметим, что ЛБД как технология и формат должны использоваться в комплексе с традиционными источниками информации, в первую очередь, образовательной литературой, что обусловлено концептуально новыми фактора- ми образовательного процесса – как индивидуального, внеаудиторного (оффлайн), так и коллективного, аудиторного (онлайн).

Основным выводом по вопросам использования баз данных в преподавании иностранного языка является констатация факта, что лингвистическая обработка аутентичного материала в цифровом формате позволяет сократить время поисковой деятельности, оптимизировать усвоение информации гипер-объема, совершенствовать коммуникативную компетенцию, и, как следствие, повысить мотивацию к освоению технологий перевода.

Список литературы Типология БД как лексикографического продукта: основные характеристики и преимущества

  • Полонский В.М. Словарь по образованию и педагогике. - М.: Высш. шк., 2004. - 511 с.
  • Руднев В.П. Словарь культуры XX века: ключевые понятия и тексты - М.: Аграф, 1999. - 381 с.
  • Шевчук В.Н. Информационные технологии в переводе. Электронные ресурсы переводчика. - М.: Зебра Е, 2013. - 384 с.
Статья научная