Сетевые технологии при обработке диалектного материала: «Лексический атлас Волгоградской области»

Автор: Земляков Дмитрий Вячеславович, Кузнецова Елена Валентиновна

Журнал: Грани познания @grani-vspu

Рубрика: Филология

Статья в выпуске: 2 (12), 2011 года.

Бесплатный доступ

Описывается новый способ обработки языковых данных при помощи современных информационных и сетевых технологий. Рассказывается о создании лингвогеографических карт, способных непрерывно развиваться благодаря возможностям сети Интернет.

Диалектология, сетевые технологии, лингвистическая география, лингвистическая карта, информационные технологии

Короткий адрес: https://sciup.org/14821641

IDR: 14821641

Network technologies in dialect material processing: Lexical atlas of the Volgograd region

There is described the new method of language information processing with the help of the modern informational and network technologies. There are regarded the linguistic geographical maps, which continuously develop due to the Internet opportunities

Текст научной статьи Сетевые технологии при обработке диалектного материала: «Лексический атлас Волгоградской области»

Лингвистика – это не только область человеческого знания, но и сфера приобщения к национальной и мировой культуре, следовательно, язык как историческая память о традициях, обычаях, фиксирует для потомков и транслирует духовную культуру народа, его предпочтения и мировидение. В территориальном распределении языковых фактов отражаются судьба носителей языка, история народа, культурные, политические и социально-экономические отношения населения в прошлом. Изучение языка малой родины как один из путей культурной рефлексии, способов патриотического самовоспитания человека, безусловно, актуально в условиях современной России и, в частности, Волгоградской области.

Вследствие неоднородности заселения, разницы этнокультурных особенностей переселенцев на территории Волгоградской области бытуют три типа русских переселенческих говоров: ранние переселенческие (донские казачьи – на западе области, говоры социально изолированного типа, формировавшиеся в XVI – XVII вв. на бывшей территории Области Войска Донского); собственно переселенческие, пестрые, неоднородные вследствие неоднородности заселения (часть волжских говоров – на востоке области, формировались в XVIII в.) и поздние переселенческие (Палласовский и Старополтавский районы в крайней восточной части области) – волжские говоры, которые формировались в начале XIX в. [2; 3].

Комплексное лингвогеографическое исследование переселенческих говоров разного типа на территории Волгоградской области в связи с историей заселения и особенностями материальной и духовной культуры населения региона позволяет наглядно продемонстрировать влияние внеязыковых факторов на формирование и развитие языка. Визуализированная пространственная соотнесенность фактов языка (т.е. профессионально составленная, информативно полная лингвогеографическая карта) дает возможность не только выявить ареалы слов, связанных с материальной и духовной культурой народа, но и исследовать структурно-семантические, функциональные особенности, историю слов в связи с историей и культурой народа.

Данное исследование находится на пересечении активно развивающихся лингвистических отраслей (лингвогеография, лингвокультурология и этнолингвитика) и современных информационных технологий [1; 4]. Последние позволяют эффективно, быстро и наглядно обрабатывать языковой материал, что способствует повышению доступности и популяризации лингвистических знаний.

В начале XXI в. лингвогеография накопила достаточно опыта в создании лингвистических атласов разного типа: атласы отдельных территорий, одного языка, группы родственных языков и т.д. В России первым академическим проектом был «Диалектологический атлас русского языка: Центр Европейской части СССР». Работа над ним велась в 1936 – 2004 гг. Одновременно в конце XX в. были созданы региональные диалектологические атласы: «Диалектологический атлас русских народных говоров Волгоградской области» (Л.М. Орлов, 1969 г.); «Атлас русских говоров среднего и нижнего Поволжья» (под руководством Л.И. Баранниковой, 2000 г.).

Современный общероссийский академический проект – создание «Лексического атласа русских народных говоров» (с 1985 г. работу над ним координирует Институт лингвистических исследований РАН). Над проектом в настоящее время работают более 100 вузов России, в том числе (с 1993 г.) Волгоградский государственный социально-педагогический университет (ВГСПУ). В 2004 г. вышел пробный выпуск части первого тома атласа, посвященного лексике природы. Обработку диалектных материалов в Словарном секторе Института лингвистических исследований РАН и вузах страны осуществляют студенты и преподаватели в рамках диалектологических практик и научно-исследовательской работы. Все карты пробного выпуска (как и других современных атласов) составлены вручную учеными-диалектологами на основе бумажной картотеки, доставляемой в ИЛИ РАН с обследуемой территории России.

Последние несколько лет для создания «Лексического атласа…» составителям карт предлагается использовать новый метод. Для каждого вопроса составляется своя база данных, далее эти данные импортируются в другую программу, в которой осуществляется визуализации материала, т.е. видна сама карта со значками. Обнаруженные недочеты нужно исправлять в исходной базе данных. Прямой связи между первичной базой и программой визуализации нет, потому правки снова делаются «вслепую». Хотя этот способ обработки данных и создания карт является относительно новым и облегчает процесс по сравнению с ручной обработкой, у него есть следующие недостатки:

  • –    сложность, трудоемкость преобразования первичного диалектного материала в форму, необходимую для внесения в электронную базу данных;

  • –    долгий и непрямой путь данных от внесения в базу до сознания карты;

  • –    отсутствие визуализации данных (карты) в процессе работы над ней;

  • –    отсутствие обратной связи в звене «студент – наука» (как следствие – снижение мотивации работы студентов).

На кафедре общего и славяно-русского языкознания ВГСПУ за время сотрудничества с ИЛИ РАН по программе «Лексического атласа русских народных говоров» накоплен обширный диалектный материал, который требует обработки и может служить основой для создания диалектного атласа. Обработка, систематизация этих данных, составление лингвистических карт на диалектном материале – кропотливая и длительная работа.

Проанализировав существующие в современной науке подходы, мы разработали модель новой информационной системы, ориентированной на решение указанных выше недостатков обработки диалектных данных. Авторская модель реализуется в пилотном интернет-проекте «Лексический атлас Волгоградской области», позволяющем организовать работу над диалектными лингвистическими картами на качественно ином уровне.

Основное содержание готового ресурса – диалектные лингвистические карты Волгоградской области, созданные на основе материалов кафедры общего и славяно-русского языкознания. На картах отражена лексика различных тематических групп, собранная в рамках диалектологических экспедиций преподавателей и студентов ВГСПУ в районах Волгоградской области. Каждая карта может сопровождаться развернутым лингвистическим комментарием с привлечением культурологической, этнографической и исторической информации. Разработанная методика создания диалектных карт (пока в масштабах Волгоградской области) лишена указанных ранее недостатков, поскольку:

  • 1)    первичный диалектный материал автоматически обрабатывается, преобразуется и визуализируется предложенной системой в виде лингвистических карт; при внесении в базу данные не кодируются исследователем по определенному алгоритму (как это делается на современном этапе при работе над другими российскими проектами), а вносятся на сайт в привычной (интуитивно понятной) для обычного пользователя форме;

  • 2)    сразу после добавления в базу данных и одобрения администратором информация появляется на лингвистической карте и становится доступной для всех пользователей;

  • 3)    разработанный принцип построения лингвистических карт дает возможность исследователю видеть процесс создания карты: оценивать ареалы слов, делать вывод о том, какие вопросы и карты требуют доработки, какие районы не обследованы по тому или иному аспекту;

  • 4)    разработанный проект решает проблему преемственности исследований, привлечения к научной работе студентов и школьников и популяризации лингвистической науки, поскольку является общедоступным и бесплатным.

Таким образом, создан информативный, высоконаучный и одновременно доступный для широкого круга пользователей ресурс «Лексический атлас Волгоградской области», находящийся по адресу Разработанная система предоставляет пользователю всю имеющуюся информацию в удобном виде, что делает возможным ее применение в вузовском учебном процессе (в рамках диалектологической практики студентов филологического факультета), т.к. путем администрирования сайта осуществляется контроль деятельности студентов. В дальнейшем планируется разработка варианта атласа, предназначенного для публикации.

Новизна проекта обусловлена качественно новыми средствами решения поставленных задач. Собранный в результате многолетнего исследования говоров диалектный материал продолжает пополняться каждый год сведениями, полученными в экспедициях по области. Синтез накопленного в течение многих десятилетий опыта работы лингвистов и потенциала современных информационных технологий позволит организовать эту работу по-новому продуктивно, поможет привлечь широкий круг людей к работе над лингвистическими картами (от школьников и студентов до ученых-лингвистов), а также будет способствовать повышению интереса к языку людей, не связанных с лингвистической наукой.

Исследование выполняется при поддержке следующих грантов: Президента Российской Федерации для государственной поддержки молодых российских ученых МД-7146.2010.6, 2010 – 2012, «Разработка концепции реализации образовательных сетевых технологий учебно-методической, исследовательской, социально направленности на уровне среднего общего образования»; Российского гуманитарного научного фонда, РК 2011 «Волжские земли в истории и культуре России», проект 11-14-34002а/В «Лексический атлас Волгоградской области: информационные технологии в современной лингвистике».

Список литературы Сетевые технологии при обработке диалектного материала: «Лексический атлас Волгоградской области»

  • Коротков А.М. Организация совместно-распределенной деятельности учащихся при обучении в компьютерной среде//Развитие личности в образовательных системах: материалы докл. XXIX Междунар. психол. чтений. Ростов н/Д.: ИПО ПИ ЮФУ. 2010 С. 47-54.
  • Кудряшова Р.И. Слово народное. Говоры Волгоградской области в прошлом и настоящем: учеб. пособие. Волгоград: Перемена, 1997.
  • Орлов Л.М. Русские говоры Волгоградской области: учеб. пособие. Волгоград: Изд-во ВГПИ им. А.С. Серафимовича, 1984.
  • Система совместно-распределенной деятельности по созданию и использованию электронных ресурсов в непрерывном педагогическом образовании: моногр./под. ред. А.М.Короткова. Волгоград: Перемена, 2009.