Использование корпуса текстов для обучения иностранному языку

Бесплатный доступ

В статье раскрывается содержание применения корпусных технологий при изучении иностранных языков: дано понятие «корпус текстов», области использования корпусов; приведен фрагмент конкорданса, построенного на основе Британского национального Корпуса как пример инструментария, позволяющего автоматизировать работу с корпусом; приведены задания для построения которых целесообразно использовать корпусы текстов

Короткий адрес: https://sciup.org/14239344

IDR: 14239344

Текст научной статьи Использование корпуса текстов для обучения иностранному языку

кандидат филологических наук, Южно-Уральский государственный университет г. Челябинск

ИСПОЛЬЗОВАНИЕ КОРПУСА ТЕКСТОВ ДЛЯ ОБУЧЕНИЯ ИНОСТРАННОМУ ЯЗЫКУ

В статье раскрывается содержание применения корпусных технологий при изучении иностранных языков: дано понятие «корпус текстов», области использования корпусов; приведен фрагмент конкорданса, построенного на основе Британского национального Корпуса как пример инструментария, позволяющего автоматизировать работу с корпусом; приведены задания для построения которых целесообразно использовать корпусы текстов.

В традиционном обучении в качестве источника лингвистического знания зачастую выступают аутентичные тексты. Прежде всего, это относится к изучению лексики. Однако аутентичные тексты едва ли содержат достаточное количество речевых образцов, полно демонстрирующих функционирование той или иной лингвистической единицы в дискурсе. Кроме того, при использовании аутентичного текста нет гарантии, что данный текст содержит лексему в наиболее частотном (т.е., наиболее типичном для нее) контексте. Решением этих проблем может являться конструирование специальных учебных текстов, которые, в свою очередь, зачастую искусственны, и не отражают реальный процесс коммуникации.

Сам процесс обучения в рамках традиционного подхода подразумевает, что учитель (и учебник) выступает в роли источника готового знания: студенту даются сформулированные правила, готовые к использованию. Вместе с тем, многими лингвистами-практиками отмечается, что знание, в приобретении которого студент принимает активное участие, гораздо лучше откладывается и быстрее усваивается.

Осознание этих проблем в методике приводит к тому, что прочные позиции занимает эмпирический подход в отборе содержания образования при обучении иностранным языкам. В частности, это выражается в интеграции в учебный процесс исследований в области корпусной лингвистики.

Под корпусом текстов понимается любая коллекция текстовых произведений, представленных в письменной или устной форме [8, с. 197]. Некоторые корпусы ориентированы на узкую предметную область, например, ресторанный менеджмент [4, 6, 10]. Анализ корпусов текстов позволяет сделать статистически обоснованные выводы о функционировании изучаемых языковых явлений в тексте. Как показывает ряд исследований в данной области, интуитивные представления о языке, выраженные в грамматиках и словарях, не всегда статистически достоверно отражают функционирование языка. Так, например, в традиционных грамматиках постулируется, что использование any в функции определения грамматически верно только в отрицательных и вопросительных предложениях, и неверно в утвердительных. Однако корпусное ис- следование показывает, что any в 50% случаев используется именно в утвердительных предложениях [8, 9]. Таким образом, корпусный анализ подкрепляет и расширяет базу знаний о языке, полученную в результате применения метода интроспекции.

Использование корпуса текстов в обучении (подход, который получил в англоязычной традиции название Data-Driven Learning) основывается на постулате о том, что студент должен в процессе своего обучения выступать в роли исследователя [7, с. 2], делать самостоятельные выводы на основе непосредственно эмпирических данных, представленных в корпусе, не прибегая к интерпретациям грамматистов и не будучи ограничен неполнотой лексикографических ресурсов. Таким образом, студент при обучении не зависит от существующей педагогической традиции и выводов, сделанных лингвистами и предписывающих следовать той или иной интерпретации лингвистических явлений.

Методистами в области применения корпусных технологий в обучении выделяются три основные области использования корпусов [3]:

  • 1)    составление учебных программ : в зависимости от коммуникативных задач, которые стоят перед данной аудиторией, отбирается материал в ходе анализа релевантного для заданных целей обучения корпуса: определяются языковые единицы, обеспечивающие определенные решения коммуникативных задач, что и служит основой для определения стратегии и содержания обучения;

  • 2)    академическая работа студента («жесткий» вариант): представляет собой самостоятельную работу студентов с корпусом текстов, в результате которой, используя программные средства, они могут самостоятельно делать изыскания о

функционировании языковых единиц и явлений в изучаемом языке.

  • 3)    разработка учебного материала («мягкий» вариант): корпус текста, отражающий особенности коммуникации в заданной ПО, дает возможность преподавателю выявить типовые ситуации общения и составить набор упражнений, ориентированный на успешное решение коммуникативных задач, и/или комплект учебных справочных материалов.

Рассмотрим подробнее последний способ использования корпусов. Так как информация в корпусе представлена хаотично, это требует определенных усилий для обобщения материала. Поэтому на практике на учителя возлагается ответственность (по крайней мере, на начальной стадии обучения) обработки корпуса и вычленения из него информации, релевантной для нужд студента.

Для получения данных из корпуса необходимы специальные инструменты, позволяющие автоматизировать работу с ним. Для извлечения информации из корпуса используются программы для построения конкордансов. Конкорданс (concordance) представляет собой список слов с указанием контекста их использования [1, с. 74].

Как правило, корпусы снабжаются грамматической разметкой, а про-грамммы для построения конкордансов позволяют отыскивать не только слово в начальной форме, но и различные его морфологические варианты, а также осуществлять фильтрацию по различным лексическим и грамматических контекстам.

Так, на рис. представлен фрагмент конкорданса для глагола chop в контексте существительного в пределах трех слов вправо, построенного на основе Британского Национального Корпуса.

smaller portions of already prepared chopped vegetables you can use in stir-fries and casseroles

2 red bell peppers, seeded and chopped ¼ red onion 1 cup cilantro, extra virgin olive oil Black pepper Coarsely but most people pile it in so they do n't have to to burn us up in fire. Nobody 's going to

chop the herbs and mix them with the other ingredients. chop so many herbs. Put all the ingredients into a bowl chop our heads off. Records that say ' faggot '

glacé cherries, chopped 25g/1oz angelica, chopped 50g/2oz white chocolate 50g/2oz plain chocolate

3 Mix thoroughly and stir in the chopped apricots and chocolate chips. Add more

Рис. Фрагмент конкорданса для глагола chop на основе Британского национального корпуса

Конкорданс является основой доступа студента и преподавателя к данным корпуса. Далее преподаватель должен «адаптировать» конкорданс для предъявления студенту примеров из корпуса. Предварительная работа преподавателя с конкордансом может включать:

  • 1)    составление выборки наиболее показательных примеров для демонстрации изучаемого явления;

  • 2)    определение размера текстов, предъявляемых студенту (уровень словосочетаний, предложений, параграфов);

  • 3)    адаптация элементов выборки из корпуса (редактирование текстов в соответствии с уровнем обучаемых: исключение предложений, включающих неизвестные студентам грамматические конструкции, сложную лексику и т.д.).

Задания, для построения которых целесообразно использовать корпусы текстов, могут включать следующий набор [5, с. 14-17]:

  • 1)    формирование навыка языковой догадки;

  • 2)    изучение сочетаемостей слов;

  • 3)    сравнительный анализ значений слов из одного семантического поля;

  • 4)    сравнительный анализ употребления слова в различных типах дискурса;

  • 5)    критическое изучение грамматических правил.

Задания для развития навыка языковой догадки могут звучать следующим образом: предположите, какое слово пропущено в наборе предложений из корпуса; выберите из предложенных вариантов верное значение, в котором слово используется в наборе предложений из текста; в каких различных значениях используется центральное слово приведенного конкорданса и т.д.

Изучение сочетаемостей слова предполагает выявление его коллокацион-ных и коллигационных образцов, например, на основе конкорданса для глагола chop студент может выявить следующие закономерности: а) коллокация с наречием: coarsely + chop ; б) коллигация NOUN + chopped (ATTR) (т.е. форма chopped может употребляться в пост-позиции от существительного в функции определения).

Сравнительный анализ основан на изучении функционирования отдельных слов и их сравнении. Например, при сравнении конкордансов слов chop и carve с общей семой [Резать] студент может определить, что а) первый из глаголов сочетается с существительными, обозначающими овощи и зелень, а второй – с существительными, обозначающими приготовленное мясо; б) первый из глаголов используется при описании приготовления пищи, а второй – в ситуациях описания сервировки стола.

Сравнительный анализ употребления лексики в различных типах дискурса подразумевает сравнительный анализ конкордансов одной и той же лексической единицы, которые составлены на основе корпусов, принадлежащих различным регистрам.

Критическое изучение грамматики подразумевает использование вкупе составленным конкордансом грамматического курса с целью проверки на корпусе изложенных в нем правил и, в случае необходимости, корректировки последних.

Использование корпуса в обучении позволяет перейти от концепции единственно верного решения, понятия фиксированных правил и исключений из них к распознаванию речевых образцов и возможных вариантов, а также выводит на передний план значение контекста. Студенты, рассматривая примеры из корпуса, развивают умение распознавать образцы в системе языка и речи.

Использование корпуса в обучение дает возможность пересмотреть роль преподавателя. Учитель становится не источником готового знания, а человеком, который направляет и помогает студенту в самостоятельном освоении языка. В традиционном обучении единственным источником надежного знания о системе языка и его функционировании в речи является носитель языка. Использование корпуса расширяет спектр источников знаний, оказывая поддержку учителям и студентам, для которых язык не является родным, причем этот источник зачастую оказывается более доступным, чем общение с носителями языка.

Корпусы текстов целесообразно использовать в тандеме с языковыми портфелями, в частности в рамках реализации одной из функций портфеля – педагогической. Содержание данной функции подразумевает выполнение таких видов работ, как создание студентами собственных материалов, создание ими банка учебных заданий [2, с. 19-20]. Вовлекая студента в подобные виды работы, преподаватель развивает в них умения рефлексивной оценки, что является основой для развития способностей к самокритическому мышлению и самооценке, постепенно возлагая ответственность за учебу на учащихся. Оценивая пробелы в знаниях, студент способен выстраивать собственную траекторию изучения языка, в частности разрабатывая задания на отработку употребления того или иного языкового явления.

Список литературы Использование корпуса текстов для обучения иностранному языку

  • Англо-русский словарь по лингвистике и семиотике [Текст]/А.Н. Баранов, Д.О. Добровольский, М.Н. Михайлов, П.Б. Паршин, О.И. Романова. -М.: Азбуковник, 2001. -640 с.
  • Литл, Д. Европейский языковой портфель: Пособие для учителей и преподавателей педагогических факультетов [Текст]/Давид Литл, Радка Перклова. -М.: МГЛУ, 2003. -72 с.
  • Barlow, M. Corpora, concordancing, and language teaching [Текст]/M. Barlow. -Daejon, Korea. -2002. -Pp. 135-141.
  • Burke, Robin. Knowledge-based recommender systems [Текст]/Robin Burke. -New York: Marcel Dekker, 2000. -23 p.
  • Gabrielatos, C. Corpora and Language Teaching: Just a Fling or Wedding Bells? [Текст]/Costas Gabrielatos, 2005. -Pp. 1-37. [Электронный ресурс] http://writing.berkeley.edu/TESL-EJ/ej32/a1.html http://writing.berkeley.edu/TESL-EJ/ej32/a1.html>.
  • Grace, Chung. Automatic Induction of Language Model Data for A Spoken Dialogue System [Текст]/Grace Chung, 2005. -Pp. 55-64.
  • Johns, T. Should you be persuaded: two samples of data-driven learning materials [Текст]/T. Johns, P. King. -Birmingham: Birmingham University, 1991. -Pp. 1-16.
  • McEnery, T. Corpus linguistics [Текст]/Tony McEnery, Andrew Wilson. -Edinburgh: Edinburgh University Press, 2001. -260 p.
  • Mindt, Dieter. Corpora and the teaching of English in Germany [Текст]/D. Mindt. -Longman, 1997. -Pp. 40-50.
  • Nguyen, Patrick. Summarization of Multiple User Reviews in the Restaurant [Текст]/P. Nguyen. -Technical Report MSR-TR-2007-126. -17 p.
Еще
Статья научная