Корпусная лингвистика и преподавание иностранных языков
Автор: Базарова Б.Б.
Журнал: Вестник Бурятского государственного университета. Философия @vestnik-bsu
Рубрика: Теория и методика обучения гуманитарным дисциплинам
Статья в выпуске: 15, 2015 года.
Бесплатный доступ
Статья посвящена использованию электронных корпусов в обучении английскому языку. Рассматривается методический потенциал корпусной лингвистики. Эффективность обращения к корпусным данным при обучении иностранному языку и при его изучении бесспорна, тем не менее корпусная лингвистика еще не получила должного внимания со стороны преподавателей. Корпусный метод можно рассматривать в качестве эффективного инструмента для развития практических навыков и умений в овладении иностранным языком, при организации самостоятельной работы студентов. Обзор существующей литературы по проблеме и обращение к данным Британского национального корпуса в целях преподавания теории и практики английского языка показали, что необходима разработка специальных методических указаний, как для преподавателя, так и для студента, с алгоритмом работы в корпусе, с системой упражнений для более эффективного решения различных лингвистических задач.
Информационно-коммуникационные технологии, корпусная лингвистика, электронные корпусы, обучение иностранному языку, компетенции
Короткий адрес: https://sciup.org/148182833
IDR: 148182833
Текст научной статьи Корпусная лингвистика и преподавание иностранных языков
Развитие науки сегодня позволяет изучать иностранный язык на совершенно ином уровне с использованием информационных технологий. «Развитие высшего образования сегодня связывают с потенциалом новейших средств обучения, а одним из важнейших условий повышения качества профессионального образования является его информатизация. Информатизация общества инициирует формирование информационно-коммуникативной среды, в которой главным ресурсом становится человек, способный приобретать, сохранять, работать с информацией, творчески ее применять в жизни и в профессиональной деятельности, а также участвовать в процессах поиска и создания новых знаний. Подготовка такого специалиста возможна только новыми средствами, ориентированными на опережающее его развитие как индивидуума, для которого знание становится важным источником интеллектуального, личностного и профессионального развития [4, с. 1699]. В Федеральном государственном образовательном стандарте высшего образования по направлению подготовки 45.03.01 Филология (уровень бакалавриата) в качестве одной из общепрофессиональных компетенций заявлена «способность решать стандартные задачи профессиональной деятельности на основе информационной и библиографической культуры с применением информационно-коммуникационных технологий и с учетом основных требований информационной безопасности (ОПК-6)» [7, с. 5]. Такая формулировка со всей очевидностью требует формирования у студентов навыков и умений использовать упомянутые технологии на профессиональном уровне.
К информационно-коммуникационным технологиям (ИКТ) принято относить интернет-ресурсы, электронные учебники, словари, справочники и различные виды коммуникации и др. Существуют различные классификации подобных технологий. Нас же интересует такой ресурс, как электронный, или лингвистический, корпус, который можно уже считать необходимым компонентом информационно-коммуникативной среды при обучении иностранному языку. И тогда «на первый план выходит концептуальное обоснование целостной лингвометодической подготовки будущего учителя иностранного языка с помощью оптимального сочетания современных информационно-коммуникационных и педагогических технологий. Другими словами, возникает потребность в интеграции ИКТ и традиционных технологий для взаимообогащения их возможностей» [4, с. 1700].
Для такой подготовки студентов сами педагоги должны обладать необходимыми умениями. «В современных условиях педагогу недостаточно быть только пользователем, необходимо говорить о повышении компетентности педагога в области ИКТ, являющейся его профессиональной характеристикой, составляющей педагогического мастерства» [1, с. 5]. Е. А. Вылегжанина обращается к существующей в педагогической практике двухуровневой модели информационно-коммуникационной компетентности учителя: 1) уровень функциональной грамотности (подготовленность к деятельности), куда входят: владение компьютерными программами обработки текстовой, числовой, графической, звуковой, видеоинформации; умение работать в сети Интернет, пользоваться ее сервисами; умение использовать такое оборудование, как сканер, принтер и т. д.; 2) деятельностный уровень (реализованная деятельность) — эффективное и систематическое использование функциональной грамотности в сфере ИКТ в образовательной деятельности для достижения высоких результатов. Далее, согласно этой модели, деятельностный уровень подразделяется на внедренческий и творческий подуровни. Первый подразумевает включение в образовательную деятельность специализированных медиаресурсов, разработанных в соответствии с требованиями к содержанию и методике того или иного учебного предмета; второй — разработку собственных электронных средств учебного назначения [1, c. 5]. Очевидно, что именно деятельностный уровень компетентности преподавателя должен стать нашей целью для формирования у студентов вышеупомянутой компетенции.
Обратимся к корпусной лингвистике. Методологический аппарат корпусной лингвистики является перспективным инструментом в теоретическом и практическом обучении иностранному языку. Корпусная лингвистика ― раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с применением компьютерных технологий [2, c. 3]. Под лингвистическим, или языковым, корпусом текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач [2]. Кроме того, этот термин обозначает и систему управления текстовыми и лингвистическими данными, которую называют корпусным менеджером (или корпус-менеджером). Последний служит в качестве специализированной поисковой системы, куда входят программные средства для поиска данных в корпусе с целью получения статистической информации и предоставления результатов пользователю в удобной для работы форме. Таким образом, ресурсы лингвистических корпусов можно рассматривать как неотъемлемый методический компонент в обучении иностранному языку. Представляется также, что электронные корпусы текстов, точнее ― анализ корпусов, следует рассматривать в качестве способа самостоятельного получения информации для студента-филолога.
Для изучающих иностранный язык существует тип учебного корпуса, под которым понимается электронный корпус текстов, основной целью которого является их анализ на предмет выявления способов и эффективности освоения изучаемого языка. Такого рода корпусы могут быть использованы в лингвистическом анализе для выявления лексических или синтаксических ошибок при освоении иностранного языка, что помогает установить частотность тех или иных типов языковых ошибок и характерные контексты. Подобные данные необходимы для выработки планов и методических приемов для дальнейшей коррекции в обучении языку. Используются такие корпусы и при обучении переводу [5; 8; 9].
Наш опыт работы с корпусами основан на попытке использовать их в курсе лексикологии современного английского языка. Как известно, существует целый ряд разных англоязычных корпусов (British National Corpus, Corpus of Contemporary American English и др.). Знакомство с этими корпусами демонстрирует широкий круг возможностей не только для исследователя, но и для студента в качестве части самостоятельной работы.
В курсе лексикологии традиционно обращается внимание на британский и американский варианты. На основе существующего Британского национального корпуса (BYU ‒ BNC) можно проводить сравнительный анализ, сопоставляя с данными Корпуса современного американского английского (COCA), не только лексических и грамматических особенностей, но и по частотности употребления тех или иных слов и их сочетаемостных возможностей. Морфологическая и деривационная структуры слов также могут быть рассмотрены [10]. Так, на запрос по морфеме -ism на основе этих двух корпусов выдаются первые 100 частотных слов с указанной морфемой в структуре слова. В таблице 1 приведем для примера вырезку из корпуса лишь первых десяти слов, представленных в базе американского корпуса, где 1: COCA ― данные американского корпуса; 2: BNC ― те же слова, но в британском корпусе; РМ 1 ― встречаемость слова на 1 миллион словоупотреблений в COCA; PM 2 ― встречаемость слова на 1 миллион употреблений в BNC; RATIO ― процентное соотношение по частотности.
Таблица 1 Сравнительный анализ частотности слов с морфемой -ism в COCA и BNC
COCA: 450,000,000 WORDS
WORD/PHRASE |
1: COCA |
2: BNC |
PM 1 |
PM 2 |
RATIO |
|
1 |
COUNTERTERRORISM |
1356 |
1 |
3.01 |
0.01 |
301.33 |
2 |
BIOTERRORISM |
426 |
0 |
0.95 |
0.00 |
94.67 |
3 |
VOLUNTEERISM |
400 |
1 |
0.89 |
0.01 |
88.89 |
4 |
NEOLIBERALISM |
309 |
1 |
0.69 |
0.01 |
68.67 |
5 |
ISLAMISM |
287 |
1 |
0.64 |
0.01 |
63.78 |
6 |
PENTECOSTALISM |
204 |
1 |
0.45 |
0.01 |
45.33 |
7 |
ANTITERRORISM |
189 |
0 |
0.42 |
0.00 |
42.00 |
8 |
ECOTOURISM |
410 |
3 |
0.91 |
0.03 |
30.37 |
9 |
BOOSTERISM |
122 |
0 |
0.27 |
0.00 |
27.11 |
10 |
GLOBALISM |
196 |
2 |
0.44 |
0.02 |
21.78 |
В таблице 2 приводятся первые десять слов на базе британского корпуса, где 2: BNC ― данные британского корпуса; 1: COCA ― те же слова, но в американском корпусе; PM 2 ― встречаемость слова на 1 миллион употреблений в BNC; РМ 1 ― встречаемость слова на 1 миллион словоупотреблений в COCA; RATIO ― процентное соотношение по частотности.
Сравнительный анализ частотности слов с морфемой -ism в BNC и COCA
Таблица 2
BNC: 100,000,000 WORDS
WORD/PHRASE |
2: BNC |
1: COCA |
PM 2 |
PM 1 |
RATIO |
|
1 |
TSARISM |
34 |
1 |
0.34 |
0.00 |
153.00 |
2 |
EQUESTRIANISM |
29 |
1 |
0.29 |
0.00 |
130.50 |
3 |
NORMATIVISM |
27 |
1 |
0.27 |
0.00 |
121.50 |
4 |
ISOMERISM |
27 |
1 |
0.27 |
0.00 |
121.50 |
5 |
LABOURISM |
72 |
3 |
0.72 |
0.01 |
108.00 |
6 |
OWENISM |
17 |
1 |
0.17 |
0.00 |
76.50 |
7 |
TORYISM |
47 |
3 |
0.47 |
0.01 |
70.50 |
8 |
VOLUNTARYISM |
13 |
1 |
0.13 |
0.00 |
58.50 |
9 |
JACOBITISM |
64 |
6 |
0.64 |
0.01 |
48.00 |
10 |
LAMARCKISM |
55 |
7 |
0.55 |
0.02 |
35.36 |
Можно поставить под сомнение сопоставимость данных в этих таблицах, основываясь на разном объеме словоупотреблений (450 000 000 и 100 000 000). На основе этих двух таблиц можно видеть тем не менее, что, во-первых, инвентарь самих существительных с морфемой -ism отличается в двух вариантах, во-вторых, по встречаемости этих слов на один миллион очевидны большие расхождения. Основываясь на подобных данных, можно проводить морфологический, деривационный, семантический анализ английского слова.
С разработкой Исторического корпуса американского варианта английского языка (COHA) появилась возможность проводить диахронические исследования языка. Этот корпус насчитывает 400 миллионов слов за период 1810–2009 гг.
В качестве примера рассмотрим слово challenge, которое можно отнести к частотной лексике современного английского языка. Результаты запроса выдаются за 0,930 секунд, и это слово в историческом корпусе выглядит следующим образом: общее число за исторический период составляет 1120, из них в 1810 г. упоминается 22 случая употребления, в 1910 г. ― 392, в 2000 г. уже насчитывается 2031 случай употребления этого слова. Контекст употребления этого слова тоже интересен с точки зрения как диахронических изменений в его семантике, так и его сочетаемостных способностей ― грамматических и лексических; отдельного рассмотрения заслуживает и жанровая распределенность слова. Всю эту информацию можно получить для более тщательного анализа, обратившись к функции «ключевое слово в контексте» (keyword in context ― KWIC).
Наряду с одноязычными корпусами, как известно, существуют дву- и многоязычные корпуса, которые тоже обладают отличительными дидактическими свойствами и методическими функциями. К таким дидактическим свойствам относятся: а) многоязычие; б) контекстность результатов поиска; в) возможность ограничения области использования языка [3, с. 61]. Кроме формирования речевых навыков параллельные корпуса полезны для формирования переводческих навыков и умений. Так, существующий Национальный корпус русского языка содержит в себе и параллельные корпуса, в том числе англо-русский.
Беглый обзор возможностей корпусов подтверждает актуальность обращения к таковым с целью проведения не только разного рода собственно научных изысканий, но и с целью привлечения таких ресурсов в обучении иностранным языкам. Остается только добавить, что работа по усовершенствованию и расширению возможностей существующих корпусов разных языков, в том числе и корпуса русского языка (Национальный корпус русского языка — НКРЯ), продолжается.
Список литературы Корпусная лингвистика и преподавание иностранных языков
- Вылегжанина Е. А., Мальцева Н. Н. Использование информационно-коммуникационных технологий в образовательном процессе//Актуальные задачи педагогики: материалы VI Междунар. науч. конф. (г. Чита, январь 2015 г.). -Чита: Молодой ученый, 2015. -С. 4-6.
- Захаров В. П. Корпусная лингвистика: учеб.-метод. пособие. -СПб., 2005. -48 с.
- Кокорева А. А. Корпус параллельных текстов в обучении иностранному языку//Вестник Тамбовского госуниверситета. Гуманитарные науки. Педагогика и психология, 2013. -С. 57-62.
- Мосина М. А. Интеграция современных образовательных педагогических и информационно-коммуникационных технологий в процессе лингвометодической подготовки будущего учителя иностранного языка//Фундаментальные исследования. 2013. -№ 11-8. -С. 1699-1703.
- Нагель О. В. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении//Язык и культура. -2008. -№ 4. -С. 53-59.
- Национальный корпус русского языка. -URL: http://www.ruscorpora.ru/
- Об утверждении федерального государственного образовательного стандарта высшего образования по направлению подготовки 45.03.01 Филология (уровень бакалавриата): приказ Минобрнауки России от 07.08.2014 № 947.
- Садовникова О. Э. Прямое и косвенное использование корпусов текстов в зарубежной лингводидактике//Magister Dixit: науч.-пед. журнал Восточной Сибири. -2013. -№ 2 (06). Июнь.
- Сысоев П. В. Лингвистический корпус в методике обучения иностранным языкам//Язык и культура. -2010. -№ 1(9). -С. 99-111.
- Mark Davies. Using corpora to research lexical changes in Late (and Early) Modern English. -http://corpus.byu.edu/co-ha/files/davies-lexical-2015.pdf
- British National Corpus -http://www.natcorp.ox.ac.uk/
- BYU -BNC: British National Corpus -http://corpus.byu.edu/
- Corpus of Contemporary American English -http://corpus.byu.edu/coca/
- Corpus of Historical American English -http://corpus.byu.edu/coha/