Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take)
Автор: Матыцина Марина Станиславовна, Прохорова Ольга Николаевна, Чекулай Игорь Владимирович
Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics
Рубрика: Межкультурная коммуникация и сопоставительное изучение языков
Статья в выпуске: 4 т.23, 2024 года.
Бесплатный доступ
Статья посвящена вопросам определения устойчивой сочетаемости слов в речи с применением различных мер ассоциации на примере лингвистического корпуса. Актуальность исследования обусловлена существующей в лингвистике потребностью углубления знаний о факторах, детерминирующих формирование устойчивых отношений элементов внутри словосочетания. В качестве источника избран English Web Corpus (enTenTen) и его подкорпусы. Материалом для анализа послужили биграммы двухсловного сочетания: глагола take с соседним словом. Наряду с критическим рассмотрением мер, используемых для установления связности слов, описан характер отношений между элементами коллокации. Особое внимание уделено сравнению коллокаций в подкорпусах, содержащих тексты разных жанров и тематики. Проанализировано более 100 биграмм, извлеченных посредством мер ассоциации t-score, MI-score и Log Dice. Установлено, что показатели меры t-score различаются в изучаемых подкорпусах, показывают зависимость полученных данных от размера подкорпусов. Делается вывод о том, что вычисление степени устойчивости ассоциативной связи биграмм глагола take, основанное только на этом показателе, невозможно. Данные, полученные с помощью мер MI-score и Log Dice, свидетельствуют о незначительной разнице между подкорпусами, что демонстрирует независимость таких показателей от размера корпуса. Выявлено, что вариативный характер отношений между элементами коллокации заключается в зависимости степени связности слов в словосочетании от частоты их встречаемости в текстах разных жанров, регистров и модальности. М.С. Матыциной подготовлен общий план исследования, осуществлен сбор необходимой информации из корпуса. О.Н. Прохоровой разработана методика анализа, выполнено обобщение материала. И.В. Чекулаем интерпретированы результаты проведенной научной работы.
Лингвистический корпус, подкорпус, коллокация, меры ассоциации, english web corpus (ententen), t-score, mi-score, log dice
Короткий адрес: https://sciup.org/149146839
IDR: 149146839 | DOI: 10.15688/jvolsu2.2024.4.9
Список литературы Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take)
- Захаров В. П., Хохлова М. В., 2010. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф. «Диалог-2010» (Бекасово, 26-30 мая 2010 г.). М.: Изд-во РГГУ Вып. 9 (16). С. 137-143.
- Захаров В. П., 2005. Корпусная лингвистика. СПб.: Изд-во СПбГУ 48 c.
- Мельчук И. А., 1960. О терминах «устойчивость» и «идиоматичность» // Вопросы языкознания. № 4. С. 73-80.
- Филимонов Д. Ю., Светлов А. В., Горбань О. А., Косова М. В., Шептухина Е. М., 2020. Автоматизация процесса метаразметки архивных документов // Математическая физика и компьютерное моделирование. Т. 23, № 4. С. 56-68.
- Шамне Н. Л., Ребрина Л. Н., 2015. Глагольные кол-локации памяти в германских СМИ // В мире научных открытий. № 7-8 (67). С. 3097-3108.
- Baker P., 2006. Using Corpora in Discourse Analysis. L.: Bloomsbury Academic. 280 p.
- Burchfeld R. W., 1996. The New Fowler's Modern English Usage. Oxford: Oxford University Press. 864 p.
- Durrant P., Schmitt N., 2009. To What Extent Do Native and Non-Native Writers Make Use of Collocations? // IRAL-International Review of Applied Linguistics in Language Teaching. Vol.47, iss. 2. P. 157-177. D0I:10.1515/ iral.2009.007
- Evert S., 2008. Corpora and Collocations // Corpus Linguistics: An International Handbook. Berlin: Mouton de Gruyter. P. 1212-1248. DOI: 10.1515/ 9783110213881.2.1212
- Henriksen B., 2013. Research on L2 Learners' Collocational Competence and Development - A Progress Report // L2 Vocabulary Acquisition, Knowledge and Use New Perspectives on Assessment and Corpus Analysis. [S.l.]: [s.n.]. P. 29-56.
- Hill J., 2000. Revising Priorities: From Grammatical Failure to Collocational Success // Teaching Collocation: Further Developments in the Lexical Approach. Hove: LTP. P. 47-67.
- Hunston S., 2002. Corpora in Applied Linguistics. Cambridge: Cambridge University Press. 241 p. DOI: 10.1017/CBO9781139524773
- Hunston S., Laviosa S., 2000. Corpus Linguistics. Birmingham: School of English: CELS. 146 p.
- O'Keeffe, A., McCarthy M., Carter R., 2007. From Corpus to Classroom: Language Use and Language Teaching. Cambridge: Cambridge University Press. 332 p.
- McEnery T., Hardie A., 2011. Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press. 312 p.
- Sinclair J., 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press. 179 p.
- Siyanova A., Schmitt N., 2008. L2 Learner Production and Processing of Collocation: A Multi-Study Perspective // Canadian Modern Language Review. Vol. 64, №> 3. P. 429-458. DOI: 10.3138/cmlr.64.3.429
- Smadja F., McKeown K. R., Hatzivassiloglou V, 1996. Translating Collocations for Bilingual Lexicons: A Statistical Approach // Computational Linguistics. Vol. 22, №> 1. P. 1-38.
- Stubbs M., 1995. Collocations and Semantic Profiles: On the Cause of the Trouble with Quantitative Studies // Functions of Language. Vol. 2, iss. 1. P. 23-55. DOI: 10.1075/fol.2.1.03stu
- Wolter B., Gyllstad H., 2011. Collocational Links in the L2 Mental Lexicon and the Inuence of L1 Intralexical Knowledge // Applied Linguistics. Vol. 32, iss. 4. P. 430-449. DOI: 10.1093/applin/amr011