Влияние потенциального контекста на распознавание изолированных омофонов

Автор: Риехакайнен Елена Игоревна

Журнал: Вестник Пермского университета. Российская и зарубежная филология @vestnik-psu-philology

Статья в выпуске: 4 (10), 2010 года.

Бесплатный доступ

В статье описывается устно-письменный эксперимент по восприятию изолированно предъявляемых лексических и грамматических омофонов носителями русского языка. Сопоставляются результаты, полученные на двух группах испытуемых, первая из которых должна была просто записать услышанное, а вторая - составить любую фразу с услышанным стимулом. Рассматриваемые в статье данные свидетельствуют о том, что на степень активации одной из интерпретаций неоднозначного сигнала в условиях отсутствия контекста, снимающего неоднозначность, может влиять не только частотность словоформы и грамматических классов, в которые она входит, но и число потенциальных контекстов, в которых она может употребляться, а также наличие типичных сочетаний с данной словоформой.

Еще

Восприятие речи, омофоны, ментальный лексикон слушающего

Короткий адрес: https://sciup.org/14728895

IDR: 14728895 | УДК: 81?23

Текст научной статьи Влияние потенциального контекста на распознавание изолированных омофонов

Под омофонами традиционно понимаются слова, совпадающие по звучанию, но отличающиеся лексически и/или грамматически. В словаре слушающего, таким образом, омофоничным отрезкам должны соответствовать разные по лексическому и/или грамматическому значению единицы, в одинаковой степени соответствующие входному речевому сигналу по фонемной структуре. По мнению А.В.Венцова, в перцептивном словаре омофоны представлены одной единицей, обнаружение которой в акустическом сигнале приводит к немедленной активации комплексной информации об обоих омофонах — их грамматических характеристик, частоты встречаемости и др. [Венцов 2007: 65].

В естественной речи доля лексически или грамматически неоднозначных отрезков достаточно велика. В коллективной монографии указывается, что «в очень небрежно произнесённом спонтанном монологе на 1015 фонетических слов встретилось 125 омофоничных отрезков (12,5%), <…> на тексте из 384 фонетических слов – 32 омофоничных отрезка» [Фонетика спонтанной речи 1988: 132-133]. Тем не менее интерпретация подобных фрагментов речевого сигнала обычно не вызывает трудностей у слушающих: из 125 омофоничных отрезков, зафиксированных в первом случае, более 90% могли быть однозначно интерпретированы с помощью контекста [там же: 137]. Контекст является основным фактором, позволяющим слушающему соотнести неоднозначный входной речевой сигнал с той единицей ментального лексикона, которая подразумевалась говорящим. Однако в ряде случаев обращение к контексту является невозможным или не позволяет выбрать единственную интерпретацию неоднозначного сигнала. В условиях естественной коммуникации подобная ситуация возможна тогда, когда омофоничной оказывается самая первая словоформа в высказывании (и опора на контекст невозможна в принципе), и тогда, когда левый контекст не позволяет снять неоднозначность. В таких случаях, по-видимому, все единицы перцептивного словаря, активированные входным речевым сигналом, должны сохраняться в памяти слушающего до тех пор, пока контекст не позволит выбрать одну из них. При этом степень активации данных единиц, как правило, оказывается различной, т.е. одни единицы являются более вероятными кандидатами на опознавание, чем другие. Целью эксперимента, описываемого в статье, являлось определение того, какие факторы могут способствовать более сильной активации одного из омофонов в каждой паре в условиях отсутствия контекста, снимающего неоднозначность.

Материал и методика эксперимента

В эксперименте были использованы следующие типы омофонов:

лексические :

например, /rok/ ( рог-рок ), /mak/ ( маг-мак ) и т.д. К этому же типу была отнесена и пара лексико-грамматических омофонов без-бес , в которой одно из слов является не существительным, а предлогом;

грамматические :

(2) формы глаголов прошедшего времени единственного числа с безударным окончанием /a/: /stо+ila/¹ ( стоило-
стоила), /slama+las’/ (сломалось-
сломалась) и т.д.;

(3) словоформы, которые могут быть интерпретированы как наречия и краткие прилагательные среднего рода или краткие прилагательные женского рода: /uža+sna/ ( ужасно-ужасна ), /zabo+tl’iva/ ( заботливо-заботлива ) и т.д.
(4) формы глаголов 3 лица настоящего времени с безударным окончанием: /vo+z’it/ ( возит-возят ), /dru+žыt/ ( дружит-
дружат) и т.д.2

В качестве основного фактора, который может повлиять на интерпретацию омофонов при отсутствии контекста, традиционно упоминается частотность [см., например: Hare et al. 2001]. В условиях же устно-письменного эксперимента на опознание услышанного, который был выбран для проведения данного исследования, необходимо было принять во внимание и другой фактор, а именно степень соответствия между произнесением и написанием (например, существительные, на конце которых пишется буква, соответствующая глухому согласному, оказываются ближе к произношению, чем существительные, оканчивающиеся на букву, соответствующую звонкому согласному).

С учётом указанных факторов для каждого из выбранных типов омофонов были подобраны следующие пары:

– омофон, орфографическая запись которого ближе к произношению, является более частотным, чем второй омофон данной пары;

– омофон, орфографическая запись которого ближе к произношению, является менее частотным, чем второй омофон данной пары.

Для третьего типа удалось подобрать только те пары, в которых более частотным является омофон, написание которого отличается от произношения (т.е. вариант, заканчивающийся на - о ). Всего было отобрано 40 пар омофонов: 13 – первого типа, 10 – второго, 4 – третьего и 13 – четвёртого.

Частотность определялась по данным Национального корпуса русского языка ( http://www.ruscorpora.ru ; далее – НКРЯ;

162 132 407 словоупотреблений). Для стимула /paro+k/, который может быть интерпретирован тремя способами ( порог, порок, парок ), – по аналогии с другими стимулами первого типа – была определена суммарная частотность словоформ, заканчивающихся на букву, соответствующую глухому согласному ( поро к и паро к ), и частотность словоформы поро г .

В ходе подготовки тестовой последовательности были составлены предложения с теми омофонами, орфографическая запись которых отличается от произношения. Омофоны одного типа занимали одинаковую позицию в предложениях.

Все предложения были прочитаны двумя дикторами (мужчиной и женщиной). Слуховой и инструментальный анализ показал, что данные словоформы были прочитаны обоими дикторами так, что при изолированном предъявлении могли быть интерпретированы несколькими способами. Инструментальная обработка потребовалась только для стимулов четвертого типа: в каждой из данных словоформ стационарный участок гласного окончания был заменён паузой.

Поскольку омофоны, относящиеся к разным типам, значительно отличались друг от друга как по фонетическому облику, так и по лексикограмматическим характеристикам, решено было не включать в тестовую последовательность филлеры, чтобы не делать эксперимент чрезмерно продолжительным по времени. Следующие друг за другом в тестовой последовательности стимулы всегда относились к разным типам омофонов; стимулы в мужском и женском произнесении чередовались. В качестве первого стимула был выбран омофон без-бес (в мужском произнесении), поскольку для целей эксперимента было важно, чтобы на его восприятие не повлияло наличие в тестовой последовательности омофонов-существительных и отсутствие других предлогов.

Тестовая последовательность предъявлялась испытуемым для прослушивания через наушники. Каждый стимул звучал только один раз.

Испытуемые были разделены на две группы, первой из которых предлагалось просто записать услышанное. При такой инструкции межстимульный интервал составлял 5 секунд, эксперимент продолжался 4 минуты 25 секунд. Подобное задание достаточно близко к диктанту и, следовательно, при его выполнении роль степени соответствия между написанием и произнесением может оказаться значительной.

Задание, предложенное второй группе испытуемых, должно было уменьшить влияние данного фактора: участникам эксперимента предлагалось составить любую фразу с каждым стиму- лом. Если же они не могли этого сделать, им предлагалось записать хотя бы услышанное слово. Предполагалось, что, выполняя подобную инструкцию, испытуемые будут не просто механически фиксировать услышанное, а обращать внимание прежде всего на план содержания предъявляемых словоформ.

Кроме того, задание второго типа, по-видимому, оказывается ближе к тому, что происходит в естественной ситуации общения, в которой слушающий преимущественно ориентирован на восприятие словоформ в контексте.

В данном случае пауза между стимулами составила 20 секунд, а продолжительность эксперимента – 14 минут 25 секунд.

В эксперименте приняли участие 85 человек в возрасте от 15 до 54 лет: 50 в первой группе и 35 – во второй.

Ни один из испытуемых не имеет лингвисти-ческого/филологического образования и не является студентом филологического факультета.

Принципы обработки результатов

В ходе обработки результатов проценты распознавания каждого омофона из пары вычислялись для каждого типа стимулов отдельно. Для сравнения полученных результатов использовались доверительные интервалы на 5%-ом уровне значимости.

Сравнение результатов первой и второй групп испытуемых проводилось также на основе доверительных интервалов, для первого и второго типов, кроме того, был вычислен коэффициент корреляции рангов для результатов, полученных на первой и второй группах испытуемых.

Для стимулов первого типа в ответах второй группы испытуемых падежные формы ед. и мн.ч. анализируемых омофонов приравнивались к форме им.п. ед.ч. Для стимулов второго и четвертого типов глаголы с приставками ( замучила , постучала и т.п.) или, напротив, без них ( видеться для увидеться ) приравнивались к соответствующим омофонам.

Результаты эксперимента

В целом стимульный материал был воспринят испытуемыми хорошо: процент отказов составил 0,6% в первой части и 1,7% – во второй. Чаще всего встречались отказы на стимулы четвертого типа (глагольные формы наст. вр. 3 л.), что, по-видимому, объясняется некоторой неестественностью их звучания, возникшей в результате удаления гласного окончания. Для стимулов третьего типа (наречий/кратких прилагательных на -о ) отказов зафиксировано не было.

Результаты, полученные на первой группе испытуемых, свидетельствуют о том, что основным фактором, способствующим большей активации одной из омофоничных словоформ, является частотность словоформ. Подтверждением этого являются данные, полученные для большинства омофонов первого и второго типов: если омофон являлся более частотным, выбор делался в его пользу, даже если его графический облик не соответствовал звучанию. При этом количество ответов, содержащих разные омофоны, достоверно не различается для тех пар, в которых омофоны встречаются в речи с примерно равной частотой (например, /stok/, /mak/, /stuča+la/). Для ряда грамматических омофонов (некоторых стимулов второго типа, заканчивающихся на /as’/, и стимулов четвертого типа) более значимой оказалась не частотность словоформ, а кумулятивная (суммарная) частотность тех грамматических классов, к которым они относятся, в результате чего более частотные в речи формы 3 л. ед.ч. выбирались большим количеством испытуемых независимо от соотношения частотностей в конкретной паре омофонов, формы же на -ось и на -ась для стимулов /slama+las'/, /zakrы+las'/ и /stuča+las'/ оказались представленными в ответах примерно в равном количестве, что соответствует соотношению суммарных частотностей всех форм на -ось и на -ась в НКРЯ, а не конкретных словоформ в парах. Для грамматических омофонов третьего типа соотношение частотностей словоформ в каждой паре совпадало с кумулятивной частотностью класса, поэтому нельзя было определить, какая именно частотность оказала большее влияние. Подробное описание результатов, полученных на первой группе испытуемых, представлено в другой нашей работе [Риехакай-нен 2009]. В рамках же данной статьи наибольший интерес представляет сопоставление результатов испытуемых из первой и второй групп.

Стратегии распознавания большинства стимулов первого типа испытуемыми обеих групп являются близкими. Коэффициент ранговой корреляции между результатами, полученными на первой и второй группах, был вычислен на основе сопоставления списков стимулов, отсортированных по разности между процентом испытуемых, записавших более частотный омофон, и процентом испытуемых, записавших менее частотный омофон, и составил r s =0,94 (при пороговом значении на 5%-ом уровне значимости для 13 пар r s =0,56). Различия наблюдаются лишь для стимулов /stok/, который первой группой испытуемых записывался чаще как сток , а второй – как стог , и /rok/, который при необходимости употребления в контексте мог быть интерпретирован и как рок , и как рог , хотя ответ рок и преобладал.

Таблица 1

Распознавание стимулов /stok/ и /rok/

Стимул	Частотность омофона на -г / частотность омофона на -к , ipm*	1 группа, % испытуемых		2 группа, % испытуемых
Стимул		Омофон на -г	Омофон на -к	Омофон на -г	Омофон на -к
/stok/	1,3 / 0,9	38**	56	62,6	37,1
/rok/	5,3 / 11,9	20	66	34,3	45,7

*Здесь и далее для представления частотности используется показатель ipm – количество словоупотребле- ний на миллион (instances per million words).

**Здесь и далее в таблицах жирным курсивом выделены те пары значений, доверительные интервалы для

которых пересекаются.

В ответах первой группы испытуемых на стимул /stok/ преобладает менее частотный вариант, т.е. тот, написание которого ближе к произношению, что может свидетельствовать о предпочтении испытуемыми стратегии, опирающейся на соответствие между произнесением и написанием в том случае, когда омофоны близки по частотности. Появление же ответов стог у второй группы может быть следствием наличия частотного словосочетания, в которое входит данная словоформа, при его отсутствии для словоформы сток . Анализ представленных в НКРЯ контекстов для данных словоформ показал, что на роль частотного контекста для словоформы стог может претендовать словосочетание стог сена: из 212 случаев употребления словоформы стог 77 раз (36,3%) в качестве её распространителя выступала словоформа сена (иногда вместе с прилагательным). Для словоформы сток типичных контекстов по примерам из НКРЯ выявить не удалось. Результаты эксперимента подтверждают типичность словосочетания стог сена : оно встретилось в ответах 51,4% испытуемых.

Таблица 2

Распознавание омофонов второго типа

Стимул	Частотность омофона на -о(-) / частотность омофона на -а(-) , ipm	1 группа, % испытуемых		2 группа, % испытуемых
Стимул		Омофон на -о(-)	Омофон на -а(-)	Омофон на -о(-)	Омофон на -а(-)
/maro+z'ila/	0,43 / 0,01	98	2	97,1	0
/sluči+las'/	103,3 / 8,1	94	6	94,3	5,7
/sto+ila/	37,3 / 5,6	92	2	80,0	8,6
/paluči+las'/	41,8 / 9,5	98	2	94,3	5,7
/pradalža+las'/	13,9 / 11,1	72	28	51,4	48,6
/stuča+la/	2,2 / 2,0	52	48	42,9	57,1
/mu+čila/	3,1 / 3,8	46	54	14,3	80,0
/slama+las'/	0,9 / 1,6	64	36	14,3	85,7
/zakrы+las'/	0,6 / 3,8	56	44	22,9	77,1
/stuča+las'/	0,04 / 0,39	40	60	28,6	71,4

Представленные в таблице данные свидетельствуют о том, что при необходимости составления фразы с услышанным стимулом в ответах на восемь из десяти стимулов возрастает количество форм женского рода. По-видимому, это объясняется тем, что наиболее естественным способом постановки личной формы глагола в кон-

Для пары же рок–рог типичные контексты существуют для обоих омофонов ( злой рок; рог изобилия, бараний рог ), причём для словоформы рог их несколько и встречаются они чаще. Поэтому можно предположить, что испытуемые из второй группы могли опираться или на частотность словоформ (и тогда выбирали вариант рок ), или на частотность сочетаний с данными словоформами (и тогда предпочтение отдавалось ответу рог ).

Результаты распознавания грамматических омофонов второго типа, полученные на первой и на второй группах испытуемых, различаются более существенно, чем результаты распознавания омофонов первого типа (коэффициент ранговой корреляции, вычисленный так же, как и для первого типа, равняется r s =0,79 при пороговом значении для 10 пар на 5%-ом уровне значимости r s =0,64). Это связано главным образом с тем, что в ответах испытуемых второй группы формы, заканчивающиеся на -а , встречаются чаще, чем у представителей первой группы.

текст является заполнение его первой валентности (с синтаксической точки зрения: добавление подлежащего). По данным НКРЯ, существительные женского рода (как в форме им.п., так и в целом) почти в два раза частотнее, чем существительные среднего рода:

Таблица 3

Количество существительных женского и среднего рода в НКРЯ, ipm

	Сущ-е ж.р.	Сущ-е ср.р.
Всего в корпусе	127492,44	67818,74
Только в им.п.	64594,86	34496,51

Многочисленность словоформ женского рода в ответах характерна даже для некоторых из тех пар омофонов, в которых форма среднего рода встречается в речи чаще (пусть и не намного) (например, /pradalža+las'/, stuča+la/). Следовательно, на примере этих пар видна конкуренция двух стратегий – с опорой на частотность словоформ и с опорой на частотность потенциальных контекстов.

Однако последняя из упомянутых стратегий оказывается нерелевантной для пар, в которых одним из омофонов являются частотные формы, заканчивающиеся на -о и употребляющиеся в безличных конструкциях (например, морозило , стоило , случилось, получилось ) и/или имеющие частотные контексты с существительны-ми/местоимениями среднего рода (например, в 21,6% всех употреблений в НКРЯ словоформа случилось входит в словосочетание что случилось ).

Ответы, полученные для стимулов /mu+čila/, /slama+las'/, /zakrы+las'/, /stuča+las'/, свидетельствуют о том, что стратегия с опорой на частотность контекста оказывается «сильнее» стратегии, опирающейся на кумулятивную частотность грамматического класса. При этом в некоторых случаях более высокая вероятность сочетания личной формы глагола с существительным женского рода подкрепляется наличием частотных сочетаний с конкретными глаголами. Наиболее яркий пример этого – словосочетание дверь закрылась , которое является самым частотным сочетанием для омофонов закрылась-закрылось по данным НКРЯ: из 718 употреблений этих словоформ в 334 (46,5%) подлежащим при глаголе закрылась является существительное дверь .

Влияние потенциальных контекстов прослеживается и при распознавании ряда стимулов четвертого типа. Хотя ни для одного из стимулов различия в ответах первой и второй групп испытуемых не являются значимыми, для 6 из 13 стимулов наблюдается увеличение количества форм 3 л. мн.ч. в ответах, а для стимула /so+r'ica/3 даже преобладание форм мн.ч. над формами ед.ч. (17,1% и 4% соответственно).4 Формы мн.ч., по данным НКРЯ, имеют более высокую частотность для пяти из рассмотренных стимулов (/su+d'it/, /ko+rm'it/, /so+r'ica/, /t'e+šыca/, /gru+z'it/), однако этот фактор проявляется только тогда, когда испытуемым необходимо придумать кон- текст со стимулом. При простой же фиксации услышанного слушающий, по-видимому, больше опирается на звучание словоформы, которое в данном случае могло способствовать распознаванию омофонов как форм 3 л. ед.ч. Оставшиеся же два стимула являются глаголами, обозначающими совместное действие (/dru+žыt/, /m'i+r'ica/), и, по-видимому, в первую очередь ассоциируются с ситуациями, в которых присутствуют два действующих лица. Т.о., для испытуемых из второй группы более значимым оказывается не соотношение частотностей словоформ внутри пары, а типичная ситуация, для описания которой могут быть употреблены данные глаголы.

Стимулы третьего типа распознавались большинством испытуемых из второй группы как формы на -о . Как и ожидалось, при необходимости придумать контекст словоформы /zabo+tl'iva/ и /gra+matna/ употреблялись в функции обстоятельства, а /pr'ija+tna/и /uža+sna/ — в функции обстоятельства или сказуемого. Ни одного случая употребления форм на -о в функции именной части составного именного сказуемого (т.е. краткого прилагательного ср.р.) в ответах испытуемых не встретилось. Однако даже в ответах на данный тип омофонов было зафиксировано увеличение количества форм женского рода: 20% испытуемых второй группы употребили стимул /zabo+tl'iva/ в контекстах Мама (была) заботлива (3 случая), Дочь была заботлива (1 случай) и т.п.

Выводы

Приведённые наблюдения свидетельствуют о том, что в условиях естественной коммуникации при отсутствии достаточного контекста большую активацию может получать не только наиболее частотная словоформа, но и та словоформа, которая может выступать в большем числе контекстов. В первую очередь данный параметр оказывается значимым для грамматических омофонов. Причём, как видно по результатам распознавания омофонов, заканчивающихся на /as’/, данная стратегия может оказаться более значимой, чем стратегия с опорой на кумулятивную частотность грамматического класса. Влияние количества возможных контекстов свидетельствует о том, что между единицами в ментальном лексиконе существуют связи, опирающиеся не только на парадигматические отношения, но и на синтагматические.

Вместе с тем значимым оказалось не только количество возможных контекстов, но и их частотность. При этом полученные результаты не являются подтверждением идеи о том, что некоторые сочетания словоформ благодаря высокой частотности получают особый статус в словаре и хранятся в качестве самостоятельных единиц или даже формируют особый словарь, как это предполагается, например, в [Wray 2002]. Преобладанию одного из омофонов над другим в ответах испытуемых способствовало не вхождение в особо частотные выражения русского языка (разнообразные идиомы, формулы вежливости и т.п.), а просто более высокая частотность одних сочетаний по сравнению с другими, что согласуется с результатами последних исследований в данной области (см. обзор и описание экспериментов в [Arnon, Snider 2010]). Более того, речь в данном случае должна идти не о застывших конструкциях, а скорее о том, что соположение (необязательно даже непосредственное) одних словоформ встречается в речи чаще, чем других. Примерами подобных частотных соположений являются сочетания стог сена или дверь закрылась, которые часто встречаются в пределах одной фразы, нередко оказываясь разделенными одним или несколькими словами (например, стог свежего сена или и дверь за ним с грохотом закрылась). Следовательно, более оправданным представляется не выделение подобных сочетаний в самостоятельные единицы словаря, а указание на то, что частота совместной встречаемости словоформ в речи влияет на силу связей между ними. Чем сильнее связь между двумя единицами, тем сильнее будет их взаимная активация в процессе распознавания речи.

Таким образом, проведённый эксперимент показал, что даже при восприятии изолированных словоформ слушающий может опираться не только на парадигматические, но и на синтагматические связи между единицами ментального лексикона. Возможно, в условиях естественной коммуникации, которая принципиально ориентирована на восприятие словоформ в контексте, роль стратегии, опирающейся на потенциальные контексты и их частотность, является даже более значимой, чем было отмечено в эксперименте.

1Знак «+» в транскрипции указывает на ударность предшествующего гласного.

2Произнесение одинакового звука в заударных окончаниях глагольных форм 3 л. ед.ч. и в 3 л. мн.ч. характерно, по-видимому, прежде всего для спонтанной речи. Однако Л.А.Вербицкая указывает на то, что и в устном варианте кодифицированного литературного языка в безударном окончании 3 л. мн.ч. произносится /i/ или /ы/ (после мягкого и твёрдого согласных соответственно) [Вербицкая 1993: 74].

3В стимулах четвертого типа гласный окончания, стационарный участок которого был заменён на паузу, обозначается надстрочным символом.

⁴В целом низкий процент форм 3 л. ед.ч. и 3 л. мн.ч. в ответах на стимулы, заканчивающиеся на /ca/, объясняется тем, что большинство испытуемых интерпретировали эти словоформы как неопределённую форму глагола ( ссориться, тешиться и т.д.).

THE ROLE OF POTENTIAL CONTEXT

IN THE RECOGNITION OF ISOLATED HOMOPHONES

Elena I. Riekhakaynen

Postgraduate of General Linguistics Department

St. Petersburg State University

Список литературы Влияние потенциального контекста на распознавание изолированных омофонов

Венцов А.В. Восприятие устной речи и ментальный лексикон//Русская языковая личность: Материалы шестой выездной школы-семинара. Череповец: ГОУ ВПО «Череповецкий государственный университет», 2007. С. 63-69.
Вербицкая Л.А. Давайте говорить правильно! М.: Высшая школа, 1993. 144 с.
Риехакайнен Е.И. Стратегии восприятия омофонов носителями русского языка//Материалы XXXVIII Международной филологической конференции 11-13 марта 2009 г. Психолингвистика. Часть 2. СПб: Факультет филологии и искусств СПбГУ, 2009. С. 8-15.
Фонетика спонтанной речи/под ред. Н.Д.Светозаровой. Л., 1988. 248 с.
Arnon I., Snider N. More than Words: Frequency Effects for Multi-Word Phrases//Journal of Memory and Language. 2010. №62. P. 67-82.
Hare M.L., Ford M., Marslen-Wilson W.D. Ambiguity and Frequency Effects in Regular Verb Inflection//Frequency and the Emergence of Linguistic Structure/Ed. by J. Bybee, P. Hopper. Philadelphia, PA: John Benjamins B.V. 2001. P. 181-200.
Wray A. Formulaic Language and the Lexicon. Cambridge: Cambridge Univ. Press, 2002. 326 p.