Методы интерпретации невербальной информации применительно к задачам речевого портретирования (на материале звучащей речи)

Автор: Потапова Р.К., Потапов В.В., Курьянова И.В.

Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics

Рубрика: Материалы и сообщения

Статья в выпуске: 5 т.24, 2025 года.

Бесплатный доступ

Статья посвящена актуальным лингвистическим проблемам, связанным с интерпретацией звучащей речи при речевом портретировании (профилировании) индивидуальных особенностей человека, в частности различению неподготовленной или подготовленной продуцируемой устной речи с учетом эмоционального состояния говорящего, что особенно значимо для судебной лингвистики и криминалистики. Цель проведенного исследования заключается в обосновании возможностей применения акустических методов для выявления акустико-лингвистических параметров, релевантных при квалифицировании высказываний как спонтанных или подготовленных с учетом эмоционального состояния говорящего. В статье описаны результаты апробации инструментальных методов применительно к задачам речевого портретирования на базе специализированного звукового редактора SIS II (разработчик – ООО «Центр речевых технологий», г. Санкт-Петербург): методы анализа микроструктуры звуков и мелодического контура синтагм. Охарактеризованы акустические корреляты перцептивно-слуховых особенностей неподготовленной (спонтанной) и подготовленной речи на сегментном и супрасегментном уровнях на материале аутентичных фонограмм, предоставляемых для проведения судебных фоноскопических и психолого-лингвистических экспертиз. Установлены значимые информативные параметры, которые позволяют в совокупности с традиционно выделяемыми лингвистическими признаками звучащей речи объективизировать результаты интерпретации ее спонтанности и степени подготовленности с учетом эмоционального состояния говорящего. Вклад авторов. Р.К. Потаповой осуществлено научное руководство исследованием, разработка методологии, характеристика соотношения фонетико-фонологических особенностей речи и эмоций. В.В. Потаповым определены основные направления исследования, выполнена валидация и интерпретация данных, сформулированы общие выводы. И.В. Курьяновой выполнен сбор экспериментального материала, его анализ посредством инструментальных методов, обработка результатов исследования.

Еще

Лингвистические параметры интерпретации звучащей речи, речевое портретирование, диагностика эмоционального состояния, подготовленная речь, спонтанная речь, акустические характеристики звучащей речи, просодия

Короткий адрес: https://sciup.org/149149759

IDR: 149149759   |   УДК: 81’42:81’322.5   |   DOI: 10.15688/jvolsu2.2025.5.11

Текст научной статьи Методы интерпретации невербальной информации применительно к задачам речевого портретирования (на материале звучащей речи)

DOI:

Изучение методов интерпретации звучащей речи занимает особое место в рече-ведении, в частности, в контексте широких задач, стоящих перед современной лингвок-риминалистикой. Исследование индивидуальных особенностей голоса и речи для определения личностных характеристик человека является одним из наиболее активно развивающихся направлений профайлинга – профессионального портретирования личности средствами и методами прикладной лингвистики. В рамках профайлинга интерес представляет, как непосредственно звучащий текст – зафиксированная на фонограмме фактическая вербальная информация, так и пара- и экстравербальная информация [Потапова, Потапов, 2006]. Для оценки непосредственной реакции человека на внешние стимулы (обращенная речь, интонационная произносительная специфика и внешние сопутствующие мимические особенности речи допрашивающего коммуниканта и т. д.) большое значение имеет определение факта спонтанности или подготовленности устно реализуемого высказывания с учетом эмоционально-модального состояния говорящего. Эмоциогенный характер различных стимулов и реакций активно изучается в психологии и психиатрии, поскольку «именно emotio, а не ratio, прежде всего, толкает лю- дей на совершение преступлений, неординарных поступков и т. д.» [Потапова, Потапов, 2023, с. 53]. Объективная оценка эмоционального состояния говорящего при проведении следственных и иных процессуальных действий (например, в ситуации допроса) является одной из сложнейших задач современной лингвокриминалистики.

Несмотря на большое количество материалов, отражающих экспертно-криминалистическую практику, единого методического подхода к определению степени спонтанности или подготовленности речи с учетом эмоционального состояния говорящего до настоящего времени не разработано. Как правило, для интерпретации звучащей речи в случаях, когда у следователя или суда имеются какие-либо сомнения в достоверности показаний, эксперты обращаются к специальным лингвистическим и психологическим знаниям [Волохова, Секераж, 2015]. При этом эмоциональность, спонтанность и/ или подготовленность звучащей речи может быть описана на основе не только вербальной, но и паравербальной, невербальной и эк-стравербальной информации. Акустические методы, определяющие физические параметры звука, не зависят от восприятия голоса человеком – лингвистом или психологом, и, следовательно, позволяют представить объективные данные, свидетельствующие о степени спонтанности и степени подготовленности звучащей речи с учетом эмоционального состояния говорящего. В связи с этим требуется уточнение имеющихся и разработка новых подходов к интерпретации результатов исследования звучащей речи применительно к решению задач линг-вокриминалистики, прежде всего речевому портретированию.

Цели настоящей работы заключаются в систематизации существующих традиционных подходов к интерпретации звучащей речи для решения задач лингвокриминалистики, а также выявление и описание акустических коррелятов перцептивно-слуховых особенностей неподготовленной (спонтанной) и подготовленной речи на сегментном и супрасег-ментном уровнях посредством применения инструментальных акустических методов исследования.

Методы исследования

Подготовленная и спонтанная речь

В научной литературе предложены различные подходы для оценки уровня подготовленности (заученности) / неподготовленности (спонтанности) звучащего текста. Подготовленная речь – репродуцированная речь, которая в той или иной степени отрабатывалась перед ее произнесением [Галяшина, 2003, с. 95–96; Хитина, 2003]. Неподготовленная (спонтанная, свободная) речь – непосредственно продуцируемая в процессе фонации речь (звучащий текст, который не отрабатывался заранее, а порождался одновременно с его произнесением) [Галяшина, 2003, с. 84–90].

По степени подготовленности устная речь может быть представлена шкалой, предложенной М.В. Хитиной:

– речь полностью неподготовленная;

– речь на известную заранее тему;

– речь по обдуманному плану;

– речь, отдельные части которой обдуманы и/или подготовлены заранее;

– речь по теме, на которую имеется письменный текст;

– речь, полностью подготовленная [Хитина, 2003].

Экспертная практика показывает, что данная шкала может и должна быть дополнена категорией «пересказ “своего” или “чужого” текста» как разновидности подготовленной речи, наиболее часто встречающейся при проведении следственного действия «Допрос».

Традиционные методы интерпретации звучащей речи при определении степени его подготовленности

В настоящее время распространено два направления интерпретации звучащей речи при определении степени ее спонтанности или подготовленности: 1) изучение речевого потока в целом и визуальной информации (при наличии видеоряда); 2) интерпретацию речи по уровням языка.

Изучение звучащей речи для решения указанных выше задач посредством анализа речевого потока и визуального ряда проводится психологами с применением перцептивно-аудитив- ного, перцептивно-визуального и когнитивного методов для оценки психологических особенностей речи, коммуникативной компетенции говорящего, онтогенеза его речевого мышления [Седов, 2016, с. 261–277], соответствия реплик-реакций вербальным стимулам и возрастным особенностям коммуниканта.

Поуровневое исследование звучащей речи для определения степени ее неподготовленности (спонтанности) / подготовленности проводится лингвистами с учетом информации о специфике реализации всех языковых уровней. Лингвистические параметры, традиционно используемые для определения индивидуализирующих признаков звучащей речи, сводятся, по мнению специалистов [Галяши-на, 2003, с. 84–92; Исаева, 2020, с. 40–42], к следующим:

  • а)    лексико-грамматические особенности (индивидуальное словоупотребление, например, наличие дискурсивных слов, вводных элементов, незнаменательной лексики, жаргонизмов, а также наличие различного рода аг-рамматизмов, связанных с нарушением норм склонения, согласования, неразличением лексической валентности слов и пр.);

  • б)    семантико-синтаксические особенности используемых синтаксических моделей (спонтанный звучащий текст характеризуется инверсивным порядком слов, незавершенностью конструкций, «фразовым нанизыванием», когда каждая фраза по смыслу задается предыдущей и определяет последующую, тенденцией к сегментации речи на простые фразы и т. д.);

  • в)    стилистические характеристики (соответствие / несоответствие стилистики речи коммуникативной ситуации, последовательное / непоследовательное развитие темы, высокая / низкая степень связности речи);

  • г)    фонетические особенности (интонационный рисунок, темп речи, паузация и др.). Как правило, к особенностям спонтанной речи на данном уровне относят такие признаки, как темповая неоднородность, усиление редукции гласных, стяжение безударных согласных в единый сегмент, полная редукция безударных гласных, сокращение пауз в речи и др. [Венцов, Слепоку-рова, Снюгина, 2011, с. 28–30].

Вышеперечисленные лингвистические параметры, традиционно используемые в про- цессе работы с звучащей речью для определения степени ее неподготовленности (спонтанности) / подготовленности, являются основой для решения задач профайлинга (атрибутики и портретирования) личности по языковым (вербальным) характеристикам устной речи. Однако работа с устно-речевым дискурсом в случаях, когда речь идет о следственных действиях, предполагающих наличие факторов, значительно влияющих на продуцирование речи, существенно усложняется и требует дополнительных методических подходов.

Любое следственное действие, например, допрос, предполагает нетипичную и даже стрессовую ситуацию для говорящего, в связи с чем опора исключительно на традиционную матрицу для однозначного определения неподготовленности (спонтанности) или подготовленности продуцируемой речи не всегда значима. При проведении исследований по голосу и речи с целью речевого портретирования целесообразно опираться на акустические признаки, которые являются инвариантными к воздействию искажений, вносимых, например, каналом записи и передающим каналом. К ним относятся признаки, описывающие статистические характеристики основного тона голоса и спектральные характеристики. Исследование звучащей речи акустическими инструментальными методами, с учетом когнитивного и лингвистического анализа речевого материала, позволит объективизировать решение задачи различения неподготовленной или подготовленной устной речи и эмоционально-модального состояния говорящего.

Акустико-аудитивный анализ неподготовленной (спонтанной) и подготовленной звучащей речи

Положение о возможности интерпретации звучащей речи в криминалистических целях основывается на индивидуальности физиологической структуры органов речеобразо-вания, а также обосновывается сознательной и подсознательной деятельностью высшей нервной системы, выступающей отражением интеллектуального уровня речевого развития говорящего и степенью его речемыслительных навыков. Стратегия речевого портретирования говорящего по продуцируемому вслух тексту (в частности, определение степени эмоциональности и разграничение неподготовленной (спонтанной) и подготовленной устной речи) реализуется посредством описания психических явлений через установление их зависимостей с аспектами другого рода (особенностями речепроизводства, латентным периодом голосообразования и пр.): «По содержательным основаниям устанавливается связь физиологических свойств нервной системы и психических свойств человека через внешний формальный показатель (совокупность акустических и лексико-грамматических признаков)» [Потапова, Потапов, 2006, с. 246]. Артикуляторные программы человека, призванные продуцировать произносимый речевой фрагмент как последовательность входящих в его состав отдельных акустических элементов, в то же время координируют просодические модели речи, отражая когнитивные установки конкретной личности. Тем-самым, индивидуальность голоса и речи человека отражается в разнообразных физических характеристиках речевого сигнала, охватывающих спектральные (формантные), темпоральные, амплитудные и мелодические параметры сигнала, а также особенности их изменения во времени [Потапова, Потапов, 2006]. Звучащая речь может быть рассмотрена как цепочка акустических событий, где генерация, передача и прием вербального сообщения являются лишь частью общего процесса коммуникации в целом [Potapova, Potapov, Kuryanova, 2022].

Инструментальный метод фонетико-спектрального анализа микроструктуры речевых единиц

Фонетико-спектральный анализ микроструктуры речевых единиц (микроанализ) состоит в вычислении формантных частот на спектрограмме речевого сигнала – спектральных максимумов (применительно к задаче определения спонтанности / подготовленности речи: F1 и F2) в диапазоне частот от 300 до 3 500 Гц. Вычисление акустических признаков микроанализа звуков проводится на наиболее информативных (с точки зрения проявления индивидуальности) гласных звуках [а], [и], [э], [о], [у]. Немаловажную роль в выборе именно этих звуков для акустического анализа играет и то обстоятельство, что они имеют наибольшую частоту встречаемости в устной русской речи.

В ходе проведения микроанализа исследовались следующие характеристики звуков в триадах (диадах): значения частоты основного тона (F0) на гласном звуке, значения первых двух формант, значения длительности согласных, окружающих ударный гласный.

Метод инструментального анализа мелодического контура синтагмы

Полифункциональность просодии позволяет применять супрасегментные свойства языка (мелодику, паузы, тембр, ритм) для передачи ряда как общих, так и частных значений: «...существует несколько коммуникативных функций голосовых паравербальных характеристик, которые включают использование просодических параметров для выделения определенных фрагментов высказывания, а также усиления / редукции прагматического эффекта» [Потапова, Потапов, 2012, с. 296].

Возможность исследования мелодического оформления различных фрагментов речевого сигнала обеспечивается их относительной реализационной стабильностью в сопоставимых контекстах, то есть типичностью и повторяемостью в речи конкретного диктора [Курьянова, 2020, с. 81–82]. Под мелодическим контуром традиционно понимают траекторию изменения частоты основного тона голоса, реализующуюся на определенном речевом отрезке [Potapova, Potapov, Kuryanova, 2022, p. 569].

В качестве основной единицы инструментального интонационного анализа применительно к решаемым задачам использовался мелодический контур синтагмы. Мелодический контур синтагмы неоднороден по своей структуре, в зависимости от направления мелодической кривой «синтагма» может реализовываться с помощью трех основных подтипов: синтагма с нисходящим или с восходящим завершением, а также синтагма с ровным завершением основного тона различного уровня. Описание и анализ супрасегментных (просодических) характеристик речи, содержащих информацию о спонтанности / подго- товленности высказываний с учетом эмоционального состояния говорящего, осуществлялось по параметрам частоты основного тона, интенсивности и длительности участков мелодического контура синтагмы (рассчитывалось в автоматическом режиме на базе звукового редактора SIS II), а также посредством описания основных типов и подтипов мелодической кривой.

Материал исследования

С целью апробации указанных методов, применяемых для интерпретации звучащей речи, и выявления акустических параметров, релевантных для определения спонтанности / подготовленности высказываний с учетом эмоционального состояния говорящего, было проведено экспериментально-фонетическое исследование сегментного и супрасегментного уровней языка на базе универсальной акустико-лингвистической платформы SIS II (ООО «Центр речевых технологий», г. Санкт-Петербург).

Материалом для экспериментально-фонетического исследования послужили аутентичные фонограммы, предоставляемые для проведения судебных фоноскопических и психолого-лингвистических экспертиз, содержащие спонтанную и предположительно квази-спонтанную речь (видеозаписи следственных действий «Допрос»), спонтанную диалогическую речь (материалы оперативно-разыскного мероприятия «Прослушивание телефонных переговоров»), а также преимущественно подготовленную речь (аудиозаписи следственных действий «Сбор образцов для сравнительного исследования» – пересказ, чтение, воспроизведение автобиографии и т. д.).

В ходе эксперимента было проанализировано 120 фонограмм (аудио- и видеозаписей) на русском языке, из которых 45 фонограмм – аудиозаписи оперативно-разыскного мероприятия «Прослушивание телефонных переговоров», 30 фонограмм – видеозаписи следственных действий «Допрос», 45 фонограмм – аудиозаписи следственных действий «Сбор образцов для сравнительного исследования». Длительность фонограмм в общей сложности составила 52 часа 17 минут.

Экспериментальный корпус отобран с учетом тех задач, для решения которых пред- назначалось проведение эксперимента. Речевой материал, используемый для проведения исследования, содержит различные контексты, способствующие проявлению индивидуальной вариативности голоса, стереотипы речевого поведения и ситуационные влияния (факторы, обусловленные ситуацией, в которой происходит звукозапись речевого материала), существенные для реализации информативных признаков голоса и определения спонтанности / подготовленности речи с учетом эмоционального состояния говорящего.

Результаты и обсуждение

Сегментные признаки неподготовленности (спонтанности) и подготовленности звучащей речи

Единицы сегментного уровня спонтанной речи подвержены модификациям в области вокализма и консонантизма, обусловленным, в первую очередь, ослаблением артикуляции вследствие быстрого темпа произнесения. В ходе инструментального анализа гласных изучались их качественные характеристики, определяющиеся формантной структурой (в частности, взаимным расположением F1 и F2). При анализе согласных в качестве основного акустического параметра была выбрана их длительность. Полученные данные представлены в таблицах 1 и 2.

Исследование показало, что модификации гласных, реализованных в подготовленной речи, в целом незначительно отличаются от их реализации в неподготовленной (спонтанной) речи, что вызвано, прежде всего, особенностями внут-ридикторской вариативности. Анализ реализации согласных сегментов продемонстрировал тенденцию к увеличению их длительности в подготовленной речи, что связано с более медленным темпом произнесения.

Супрасегментные признаки устной неподготовленной (спонтанной) и подготовленной речи

Выделяемые по результатам анализа мелодического контура синтагм признаки неподготовленной (спонтанной) и подготовленной речи на просодическом уровне соотносят-

Таблица 1. Средние значения F1 и F2, Гц

Table 1. Average values of F1 and F2, Hz

Гласный

Подготовленная речь

Спонтанная речь

F 1

F 2

F 1

F 2

а

690–900

1051–1108

634–706

1155–1250

о

478–550

790–946

415–600

826–1047

у

347–365

630–867

316–337

967–1100

э

460–689

1808–1945

494–690

1550–1650

и

240–315

1766–2276

289–376

1757–2449

Таблица 2. Значения длительности согласных, мс

Table 2. Consonant duration values, ms

Слоги типа СV Средняя длительность согласных в подготовленной речи Средняя длительность согласных в спонтанной речи тэ 104–113 87–99 дэ 79–85 67–72 ди 90–98 61–67 бэ 83–92 66–72 ко 91–105 84–96 ка 99–110 80–115 га 72–80 62–75 ся с описанием речевого потока в целом: синтагмы при спонтанном продуцировании преимущественно более краткие, часто встречаются просодические модели незавершенности (восходящее завершение), интонационные конструкции достаточно «размыты». Эти отличия могут быть объяснены закономерностями процесса порождения спонтанной речи: синтагма спонтанной речи произносится на одном физиологическом выдохе, интенсивность изменяется от наиболее громкого в начале высказывания к тихому в конце синтагмы [Потапова, Потапов, 2012, с. 179–181].

Полученные результаты анализа неподготовленной (спонтанной) и подготовленной устной речи свидетельствуют о наиболее индикативном противопоставлении указанных форм речи с учетом темпоральных особенностей и паузации. Паузация спонтанной речи реализуется за счет хезитационных и эмфатических пауз, которые в среднем более длительны, чем в подготовленной. Общая тенденция проявления темпоральных свойств обнаруживается в темповой неоднородности: переключении с быстрого темпа на более медленный, ускорении темпа в центре синтагмы с последующим замедлением к ее завершению. Мелодический контур синтагм в спонтанной речи характеризуется отсутствием нисходящего тона в конце синтагмы, свиде- тельствующим о направленности речи на продолжение коммуникации. Подготовленная речь отличается относительно стабильным темпом речи, уменьшением количества необусловленных пауз, достаточно узким диапазоном изменения значений частоты основного тона, минимальным количеством (или полным отсутствием) пауз хезитации.

Исследование просодических характеристик спонтанной и подготовленной речи на супрасегментном уровне показало, что такие параметры, как громкость, темп, значения частоты основного тона голоса (ЧОТ), направление движения мелодической кривой претерпевают существенные изменения под влиянием различных эмоциональных состояний. Эмоциональное состояние участника следственного действия (информанта) подвержено влиянию сразу нескольких факторов: реально переживаемые глубинные эмоции, скрываемые эмоции, транслируемые специально эмоции в ситуации «правда – ложь», реальная коммуникативная цель допрашиваемого, наличие наводящих вопросов со стороны других участников следственного действия, физиологическое состояние говорящего в момент допроса, особенности его типа нервной деятельности и т. д. Речевое портретирование на основе интерпретации эмоций может служить опорой при определении спонтанности / подготовленности высказываний, а также установлении факта самостоятельности / несамостоятельности продуцирования речи.

Пилотные эксперименты по исследованию звучащей речи показали, что речь, произносимая в состоянии страха, может свидетельствовать (в зависимости от коммуникативной ситуации) о продуцировании речи под давлением, принуждением. Такая речь характеризуется в большинстве случаев тихим голосом, в ряде случаев наблюдается хриплый тембр (следствие «зажатого» голосообразо-вания [Потапова, Потапов, 2006, с. 317]), наличие «скованных» ритмов, затрудненная артикуляция, монологизированный речевой стиль, частое употребление слов-паразитов, лексически «пустых» заполнителей.

Выводы

Речевое портретирование играет особую роль в тех случаях, когда центром исследования является конкретное поведение личности, его психологические особенности, умение скрывать свои мысли с помощью ряда спектрально-просодических признаков звучащей речи, степени владения искусством сокрытия истинного психологического состояния в ходе вопросно-ответной коммуникации с заключительным формированием конкретного профайлинга данной личности.

В результате проведенного исследования установлены наиболее индикативные параметры, позволяющие на основе использования акустических методов анализа звучащей речи (анализа микроструктуры звуков и анализа мелодического контура синтагм) прийти к выводу о спонтанности или подготовленности высказываний, в частности в коммуникативной ситуации допроса: значения длительности согласных в потоке речи, параметры частоты основного тона, интенсивности и длительности участков мелодического контура синтагмы, направление движения мелодической кривой, темпоральные характеристики и паузация.

Для определения неподготовленной (спонтанной) и подготовленной речи и ее эмоциональной насыщенности представляется необходимым проведение всестороннего ис- следования звучащего текста с учетом анализа формы речи (монологическая / диалогическая) и коммуникативной роли каждого из участников полилогической коммуникации (в частности, как именно испытуемый реагирует на реплику-стимул в различных коммуникативных ситуациях); жанра, в котором порождается речь (беседа, спор и т. д.); возраста говорящего, влияющего как на сформированный речевой навык, так и на объем кратковременной и долговременной памяти; характера коммуникации и параметров коммуникативной ситуации (отношения между говорящим и слушающим, место общения и т. д.). В связи с этим изучение и описание портрета анализируемой личности (профайлинг) на базе различных коммуникативных ситуаций требует междисциплинарного подхода с учетом знаний в области нейрофизиологии, психологии, психиатрии, когнитивистики, лингвистики и др.

Таким образом, применительно к задачам речевого портретирования целесообразно применение комплекса методов интерпретации звучащей речи: лингвистических методов анализа устных высказываний на всех уровнях языка, психологических методов анализа речевого потока в целом и визуальной информации, акустических методов исследования сегментных и супрасегментных признаков голоса, отражающих как степень подготовленности высказываний, так и их эмоционально-модальную насыщенность, что в своей совокупности будет способствовать и выявлению признаков маскировки реальных коммуникативных целей, фактов искажения передаваемой информации, несамостоятельности суждений.

Использование инструментальных акустических методов исследования речи открывает дополнительные возможности для изучения спонтанности / подготовленности высказываний, а также свидетельствует о потенциальной допустимости определения ряда значимых информативных признаков, позволяющих объективизировать процедуру профилирования личности по голосу и устной речи. Разработка междисциплинарной методики определения спонтанности / подготовленности высказываний участников следственных действий с применением специальных акустико-лингвисти- ческих и психологических знаний является перспективой дальнейших исследований. Комплексное изучение звучащей речи с целью дальнейшей разработки алгоритма анализа устно-речевого дискурса для определения степени подготовленности или спонтанности звучащей речи с учетом ее эмоциональной насыщенности, представляет собой одну из важнейших задач фундаментальной и прикладной лингвистики, поскольку будет способствовать объективизации экспертиз в области теоретического и прикладного рече-ведения, исследующих звучащую речь в криминалистических целях.