Вероятностно-статистическая методика установления гендерной принадлежности текстов на русском языке в судебном автороведении

Автор: Радбиль Тимур Беньюминович, Маркина Марина Викторовна

Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics

Рубрика: Развитие и функционирование русского языка

Статья в выпуске: 5 т.20, 2021 года.

Бесплатный доступ

В статье представлены промежуточные результаты разработки и усовершенствования компьютеризованной модели авторизации текстов на русском языке на основе вероятностно-статистической методики. Целью исследования является интерпретация экспериментального исследования расширенных возможностей компьютерной программы авторизации текста «КАТ» (компьютерная авторизация текста) при применении ее в диагностических автороведческих экспертизах по установлению гендерной принадлежности предполагаемого автора текста. Описаны результаты апробации усовершенствованной версии «КАТ», которая была адаптирована для определения и сопоставления стабильных относительных частот коэффициентов корреляции в текстах, авторами которых являются мужчины и женщины. Материалом исследования послужили созданные авторами и непрерывно пополняемые первичные базы художественных текстов XIX и XXI веков. Установлено, что в текстах, написанных мужчинами и женщинами, имеются значимые расхождения в таких коэффициентах корреляции, как средняя длина слов, средняя длина предложения, коэффициент предметности, коэффициент качественности, коэффициент активности, коэффициент динамизма, коэффициент связности. Проверка полученных результатов показала, что точность определения гендерной принадлежности на данном этапе исследования составляет приблизительно 65 %. Этот показатель может быть существенно превышен при увеличении объема и качественной спецификации баз данных с учетом типа дискурса и/или при использовании других моделей исчисления коэффициентов корреляции.

Еще

Авторизация текста, компьютерная авторизация текста, гендер, судебное автороведение, автоматическая обработка текста, вероятностно-статистическая методика, прикладная лингвистика

Короткий адрес: https://sciup.org/149139434

IDR: 149139434   |   DOI: 10.15688/jvolsu2.2021.5.4

Список литературы Вероятностно-статистическая методика установления гендерной принадлежности текстов на русском языке в судебном автороведении

  • Баранов А. Н., 2001. Введение в прикладную лингвистику. М. : Эдиториал УРСС. 347 с.
  • Верзохин С. С., 2013. К вопросу о лингвотеорети-ческих основах методик авторизации текста // Ученые записки Забайкальского государственного гуманитарно-педагогического университета им. Н.Г. Чернышевского. №2 2 (49). С. 22-27.
  • Викторова Е. Ю., 2011. Влияет ли гендер на использование дискурсивов? : (На материале письменного научного дискурса) // Известия Саратовского университета. Новая серия. Серия: Филология. Журналистика. Вып. 3. С. 8-14.
  • Вул С. М., 1977. Теоретические и методические вопросы криминалистического исследования письменной речи. М. : ВНИИСЭ. 109 с.
  • Галяшина Е. И., Ермолова Е. И., 2005. Перспективы развития автороведческой экспертизы в России // Судебная экспертиза. №9 3. С. 5-11.
  • Головин Б. Н., 1970. Язык и статистика. М. : Просвещение. 190 с.
  • Горошко Е. И., 1999. Особенности мужского и женского стиля письма // Гендерный фактор в коммуникации : сб. науч. тр. Иваново : Иван. гос. ун-т. С. 28-41.
  • Енгалычев В. Ф., Белянин В. П., Константинова Е. С., Ощепкова Е. С., 2001. Психолингвистические особенности «мужского» и «женского» языков // Труды регионального конкурса научных проектов в области гуманитарных наук. Калуга : Эйдос. Вып. 2. С. 177-187.
  • Ионова С. В., Огорелков И. В., 2020. Речевая диагностика личности по гендерному признаку в автороведении: квантитативный подход // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 19, № 1. С. 115-127. DOI: https://doi.org/ 10.15688/тгоки2.2020.1.10.
  • Катышев П. А., Осадчий М. А., 2018. Метод параметрического моделирования в судебной лингвистике // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 17, № 3. С. 24-34. DOI: https:// doi.org/10.15688/jvo1su2.2018.3.3.
  • Кремер Н. Ш., 2007. Теория вероятностей и математическая статистика. Изд. 3-е, перераб. и доп. М. : ЮНИТИ-ДАНА. 543 с.
  • Крючкова Т. Б., 1976. К вопросу о дифференциации языка по полу говорящего // Восточное языкознание : сб. тр. / отв. ред. В. П. Старинин. М. : Наука. С. 152-158.
  • Литвинова Т. А., 2012. Языковые корреляты личностных особенностей автора письменного текста: алгоритм исследования // В мире научных открытий. Серия: Проблемы науки и образования. № 9.3 (33). С. 236-255.
  • Литвинова Т. А., Загоровская О. В., Черванева В. А., Литвинова О. А., 2014. Проблема диагностирования пола автора письменного текста: фактор жанра // Современные исследования социальных проблем : электрон. науч. журн. № 1 (33). DOI: 10.12731/2218-7405-2014-1-4. URL: https:// cyberleninka. ru/art icle/n/probl ema-diagnostirovaniya-pola-avtora-pismennogo-teksta-faktor-zhanra/viewer (дата обращения: 14.08.2020).
  • Литвинова Т. А., Громова А. В., 2020. Компьютерные технологии в судебной автороведческой экспертизе: проблемы и перспективы использования // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 19, № 1. С. 77-88. DOI: https://doi.org/ 10.15688/jvolsu2.2020.1.7.
  • Морозов Н. А., 1916. Лингвистические спектры : Средство для отличения плагиатов от истинных произведений того или другого известного автора. Пг. : Тип. Императ. Акад. наук. 42 с. URL: http://www.textology.ru/library/ book.aspx?bookId=1&textId=3 (дата обращения: 12.05.2020).
  • Радбиль Т. Б., 2014. Выявление содержательных и речевых признаков недобросовестной информации в экспертной деятельности лингвиста // Вестник Нижегородского университета им. Н.И. Лобачевского. №2 6. С. 146-149.
  • Радбиль Т. Б. Маркина М. В., 2019. Вероятностно-статистические модели в производстве авторовед-ческой экспертизы русскоязычных текстов // Политическая лингвистика. № 2 (74). С. 156-166.
  • Радбиль Т. Б., Юматов В. А., 2014. Способы выявления имплицитной информации в лингвистической экспертизе // Вестник Нижегородского университета им. Н. И. Лобачевского. № 3 (2). С. 18-21.
  • Романов А. С., Мещеряков Р. В., 2009. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интеллектуальные технологии : по материалам ежгод. Междунар. конф. «Диалог 2009» (Бе-касово, 27-31 мая 2009 г). М. : РГГУ Вып. 8 (15). С. 432-437.
  • Сеченова Е. Г., 2012. Гендерная идентичность в фокусе современного научного дискурса // Вестник Тюменского государственного университета. Гуманитарные исследования. N° 1. С. 86-91.
  • Хмелев Д. В., 2000. Распознавание автора текста с использованием цепей А.А. Маркова // Вестник Московского университета. Серия 9, Филология. № 2. С. 115-126.
  • Хоменко А. Ю., 2019. Лингвистическое атрибуци-онное исследование коротких письменных текстов: качественные и количественные методы // Политическая лингвистика. № 2 (74). С. 177-187. DOI: 10.26170/pl19-02-20.
  • Юматов В. А., Маркина М. В., Ковалева А. С., 2015. Программа криминалистической диагностики и авторизации текста «КАТ» // Вестник Костромского государственного университета им. Н.А. Некрасова. Т. 21, № 3. С. 199-202.
  • Юматов В. А., Маркина М. В., Юматов С. В., 2016. Математические методы криминалистической диагностики и авторизации текста в рече-ведческой экспертизе // Вестник Нижегородского университета им. Н.И. Лобачевского. № 5. С. 227-232.
  • Argamon Sh., Koppel M., Pennebaker J. W., Schler J., 2009. Profiling the Author of an Anonymous Text // Communication of the ACM. Vol. 52 (2). Р. 119-123.
Еще
Статья научная