Методики атрибуции авторства в современной отечественной филологии

Автор: Гурова Евгения Игоревна

Журнал: Новый филологический вестник @slovorggu

Рубрика: Теория литературы

Статья в выпуске: 3 (38), 2016 года.

Бесплатный доступ

Статья представляет собой аналитический обзор современных отечественных методов определения авторства, применимых для решения конкретных филологических задач. Выделяются четыре основные методики: основанные на анализе словоупотребления, на исследовании синтаксических конструкций, на изучении последовательностей, а также комплексные (комбинированные) методы. Проведен сравнительный анализ этих методов атрибуции, выявлены их преимущества и недостатки. На примере ряда статей, приписываемых Ф.М. Достоевскому, показано, что наиболее эффективным выглядит всесторонний, многоаспектный анализ, в котором используются как традиционные филологические подходы, так и элементы лингвистической статистики.

Еще

Атрибуция, авторство, достоевский, публицистика, ирли (пушкинский дом) ран

Короткий адрес: https://sciup.org/14914564

IDR: 14914564

Текст научной статьи Методики атрибуции авторства в современной отечественной филологии

Возможность, не обладая документальными свидетельствами, определить автора анонимного текста опирается на представление об уникальности авторского стиля. В лингвистике оно имеет особый смысл: под ним подразумевают «набор свойств (параметров), характеризующих состав, способы объединения и статистико-вероятностные закономерности употребления речевых средств»1. Согласно определению В. Винтера, стиль -это система повторяющихся выборок из перечня произвольных черт языка2.

Но если стиль - это «статистическая выборка», «набор исчислимых параметров», значит, его можно измерить и создать на основе измерений математическую модель. И уже ее (а не сам текст) анализировать статистическими методами.

В филологии существует немало лингвистических методик установления авторства; накоплен большой опыт их применения. Однако аналитического обзора этого обширного материала пока еще нет. Данная статья -попытка заполнить существующую лакуну.

Известно несколько классификаций лингвистических методов атрибуции. Т.В. Батура основывает свою на особенностях используемых подходов. Однако в ней отсутствуют классические методы. Они лишь упомянуты и названы там «экспертными», поскольку требуют вмешательства специалиста-автороведа. Остальные методы исследователь распределил внутри двух больших групп: статистического анализа и машинного (компьютерного) обучения (программ, опробованных на определенных текстах)3.

А.В. Муха, В.Л. Розалиев и Ю.А. Орлова различают методы определения авторства на основе выбранных для анализа признаков текста (средних частот употребления, характерных слов, эмоциональности, сложности, типичных ошибок, непрямых синонимов)4. Их классификация не отличается стройностью и последовательностью. Во-первых, используемая этими исследователями характеристика «частоты» применима и к остальным параметрам Во-вторых, некоторые признаки текста, в зависимости от аспектов рассмотрения, могут быть отнесены к разным группам.

З.И. Резанова, А.С. Романов и РВ. Мещеряков подразделяют свойства текста на языковые (перечислены выше) и собственно текстовые (структурно-графическое оформление, метаданные документа (свойства файла))5.

Согласно классификации А.С. Сурковой, существует пять методик определения авторства: анализ лексики, «графов зависимостей», методы «распознавания образов», статистика парных употреблений, комплексы «Лингвоанализатор» и «Атрибутор»6. Несколько неожиданным выглядит то, что «Лингвоанализатор» и «Атрибутор» не отнесены к статистике парных употреблений, ведь они работают на основе этого метода.

По нашему мнению, в зависимости от того, какие параметры выбраны для анализа, можно выделить четыре основные методики: основанные на анализе словоупотребления, на исследовании синтаксических конструкций, на изучении последовательностей, а также комплексные (комбинированные) методы.

Анализ словоупотребления

Текст воспринимается как набор слов, поэтому лексические стилеобразующие признаки заинтересовали лингвистов еще в середине XIX в. Но лексика - настолько богатое поле для анализа, что методики определения авторства, основанные на ее изучении, появляются до сих пор.

В 1851 г. английский математик А. де Морган предположил, что стиль автора отражает средняя длина слов в тексте7. Этим утверждением он «породил дискуссию о возможностях применения математических методов для подобных задач»8, которая продолжается и сейчас, причем даже среди самих лингвистов.

Первым в России статистику в атрибуции применил Н.А. Морозов. В основе его метода лежит подсчет использования служебных слов. По мнению исследователя, именно они лучше всего отражают стиль и не зависят от темы, поскольку выбор их из группы синонимов происходит бессознательно9. Результаты своих исследований Н.А. Морозов представлял в виде графиков, отображающих частоту использования определенных частиц. Для этого он брал первую тысячу слов текста и подсчитывал, сколько, в среднем, встречается каждая единица; результат делил на общеязыковую частоту. Затем составлял ряд «лингвистических спектров» - графиков, характеризующих текст. Если они оказывались похожими, Морозов заключал, что и тексты, на основе которых составлены графики, близки.

Метод требовал проверки на текстах большего объема. Но такая возможность возникла лишь с появлением ЭВМ, в 1960-1970-е гг.

М.Х.Т. Элфорд в 1969 г. заключил, что некоторые слова, низкочастотные для языка, могут оказаться высокочастотными для конкретного автора10. Для анализа авторской частоты словоупотребления в 1970-е гг. начали составлять конкордансы, учитывающие контекст.

В 1980-е гг. велись поиски лексических параметров, которые лучше всего отражают стиль. Так, А.П. Василевич считал таковыми авторские наименования цвета, точнее, их частоту употребления, лексическую (отношение числа редких к числу частых слов) и морфологическую (отношение сложных к простым) оригинальность11.

В.П. Фоменко и Т.Г. Фоменко в 1983 г. исследовали отечественную классику, доработав метод Морозова, и доказали, что объем используемых служебных слов устойчив для каждого писателя12. Недостаток этого метода в том, что он «работает» только на текстах большого объема: оптимальной оказывается выборка в 16 000 слов, причем ее уменьшение снижает точность атрибуции, а увеличение - не повышает.

Метод О. Хрулева таков: для каждого писателя составляется нормализованный частотный словарь, а затем данные из него сравнивают с полученными из атрибутируемого текста. Однако и этот метод не работает с короткими произведениями, где лексика зависит от темы. Кроме того, частота употребления тех или иных слов меняется в зависимости от периода творчества писателя или литературного жанра, в котором создано произведение13.

А.Н. Баранов выявил еще один недостаток статистического анализа близких по значению служебных и модальных слов. Оказалось, что этот метод характеризует не столько стиль автора, сколько его отношение к событиям и героям произведения14.

Итак, атрибуция на основе лексических параметров не всегда дает результат даже для текстов большого объема. Кроме того, лексические и лексико-синтаксические единицы могут намеренно моделироваться авторами15. Чем лучше писатель владеет языком, тем менее подходящими для атрибуции становятся подобные параметры его произведения.

Исследование синтаксиса

Для определения типичной авторской синтаксической конструкции исследуют как предложения, так и их части, порядок слов, виды вводных слов, абзацы и т.п. Существуют следующие подходы к анализу синтаксиса: статистика; сопоставление графических изображений синтаксических структур; комплексный статистико-графический анализ16.

Часто атрибуцию основывают на статистике средней длины предложения. Однако, помимо авторского стиля, она отражает также жанровостилистические особенности. Поэтому при ее применении необходимо соблюдать правило однородности: сравниваемые тексты должны быть одного жанра, стиля и временного периода. Доказано, что в противном случае этот метод позволяет приписать диссертацию Н.Г. Чернышевского, статью Л.Н. Толстого и книгу В.С. Ключевского одному автору, романы «Что делать?» и «Война и мир» - другому, а письма Толстого, Чернышевского и Ключевского - третьему17.

Но и стиль одного и того же автора не единообразен, поэтому важно составить однородную выборку. Иначе определение авторства невозможно18.

Программа «Штампомер» html#Analysis2) атрибутирует тексты по следующим параметрам: знаки препинания, завершающие знаки препинания, предложения в абзаце, слова в предложении, знаки препинания в предложении, штампы (под которыми понимается словосочетание из нескольких слов). Сведений о точности работы программы нет.

Относительно высокую надежность показывают предложенные И.П. Себво методы «графов зависимостей». С их помощью по 50 предложениям текста его можно атрибутировать с вероятностью в 75 %. Однако эта цифра верна, только если предполагаемых авторов двое. Если их больше, точность атрибуции существенно снижается19.

Л.И. Бородкин предложил определять авторство, исследуя только наиболее характерные пары грамматических классов20. Но для того чтобы применить его метод, необходим грамматический анализ текста, требующий работы экспертов-лингвистов.

Уязвимость методов анализа синтаксиса видится в том, что они скорее описывают особенности предложения21, чем всего текста, а также в трудоемкой предварительной подготовке материала22.

Метод Л.И. Бородкина можно отнести как к тем, что основаны на анализе синтаксиса, так и к тем, которые опираются на изучение последовательностей.

Изучение последовательностей

В начале XX в. свой метод атрибуции изложил А.А. Марков, создатель универсально применимых «цепей Маркова»23. Этот метод стал активно развиваться с появлением компьютеров.

Суть методов, основанных на «цепях Маркова», заключается в подсчете количества последовательностей из предложений, слов, слогов или даже букв: признаки авторского стиля, таким образом, содержатся уже на буквенном уровне24. Чаще всего для анализа используются пары, триады или четверки букв, либо пары идущих подряд грамматических классов. Причем подсчет буквенных пар оказывается эффективнее, чем анализ одиночных грамматических классов слов и их пар25. Еще более точные результаты дает комплексный анализ: пар идущих подряд букв, двух букв, встречающихся через одну, пар наиболее частых в русских текстах двухбуквенных сочетаний26.

Метод работает так. Текст разбивают на последовательности из букв или классов и обрабатывают статистически. А.Н. Тимашев, один из разработчиков онлайн-сервиса «Атрибутор», поясняет этот процесс так: «слово “собака” разбирается на следующие цепочки: “_со”, “соб”, “оба”, “бак”, “ака”, “ка_”. Одинаковые триады суммируются, из собранных по тексту триад получается профиль, который является поисковым образом, характеризующим авторский стиль»27.

Цепи Маркова лежат в основе многих методов атрибуции. Так, их используют Л.В. Милов и Л.М. Бородкин (анализ частот пар грамматических классов); А.А. Поликарпов, Д.В. Хмелёв, А.Н. Тимашев (анализ буквенных пар и триад); А.С. Суркова (анализ комплекса буквенных и словесных последовательностей). Этот же метод положен в основу онлайн-сервисов «Лингвоанализатор» и «Атрибутор» , отличающихся текстовыми базами. «Атрибутор» работает с классической русской художественной прозой, а «Лингвоанализатор» - с фантастикой.

Но, помимо неполноты баз, недостатком оказываются требования к объему текста. Согласно исследованиям И.О. Тарнопольской, он должен быть не менее 10 000 символов, а метод Д.В. Хмелёва работает с выборками от 100 00028.

Комплексные подходы

Одновременное применение нескольких подходов увеличивает точность атрибуции. В 1978 г. свою комплексную методику установления авторства на основе частотных словарей и статистических данных предложил норвежский математик Г. Хетсо. Ученый исследовал тексты М.А. Шолохова и Ф.М. Достоевского по 15 параметрам29.

Для того времени метод Г. Хетсо был открытием. Однако и он не стал универсальным: некоторые атрибуции не внушают доверия, а сама методология не раз подвергалась критике. Неверным считают использование непоказательного параметра «средняя длина предложения»30, отсутствие проверки на текстах, заведомо не принадлежащих проблемному автору. Ю.В. Сидоров, применив методику Хетсо к другим текстам, показал, что ее использование приводит к тому, что статья Ап. Григорьева «Стихотворения А.С. Хомякова» и статья М.М. Достоевского «Рассказы из народного русского быта Марка Вовчка», «Пожары», «Гроза» и др. оказываются написанными Ф.М. Достоевским31.

Идеи Г. Хетсо развивают исследователи из Петрозаводского государственного университета В.Н. Захаров, А.А. Рогов и Ю.В. Сидоров. Последний использовал тексты в авторской орфографии и пунктуации, увеличил до 156 число параметров и подверг методологию всесторонней проверке на обширном материале (81 статья из журналов «Время» и «Эпоха»), Работа показала: результат не зависит от того, в какой орфографии приводятся тексты; некоторые параметры зависят от объема выборки; атрибуции Г. Хетсо неверны32. И все же подход Ю.В. Сидорова не позволил однозначно решить вопрос об авторстве проблемных текстов. Тем не менее, на базе его метода была создана система «СМАЛТ» (Статистические методы анализа литературного текста), которая, в отличие от «Лингвоанализатора» и «Атрибутора», была признана эффективной33.

Исследования Ю.В. Сидорова были использованы В.Н. Захаровым для решения вопросов атрибуции журнальной публицистики в ходе подготовки нового издания полного собрания сочинений Достоевского. В.Н. Захаров выдвинул методику, учитывающую как традиционные документальные, идейно-тематические и стилистические признаки, так и результаты статистической обработки формально-грамматических и синтаксических параметров34. Однако однозначно атрибутировать с помощью этой статистики тексты не удалось, так что В.Н. Захаров вынужден был больше полагаться на традиционные методы.

Еще одним комплексным подходом к определению авторства является теория распознавания образов, предложенная М. А. Марусенко в 1990 г. В ней авторский стиль рассматривается как «образ» - комплекс измеримых математически лексических и синтаксических параметров, обладающих уникальными характеристиками. Сначала их исследуют, затем выбирают наиболее информативные из них и проводят сравнение по ним35.

Теория распознавания образов тесно связана с литературоведением. Лингвистика служит здесь лишь средством проверки выдвинутой гипотезы и не может применяться в отрыве от тщательного изучения проблемы. По словам М.А. Марусенко, его опыт «подтвердил точку зрения, которой придерживались В.В. Виноградов, П.Н. Берков и Б.В. Томашевский, о том, что математические методы анализа языка и стиля, несмотря на их важность, являются вспомогательными»36.

Хотя в целом определение авторства с помощью теории распознавания образов выглядит весьма убедительно, применение этого метода не всегда оказывается возможным: значительное количество признаков необходимо определять вручную, нельзя рассматривать большое количество авторов и т.п.37

Универсального подхода к определению авторства на сегодняшний день нет. Для решения конкретных задач разрабатываются различные методы. Статистические гипотезы носят вероятностный характер38, а параметры для сравнения выбираются достаточно случайным образом39. По 34

подсчетам Дж. Рудмана, для атрибуции используется свыше 1 000 параметров, что говорит не только о сложности задачи, но и о недоработках в методологии40. Следовательно, лингвистические методы определения авторства могут быть лишь подспорьем для филолога: полностью доверять им нельзя.

Рассматривая проблему определения авторства на примере приписываемой Ф.М. Достоевскому публицистики, можно заключить, что лингвистические методы по сравнению с комплексными филологическими недостаточно эффективны. Убедительность теории распознавания образов во многом обеспечена филологической подготовкой исследователей и проработкой гипотез о принадлежности текстов целому кругу публицистов. Так, для атрибуции тех же приписываемых Достоевскому статей, с которыми работал Г. Хетсо, М.А. Марусенко составил список предполагаемых авторов из И человек41. Спорные статьи проверяли на принадлежность каждому из них.

Вывод М.А. Марусенко оказался неожиданным: гипотеза о том, что написал статьи Ф.М. Достоевский, была опровергнута. Удалось определить авторов четырех публикаций, остальные восемь остались неатрибутиро-ванными42. Ученый связывает это с тем, что, вероятно, они принадлежат перу не вошедших в исследуемую группу публицистов.

Представляется немного странным, что М.А. Марусенко изначально не выдвигает предположений о соавторстве или редакторском вмешательстве Ф.М. Достоевского: то, что выдающиеся исследователи приписали ему рассматриваемые статьи, дает основания предполагать хотя бы некоторое его вмешательство в текст.

Неизвестно, была ли теория распознавания образов проверена на современной Достоевскому публицистике, те. верно ли она атрибутирует статьи, авторы которых доподлинно известны.

Недостаток лингвистических методов заключается также в том, что компьютер учитывает только статистические данные, не распознавая контекст. В то же время у каждого писателя есть слова-маркеры, используемые в непривычном значении. Хорошим подспорьем в данном случае являются словари языка того или иного автора.

Существуют разные типы таких изданий. Например, «Статистический словарь языка Достоевского» относится к частотным словарям: в нем содержится информация о том, сколько раз та или иная лексема употребляется в творчестве автора43. «Словарь языка Достоевского» отображает особенности его речи44. В словарной статье указано, как часто рассматриваемая единица встречается во всем творчестве писателя и в текстах каждого жанра; описано каждое из ее значений (в том числе в составе собственных имен, фразеологических единств, пословиц и поговорок); даны словоуказатель, комментарий и примечания, указания на использование описываемого слова в чужой речи и словообразовательная окрестность. Таким образом, мы имеем целостную картину авторского употребления значимых для Достоевского слов, которая может быть полезна для решения конкретных задач. Так, использование в тексте слов-маркеров в привычном для писателя значении может свидетельствовать в пользу его авторства, а странная, необычная для Достоевского семантика - против.

Подобные словари, отражающие идиолект и авторское словоупотребление, дают исследователю дополнительный инструментарий. Они облегчают традиционный стилистический и идейно-тематический анализ, ведь не в последнюю очередь он основывается на использовании слов-маркеров. Так, устанавливая авторство статьи «Семейная неурядица как причина самоубийства», А.В. Отливанчик отмечает, что она может принадлежать либо Ф.М. Достоевскому, либо В.П. Мещерскому. К таким выводам исследователь приходит в том числе благодаря изучению «узнаваемой» лексики Достоевского, которая употребляется здесь в привычном для писателя контексте45. Помимо анализа лексики, в своей атрибуции Отливанчик использует и другие филологические методы. Такого же подхода придерживается и А.Ю. Балакин, дополняя традиционный филологический анализ данными о словоупотреблении Достоевского46.

Свидетельством авторства могут оказываться реминисценции, особенно - автореминисценции. Так, С.А. Кибальник в позднейшем творчестве Ф.М. Достоевского нашел дополнительное подтверждение гипотезы о его полном или частичном авторстве статьи «Гроза. Драма в пяти действиях А.Н. Островского», подписанной именем М.М. Достоевского47. В то же время ученый не отвергает и методы традиционного филологического анализа48.

Итак, среди лингвистических методов определения авторства наиболее эффективными оказываются комплексные (комбинированные) подходы, в которых атрибуция проводится сразу по многим параметрам. Однако даже они могут быть использованы в филологии лишь как вспомогательное средство. Отказываться от идейно-тематического и стилистического анализа рано: лингвистика пока не способна и скорее всего так и не сможет его заменить. Наиболее эффективным методом атрибуции выглядит всесторонний, многоаспектный анализ, в котором используются как традиционные филологические подходы, так и элементы лингвистической статистики.

Исследование выполнено за счет гранта Российского научного фонда (проект № 16-18-10034), ИРЛИ РАН.

Список литературы Методики атрибуции авторства в современной отечественной филологии

  • Муха А.В., Розалиев В.Л., Орлова Ю.А., Заболеева-Зотова А.В. Автоматизированный подход к определению авторства текста//Известия Волгоградского государственного технического университета. 2013. Т. 17. № 14 (117). С. 52
  • Журавлева Н.Н. Применение количественных методов при анализе стиля автора и решении проблем атрибуции//Вестник Тюменского государственного университета. 2012. № 1. С. 150
  • Батура Т.В. Формальные методы определения авторства текстов//Вестник Новосибирского государственного университета. Серия: Информационные технологии. 2012. Т. 10. № 4. С. 81-94.
  • Муха А.В., Розалиев В.Л., Орлова Ю.А., Заболеева-Зотова А.В. Автоматизированный подход к определению авторства текста//Известия Волгоградского государственного технического университета. 2013. Т. 17. № 14 (117). С. 52
  • Резанова З.И., Романов А.С., Мещеряков Р.В. О выборе признаков текста, релевантных в автороведческой экспертной деятельности//Вестник Томского государственного университета. Филология. 2013. № 6 (26). С. 40
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 146
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 146
  • Сидоров Ю.В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров. СПб., 2002. С. 3
  • Морозов Н.А. Лингвистические спектры: Средство для отличия плагиатов от истинных произведений того или другого известного автора: Стилеметрический этюд//Известия Отделения русского языка и словесности Императорской Академии наук (ИАН). Т. XX, кн. 4. Пг., 1915. С. 93-134
  • Журавлева Н.Н. Применение количественных методов при анализе стиля автора и решении проблем атрибуции//Вестник Тюменского государственного университета. 2012. № 1. С. 153
  • Родионова Е.С. Методы атрибуции художественных текстов//Структурная и прикладная лингвистика. 2007. № 7. С. 120
  • Фоменко В.П., Фоменко Т.Г. Авторский инвариант русских литературных текстов//Методы количественного анализа текстов нарративных источников. М., 1983. С. 86-109
  • Кирносов В.В. Применение статистических методов в сравнительных исследованиях художественных текстов//Вестник Московского городского педагогического университета. 2008. № 16. С. 113. (Информатика и информатизация образования)
  • Верхозин С.С. К вопросу о лингвотеоретических основах методик авторизации текста//Ученые записки Забайкальского государственного гуманитарно-педагогического университета. 2013. № 2 (49). С. 24. (Филология, история, востоковедение)
  • Резанова З.И., Романов А.С., Мещеряков Р.В. О выборе признаков текста, релевантных в автороведческой экспертной деятельности//Вестник Томского государственного университета. Филология. 2013. № 6 (26). С. 49
  • Марусенко М.А., Бессонов Б.Л., Богданова Л.М. В поисках потерянного автора: этюды атрибуции. СПб., 2001. С. 18-19
  • Марусенко М.А., Бессонов Б.Л., Богданова Л.М. В поисках потерянного автора: этюды атрибуции. СПб., 2001. С. 18-19
  • Марусенко М.А., Бессонов Б.Л., Богданова Л.М. В поисках потерянного автора: этюды атрибуции. СПб., 2001. С. 21
  • Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. Л., 1990. С. 21
  • Хозяинов С.А. Некоторые проблемы и методы квантитативно-структурного изучения авторских стилей//Известия Российского государственного педагогического университета им. А.И. Герцена. 2008. № 63.1. С. 378-383
  • Родионова Е.С. Методы атрибуции художественных текстов//Структурная и прикладная лингвистика. 2007. № 7. С. 122
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 147
  • Марков А.А. Об одном применении статистического метода//Известия Императорской Академии наук (ИАН). 1916. Т. 10, № 4. С. 239-242. (Сер. 6)
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 147
  • Хмелёв Д.В. Распознавание автора текста с использованием цепей А.А. Маркова//Вестник Московского государственного университета. 2000. № 2. С. 115-126. (Сер. 9. Филология)
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 146
  • Тимашев А.Н. Атрибутор: Версия 1.01: Описание программы. М., 1999-2007. URL: http://www.textology.ru/atr_resum.html (дата обращения 01.02.16)
  • Хозяинов С.А. Некоторые проблемы и методы квантитативно-структурного изучения авторских стилей//Известия Российского государственного педагогического университета им. А.И. Герцена. 2008. № 63.1. С. 381
  • Хетсо Г. Автор статьи -Достоевский?//Достоевский. Материалы и исследования. Т. 6. Л., 1985. С. 207-234
  • Родионова Е.С. Методы атрибуции художественных текстов//Структурная и прикладная лингвистика. 2007. № 7. С. 123
  • Сидоров Ю.В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров. СПб., 2002. С. 5
  • Сидоров Ю.В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров. СПб., 2002. С. 6
  • Батура Т.В. Формальные методы определения авторства текстов//Вестник Новосибирского государственного университета. Серия: Информационные технологии. 2012. Т. 10. № 4. С. 81-94.
  • Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. Л., 1990. С. 2
  • Марусенко М.А., Бессонов Б.Л., Богданова Л.М. В поисках потерянного автора: этюды атрибуции. СПб., 2001. С. 7
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 147
  • Верхозин С.С. К вопросу о лингвотеоретических основах методик авторизации текста//Ученые записки Забайкальского государственного гуманитарно-педагогического университета. 2013. № 2 (49). С. 26. (Филология, история, востоковедение)
  • Суркова А.С. Идентификация авторства текстов на основе информационных портретов//Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 3.1. С. 147
  • Резанова З.И., Романов А.С., Мещеряков Р.В. О выборе признаков текста, релевантных в автороведческой экспертной деятельности//Вестник Томского государственного университета. Филология. 2013. № 6 (26). С. 39
  • Марусенко М.А., Родионова Е.С., Мельникова Е.Е. Об авторстве анонимных и псевдонимных статей, приписываемых Ф. М. Достоевскому (журналы «Время» и «Эпоха» 1861-1865). Ч. I//Вестник Санкт-Петербургского университета. 2008. № 3.1. С. 49. (Сер. 9)
  • Марусенко М.А., Родионова Е.С., Мельникова Е.Е. Об авторстве анонимных и псевдонимных статей, приписываемых Ф.М. Достоевскому (журналы «Время» и «Эпоха» 1861-1865). Ч. II//Вестник Санкт-Петербургского университета. 2008. № 4.1. С. 74. (Сер. 9)
  • Шайкевич А.Я., Андрющенко В.М., Ребецкая Н.А. Статистический словарь языка Достоевского. М., 2003
  • Словарь языка Достоевского: идиоглоссарий: в 3 т./авт.-сост. Е.Л. Гинзбург; гл. ред. Ю.Н. Караулов. Т. 1. М., 2008. С. XI
  • Отливанчик А.В. Неизвестный текст Достоевского? К вопросу об авторстве статьи «Семейная неурядица как причина самоубийства» («Гражданин», 1873 г., № 49)//Достоевский и современность. Старая Русса, 2007. С. 232
  • Балакин А. Ю. Еще об авторстве статьи «Выставка в Академии художеств за 1860-61 год», атрибутируемой Достоевскому // Slavica Revalensia. 2015. Vol. 2. С. 35-59
  • Кибальник С.А. А.Н. Островский и Ф.М. Достоевский (к вопросу о статье М. Достоевского ‹?› "Гроза. Драма в пяти действиях А.Н. Островского") // Известия РАН. Сер. литературы и языка. 2013. Т. 72, № 4. С. 41
  • Кибальник С.А. А.Н. Островский и Ф.М. Достоевский (к вопросу о статье М. Достоевского ‹?› "Гроза. Драма в пяти действиях А.Н. Островского") // Известия РАН. Сер. литературы и языка. 2013. Т. 72, № 4. С. 40-45
Еще
Статья научная