Корпус архивных документов Войска Донского: проблемы морфологического анализа

Автор: Горбань Оксана Анатольевна, Косова Марина Владимировна, Шептухина Елена Михайловна, Светлов Андрей Владимирович

Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics

Рубрика: Главная тема номера

Статья в выпуске: 6 т.21, 2022 года.

Бесплатный доступ

В статье обобщены некоторые результаты исследования, нацеленного на создание специального аннотированного диахронического корпуса документов архивного фонда Михайловского станичного атамана Государственного архива Волгоградской области. Предложены решения лингвистических и технических задач, связанных с разметкой текстов и представлением их в электронно-поисковой среде. Для корректной работы с текстами документов, написанными скорописью XVIII в. и первой половины XIX в., группой специалистов под руководством А.В. Светлова создана надстройка над утилитой для стемминга MyStem И.В. Сегаловича. Она добавляет к возможностям утилиты выводить всю грамматическую информацию и количественные данные опцию работы с устаревшей кириллицей, удобный графический интерфейс, имеет функционал для снятия омонимии вручную, поддерживает экспорт размеченного текста во внешнюю систему хранения и обработки данных. В результате морфологического анализа части текстов О.А. Горбань и Е.М. Шептухиной установлены варианты падежных форм существительных, не отмеченные в «Российской грамматике» М.В. Ломоносова, в современных исследованиях литературных текстов XVIII в., и обоснована необходимость корректировки программных инструментов разметки текстов в плане расширения возможных вариантов грамматического разбора омонимичных форм для последующего снятия омонимии вручную. Количественный анализ выявленных фактов, проведенный М.В. Косовой, и их лингвистическая интерпретация показали в сфере грамматики, наряду с общими тенденциями развития и функционирования русского языка, особенности, характерные для деловой письменной речи в ее региональном варианте.

Еще

История русского языка, региональная деловая письменность, лингвистический корпус, морфологическая разметка, варианты падежных форм, грамматическая омонимия

Короткий адрес: https://sciup.org/149141658

IDR: 149141658   |   DOI: 10.15688/jvolsu2.2022.6.4

Текст научной статьи Корпус архивных документов Войска Донского: проблемы морфологического анализа

DOI:

Одна из проблем развития русского исторического языкознания заключается в малодоступности значительной части источников для широкого круга исследователей. Особенно это касается массива памятников деловой письменности, хранящихся в многочисленных российских региональных архивах. Введение такого материала в научный обо- рот даст возможность более полно представить картину исторического развития русского языка во всем ее многообразии, с учетом местных вариантов. Традиционно эта задача решается путем публикации письменных памятников. Новые возможности открываются благодаря современным информационным технологиям и созданию лингвистических корпусов. В данной статье представлены некоторые результаты исследования, осуществ- ленного в Волгоградском государственном университете в рамках коллективного проекта, нацеленного на создание специального аннотированного диахронического корпуса документов Войска Донского XVIII–XIX вв. (участники проекта – О.А. Горбань, М.В. Косова, Е.М. Шептухина, А.В. Светлов, И.С. Герасимова, Н.И. Тихонова). В 2019–2021 гг. работа по составлению этого корпуса выполнялась при финансовой поддержке РФФИ (проект № 19-012-00246 «Параметризация текстов как основа создания лингвистического корпуса архивных документов XVIII–XIX вв. канцелярий Войска Донского»).

Земля Войска Донского представляла собой специфичное административно-территориальное образование в составе Российской империи. Лишившись при Петре I государственной автономии, оно сохраняло автономию областную, что обусловливало его социальное и этнокультурное своеобразие, несмотря на все большее подчинение на протяжении двух столетий общегосударственной системе управления. В рамках норм этой системы складывалась и функционировала документация, обеспечивавшая управление Войском со стороны верховной власти и управление внутри Войска.

В языковом отношении это территория формирования и распространения донских говоров южнорусского наречия. Памятники деловой письменности, созданные в этом регионе, отражают взаимодействие общерусских и региональных языковых черт и представляют собой ценный источник для изучения истории русского языка на Юге России в XVII – начале XX века. Однако, как отмечают исследователи, обращение к донским документальным источникам затруднено тем, что значительная их часть утрачена, а оставшаяся рассредоточена по различным центральным и региональным хранилищам, из которых основное – Государственный архив Ростовской области [Сень, 2014, с. 484]. Часть документов хранится в Государственном архиве Волгоградской области (далее – ГАВО).

Материал и методы

Создаваемый лингвистический корпус основан на документах 1734–1837 гг., отложившихся в фонде Михайловского станично- го атамана ГАВО (фонд 332, опись 1, дела 1– 158; далее при цитировании источников указываются только дело и лист / оборот листа, примеры приводятся в упрощенной графике с использованием современного алфавита). Фонд включает оригиналы и копии документов, поступивших в канцелярию (станичную избу) станицы Михайловской на Хопре из войсковой канцелярии, из учреждений Волжского войска, соседних губерний, в частности Воронежской, от должностных лиц и рядовых казаков; черновики и копии документов, отправленных из станичной канцелярии в другие учреждения или отдельным должностным лицам; копии некоторых высочайших указов, касавшихся Войска Донского. Часть документов опубликована (см.: [Горбань и др., 2020]). В фонде представлена большая коллекция оригиналов войсковых грамот; документы этого уникального жанра характерны именно для Войска Донского. Войсковые грамоты, содержащие распоряжения Войска для исполнения в донских станицах, копировались в минимальном количестве, грамота от Черкасского – столицы Войска – направлялась по всем станицам, расположенным вдоль одной реки, в каждой из них читалась и копировалась, затем передавалась дальше и оставалась в последней. Такой станицей в верховьях реки Хопёр и была Михайловская.

Документы написаны скорописью первой и второй половины XVIII в. и первой половины XIX века. Для них характерно: использование вышедших из употребления букв кириллицы ( 1 , i , 4 , з , ' , 9 , 0 , ), выносных букв; запись слов под титлом; деление текста на слова, но слитное написание союзов, предлогов и частиц с последующей или предыдущей словоформой; отсутствие прописных букв как маркеров имен собственных; редкое и непоследовательное употребление знаков препинания, затрудняющее выделение синтаксических единиц, в частности предложений; написание чисел арабскими цифрами.

Разработка параметров и инструментов метаразметки [Филимонов и др., 2020], принципов представления текстов в электроннопоисковой среде, подготовка их для автоматической машинной обработки потребовали решения ряда лингвистических и технических задач.

С целью расширения возможностей исторических лингвистических исследований тексты даны в корпусе с сохранением орфографии оригиналов и подвергнуты лишь частичной адаптации: выносные буквы даны в строке, диграф передан как сочетание двух букв в строке; титла раскрыты; союзы, предлоги и частицы даны раздельно с последующими или предыдущими словоформами; имена собственные (личные имена и географические названия) – с прописной буквы. Такое представление материала в основном соответствует принципам презентации текстов в Национальном корпусе русского языка [Савчук, Сичинава, 2009, c. 57], облегчает работу пользователей и обеспечивает адекватную работу программ по морфологической разметке текстов. Однако при этом вышедшие из употребления кириллические буквы сохранены, восстановленные при раскрытии титл буквы приведены в круглых скобках, поскольку они даются в современной орфографии и должны быть маркированы как неаутентичные. Сохранена также пунктуация оригиналов, поскольку невозможно однозначно осуществить синтаксическое членение текстов и оформить его по современным правилам. Проведена структурная разметка, предусматривающая деление текстов на сегменты (не всегда совпадающие с предложениями), необходимые и достаточные для контекстуального представления пользователю результатов поиска в корпусе (подробно об этом см.: [Горбань, Косова, Шептухина, 2021]).

В данной статье рассмотрим некоторые вопросы, связанные с морфологической разметкой, правила которой во многом совпадают с принятыми в Национальном корпусе русского языка (см. о них: [Ляшевская, Плунгян, Сичинава, 2005]).

Результаты и обсуждение

Для морфологической разметки текстов используется морфологический анализатор MyStem, разработанный И.В. Сегаловичем [Segalovich, 2003]. MyStem корректно обрабатывает устаревшую лексику, если она передается в программу с использованием современной кириллицы. Поэтому для работы с устаревшей графикой IT-специалистами – участниками проекта было создано приложение- надстройка к MyStem, которое буквы i, 4, w, ', 9 заменяет соответственно на и, e, о, ф, кс, затем передает текст для анализа в MyStem и после этого производит уже в обработанном документе обратную замену символов. Приложение добавляет к возможностям утилиты удобный графический интерфейс, имеет функционал для снятия омонимии вручную [Комендантов, Матвеев, Светлов, 2019].

При помощи созданного приложения была проведена пробная морфологическая разметка документов 1734–1753 гг., которая выявила случаи ошибочного определения форм программой и вызвала необходимость ее корректировки. Эти случаи обусловлены, с одной стороны, выбранным подходом к орфографической передаче текстов, с другой – грамматическими особенностями самих текстов.

Так, слова с раскрытыми титлами не были прочитаны как целостные единицы, потому что круглые скобки воспринимались как знак препинания. Данная проблема устранена путем игнорирования круглых скобок; такая возможность объясняется тем, что скобки в функции знаков препинания в размечаемых документах не используются и не имеют значения для передачи их синтаксиса.

Трудности связаны также с правописанием некоторых грамматических формантов, например падежных окончаний адъективного и местоименного склонений. Как известно, флексия родительного падежа единственного числа мужского и среднего родов прилагательных, причастий, ряда местоимений могла передаваться на письме как - аго /- яго и - ого /- его (это объясняется историей местоименных форм в церковнославянском и восточнославянских языках; отношения данных вариантов – предмет отдельного рассмотрения). Такое вариативное написание широко представлено и в документах Войска Донского, однако программа корректно определяет оба варианта как формы прилагательных и причастий.

Наряду с указанными, в текстах часто встречаются написания окончаний - ова /- ева , местоимения 3-го лица ево (вместо его ), которые отражают живое произношение соответствующих форм: пьянова (д. 8, л. 4), хорче-вова (д. 9, л. 14), коровева , поснова (д. 9, л. 14 об.), какова (д. 8, л. 30), никакова (д. 9, л. 9) и др.; они же в современной орфографии:

пьяного , харчевого , коровьего , постного , какого , никакого . Формы на - ова в своем графическом облике омонимичны формам широко распространенных русских фамилий на - ов и последовательно определены программой как имена существительные (отметим, что в рассмотренных документах фамилия графа Г.П. Толстого в родительном падеже пишется только как Толстова , в других падежах, по аналогии, Толстову , Толстовым наряду с правильными Толстой , Толстому ). В связи с этим требуется корректировка программы в плане расширения количества возможных грамматических разборов подобных словоформ для последующего снятия омонимии.

Такое расширение количества омонимов и, следовательно, вариантов разбора у одной морфологической формы может быть связано не только с орфографией, но и с собственно грамматическими особенностями текстов. Морфологический анализ обнаружил формы, не сохранившиеся в современном русском языке, некоторые из них не отмечаются уже грамматиками XVIII века. Соответственно, омонимичные формы не получают всего набора морфологических признаков, что обусловливает возможность ошибки в их разборе. Известные же и сегодня вариантные формы могут иметь функциональную специфику. В связи с этим перед исследовательским коллективом стоит задача определить, насколько частотны такие явления и требуют ли они существенной корректировки программы. Однако уже имеющиеся результаты позволяют оценить значимость документов создаваемого корпуса как источников для истории русского языка и получить представление о нормах делового языка рассматриваемого исторического периода в среде донского казачества.

В качестве иллюстрации рассмотрим падежные формы имен существительных родительного и предложного падежей единственного числа (далее – Р. ед., П. ед.), дательного, творительного и предложного падежей множественного числа (далее – Д. мн., Т. мн., П. мн.).

Родительный и предложный падежи единственного числа. Наличие у существительных мужского рода вариантных окончаний -а/-я, -у/-ю в Р. ед. и окончаний -е, -у/-ю в П. ед. является хорошо известной и давней чертой русского языка. Они широко представлены в памятниках деловой письменности XVII и XVIII вв., что отмечается многими учеными (сошлемся здесь на книгу Н.И. Та-рабасовой, в которой учтены наблюдения А.А. Шахматова, С.И. Коткова, В.М. Маркова и других исследователей: [Тарабасова, 1986, с. 62–80]). Варианты Р. ед. и П. ед. подробно описаны в «Российской грамматике» М.В. Ломоносова, «Российской грамматике» А.А. Барсова с указанием лексических, словообразовательных, морфонологических, стилистических признаков их дифференциации [Ломоносов, 1755, с. 81–85; Барсов, 1981, c. 117–122, 437–442]. Н.А. Еськовой показано употребление этих форм в литературных произведениях XVIII в., отличающееся от современной нормы и свидетельствующее об их конкуренции [Еськова, 2008, c. 545–621]. Так называемые второй родительный и второй предложный с окончанием -у отражены в Национальном корпусе русского языка (далее – НКРЯ), где отмечается омонимия этих форм и формы дательного падежа единственного числа. Традиционно вариант на -у связывают с народно-разговорной традицией, однако С.И. Котков считал, что это черта всего русского языка, разговорного и литературного (см.: [Тарабасова, 1986, c. 74]). Материал документов изучаемого фонда подтверждает имеющиеся сведения об употреблении данных вариантов, однако количественный анализ словоформ позволяет дополнить их некоторыми наблюдениями.

Так, в Р. ед. в размеченных текстах у слова год существенно преобладает форма на - у (86 %). У слов полк , род , сыск , уезд , указ она является единственной. Сопоставление этих данных с данными НКРЯ (в подкорпусе 1734–1753 гг.) по состоянию на 25.10.2021 показывает в деловых текстах бóльшую частотность этой формы у слов род , сыск , полк и меньшую – у слов указ , уезд .

Формы П. ед. на -у в текстах немногочисленны и зафиксированы у слов круг, год, сыск. Отметим такую особенность, как употребление слова сыск только во втором предложном, в том числе с предлогом о, причем в одном случае, вероятно, под влиянием стоящей рядом формы сыску написана и форма поиску: велено о сыску и поиску бежавших ис крепости святые Анны [...] публиковать (д. 9, л. 38). Источники, преимущественно следственные документы, этого же периода в НКРЯ показывают распределение о сыске, но в сыску (хотя зафиксирован один случай употребления о сыску в работе В.Н. Татищева 1733 г.). Словоформа о сыску отмечается в памятниках деловой письменности XVII в., где П. ед. на -у, характерный для народно-разговорной речи, использовался довольно широко [Тарабасова, 1986, c. 76, 80]. Документы фонда в целом сохраняют эту особенность.

Дательный, творительный и предложный падежи множественного числа. Результаты морфологического анализа показали наличие вариантов форм Д. мн., Т. мн. и П. мн., нехарактерных для современного русского языка.

Для Д. мн. наряду с узуальным окончанием - ам /- ям отмечается также окончание - ом /- ем , восходящее к древнему продуктивному типу склонения на *о и свойственное большинству имен существительных мужского рода с окончанием - ъ /- ь (позднее – нулевым) в начальной форме. Как известно, оно постепенно вытеснялось формами на - ам /- ям под влиянием имен на *ā в результате унификации системы склонений. Однако, по наблюдениям Н.И. Тарабасовой, еще в XVII в. в деловых памятниках окончание - ом /- ем в Д. ед. в именах мужского рода преобладало, причем встречалось и под ударением, что позволяет видеть здесь не только орфографическую примету [Тарабасова, 1986, c. 97–107]. Грамматики М.В. Ломоносова и А.А. Барсова данный вариант Д. мн. не отмечают [Ломоносов, 1755, c. 69; Барсов, 1981, c. 128, 447– 448]; поиск в подкорпусе НКРЯ результатов также не дал.

Формы на - ом /- ем являются омонимичными формам творительного падежа единственного числа, и для соответствующих словоформ при морфологической разметке должны быть предусмотрены варианты грамматического разбора. Наличие Д. мн. на - ом характерно для существительных указ и атаман , что может быть интерпретировано по-разному. В первую очередь необходимо сказать, что в обоих словах окончание Д. мн. является безударным и в «акающих» донских говорах - ом и - ам фонетически не различаются.

Слово указ в размеченных документах встречается только в форме указом в сочетании с предлогом по ; данная конструкция регулярно используется для ссылки на постановляющие документы верховной власти, и ее можно рассматривать как устойчивую и воспроизводимую, в том числе орфографически; встречается она и в копиях высочайших указов.

Словоформа атаманом используется, как правило, в устойчивых формулах адресата атаманом и казакам , например в начальном протоколе войсковых грамот: От донских атаманов и казаков [...] станищнымъ атама-номъ и казакамъ обявляемъ (д. 1, л. 2; и др.). Результаты количественного анализа показывают, что вариантные формы представлены примерно в равных долях, но атаманом чаще встречается в ранних документах и со временем уступает место форме на - ам . Элементы формуляра войсковых грамот во многом продолжают традиции делопроизводства московских приказов и сохраняют некоторые обороты, устоявшиеся в деловой письменности.

Кроме того, образцами для войсковых и станичных писарей могли служить документы, поступавшие из вышестоящих учреждений. Так, высочайшие грамоты XVII–XIX вв. в адрес Войска Донского, собранные и опубликованные А.А. Лишиным, содержат аналогичную начальную формулу, в которой примерно до середины 1730-х гг. последовательно употребляется выражение донским атаманом и казаком, затем наблюдается регулярное атаманом и казакам, и примерно с середины 1750-х гг. – атаманам и казакам (Акты..., т. 1, с. 241, 246 и др.; т. 2, с. 132 и след.; т. 3, с. 728 и след.). Если форму казаком с ударным окончанием еще можно считать архаизмом (возможно, и в произношении) как чертой приказного языка, а при ней так могла восприниматься и атаманом, то в сочетании атаманом и казакам написание атаманом, вероятно, уже чисто орфографическое явление. Добавим также варианты написания окончания Д. мн. прилагательного в одном и том же документе: станищномъ атаманомъ и казакам (д. 8, л. 35) и станищ-нымъ атаманом и казакамъ (д. 8, л. 36 об.), где отражена нейтрализация противопоставления /ы/, /о/, /а/ в заударном положении, характерная для донских и некоторых других южнорусских говоров [Касаткин, 1999, c. 483– 485; Осипов, Гейгер, Рогожникова, 1993, c. 21– 22]. Таким образом, написание атаманом, скорее всего, определяется орфографической нормой, которая поддерживается документами центральных учреждений.

Формы Т. мн. имеют регулярные окончания - ами /- ями и - ми , что отражает общую норму литературного языка XVIII века. Однако в документах фонда у некоторых имен мужского рода и pluralia tantum встречаются также формы с окончанием - ы /- и , восходящие к древнему типу склонения на *о, например: с пожитки (д. 5, л. 3), всеми образы и меры (д. 5, л. 3 об.), с тремя человеки (д. 7, л. 11 об.), под немалыми штрафы (д. 8, л. 14). Конкуренция старой и новой форм была широко представлена в деловой письменности XVII в. [Тарабасова, 1986, c. 104–112]. М.В. Ломоносов в своей Грамматике вариант - ы /- и у имен данного типа склонения не отмечает [Ломоносов, 1755, c. 68–71, 76], однако А.А. Барсов пишет о ней как о довольно регулярной, хотя и имеющей некоторые лексические ограничения [Барсов, 1981, c. 129–130, 449]. Формы Т. мн. на - ы /- и вступают в отношения омонимии с формам родительного падежа единственного числа женского рода и именительного падежа множественного числа мужского и женского родов, предложного падежа имен среднего рода с мягким согласным в исходе основы; окончание - и свойственно нескольким падежным формам имен женского рода с нулевым окончанием, что также необходимо учитывать при автоматической разметке.

В размеченных документах окончание - ы /- и имеют единичные словоформы Т. мн. Из них всеми образы представляет собой устойчивый оборот, употребительный в языке XVIII в., о чем свидетельствуют данные НКРЯ. Окончание - ы , как показывает материал, появляется у заимствованного штраф , что в целом нехарактерно для языковой нормы. В выражении всеми образы и меры видим воздействие формы на - ы и на форму существительного женского рода, также наблюдавшееся в деловых памятниках XVII в. [Тара-басова, 1986, c. 105].

Предложный падеж множественного числа регулярно принимает окончания -ах/-ях, однако некоторые существительные употреб- ляются с окончанием -ех, исконным (с учетом фонетических изменений гласных) для имен древних типов склонения на *о и *1. Формы на -ех в деловых письменных памятниках XVII в. преобладали над словоформами с -ах и выступали в качестве узуальной нормы [Та-рабасова, 1986, c. 115], однако в XVIII в. их соотношение изменилось.

В документах Войска Донского середины XVIII в. окончание - ех является единственным для отдельных слов, например сбор , год , у большинства же существительных отмечается - ах /- ях . В источниках того же периода из НКРЯ у слова год наблюдаются варианты, причем преобладает форма на - ах (56 вхождений против 17), то же обнаруживается у слова место (516 случаев употребления форм на - ах против 54), у слова сбор – только форма на - ах . Грамматики М.В. Ломоносова и А.А. Барсова в П. мн. фиксируют единственное окончание - ах /- ях . Таким образом, документы фонда отражают в определенной степени узус деловой письменности предшествующего периода при явной тенденции к утверждению нормы - ах /- ях . Форма на - ех в парадигме имен существительных является уникальной и не вступает в отношение омонимии с другими формами.

Заключение

Морфологическая разметка части документов Войска Донского XVIII в. из фонда Михайловского станичного атамана Государственного архива Волгоградской области выявила наличие грамматических форм, нехарактерных для современного русского языка и, соответственно, необходимость корректировки программных инструментов разметки текстов в плане расширения возможных вариантов грамматического разбора омонимичных форм для последующего снятия омонимии вручную. Результаты количественного анализа фактов и их лингвистическая интерпретация показали в сфере грамматики, наряду с общими тенденциями развития и функционирования русского языка, особенности, характерные для деловой письменной речи в ее региональном варианте.

На примере падежных форм имен существительных обнаружено, что исследуемые региональные источники в большей степени сохраняют узус делового языка предшествующего исторического периода, нежели официальные документы центральных учреждений и тексты художественной литературы, публицистики и др. В формах родительного и предложного падежей единственного числа отличие наблюдается в лексическом распределении характерных для общерусского языка вариантов и в их частотности. В дательном, творительном и предложном падежах множественного числа отмечаются архаичные формы, вышедшие из общего употребления либо характеризующиеся меньшей частотностью в иных источниках.

Данные выводы имеют на сегодня предварительный характер и могут быть уточнены в результате расширения обработанных в процессе создания лингвистического корпуса текстов. Пока не представляется возможным сделать вывод о специфике выявленных особенностей для деловой письменной речи именно в среде донского казачества. Несмотря на это, полученные сведения подтверждают значимость документов Войска Донского как источников истории русского языка и актуальность представления их в корпусе для проведения исследований в этой области.

Список литературы Корпус архивных документов Войска Донского: проблемы морфологического анализа

  • Барсов А. А., 1981. Российская грамматика Антона Алексеевича Барсова. М.: Изд-во МГУ. 776 с.
  • Горбань О. А., Косова М. В., Шептухина Е. М., 2021. Структурная разметка деловых документов в диахроническом лингвистическом корпусе: проблемы и решения // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 20, № 4. С. 5–18. DOI: https://doi.org/10.15688/jvolsu2.2021.4.1
  • Горбань О. А., Косова М. В., Шептухина Е. М., Дмитриева Е. Г., Сафонова И. А., 2020. Документы Войска Донского XVIII века: лингвистическое описание и тексты. Волгоград: Изд-во ВолГУ. 464 с.
  • Еськова Н. А., 2008. Нормы русского литературного языка XVIII–XIX веков: Ударение. Грамматические формы. Варианты слов. Словарь. Пояснительные статьи. М.: Рукоп. памятники Древ. Руси, 2008. 960 с.
  • Касаткин Л. Л., 1999. Современная русская диалектная и литературная фонетика как источник для истории русского языка. М.: Наука: Шк. «Яз.рус. культуры». 526 с.
  • Комендантов А. С., Матвеев А. Г., Светлов А. В., 2019. Автоматизация морфологической разметки архивных документов // Математическая физика и компьютерное моделирование. Т. 22, № 4. С. 53–63. DOI: https://doi.org/10.15688/mpcm.jvolsu.2019.4.4
  • Ломоносов М. В., 1755. Российская грамматика Михайла Ломоносова. СПб.: Тип. Императ. Акад. наук. 210 с.
  • Ляшевская О. Н., Плунгян В. А., Сичинава Д. В., 2005. О морфологическом стандарте Национального корпуса русского языка // Национальный корпус русского языка: 2003–2005. Результаты и перспективы. М.: Индрик. C. 111–135.
  • Осипов Б. И., Гейгер Р. М., Рогожникова Т. П., 1993. Язык русских деловых памятников XV–XVIII вв.: Фонетический, орфографический и стилистический аспекты. Омск: Ом. ун-т. 96 с.
  • Савчук С. О., Сичинава Д. В., 2009. Корпус русских текстов XVIII века в составе Национального корпуса русского языка: проблемы и перспективы // Национальный корпус русского языка: 2006–2009. Новые результаты и перспективы / отв. ред. В. А. Плунгян. СПб.: Нестор-История. С. 52–69.
  • Сень Д. В., 2014. Архив Войска Донского и история войскового делопроизводства: актуальные вопросы изучения // Научное наследие профессора А.П. Пронштейна и актуальные проблемы развития исторической науки (к 95-летию со дня рождения выдающегося российского ученого): материалы Всерос. (с междунар. участием) науч.-практ. конф., г. Ростов-на-Дону, 4–5 апр. 2014 г. / отв. ред. М. Д. Розин, Д. В. Сень, Н. А. Трапш. Ростов н/Д: Фонд науки и образования. С. 484–495.
  • Тарабасова Н. И., 1986. Явления вариативности в языке московской деловой письменности XVII в. / отв. ред. С. И. Котков. М.: Наука. 164 с.
  • Филимонов Д. Ю., Светлов А. В., Горбань О. А., Косова М. В., Шептухина Е. М., 2020. Автоматизация процесса метаразметки архивных документов // Математическая физика и компьютерное моделирование. Т. 23, № 4. C. 56–68. DOI: https://doi.org/10.15688/mpcm.jvolsu.2020.4.6
  • Segalovich I., 2003. A Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine // Proceedings of the International Conference on Machine Learning: Models, Technologies and Applications. LasVegas: CSREAPress. P. 273–280.
Еще
Статья научная