Структурная разметка деловых документов в диахроническом лингвистическом корпусе: проблемы и решения
Автор: Горбань О.А., Косова М.В., Шептухина Е.М.
Журнал: Вестник Волгоградского государственного университета. Серия 2: Языкознание @jvolsu-linguistics
Рубрика: Главная тема номера
Статья в выпуске: 4 т.20, 2021 года.
Бесплатный доступ
Актуальность исследования определяется необходимостью проведения структурной разметки документов Войска Донского середины XVIII в., отложившихся в фонде Михайловского станичного атамана Государственного архива Волгоградской области (ГАВО, ф. 332, оп. 1), с целью создания лингвистического корпуса. Авторами охарактеризованы проблемы осуществления структурного деления текста документов фонда, обусловленные спецификой формуляра, динамикой жанров и особенностями синтаксиса деловой речи середины XVIII столетия, выявлено, что сложность членения документного текста зависит от степени его нарративности. Мотивирован выбор в качестве единицы разметки структурно-смыслового сегмента, объединенного микротемой, совпадающего с предложением или представляющего собой цепь тесно связанных предложений. Обоснована комплексная методика членения документов для их структурной разметки, базирующаяся на жанровой параметризации документов и их синтаксической сегментации. Установлено, что показателями границ сегментов могут выступать в совокупности графические символы, речевые формулы, выполняющие функции реквизитов, лексико-грамматические средства. В результате исследования показано, что совокупность ряда процедур по сегментации текста, ориентированных на жанровую и речевую организацию документа, позволяет представить в диахроническом корпусе необходимую и достаточную для пользователя информацию о свойствах текста документа и его единиц.
История русского языка, документ, Войско Донское, лингвистический корпус, структурная разметка, жанр, членение текста.
Короткий адрес: https://sciup.org/149138083
IDR: 149138083 | DOI: 10.15688/jvolsu2.2021.4.1
Текст научной статьи Структурная разметка деловых документов в диахроническом лингвистическом корпусе: проблемы и решения
DOI:
Одной из актуальных задач языкознания в настоящее время стало создание лингвистических корпусов, что предполагает определение принципов представления источников в электронном формате, способов разметки текстов документов, выбор программных средств их машинной обработки и реализации в электронно-поисковой системе.
Рассмотрение этих и других вопросов применительно к диахроническим корпусам сопряжено с рядом дополнительных трудно- стей, обусловленных спецификой исторических источников, их языка и связанных в первую очередь со структурной разметкой, для проведения которой нужно обосновать процедуру сегментации текста, то есть его членение на необходимые и достаточные сегменты, релевантные для компьютерной обработки текста, позволяющие пользователю определить лексические, грамматические и иные свойства изучаемых единиц. Цель настоящей статьи – представить методику сегментации текстов деловых документов середины XVIII в. для их структурной разметки.
Материал и методы
Реализуемый в Волгоградском государственном университете проект, некоторые результаты которого отражены в данной статье, направлен на создание лингвистического корпуса официальных документов XVIII–XIX вв. Войска Донского, отложившихся в фонде Михайловского станичного атамана Государственного архива Волгоградской области (ГАВО, ф. 332, оп. 1). Фонд включает 158 единиц хранения, содержащих документы 1734– 1836 годов. Это подлинники, копии, дубликаты, черновики документов разных жанров. Специфика машинной обработки текстов определяется особенностями этих документов.
Структурная разметка предполагает деление текста на главы, абзацы, предложения. Сложности такой сегментации связаны с особенностями построения и синтаксической организации текстов документов середины XVIII века.
Построение текста документа во многом обусловлено его жанровой принадлежностью. Поэтому первоочередной задачей является идентификация жанра документа, что в современном документе возможно сделать с опорой на его формуляр, то есть набор реквизитов. Однако в исторических документах реквизиты, как правило, графически не выделены, у многих документов отсутствует самоназвание, а динамика жанров ослабляет их релевантные признаки. Как отмечает И.С. Герасимова, объемно-прагматическое членение текстов документов в этот период только формируется, в целом же они «представляют собой нерасчлененное единство с тесными когезивными связями» [Герасимова, 2020, с. 4–5] (см. также: [Герасимова, 2019]).
Композиционно исторические документы, вследствие свойственной им тенденции к стандартизации, однотипны в рамках одного жанра, что позволяет использовать методику параметризации текста, представляющую параметры жанра в виде модели.
Вопрос о жанрах является одним из дискуссионных в науке. Существуют разные подходы к их изучению – традиционный (связанный с исследованием жанров художественной литературы), функциональный, коммуникативно-дискурсивный, когнитивный [Ильинова
2006, с. 10–11]; предлагаются различные их классификации и методы установления жанровой принадлежности [Белоконева, 2011; Гальперин, 2007; Косова, 2015; Плигина, 2012; Ромашова, 2014; Стилистический энциклопедический словарь..., 2006, с. 56–88], в том числе на историческом материале [Качалкин, 1988; Трофимова, 2002; и др.].
Описание жанра через моделирование уже используется в лингвистике. В частности широко известна модель речевого жанра, представленная в работах Т.В. Шмелевой (см., например: [Шмелева, 1997]). Исследователь выделяет семь конститутивных признаков, учитывая экстралингвистические факторы, которые влияют на формирование речевого жанра. Все перечисленные признаки находят свое выражение в языковых единицах.
По отношению к документному тексту эта модель получила уточнение [Горбань и др., 2016]: предложена типовая модель жанра документного текста, основу которой составляют такие параметры, как «функция», «адресант», «адресат», «характер передаваемой информации (информация)», «структура», «модальность», «пространство», «время», которые взаимодействуют между собой, и это взаимодействие не линейное, а многовекторное и разноплановое.
Модель отражает, во-первых, связи параметров, которые могут быть обязательными, сильными (например, связь параметров «адресант», «адресат» и «функция», «функция» и «информация», «информация» и «структура», «пространство» и «время», «информация» и «пространство») и факультативными, слабыми (например, связь параметров «адресант», «адресат» и «пространство», «структура» и «время», «функция» и «пространство»), а также прямыми и опосредованными; во-вторых, иерархию параметров (в документах мы выделяем 3 уровня иерархии, определяющие значимость параметров как жанрообразующих элементов) [Косова, 2017].
Параметрами первого уровня иерархии являются «адресант», «адресат» и «функция»; ко второму уровню относятся параметры «информация», «структура» и «модальность»; к третьему – «пространство» и «время». Жанрообразующими представляются параметры первого уровня: функция документа, особен- ности субъектов коммуникации – их интенции, социальный статус – детерминируют характер передаваемой информации, организующую композиционно-содержательную структуру текста и доминирующую модальность.
Таким образом, параметризация текста, предполагающая оценку совокупности параметров, их специфики и речевой репрезентации, позволяет идентифицировать жанровую принадлежность документа, которая в общем виде определяет структуру текста, в первую очередь его композицию и формуляр, образуемый реквизитами или речевыми единицами, выполняющими функции реквизитов. Эти речевые единицы могут быть различной длины – от одного слова до предложения, и в наши задачи входит выделение таких единиц.
Структурное членение текста документа осуществляется также посредством синтаксической сегментации.
Определяя единицу сегментации, мы принимаем во внимание тот факт, что однозначно установить границы предложений в текстах середины XVIII в. не всегда представляется возможным. Это обусловлено, с одной стороны, непоследовательным употреблением знаков препинания, их полифункциональностью, отсутствием единого знака, маркирующего границу предложения, а с другой – синтаксическими особенностями письменной речи.
Среди синтаксических особенностей литературного языка XVIII в., в том числе делового языка, который формировался как один из функциональных стилей, исследователи отмечают значительную длину предложения и периода, активность разнообразных осложняющих конструкций; разнообразие и неорганизованность синтаксических форм, вызванную борьбой старых и новых норм, смешением книжных и разговорных элементов, влиянием иностранных языков; синтаксическую и семантическую контаминацию, недиф-ференцированность приемов сочинения и подчинения, нагромождение союзов, свидетельствующее о логической нерасчлененности речи; идущую от разговорной речи «неорганическую фразу» (А.И. Горшков), незамкнутую, открытую, с отступлениями, и др. (см.: [Виноградов, 1982, с. 71–72, 77; Горшков, 1982, с. 44–58; Синтаксический словарь..., 2017, с. 12–20, 37–51; и др.]).
Эти особенности отмечены и в нашем материале, в том числе:
– характерное для старого делового языка «нанизывание» при помощи союзов и, а, да, но тесно связанных по смыслу предложений, включавших также подчинительную связь, например, доношение:
В проеsдъ его высокородия господина воис-коваго атамана Данила Ефремовича чрезъ нашу станицу и мы покорн h ишия ω живших в нашеи станицы б h s опр h деления sа н h которыми имеющими их невоsможностми представляли а на пред сег ω ω ные случившимъ здесь ω т Воiска Донскаг ω старшинам для пер h песеи были явл h ны токмо sа покаsаниями их и его высокородие при доношени прикаsал намъ покорн h ишим их прислать для рас-мотрения в Черкаск ω и а sа невосможностии их в книги не включены которые по тому прикаsу его высокородия н(ы)н h от нас покорн h иших к вашему высокоблагородию и Воиску Донскому посланы, а допросные их речи при семъ нижаишим данош h ни при ω бщенны (ГАВО, ф. 332, оп. 1, д. 6, л. 7–7 об.), здесь наблюдается цепь предложений с союзами и и а (употребление первого союза и не представляется обоснованным), одно из предложений содержит придаточное определительное с союзным словом которые ;
– контаминация сочинительных и подчинительных союзных средств, например, доношение:
а понеже онои Чеботаревъ s женою i з дет-ми ... въ прошълом 744м году проданъ нам ... но точию по покупке по согласию нашему с Савелемъ Маргуновым те наши купленныя крестяны между нами разделены (ГАВО, ф. 332, оп. 1, д. 8, л. 3–3 об.), в этом фрагменте отмечается логически неоправданное одновременное употребление подчинительного союза понеже и сочинительного но ;
– нагромождение союзов, объединение конструкций в смысловой комплекс как различными, так и однотипными формами связи, например, паспорт:
ωбявители сего Михаиловскωи cтаницы коsаки Маkимъ Пахомовъ Петръ Деменковъ кои посланы от нас станишного атамана Мирона Де-жемесова стариков и коsаковъ в Казловъ для отвозу вывезенногω с Кубани ис полону города Казлова аднадворческаго сына Акима Никити- на по силе присланнаго к намъ от господина во-исковаго атамана Данила Ефремовича и от всего Воиска Донскаго пашпорта с такимъ ωбявлhниемъ чтоб намъ станицаю отправить ево в реченнои городъ Казловъ по которому онъ со ωбявленными коsаками и отправленъ, для пропуску от помянутого господина воисковаго атамана Данила Ефремовича за рукою и sа войсковою печатью ис канцеляри воисковых делъ данъ ωному пленному ωсобливои пашпортъ которои у негω и содержитца (ГАВО, ф. 332, оп. 1, д. 4, л. 3–3 об.), здесь использованы придаточные определительные (союзное слово который повторяется или заменяется синонимичным кои) и обстоятельственное цели.
Эти и другие черты синтаксиса затрудняют членение текста на отдельные предложения, что объясняет отказ от предложения как основной единицы сегментации. В связи с этим за единицу членения в исследуемых документах предлагается принять структурно-смысловой сегмент, объединенный микротемой (см.: [Герасимова, 2020, с. 5]); это может быть предложение либо цепь тесно связанных предложений – сложное синтаксическое целое (ССЦ); кроме того, необходимо учитывать и особенности строения документного текста, определяемые формуляром; иногда весь текст синтаксически представляет собой одну единицу, то есть один сегмент (см. далее характеристику реестра).
Показателями границ таких сегментов могут выступать: графические символы (например, знаки препинания); речевые формулы, выполняющие функцию реквизитов; лексико-грамматические единицы.
Графические символы . В некоторых документах одного жанра прослеживается соответствие графических символов (точка, запятая, точка с запятой, двоеточие, косая черта, комбинация двоеточия и косой черты и др.) границе предложения. Например, доношение:
и чтоб намъ всепокорнhишимъ с получения ωбявлhннои вашеи воисковои грамоты на полномъ нашемъ станищномъ sборе достоверную справу воsыметь и с помянутого коsака Шишкина допросъ по присяжнои должности взять а прислатъ къ вашему высокоблагородию и всему Воиску Донскому при станищном нашемъ доношени в непродалжителном врhмяни :/ (ГАВО, ф. 332, оп. 1, д. 6, л. 3) 2;
войсковая грамота:
и требовано тою промемориею чтоб за ведомое держание вышеписанныхъ б h глых рекрутов Серг h ева, i θ илипова с показанныхъ казаковъ взыс-кавъ по указу штрафные денги отослать куда надлежит :/ (ГАВО, ф. 332, оп. 1, д. 6, л. 8 об.).
Однако гораздо чаще представлены случаи, когда графический символ не является маркером предложения:
доношение:
Высокоблагороднному i высокопочтhнному господину Воиска Донскаго воисковому накаsному атаману Степану Даниловичю и всему Воиску Донскому :/ покорнhишhе доношение (ГАВО, ф. 332, оп. 1, д. 6, л. 7), знак «:/» в заголовке отделяет название документа от имени адресата;
войсковая грамота:
и ежели по отводе наидитца :/ то поsволяется тhбh у помянутых каsаковъ то село ... вsять (ГАВО, ф. 332, оп. 1, д. 3, л. 4), знак «:/» разделяет части сложноподчиненного предложения;
паспорт:
чего ради имъ коsакам Пахомову Деменко-ву данъ от насъ = сеи пашпортъ с приложением станишн ω и печати (ГАВО, ф. 332, оп. 1, д. 4, л. 4), постановка знака «=» не связана со структурой предложения, вероятно, он отмечает конец строки.
Речевые формулы, выполняющие функции реквизитов . Как маркеры сегментов текста нами рассматриваются реквизиты и/или речевые формулы, выполняющие функцию реквизитов. В некоторых документах, особенно новых для XVIII в. жанров, реквизиты графически отделены от текста: название документа (посередине отдельной строки), дата (отдельная строка слева под текстом), подпись / адресант (отдельная строка / строки справа под текстом). При этом речевые формулы могут представлять собой завершенные предложения либо не являться таковыми, однако во всех подобных случаях они рассматриваются как отдельные сегменты. Приведем примеры:
реестр:
Реэстръ нашеи Михаиловскщи станицы коsакамъ которые ко отставе отчислhнны (ГАВО, ф. 332, оп. 1, д. 6, л. 1) – название, дополненное информацией о содержании документа;
доношение:
О семъ доносит вашему высокоблагородию и всему Воиску Донскому Михаиловскои станицы атаман Трифон Калинен старики i всеи станицы коsаки (ГАВО, ф. 332, оп. 1, д. 6, л. 7 об.) – указание на адресанта;
войсковая грамота:
Получена актебря 4 дня 1750 году (ГАВО, ф. 332, оп. 1, д. 6, л. 8) – отметка о получении;
доношение и некоторые другие документы:
Июля 24 дня 1750 году (ГАВО, ф. 332, оп. 1, д. 6, л. 7 об.) – дата.
Возможны ситуации, когда данные элементы синтаксически объединены между собой. Так, название документа, вынесенное в позицию заголовка, может быть связано с формулой адресата:
Благородннымъ и почт h нным господам
Воиска Донскаг ω старшинамъ
Афонасью Филиповичю, Андрею
Степановичу всепокорнhишhе доношение (ГАВО, ф. 332, оп. 1, д. 7, л. 3)3.
В таких случаях мы рассматриваем подобные единицы как один сегмент.
В ряде документов стандартные речевые формулы включают несколько элементов, соотносимых с реквизитами, представляя собой связанные предложения и не выделяясь графически из текста. Такие типовые формулы мы также принимаем за самостоятельные сегменты. Например:
войсковая грамота:
Oт донских атаманов и казаков от воискового определенного до указу атамана Ивана Ивановича сына θролова и от всего Воиска Донскаго по Хопру от Букановскои до Михайловскоi станицъ ста-нищнымъ атаманомъ и каsакамъ обявляемъ (ГАВО, ф. 332, оп. 1, д. 1, л. 2) – указание на адресанта и адресата документа, оформлено как предложение;
писана в Черкаскомъ 1735 году генваря 17го дня (ГАВО, ф. 332, оп. 1, д. 1, л. 2) – указание на место и дату создания документа, оформлено как предложение;
паспорт:
данъ в Черкаскомъ декабря дня 1753 году (ГАВО, ф. 332, оп. 1, д. 9, л. 45 об.) – указание на место и дату создания документа, оформлено как предложение.
Лексико-грамматические единицы . К таким единицам, выступающим в качестве маркеров границы сегментов, относятся глагольные формы в перформативной функции, некоторые союзные (связочные) средства.
Например, глаголы-перформативы: войсковая грамота:
T донских атаманов и каsаков от господина воисковог ω атамана Степана Даниловича и от всего Воиска Донскаго по Хопру Михаиловскои станицы станищному атаману и каsакамъ обявляемъ (ГАВО, ф. 332, оп. 1, д. 9, л. 43);
доношение:
на оное вашему высокоблагородию и всему Воиску Донскому всепокорн h ише доносимъ (ГАВО, ф. 332, оп. 1, д. 6, л. 3 об.).
В приведенных примерах глагольные формы сигнализируют о том, что далее начинается следующий блок информации.
Союзные средства:
паспорт:
сего ради и сеи пашпортъ взявъ у него иметь в станищном б h режениї (ГАВО, ф. 332, оп. 1, д. 9, л. 45 об.);
чего ради имъ коsакам Пахомову Деменкову данъ о т насъ = сеи пашпортъ с приложение м станишн ω и печати (ГАВО, ф. 332, оп. 1, д. 4, л. 4);
войсковая грамота:
Того ради приказали мы Воискомъ Донскимъ послат(ь) к вамъ станищнымъ атаманамъ и каза-камъ сию нашу воисковую грамоту (ГАВО, ф. 332, оп. 1, д. 9, л. 34 об.);
i какъ сия наша войсковая грамота вами Ми-хаиловскою станицею получена будет и вамъ ста-нищному атаману и казакамъ об ономъ ведатъ; и по вышеписанному учинит непременное исполнение (ГАВО, ф. 332, оп. 1, д. 6, л. 8 об.–9);
реестр:
и кто iменно о томъ sначит ниже (ГАВО, ф. 332, оп. 1, д. 8, л. 22).
Речевые формулы показывают переход от изложения предшествующих событий к распорядительной части, предписанию вытекающих из этого необходимых действий ( сего ради , чего ради ) или к усилению обязательности этих предписаний ( и какъ сия грамота ...) (об интенсификации предписаний см. [Дмитриева, 2016]), вводят последующий перечень.
Однако следует учитывать, что лексикограмматическая единица может как маркировать границы сегмента, например сочетание того ради в приведенном выше примере из войсковой грамоты, так и выполнять функцию союза в сложном предложении, например в паспорте, когда используется синтаксическая конструкция, имеющая союз того ради , включенный в состав сложного союза понеже... того ради :
Понеже обявителъ сего Михаиловскои станицы каsакъ Iванъ Григоревъ находился здес для не-котораго дела ï ныне отпущенъ в дом ево по прежнему того ради от Черкаскаго в ведомстве Воиска Донскаго по станицам да Михаиловскои станицы ω ному каsаку Григореву чинит[ь] свободнои про-пускъ без sадержания а Михаиловскои станицы ста-нишному атаману ω б отпуске ево ведать iз с прибытия вsяв у него сеи пошпортъ при [ре]порте при-слат к Воиску Данскому немедленъно (ГАВО, ф. 332, оп. 1, д. 8, л. 39).
Если указанных выше маркеров в тексте документа нет, то мы опираемся на структурно содержательную организацию сегмента, свойственную определенному жанру, и выделяем композиционно-содержательные части (КСЧ) текста, учитывая названные выше синтаксические особенности документов того времени.
Для структурной разметки текста имеет значение степень его нарративности. Понимание нарратива в науке разнится и зависит от направления исследования и области, в которой оно выполнено, однако традиционно нарратив трактуется как повествование, как текст, представляющий определенную последовательность событий [Шейгал 2007, с. 86–87; Шмид, 2003], как «история / фабула (основание нарратива, позволяющее отличать нарративные тексты от ненарративных) + сюжет (текст / дискурс + нар-рация)» [Троцук, 2004, с. 59]. В качестве признаков, отличающих нарративные тексты от ненарративных, исследователи называют также присутствие автора и действующих лиц, целостность, ориентирование относительно места и времени, как правило, прошедшего, временную организацию событий, проявляющуюся в грамматической структуре предложений, завершение повествования (финал) и отнесение его к моменту протекания действия и др. (см., например: [Теребков, 2012, с. 117]).
Степень нарративности текста связана с видом документа. Так, в информирующих документах нарративный компонент занимает значительное место, следствием чего является объемность, развернутость текста с соответствующими синтаксическими чертами. В учетных документах связный текст, как правило, представлен одним – двумя предложениями.
Таким образом, при анализе текста исторического документа в процессе его разметки с целью синтаксического членения мы исходим из того, что композиционно-содержательная структура текста обусловлена жанром документа, его функцией, а также особенностями синтаксической организации текста.
В качестве материала для анализа в данной статье используются опубликованные документы фонда. Применение описанной методики покажем на примере документов, тексты которых имеют разную степень нарратив-ности, в частности: доношение (высокая степень), паспорт (средняя степень), реестр (отсутствие нарратива).
Результаты и обсуждение
Документы высокой степени нарра-тивности (доношение). По своей основной функции доношения являются информирующими или просительными документами и адресованы вышестоящей инстанции – должностному лицу или органу управления. Они разнообразны по содержанию и касаются различных вопросов жизни станицы, но чаще включают сообщения по следственным делам о розыске беглых.
Доношение содержит следующие структурно-содержательные компоненты: адресат, адресант, наименование документа, изложение обстоятельств дела («мотивирующая» часть), определение по существу дела (собственно требуемая информация по делу).
Мотивирующая часть включает обычно более или менее развернутое изложение событий, которые предшествовали составлению документа, – пересказ источника, на основании которого составляется ответ или отчет об исполнении, изложение обстоятельств, которые служат основанием для просьбы, и т. д. Эта часть, а также определение по существу дела представляют собой связные тексты, которые могут требовать синтаксического членения при разметке корпуса (подробно о жанре до-ношения см.: [Горбань, 2019; Сафонова, 2017]).
На примере одного из доношений покажем возможную сегментацию 4 с учетом композиционно-содержательной и синтаксической организации текста для представления документа в корпусе (см. табл. 1).
Документы средней степени нарра-тивности ( паспорт ) . Паспорт выполнял информативно-распорядительную функцию. Это документ, который информировал адресата о цели поездки казака (или казаков) и содержал распоряжение (предписание) о том, чтобы на пути следования по станицам Войска Донского предъявителю документа не чинили препятствий.
Композиционно-содержательная структура текста документа организует информацию, закрепляя в определенном порядке содержательные части: основной текст и речевые формулы, соответствующие реквизитам «дата», «место составления документа», «отметка о печати» (см., например: [Косова, 2019]).
Анализ паспортов, хранящихся в фонде, позволил установить два варианта композиционно-содержательной структуры основного текста. Для иллюстрации сегментирования возьмем один из вариантов структуры, который реализуется чаще. В таком паспорте одна КСЧ представляет собой синтаксическую конструкцию, выражающую распоряжение по поводу события, суть которого раскрывается здесь же. Самостоятельными синтаксическими единицами являются речевые формулы, соответствующие реквизитам (дата, место и др.) (см. табл. 2).
Документы, не содержащие нарративных фрагментов (реестр). Основная функция реестра – регистрационно-информативная: он не сообщает о событиях, а фиксирует наличие тех или иных объектов в виде перечней лиц, предметов и т. д. и, наряду с ведомостями, описями и др., относится к так называемым учетным документам (подробно об учетных документах см.: [Горбань, 2021]).
По своей композиционно-содержательной структуре реестры являются, как правило, двухчастными: они включают заголовок и собственно перечень, иногда имеется третья часть, содержащая итоговые количественные данные. Пример сегментации реестра представлен в таблице 3.
Несмотря на видимую композиционную и синтаксическую членимость, такие реестры признаем целесообразным представлять в корпусе как единое целое, поскольку текст реестра без заголовка, вводной фразы и, соответственно, соотнесенности с именем нарицательным ( коsачьим ) д h тям является бессодержательным.
Сегментирование аналогичных документов более сложной структуры, в которых, например, имена в перечне сгруппированы по тем или иным категориям или сопровождаются каким-либо комментарием, может осуществляться иначе.
Заключение
Таким образом, жанровая, структурносодержательная (сочетание тенденций к связности, с одной стороны, и выделению некоторых элементов-реквизитов из связного текста – с другой) и синтаксическая специфика исторических документов определяет одно из возможных решений проблемы структурной разметки при создании лингвистического корпуса.
Совокупность ряда исследовательских процедур, учет графических средств, лексикограмматических единиц и других речевых маркеров структурно-содержательных частей текста в соотнесенности с его жанровой принадлежностью позволит представить в диахроническом корпусе необходимую и достаточную для пользователя информацию о свойствах текста документа и использованных в нем языковых единиц.
Таблица 1. Структурная разметка доношения
Table 1. Structural markup of report
Сегментированный текст (ГАВО, ф. 332, оп. 1, д. 6, л. 3–4) |
Композиционно-содержательная и синтаксическая характеристика сегмента |
Высокоблагороднному i высокопочтенному господину Воиска Донскаго воисковому накаsному атаману Степану Даниловичю i всему Войску Донскому :/ всепокорн h ишее доношение Сего 1750 году июня 30 дня получили мы всепокорн h ишия от вашегω высокоблагородия и всего Воиска Донскаго воисковую грамоту в присланнои къ вашему высокоблагородию и всему Воиску Донскому иs государственнои военнои колл h ги канторы ЕЯ IМПЕРАТОРСКОГО ВЕЛИЧЕСТВА в каторои покаsано явился б h глои р h крутъ s доношением собою 3ахар Яковлев Хиронов которои в рекруты взятъ былъ тому дватцать седмои год и быв в р h крутах месяца з два б h жал и в б h гах жителство имел в раsных коsачьих городках в томъ числе в нашеи станицы у коsака Л h онтия Шишкина полгода неsаведома что б h глои р h крутъ и чтоб намъ всепокорн h ишимъ с получения ωбявл h ннои вашеи воисковои грамоты на полномъ нашемъ станищномъ sборе достоверную справу воsыметь и с помянутого коsака Шишкина допросъ по присяжнои должности взять а прислатъ с къ вашему высокоблагородию и всему Воиску Донскому при станищном нашемъ доношени в непродалжителном вр h мяни :/ на оное вашему высокоблагородию и всему Воиску Донскому всепокорн h ише доносимъ пр h дписанную вашу воисковую грамоту на полномъ нашемъ станищномъ sборе читали и по им h ннымъ нашимъ спискамъ достоверною справку им h ли и по справке у нас в станиц h имелся коsакъ Л h онт h и Шишкин которои въ 73 годъ умре о семъ даносит Михаиловскои станицы стонищнои атоман А x енъ Лащилинъ |
Речевая формула, выполняющая функцию реквизитов «адресат» и «наименование документа» (заголовок) КСЧ, начало мотивирующей части (сложноподчиненное предложение с перформативом в придаточной части, вводящим содержание инициирующего документа) КСЧ, пересказ содержания инициирующего документа; предшествующее событие, обусловившее принятие решения (сложное предложение с последовательным подчинением и однородными сказуемыми в первом придаточном) КСЧ; продолжение пересказа содержания инициирующего документа (придаточное предложение цели с союзом чтоб ( ы ) и союзом и , который можно рассматривать как соединяющий однородные придаточные, однако предыдущая синтагма таковым придаточным предложением не является либо пропущен вводящий ее союз что ; если трактовать и как начинательный союз самостоятельного предложения, продолжающего содержание документа, то союз чтоб ( ы ) оказывается синтаксически не связанным) КСЧ, ответ на запрос (простое предложение с перформативом) КСЧ, ответ на запрос (цепь предложений – простого с однородными сказуемыми и сложноподчиненного, связанных союзом и , который можно трактовать как сочинительный союз в сложном предложении с разными видами связи, либо как начинательный союз самостоятельного предложения; в зависимости от этого синтагму «предписанную… умре» можно представить как одну или разделить на две) Речевая формула, выполняющая функцию реквизита «адресант» (простое двусоставное предложение) |
Таблица 2. Структурная разметка паспорта
Table 2. Structural markup of passport
Сегментированный текст (ГАВО, ф. 332, оп. 1, д. 8, л. 32) |
Композиционно-содержательная и синтаксическая характеристика сегмента |
Обявителем сего реки Хопра Михаиловскои станицы каsакам Якову Сокину Михаиле Лабанову Михею Плетневу которые привозили сюда порутъчика Башкина крестьянъ и по приняти оных мн h отпущены в домы их по прежнему в ведомстве Воиска Данскаго по станицам до их станицы чинит им свободнои про-пускъ б h -sадержания: а покаsаннои Михаиловскои станицы станищному атаману и каsакам ωб отпуске их ведать и с прибытия их в станицу вsяв у них сеи пашпортъ прислат к нам Воиску Данскому при вашем репорте немедленъно: дан в Черкаском маия 26г(о) дня 1753г(о) году. у сего пашпорта наша Воиска Донс[каго] печатъ:/ |
КСЧ, распоряжение станичным атаману и казакам с описанием причины (сложная синтаксическая конструкция с сочинением (союз а ) и подчинением (придаточное определительное с союзным словом который ); знак двоеточия не является обязательным) Речевая формула, выполняющая функцию реквизитов «место составления документа» и «дата» Речевая формула, выполняющая функцию реквизита «отметка о печати» |
Таблица 3. Структурная разметка реестра
Table 3. Structural markup of inventory
Сегментированный текст (ГАВО, ф. 332, оп. 1, д. 7, л. 4 об.) |
Композиционно-содержательная и синтаксическая характеристика сегмента |
реэстръ невыросткам коsачьим д h тям о том значит ниже Апифанъ Гар h лкинъ […] h Б h sбародов Фрол Ворафанов Ефим Матарыгинъ Антонъ Наsаров Григореи Тапилин Петръ Тр h тин Устинъ Капинъ <…> |
Реквизит «заголовок» (номинативное предложение) КСЧ, маркер начала перечня (можно выделить как самостоятельное предложение, однако местоимение о том и наречие ниже обеспечивают тесную связь с заголовком и последующим фрагментом текста и без них имеет смысловую недостаточность) КСЧ, собственно перечень имен собственных (имена, которые можно рассматривать как однородные члены предложения или однородные номинативные предложения, соединенные бессоюзной связью) |
Список литературы Структурная разметка деловых документов в диахроническом лингвистическом корпусе: проблемы и решения
- Белоконева К. А., 2011. К проблеме жанровости-левой принадлежности документного текста // Вестник Волгоградского государственного университета. Серия 2, Языкознание. № 2 (14). С. 148–153.
- Виноградов В. В., 1982. Очерки по истории русского литературного языка XVII–XIX веков. М. : Высш. шк. 529 с.
- Гальперин И. Р., 2007. Текст как объект лингвистического исследования. 5-е изд., стереотип. М. : КомКнига. 144 с.
- Герасимова И. С., 2019. Средства организации связности в региональных удостоверительных документах середины XVIII века // Вестник Балтийского федерального университета им. И. Канта. Серия: Филология, педагогика, психология. № 3. С. 65–71.
- Герасимова И. С., 2020. К вопросу о членимости текстов документов середины XVIII века (на материале архивного фонда «Михайловский станичный атаман») // Документ как текст культуры : сб. науч. тр. Тула : С-Принт. Вып. 13. С. 4–9.
- Горбань О. А., 2019. Доношения и рапорты донских казаков в середине XVIII в.: источниковедческий анализ // Вестник Волгоградского государственного университета. Серия 4, История. Регионоведение. Международные отношения. Т. 24, № 4. С. 45–59. DOI: https:// doi.org/10.15688/jvolsu4.2019.4.4.
- Горбань О. А., 2021. Учетные документы Войска Донского в XVIII веке: содержание и структура текстов // Научный диалог. № 2. С. 28–47. DOI: 10.24224/2227-1295-2021-2-28-47.
- Горбань О. А., Ильинова Е. Ю., Косова М. В., Шептухина Е. М., 2016. Жанровые особенности войсковых грамот середины XVIII в. (по материалам архивного фонда «Михайловский станичный атаман») // Известия Уральского федерального университета. Серия 2, Гуманитарные науки. Т. 18, № 4 (157). С. 182–199. DOI: 10.15826/izv2.2016.18.4.074.
- Горшков А. И., 1982. Язык предпушкинской прозы. М. : Наука. 241 с.
- Дмитриева Е. Г., 2016. Указание на интенсивность признака как средство характеристики в деловых текстах XVIII в. // Научное наследие В.А. Богородицкого и современный вектор исследований Казанской лингвистической школы. В 2 т. Т. 1 : тр. и материалы Междунар. конф. (г. Казань, 31 окт. – 3 нояб. 2016 г.) / под общ. ред. К. Р. Галиуллина, Е. А. Горобец, Г. А. Николаева. Казань : Изд-во Казан. ун-та. С. 120–125.
- Ильинова Е. Ю., 2006. Когнитивный аспект жанрового пространства текста // Научный Вестник Воронежского государственного архитектурно-строительного университета. Серия: Современные лингвистические и методико-дидактические исследования. Вып. 6. С. 9–17.
- Качалкин А. Н., 1988. Жанры русского документа допетровской эпохи : в 2 ч. М. : МГУ. Ч. 1 :
- Источники изучения и вопросы авторства документа. 119 с. ; Ч. 2 : Филологический метод анализа документа. 107 с.
- Косова М. В., 2015. Параметры речевого жанра как модель документного текста // Научные исследования и разработки. Современная коммуникативистика. Т. 4, № 6. C. 16–19. DOI: 10.12737/16551.
- Косова М. В., 2017. Динамика жанровых параметров региональных документов ХVIII века // Текст в языке, речи, культуре : сб. науч. ст. Минск : РИВШ. С. 123–134.
- Косова М. В., 2019. Жанровые параметры паспорта середины XVIII в. (по материалам архивного фонда «Михайловский станичный атаман») // Вестник Волгоградского государственного университета. Серия 2, Языкознание. Т. 18, № 2. С. 6–15. DOI: https://doi.org/ 10.15688/ jvolsu2.2019.2.1.
- Плигина Е. С., 2012. Корпус PR-текстов: эволюция системы жанров // Медиареальность информационного общества : материалы Междунар. науч.-практ. конф. студентов, магистрантов и аспирантов, посвящ. 15-летию Ин-та телевидения, бизнеса и дизайна
- (г. Санкт-Петербург, 6–7 дек. 2012 г.) / под ред. Н. А. Гуторовой. СПб. : Астерион. С. 40–42.
- Ромашова О. В., 2014. Жанрово-стилевая специфика медицинского документа (на материале медицинской карты стационарного больного) // Мир науки, культуры, образования. № 5 (48). С. 127–130.
- Сафонова И. А., 2017. Структурные и речевые особенности доношений XVIII века (на материале архивного фонда «Михайловский станичный атаман») // Документ как текст культуры : сб. науч. тр. Тула : Тул. произв. полиграф. об-ние. Вып. 9. С. 48–52.
- Синтаксический словарь русской поэзии XVIII века. В 4 т. Т. 1. Кантемир, Тредиаковский, 2017 / под ред. Н. В. Патроевой. СПб. : Дмитрий Буланин. 576 с.
- Стилистический энциклопедический словарь русского языка, 2006 / под ред. М. Н. Кожиной. 2-е изд., испр. и доп. М. : Флинта : Наука. 696 с.
- Теребков А. С., 2012. К вопросу о трактовке феномена нарратива в современном гуманитарном знании. Сущность и истоки // Омский научный вестник. № 3 (109). С. 114–117.
- Трофимова О. В., 2002. Жанрообразующие особенности русских документов XVIII века (на материале тюменской деловой письменности 1762–1796 гг.) : дис. ... д-ра филол. наук. Тюмень. 519 с.
- Троцук И. В., 2004. Нарратив как междисциплинарный методологический конструкт в современных социальных науках // Вестник РУДН. Серия: Социология. № 6–7. С. 56–74.
- Шейгал Е. И., 2007. Многоликий нарратив // Политическая лингвистика. Вып. 2 (22). С. 86–93.
- Шмелева Т. В., 1997. Модель речевого жанра // Жанры речи. Вып. 1 : сб. науч. ст. / отв. ред. В. Е. Гольдин. Саратов : Колледж. С. 88–98.
- Шмид В., 2003. Нарратология. М. : Яз. слав. культуры. 312 с.