Опыт сентимент-анализа «Хождения игумена Даниила»

Автор: Инесса Ивановна Булыгина

Журнал: Христианское чтение @christian-reading

Рубрика: История Церкви в Древней Руси

Статья в выпуске: 1 (116), 2026 года.

Бесплатный доступ

Тексты древнерусских «хождений» не только ценные памятники литературы, они могут являться и важным источником знаний в области культурологии, социальной, экономической истории, истории ментальностей. Зачастую в тексте произведений улавливается настроение автора, его отношение к миру и окружающей среде, что представляет интерес для исследователя как особый источник знаний о воззрениях, ментальности создателя памятника. Возможности современной компьютерной лингвистики позволяют анализировать большие объемы данных, измерять количество частотных слов в тексте и фиксировать количество их употреблений и другие параметры. Это позволяет по-новому взглянуть на работу с текстовыми материалами в ключе исторических исследований. В данной статье в контексте сентиментанализа рассматривается «эмоциональная нагрузка» «Хождения игумена Даниила», выявляется преобладающая в тексте тональность и определяется то, как через используемую лексику автор формирует образы различных географических регионов. В результате анализа было выявлено, что в «Хождении игумена Даниила» наиболее положительный сентимент связан с описанием экономического процветания и плодородия греческих островов и городов Малой Азии. Негативный же сентимент концентрируется вокруг проблем трудностей пути, небезопасности Палестины для паломников. Автор приходит к выводу о двой ственности образа Святой Земли в исследуемом памятнике: с одной стороны, это благословенный и плодородный край, а с другой — регион, полный рисков для паломников.

Еще

«Хождение игумена Даниила», древнерусская литература, паломническая литература, сентимент- анализ, тональность текста, компьютерная лингвистика, Orange Data Mining, Палестина, Малая Азия, RuSentiLex, цифровая гуманитаристика, текстология

Короткий адрес: https://sciup.org/140314039

IDR: 140314039   |   УДК: 821.161.1'04.09-992:81'32   |   DOI: 10.47132/1814-5574_2026_1_236

Attempted Sentiment Analysis of “The Life and Journey of Daniel, Abbot from the Russian Land”

The texts of Old Russian pilgrimage narratives (khozhdeniia) can serve not only as valuable literary monuments, but also an important source of knowledge in the fields of cultural studies, social, economic history, and the history of mentalities. Often, in the text of the works, one can capture the author’s mood, attitude towards the world and environment, which is of interest to researchers as a unique source of knowledge of the worldviews and mentality of the author of the monument. The present-day computer linguistics allows for the analysis of large amounts of data, measuring the frequency of words in a text and recording the number of their occurrences and other parameters. This opens up a new perspective on working with textual materials in the context of historical research. In this article, in terms of sentiment analysis, the “emotional load” of “The Life and Journey of Daniel, Abbot from the Russian Land” is examined, the predominant tone of the text is identified, and it is determined how the author forms images of different geographical regions through the lexicon used. The analysis resulted in that the most positive sentiment of “The Life and Journey of Daniel, Abbot from the Russian Land” is associated with the descriptions of the economic prosperity and fertility of the Greek islands and cities of Asia Minor. At the same time, the negative sentiment concentrates around the problems of the journey hardships and the perils of Palestine for pilgrims. In the end, a conclusion is drawn about the duality of the image of the Holy Land in the monument studied: on the one hand, it is a blessed and fertile land, and on the other hand, it is a region full of risks for pilgrims.

Еще

Текст научной статьи Опыт сентимент-анализа «Хождения игумена Даниила»

Введение

«Хождения» относятся к особым нарративным источникам по истории Средневековой Руси. В них отражены особенности духовного склада и мировосприятия автора, различные политические, нравственные, художественные идеи времени написания произведения. Также они содержат разнообразные географические, экономические, этнографические, политические, социальные материалы о местах, в которых побывали их авторы. «Хождение игумена Даниила» считается одним из основоположных текстов для жанра хождений в древнерусской литературе. Этот по-своему уникальный памятник во многом стал примером построения структуры произведения, его языкового своеобразия и предмета повествования для будущих авторов. «Хождение игумена Даниила» обладает особым богатством сведений о мире, современном автору, об окружающей его среде. В «Хождении игумена Даниила» описывается несколько географических областей. Это средиземноморские греческие острова, побережье Малой Азии, Палестина.

Нельзя не отметить, что эмоциональная окраска текста оказывает сильное влияние на его восприятие читателем. «Хождение игумена Даниила», судя по количеству сохранившихся списков (около 150), было довольно популярным в Древней Руси и предположительно имело влияние на то, как описанные в нем географические области воспринимались читателем, создавало определенный образ регионов с помощью используемой в тексте лексики. Важна и эмоциональная нагрузка, оказываемая на читателя: какая лексика использовалась при описании, например, острова Кипр, Патмоса или города Эфес — нейтральная, позитивная или негативная.

Для проверки того, какой эмоциональный фон при описании географических областей превалирует в «Хождении игумена Даниила», нами был использован метод сентимент-анализа, проведенный с помощью программы Orange Data Mining.

О методе сентимент- анализа и его применении

Сентимент-анализ (Sentiment analysis) — метод компьютерной лингвистики, изучающий сентимент (тональность) текста. Он помогает выявить ярко выраженные лексические оценки и эмоциональное отношение автора текста к какому-либо объекту. Вначале метод использовался применительно к отзывам на товары и услуги, кинорецензиям, постам в социальных сетях, затем — к художественным и академическим текстам [Колмогорова и др., 2024, 80]. В данный момент сентимент-анализ используется в экономических, филологических, литературоведческих, исторических исследованиях. Так, например, можно отметить создание и исследование корпуса русского рассказа 1900–1930 гг., созданного в рамках проекта, реализованного сотрудниками кафедры математической лингвистики филологического факультета СПбГУ и департамента филологии Научно-исследовательского университета «Высшая школа экономики» в Санкт-Петербурге. На его базе проводятся как классические лингвистические исследования [Гребенников, Марусенко, 2020, 21–28], так и исследования нового типа с применением сентимент-анализа [Шерстинова, 2023, 200–211].

Для исследования сентимента «Хождения игумена Даниила» нами было использовано открытое программное обеспечение Orange Data Mining [Orange]. Эта программа может работать с большими объемами данных и включает функционал машинного обучения для анализа и визуализации данных. На платформе Orange доступны различные инструменты анализа данных, включая предварительную обработку данных, визуализацию, кластеризацию, регрессию, классификацию, обучение без учителя, а также возможность разработки и добавления собственных алгоритмов (см. подр.: [Фазлиева, 2024, 165]).

Для анализа текст «Хождения» был переведен в формат txt, токенизирован по предложениям, были удалены стоп-слова. В итоге было получено 807 токенов

(в данном случае предложений). В программе Orange для проведения сентимент-анализа была построена следующая схема:

Рис. 1. Схема построения виджетов в программе Orange для сентимент-анализа

Как база для проведения исследования был взят русскоязычный словарь оценочной лексики RuSentiLex, достаточно широко используемый в различных исследованиях для анализа тональности текста на русском языке. Он создан на основе тезауруса РуТез и имеет разделение на положительную и отрицательную лексику [Современные словари, 2020, 21]. При анализе «Хождения игумена Даниила» в данном исследовании был использован перевод на современный русский язык проф. Г. М. Прохорова (БЛДР, 1997, 26–117).

После проведения сентимент-анализа все токены были оценены алгоритмом следующим образом: 0 — нейтральные, положительные числовые значения — положительные по сентименту предложения, отрицательные числовые значения — отрицательные по сентименту предложения.

После проведения всех вышеперечисленных действий был построен следующий график:

Рис. 2. График сентимент-анализа для «Хождения игумена Даниила»

Анализ результатов

В результате анализа выявляется, что в «Хождении игумена Даниила» позитивный сентимент резко преобладает над негативным. Так, было выделено только 30 негативных предложений при 187 позитивных и 590 нейтральных. Числовое значение токенам было присвоено алгоритмом на основе формулы S = Lnpos Lnneg 100, где S ^pos — сумма позитивных слов в предложении, X ^neg — сумма негативных слов, N — общее количество слов в предложении, S — итоговое значение сентимента. Тем самым оценка, данная алгоритмом, отражает процентное соотношение разницы тональности внутри предложения.

Рассмотрим, какие предложения были отмечены алгоритмом как самые позитивные и самые негативные. Для наглядности были созданы две таблицы, где представлено по 10 позитивных и негативных предложений, обладающих, по результатам анализа, наибольшим сентиментом.

Таблица 1. Наиболее позитивные предложения «Хождения игумена Даниила»

Номер предложения в тексте

Содержание предложения

Оценка алгоритма

781

Всем изобилует городок

25

60

Здесь родился святой Никола

20

321

Он очень богат

20

592

Город же Самария большой весьма и изобилует всем добром

20

45

Тот остров весьма всем богат: и людьми, и скотом

16,6667

65

Кипр — очень большой остров, и множество на нем людей, и изобилует он всяческим добром

16,6667

194

Церковь Святая Святых чудесно и искусно построена, украшена изнутри мозаикой, и красота ее непередаваема словами

16,6667

662

Тут же чудо было с сотником

14,2857

26

И родится на том острове мастичная смола, и вино хорошее, и плоды всякие

13,3333

19

Против того города лежит святой Евфимий Новый

12,5

Таблица 2. Наиболее негативные предложения «Хождения игумена Даниила»

Номер предложения в тексте

Содержание предложения

Оценка алгоритма

512

Грозно и безводно место то и сухо

– 37,5

373

И всё то ныне разорено погаными

– 28,5714

433

Ныне же разорено погаными место то

– 28,5714

83

Путь тут тяжел и очень страшен

– 22,2222

565

Ныне же разорено все погаными, и село то Эльмаус пусто

– 16,6667

234

Был на том месте монастырь женский, а теперь оно разорено погаными

– 15,3846

403

Ныне же разорено всё от поганых

– 14,2857

805

Ведь то, что я сподобился видеть, это же мне показал Бог, чтобы я видел, недостойный раб и дурной

– 13,0435

270

Путь от Иерусалима к Иордану лежит через Елеонскую гору на юго-восток, и путь этот очень тяжел, страшен и безводен

– 12,5

612

Выглядит место то страшно и весьма грозно

– 12,5

Тремя самыми позитивными предложениями стали «всем изобилует городок», «и он очень богат», «город же Самария большой весьма и изобилует всем добром». Тремя самыми негативными — «грозно и безводно место то и сухо», «и все то ныне разорено погаными», «путь тут и тяжел, и очень страшен». Проанализировав весь список, можно отметить, что наиболее позитивные предложения касаются в большинстве своем именно экономического благополучия регионов, посещаемых игум. Даниилом, а также их красоты, что зачастую становится немаловажным фактором для автора. В негативном сентименте преобладают предложения, повествующие о тяжести пути автора в святые места, о суровости местности паломничества: его безводности, сухости, грозности, возникающем при его созерцании страхе. Довольно часто в негативных предложениях встречаются и замечания о том, что то или иное место разорено и пусто.

Тем самым, можно выявить некую картину того, как игум. Даниил передавал читателю информацию о различных географических областях, какова эмоциональная нагрузка при описании посещаемых им мест. Так, греческие средиземноморские острова и города Малой Азии описываются игум. Даниилом исключительно положительно: среди предложений с 14-го по 77-е (в них описывается путь в Иерусалим по морю) нет ни одного отрицательного, а встречаются только положительные и нейтральные. Этот регион в глазах игум. Даниила обладает исключительно позитивными чертами: он богатый, там собираются большие урожаи, выращиваются фрукты, овощи, виноград. Богат этот регион и своими святыми: например, при описании острова Кипр, города Эфес автор упоминает множество святых, связанных с историей этих мест.

Более сложная картина складывается при описании Иерусалима и Палестины. Если сам город Иерусалим оценивается в основном положительно, то суждения о местности вокруг него уже не так однозначны. Например, это можно наблюдать в предложениях 445 «Там ведь недалеко лежит город Аскалон, вот оттуда-то и выходят поганые и многих избивают на той дороге нещадно» и 530 «А без охраны не дойти до тех мест из-за поганых, ибо туда многие сарацины ходят разбойничать, в горах тех». Подчеркивается, что путь до святых мест в Палестине очень тяжел, опасен из-за частых нападений сарацин на паломников. С ними же связано и разорение многих монастырей и святынь, что отмечает автор. Подчеркивается и противоречивость природных условий Палестины: с одной стороны, земля возле Иерусалима дает большие урожаи, но некоторые ее уголки очень неблагоприятны: они безводные, неподходящие для жизни, разоренные, там часто убивают христиан. Но при этом именно при описании Палестины внимание читателя обращается на эстетическую привлекательность региона: на красоту ее храмов, святынь, их художественного убранства.

В целом игум. Даниил создает положительный образ регионов, которые он посещает. Если у греческих средиземноморских островов и городов Малой Азии создается абсолютно положительный образ богатых, плодородных регионов, то оценка Палестины не так однозначна: часто дороги в ней разорены, населенные пункты бывают пусты и бедны. Также довольно часто в «Хождении игумена Даниила» подчеркивается нестабильная политическая обстановка в регионе паломничества. Встречается несколько упоминаний об опасностях, поджидающих паломника. Так, игум. Даниил описывает город Аскалон следующим образом: «Выходять бо оттуду срацини и избивають странныя на путѣхъ тѣх, да ту есть боязнь велика, от мѣста того входя в горы» (БЛДР, 1997, 34). Можно отметить, что в произведении показывается двойственность ситуации в Палестине в период нач. XII в. С одной стороны, это плодородный, благословленный Богом регион с высокой урожайностью фруктов, овощей, зерновых культур, наполненный святыми местами, но с другой стороны — очень опасный и неблагоприятный для тех, кто его посещает. Подчеркивается и сложность паломничества как процесса: калику перехожего ждут различные опасности, его путь изматывает и может стоить жизни. Но при этом в «Хождении игумена Даниила», исходя из данных сентимент-анализа, все равно создается больше положительный, чем отрицательный образ Иерусалима и Палестины: это красивый регион, земля эта благословлена Богом и, несмотря на риски, явно обладает самыми лучшими качествами для древнерусского человека.

Выводы

Исследование показало, что в «Хождении игумена Даниила» преобладает позитивный сентимент. Большая часть предложений, а именно 590 из 807, оказались нейтральными, а 187 — позитивными, что определяет общий оптимистично-нейтральный тон произведения. Содержание положительных предложений в основном заключается в описании экономического благополучия посещаемых паломником мест, их богатства, в то время как содержание отрицательных предложений — в описании разоренности и опустошенности. Можно отметить, что по отношению к средиземноморским греческим островам используется практически исключительно позитивная лексика, такая как «добрый», «богат», «изобилует» и т. д., тогда как при описании Палестины оценка автора уже не так однозначна: появляются слова «страшный», «безводный», «грозный», несущие в себе негативную тональность.

Несмотря на то что «Хождение игумена Даниила» традиционно считается довольно изученным произведением древнерусской литературы, современные методы в области машинной обработки естественного языка открывают широкие перспективы для исследования, помогают прийти к интересным результатам, которые в будущем могут стать объектом для анализа и нового осмысления памятника.