Digital humanities: сквозь алгоритмы к знаниям. Рубрика в журнале - Вестник Пермского университета. История

Статья научная
На современном этапе изучения отечественной истории становятся особенно актуальны дискуссии о работе с большими массивами документов по истории конца XIX – начала XXI в. Сегодня активно идет процесс оцифровки архивных коллекций, но в большинстве случаев созданный корпус просто выставляется на сайт, и многие годы с ним никто не работает, так как нередко мы сталкиваемся с трудностями обработки всего массива материалов при обращении к фондам крупного социального института. Оцифрованные фонды могут содержать сотни тысяч листов делопроизводственной документации. Ограниченность временных возможностей одного человека не позволяет даже на уровне беглого чтения охватить все имеющиеся документы. Данную проблему хотя бы частично может решить применение LLM (large language models) для аннотирования или оптимизации текстового поиска. Однако на текущем этапе развития архивного дела специалисты только начинают работать с методами обработки естественного языка. И основной запрос профессионального сообщества состоит в изучении специфики работы моделей искусственного интеллекта и машинного обучения с текстами исторического домена. Данная работа представляет собой предварительное исследование взаимодействия современных LLM с историческими текстами. Для анализа были выбраны одна из наиболее популярных моделей – BERT – и одна из наиболее распространенных NLP-задач – классификация. Важной частью исследования стал анализ весов внимания модели при решении задачи классификации текстов и заполнения пропусков в предложениях. При таком подходе у нас появилась возможность проанализировать, как модель использует семантический контекст для принятия решения.
Бесплатно

Статья научная
Представлены результаты математического анализа статей газеты «Аргументы и факты», связанных с советским периодом истории. Выбор темы исследования обусловлен возросшей ролью советского исторического наследия в современной российской социальнополитической практике и идеологическом дискурсе. Цель исследования ‒ выявление наиболее характерных черт медиаобраза СССР, конструируемого и транслируемого российской медиасредой, и особенностей исторической памяти современного российского общества. Для этого были проанализированы публикации за период с 2014 по 2022 г., в результате чего были выделены тематические кластеры, отражающие характерные черты медиаобраза Советского Союза. Кроме того, был проанализирован архив публикаций с 1983 по 1991 г. Обращение к данному временному диапазону позволило установить круг тем, присутствовавших в статьях газеты «Аргументы и факты», и сопоставить их с темами публикаций постсоветского периода (2014‒2022). Для анализа современного медиаобраза СССР были выбраны первые десять (по наибольшему количеству публикаций) кластеров. Исследование показало, что выделенные тематические кластеры связаны с теми или иными достижениями Советского Союза или же с негативными последствиями его распада. Статьи выделенных кластеров конструируют образ сильного, обладающего большим потенциалом государства с богатым культурным наследием, распад которого стал катастрофическим событием. Конструирование и трансляция в медиасреде данного образа советского прошлого свидетельствуют о наличии непроработанной исторической травмы, связанной с крушением проекта построения коммунистического государства. Подобный медиаобраз является следствием стремления обрести устойчивые ценностные ориентиры в советском прошлом.
Бесплатно

Методы и результаты оценки объема расходов на образование в России (конец XIX – начало XX века)
Статья научная
Статья посвящена реконструкции стоимостных показателей сферы образования как отрасли национальной экономики поздней Российской империи. Цель исследования заключается в уточнении имеющихся оценок роли образования на стадии перехода страны от мальтузианского к «современному» режиму экономического роста в ходе модернизации ее экономической и социальной структуры. Были решены следующие задачи: 1) представлены собранные в электронном формате данные источников (отчеты Государственного контроля, Министерства народного просвещения, Центрального статистического комитета); 2) реконструированы ряды показателей расходов на образование разных уровней и институциональных источников; 3) на их основе впервые рассчитаны оценки накопленного объема (запаса) человеческого капитала по восстановительной стоимости и на основе будущих доходов; 4) полученные стоимостные оценки непосредственно сопоставлены с основными макроэкономическими показателями страны. Оценки соответствующих показателей системы образования России и формируемого в ней человеческого капитала доступны в историко-экономической литературе за 1920–2000-е гг. Настоящее исследование углубляет их, делая в целом сопоставимыми во времени. Для обеспечения такой сопоставимости используются методики, разработанные в историко-экономической литературе, адаптированные к проблеме недостаточности исторических количественных данных и пригодные для межстрановых сопоставлений. Полученные результаты свидетельствуют о том, что в ходе запуска «современного» режима экономического роста норма накопления человеческого капитала в России повышалась, его запас увеличивался быстрее физического. Намечаются перспективы использования полученных результатов в последующих эмпирических и теоретических исследованиях.
Бесплатно

Статья научная
Статья посвящена особенностям развития экспортной и транзитной торговли Приморской области Российской империи с 1902 по 1913 г. Основу исследования составляют количественные источники соответствующего периода: материалы отечественной таможенной статистики, а также статистические отчеты Уссурийской и Китайской Восточной (КВЖД) железных дорог по перевозке грузов. Со второй половины XIX в. важнейшую роль в экономической жизни Приморья играла перевозка товаров между побережьем Японского моря и внутренними регионами СевероВосточного Китая. Поэтапное открытие грузового движения по дальневосточному участку Транссибирской магистрали в 1891–1903 гг. позволило не только интенсифицировать такую торговлю, но и в целом изменить ее характер. КВЖД в короткие сроки позволила наладить массовый вывоз сельскохозяйственной продукции из Маньчжурии на внешние рынки, транзит китайского чая в Сибирь и Европейскую Россию, а также способствовала исключительно быстрому развитию сбыта по тому же направлению местной рыбы. Тем не менее попрежнему оставался незначительным вывоз товаров из собственно Приморской области в Маньчжурию, а также становилась все более явной тенденция к утрате Владивостоком роли важного пункта снабжения Маньчжурии товарами извне, которую он постепенно уступал порту Дальнему на Ляодунском полуострове. Конкуренция двух портов особенно обострилась в период после окончания Русскояпонской войны, когда японская сторона начала предпринимать активные меры по привлечению большего количества грузов на направлении через отошедший ей в 1905 г. Дайрен (бывш. Дальний).
Бесплатно

Цифровая герменевтика исторического источника: формализация как толкование
Статья научная
Статья посвящена осмыслению трансформации методологии исторической науки под влиянием «цифрового поворота», с фокусом на ключевую дисциплину ‒ источниковедение. Автор исследует, как стремительное развитие технологий искусственного интеллекта (ИИ), особенно машинного обучения, ставит перед исследователямиисториками новые вызовы и открывает возможности, требуя переосмысления традиционных практик работы с историческими источниками. Центральной проблемой статьи является процесс перехода от исторического источника к формализованным данным (например, путем цифровой герменевтики) и обратно к интерпретации и новому историческому знанию. Автор подчеркивает, что этот процесс не просто техническая операция, а глубоко методологический акт абстрагирования (на примере собранных исторических данных, capta), сопряженный с неизбежными потерями нюансов и требующий критической рефлексии. Рассматриваются методологические дилеммы исторического исследования, такие как противостояние источникоориентированного (ad fontes, стремление к максимальной полноте) и проблемноориентированного (ceteris paribus, фокус на избранных параметрах) подходов, их эволюция в цифровую эпоху и связанные с ними дискуссии. Критически анализируется «иллюзия объективности» цифровых методов. Автор утверждает, что алгоритмы, цифровые инструменты (СУБД, ГИС, NLP) и интерфейсы не нейтральны: они несут в себе предубеждения, ограничивают фокус, упрощают сложность и иногда даже предопределяют исследовательские вопросы, что порождает риски: предвзятость алгоритмов, селективность данных, влияние дизайна визуализаций и интерфейсов, некритичное принятие результатов ИИ. В качестве перспективного решения, преодолевающего ключевые ограничения генеративных моделей (галлюцинации, «черный ящик», оторванность от источников), в статье подробно рассматривается RAGподход (RetrievalAugmented Generation), показаны его преимущества для историка. Главный вывод статьи подчеркивает незаменимую роль историкаисследователя в эпоху ИИ. RAGсистемы и подобные инструменты выступают не как замена, а как мощные «цифровые лупы» или интеллектуальные ассистенты, берут на себя трудоемкие задачи поиска и первичной обработки данных, освобождая время историка для критической интерпретации, оценки достоверности источников, построения аргументации, формулировки исследовательских вопросов и создания нового исторического знания.
Бесплатно