Применение методов информационных технологий в исследовании технических терминов промышленного оборудования XVIII в. на примере семантических полей (на основе ИС Семограф и программы SCI VI)

Бесплатный доступ

На основе информационных технологий исследованы семантические поля для технических терминов промышленных предприятияй XVIII в. Анализ полей проведен по трем источникам, содержащим термины промышленного оборудования, путевым запискам руководителей Оренбургских научных отрядов. Исследование семантических полей осуществлено на основе информационной системы Семограф и программы визуальной аналитики "SciVi". На примере семантических полей Промышленное предприятие и Промышленное оборудование изучены связи между полями, объем и вес входящих в поле терминов. Данная статья является расширенной версией работы, представленной на конференции Математика и междисциплинарные исследования 2021.

Еще

Информационная система, семантическое поле, технический термин, промышленное предприятие, промышленное оборудование

Короткий адрес: https://sciup.org/147245523

IDR: 147245523   |   DOI: 10.17072/1993-0550-2021-4-35-42

Текст научной статьи Применение методов информационных технологий в исследовании технических терминов промышленного оборудования XVIII в. на примере семантических полей (на основе ИС Семограф и программы SCI VI)

В условиях социальных изменений и появления новых научно-исследовательских, образовательных подходов к современным технологиям меняется как окружающий мир и среда вокруг людей, так и человек в современном мире. Сегодня происходят глобальные изменения в области цифровизации и разработки новых информационных технологий, появления современных систем, программ, платформ, инструментов. Они изменяют наше отношение к технологиям и их применение в практике, в том числе в науке и образовании для анализа научных проблем, как в естественных, технических, так и гуманитарных науках. Для последних внедрение и использование информационных технологий стало прорывом в анализе и визуализировании полученных результатов.

Современные методы, основанные на информационных технологиях, позволили провести исследование технической терминологии промышленного предприятия XVIII в. На основе информационной системы "Семограф" (semograph.com) (далее – ИС) [1], которая в настоящем исследовании использована для семантического анализа текстовых материалов и языковых единиц, позволила на основе семантического моделирования определить поля и объем терминов, входящих в них. Разметка терминов в семантических полях способствовала дальнейшему анализу и визуализации результатов исследования. Анализ и моделирование осуществлены с помощью программы "SciVi.semograph.com" [1] для анализа объема входящих в поля единиц и визуализации взаимосвязей между основными элементами семантических полей [1].

Материалом для изучения терминов послужили путевые записки путешественников, участников экспедиции второй поло- вины XVIII в.: П.С. Палласа, И.И. Лепехина, И.П. Фалька [2, 3, 4].

Во второй половине XVIII в. по инициативе М.В. Ломоносова и Академии наук организованы комплексные научные экспедиции для изучения Российского государства, Урала, Сибири, северных (Поморье) и южных (Прикаспийские территории) районов, ранее не исследованных.

Для исследования Уральской территории образованы три Оренбургских отряда под руководством П.С. Палласа, И.И. Лепехина, И.П. Фалька. Участники экспедиции обследовали территорию Урала, по маршруту следования посетили уральские железоделательные и медеплавильные заводы. В источнике материала, записках путешественников содержались технические термины промышленного оборудования XVIII в. Путевые записки рассмотрены как источник, содержащий дневниковые записи, в которых описаны объекты и явления по ходу маршрута экспедиции.

Цель исследования состояла в изучении технической терминологии промышленного предприятия XVIII в. на примере семантических полей Промышленное предприятие и Промышленное оборудование , выявлении взаимосвязей между полями, объема входящих в поля терминов.

В статье представлено применение методов информационных технологий и компьютерной лингвистики для анализа источников, путевых записок ученых-путешественников, датируемых XVIII в. В ходе исследования из текстов источников извлекались технические термины и контексты. Количественные данные, связанные с источниками, включали количество страниц источников: 1389 стр., количество контекстов, в которых функционировали термины, 924 контекста; общее количество терминов составило 437

(одно-словных 50 и многословных 387). Всего образовано семь семантических полей, в которые распределены термины.

На начальном, подготовительном, этапе исследования проведена работа с текстами записок, из которых выделены контексты, содержащие информацию об уральских железоделательных и медеплавильных заводах.

С помощью метода контент-анализа из текстов записок и контекстов отобраны технические термины.

Основная часть

Исследование и анализ семантических полей состоял из нескольких этапов.

На первом этапе из текстов источников материала выделены контексты описания уральских медеплавильных и железоделательных заводов. В контекстах выявлены технические термины, которые были распределены по семантическим полям с помощью информационной системы "Семограф". Всего образовано семь полей.

Приведем пример работы с текстом и контекстом. В текстах выявлены контексты описания уральских железоделательных и медеплавильных заводов.

Для термина домна выбран контекст: "Принадлежности завода суть две доменные о двух домнах в четырнадцать аршин с половиною, из коих одна всегда в запасе держится: четыре молотовые, в коих пятнадцать молотов, включая и якорьную кузницу" [4].

Из контекста выделен термин домна , семантическое значение которого проверено по словарям. В работе использовались словари XVIII в. и XIX в. Воспользуемся приведенным выше примером, проверив значение термина домна по Словарю русского языка XVIII в.: "Метал. печь для выплавки чугуна" [5]. Следовательно, домна относилась к виду промышленного оборудования, тепловому устройству, являлась видом металлургической печи.

Другой пример контекста употребления для технического термина горн : "В оной же фабрике один горн кричной , один гармахерской и сплейсофен" [3].

В Словаре русского языка XVIII в. горн определен как "тех. печь, устройство для нагревания, плавки металла, обжига глины, перегонки и т. п. ", кричной горн использовался для производства крицы [5].

В словаре В.И. Даля, горн – "род печи с широким челом (шатром), с мехом, поддувалом или тягой, для калильных и частию плавильных работ; собств. та часть рабочей печи, где огонь, для калки, плавки и пр." [2]. Горн относился к виду металлургической печи и служил техническим устройством для плавления металла.

Еще один пример функционирования в контексте термина молот в источнике И.П. Фалька: "Кушва Александровской железный завод при ручье Кушве речке Койвы, на правой стороне Чусовой, в 331 верстах от Екатеринбурга построен в 1751 году и в 1772 г. принадлежал Строганова наследникам. На нем было, 1 домна, 2 молота , большой и малой и 323 человека собственных работников" [6].

Словарь русского языка XVIII в. объяснял значение термина молот как "большой тяжелый молоток для ковки металла, дробления камней и т. п." [5]. Молот понимался как вид оборудования для производственных операций по обработке металла, железа и чугуна.

Так, из текста излечены контексты, из которых выделены термины, значение которых установлено по словарям.

Второй этап состоял в формировании таблицы контекстов, которая в виде CVS-файла загружалась в ИС "Семограф", позволяющей сформировать семантические поля и распределить термины по полям.

Таблица контекстов, предварительно подготовленная в программе Excel, включала контексты, термины, связанные с контекстами, и метаданные: источник, указание автора, название завода, географическое расположение, близость к рудникам. Далее таблица преобразовывалась в CVS-файл для последующей работы в ИС.

ИС "Семограф" в окне Контексты позволила создать контекст, выделить термин и привязать его к определенному полю.

Так, на рис. 1 представлен контекст, выбранные из него термины (например, 12 гертов ), семантические поля, в которые распределены термины и метаданные.

Рис. 1. Окно контекста из путевых записок И.П. Фалька в ИС ʺ Семограф ʺ

Для анализа семантических полей в ИС Промышленное оборудование ), термов, вклю-предусмотрен Полевый анализ, который чающих термины ( сплейсофен ), и контекстов состоит из названия поля (например, использования терминов (рис. 2).

Рис. 2. Пример окна Полевый анализ в ИС "Семограф"

На третьем этапе осуществлен анализ объема полей, входящих в него терминов, установление связей и визуальный анализ полученных данных с помощью динамического графа, построенного посредством программы "SciVi.semograph.com". В исследовании использовались понятия вершина, дуги и удельный вес. Вершины располагались по окружности динамического графа, на определенном расстоянии друг от друга и указывали на поля, расположенные внутри основного поля. Например, в семантическое поле Промышленное предприятие входят поля МПЗ (Медеплавильный завод), ЖДЗ (Железоделательный завод), МПЗ/ЖДЗ (Медеплавильный / Железоделательный завод). Дуги графа имели вид параболы, лежащие на трех точках. Толщина дуг показывала их удельный вес, который связан с объемом всех входящих в поля терминов, что позволило установить взаимосвязи между полями [1].

В статье изучены два семантических поля Промышленное предприятие и Промышленное оборудование . Поле Промышленное предприятие включало поля, характеризующие железоделательный (сокращенно – ЖДЗ ) и медеплавильный заводы ( МПЗ ), которые включали промышленные и непромышленные объекты, производственные и непроизводственные объекты. Объекты размещались на плотине (для железоделательного завода) и в фабрике (для медеплавильного завода), объекты включали промышленные тепловые устройства (печи и горны), оборудование, помещения. Анализ объема полей, содержащих термины, проводился по удельному весу узлов и толщине дуг динамического графа.

Рассмотрим результаты визуального анализа поля Промышленное предприятие по источнику, путевым запискам П.С. Палласа. Удельный вес узлов составил 58 (1591), толщина дуг 1493 (удельный вес – 16910), что являлось наиболее значительными для данного поля трех рассмотренных источников. Граф показал, что объем терминов равномерно распределен между вершинами ЖДЗ и МПЗ (рис. 3).

Рис. 3. Динамический граф семантического поля Промышленное предприятие для полей МПЗ и ЖДЗ (на основе материалов П.С. Палласа)

Объем терминов в источнике И.И. Лепехина представлен следующими показателями: удельный вес узлов составил 58 (582), толщина дуг 1165 (удельный вес – 5218). Для источника, записок И.П. Фалька, удельный вес узлов выражен в меньшей степени по сравнению с остальными источниками: 57 (407), толщина дуг 340 (удельный вес – 1360).

Анализ источников материала показал, что объем терминов поля МПЗ выше поля ЖДЗ . На рис. 4 и 5 показаны динамические круговые графы по материалам И.И. Лепехина и И.П. Фалька.

Рис. 4. Динамический граф семантического поля Промышленное предприятие для МПЗ и ЖДЗ на основе материалов И.И. Лепехина

Рис. 5. Динамический граф семантического поля Промышленное предприятие для МПЗ и ЖДЗ на основе материалов И.П. Фалька

В результате получены данные, которые показали, что наибольший удельный вес и объем терминов представлен в источнике П.С. Палласа, меньший объем выявлен в источнике И.П. Фалька. В записках П.С. Палласа выявлено равное распределение терминов между полями ЖДЗ и МПЗ , в двух других источниках наибольший объем наблюдался для поля МПЗ.

Семантическое поле Промышленное оборудование включало термины, характеризующие виды технического оборудования и тепловые устройства: печь , горн , молот , толчея .

Рассмотрим результаты изучения объема и взаимосвязей между полями и терминами, входившими в поле Промышленное оборудование . Основная вершина для анализа - Оборудование медеплавильное и Железоделательное оборудование . Для семантического поля Промышленное оборудование наибольший объем терминов представлен в источнике П.С. Палласа: это и удельный вес узлов (517) и толщина дуг графа (вес 2446). Исследование показало, что основной объем терминов связан с полем Железоделательное оборудование (для узлов: тепловое устройство Печь , Горн , оборудование Молот ). Выявлены связи узлов для промышленного оборудования, участвующего в производстве чугуна, железа и уклада (стали). Наименьший объем и вес обнаружен у поля Медеплавильное оборудование , для которого отмечено ровное распределение по узлам Печь , Горн , Молот (рис. 6).

Рис. 6. Круговой граф объема технических терминов между полями (по источнику П.С. Палласа)

Материал, представленный в источнике И.П. Фалька, показал высокий объем терминов для поля Железоделательное оборудование , меньший объем – для поля Медеплавильное оборудование .

Рисунок 7 демонстрирует наибольший вес поля Железоделательная печь , остальные виды оборудования выражены в меньшей степени. Удельный вес узлов составил 192, толщина дуг – 456.

Рис. 7. Круговой граф объема технических терминов между полями (по источнику И.П. Фалька)

Данные, представленные в источнике И.И. Лепехина, показали вес узлов – 181, толщина дуг – 672. Основной объем терминов связан с полем Железоделательное оборудование , меньший объем относился к полю Медеплавильное оборудование . Поле Железоделательное оборудование характеризовалось относительно ровным распределением терминов по видам оборудования Железоделательная печь , Железоделательный горн , Железоделательный молот . Для поля Медеплавильное оборудование характерно больший объем терминов, относящихся к полю Горн медеплавильный . Рисунок 8 показал связи между двумя полями, Железоделательное оборудование и Медеплавильное оборудование .

Рис. 8. Круговой граф объема технических терминов между полями (по источнику И.И. Лепехина)

Результаты исследования объема семантических полей Промышленное предприятие и Промышленное оборудование привели к выводам об объеме терминологических единиц, входящих в поля.

Заключение

Современные исследования отличаются использованием новых информационных технологий, которые позволяют осуществить анализ, выявить взаимосвязи, визуализировать полученные результаты исследования. В нашем исследовании технических терминов промышленного предприятия XVIII в. использованы методы информационных технологий: ИС "Семограф" и программа "SciVi.semograph.com".

Информационные технологии позволили создать семантические поля и осуществить анализ, визуализацию результатов исследования для последующей интерпретации. Круговой динамический граф, который построен в программе SciVi, позволил выявить объем содержащихся в поле терминов.

Анализ объема терминов семантического поля Промышленное предприятие , которое включало два основных поля Железоделательный завод и Медеплавильный завод , выявило преобладание объема терминов, представленных в записках П.С. Палласа. В путевых записках И.И. Лепехина и И.П. Фалька объем терминов, показал доминирование для поля Медеплавильный завод , в записках П.С. Палласа присутствовало равное распределение терминов между двумя полями.

Как показало исследование семантического поля Промышленное оборудование, наибольший объем терминов представлен в источнике П.С. Палласа, в меньшей степени – в источнике И.П. Фалька.

В поле Промышленное оборудование входили два поля: Железоделательное оборудование и Медеплавильное оборудование . Изучение объема представленных в данных полях терминов показало больший объем и вес для поля Железоделательное оборудование , что связано с наибольшим количеством терминов, функционирующих в путевых записках и в формирующейся технической терминологии промышленного предприятия XVIII в.

Список литературы Применение методов информационных технологий в исследовании технических терминов промышленного оборудования XVIII в. на примере семантических полей (на основе ИС Семограф и программы SCI VI)

  • Мукосеева Я.Ю. Исследование технических терминов XVIII в. на примере семантического поля Промышленное оборудование (на основе ИС "СЕМОГРАФ") // Математика и междисциплинарные исследования 2021: [Электронный ресурс]: материалы Всерос. науч.-практ. конф. молодых ученых с междунар. участием. Пермь, 2021. С. 163-167. EDN: BILLXP
  • Боронникова Н.В., Талески А., Белоусов К.И., Рябинин К.В. Визуальное представление эгоцентрического поля, говорящего в македонском языке (экспериментальное исследование) // Вестник Пермского университета. Российская и зарубежная филология. 2018. Т. 10, вып. 3. С. 13-27. DOI: 10.17072/2037-6681-2018-3-13-27 EDN: VKVNAS
  • Даль В.В. Толковый словарь живого великорусского языка [Электронный ресурс]. URL http://slovardalja.net/view_search.php (дата обращения 03.11.2021).
  • Лепехин И.И. Продолжение Дневных записок путешествия академика и медицины доктора Ивана Лепехина по разным провинциям Российского государства в 1770 году СПб при Императорской Академии наук, 1772. Т. 2. 353 с.
  • Паллас П.С. Путешествие по разным местам Российской империи. Физическое путешествие по разным провинциям Российской империи, бывшее в 1770 году. СПб.: при Императорской Академии наук, 1786. Ч. 1 кн. 1. 476 с.
  • Словарь русского языка XVIII века [Электронный ресурс]. URL http://feb-web.ru/feb/sl18/slov-abc/0slov.htm?cmd=2&istext=0 (дата обращения 24.09.2021).
  • Фальк И.П. Записки путешествия академика Фалька. Ч. 1 // Полное собрание ученых путешествий по России, издаваемое Императорскою Академиею наук, по предложению ея Президента. СПб.: при Императорской Академии наук, 1824. 560 с.
Еще
Статья научная