Категориальный анализ логики в концептуальном моделировании предметных областей для семантической целостности информационных ресурсов
Автор: Антонов В.В., Кононов Н.А., Пальчевский Е.В.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Общие вопросы формализации проектирования: онтологические аспекты и когнитивное моделирование
Статья в выпуске: 3 (53) т.14, 2024 года.
Бесплатный доступ
Рассматривается возможность применения аппарата категориального анализа логики для формирования концептуальной модели предметной области для проектирования информационной системы. Сформулирована проблема семантической разобщённости информационных ресурсов. Актуальность исследований обусловлена динамичным развитием информационных технологий и потребностью в их интеграции. Определено, что семантическая разобщённость возникает в процессе интеграции гетерогенных информационных ресурсов, «заложенная» на этапе проектирования информационных систем в рассматриваемой предметной области. Выявлено влияние, оказываемое информационной системой, содержащей нарушения семантической целостности, на обеспечиваемые бизнес-процессы. Выделены проблемы-маркеры: информационные разрывы, дублирование информации, необходимость предварительной обработки информации. Показано, что интеграция информационных ресурсов является обязательным, но не единственным условием для формирования семантической целостности системы. Предложено формирование единого контекста для интегрируемых компонентов системы как обязательного условия их интеграции. Разработана классификация подходов к интеграции информационных ресурсов, базирующихся на их семантической целостности. Сформулированы предложения по применению аппарата категориального анализа логики в рамках концептуального моделирования предметной области как универсального компонента по обеспечению семантической целостности системы. Новизна предлагаемого подхода заключается в рассмотрении компонентов информационной системы как множеств на базе теории категорий, выстраивании категориальных отношений между ними и идентификации структурных изоморфизмов в формальной модели.
Категориальный анализ логики, формальная модель, семантическая целостность, проектирование, информационная система
Короткий адрес: https://sciup.org/170206312
IDR: 170206312 | DOI: 10.18287/2223-9537-2024-14-3-324-334
Текст научной статьи Категориальный анализ логики в концептуальном моделировании предметных областей для семантической целостности информационных ресурсов
Современные предприятия и организации действуют в динамичной внешней среде, к которой адаптируются путём изменения бизнес-процессов (БП). Их информационные системы (ИС) устаревают, внедряются новые, изменяются программные и аппаратные платформы, изменяется регулирующее область законодательство [1, 2]. Под действием перечисленных факторов изменяются эксплуатационные свойства ИС, которые могут быть измерены: время, стоимость, масштаб и устойчивость изменений [3]. Понятие гибкости ИС предприятия и её концептуальная модель рассмотрены в работе [4].
В результате организация имеет ряд унаследованных систем, не интегрированных в единую ИС. Каждая ИС представляет собой информационный ресурс (ИР) с собственными информационными структурами и логикой их преобразования. БП предприятия, столкнувшегося с ситуацией наличия множества ИР, не интегрированных на основе семантики данных, могут характеризоваться следующими недостатками: информационные разрывы; дублирование информации; необходимость синхронизации ИР [5-7].
Актуальность исследования обосновывается распространённостью многокомпонентных ИС и необходимостью разработки подхода (совокупности модели, метода и алгоритма) к проектированию интеграционных решений (программ и программных систем, входящих в состав ИС), обладающих семантической целостностью.
Целью исследования является разработка предложений по применению категориального анализа логики для концептуального моделирования предметной области (ПрО) как универсального компонента в виде формализованного подхода, направленного на обеспечение семантической целостности ИР на этапе проектирования ИС.
Для достижения поставленной цели проанализированы основные концепции моделирования ПрО: значение концепции абстракции [8] и её уровней в процессе проектирования ИС; базовые концепции категориального анализа логики; основные положения теорий информации, баз данных и нормализации. Для анализа БП применялись методы структурного анализа и декомпозиции [9], идентификация проблемы сопровождалась применением методов системного анализа [10].
1 Семантическая целостность ИР
В работе на концептуальном уровне рассматривается информационное моделирование ПрО, на основе общетеоретических понятий, обладающих инвариантными свойствами, необходимыми для решения задач в ПрО [11]. В семантической целостности ИР различные компоненты ИС оперируют едиными сущностями с различным уровнем детализации [12]. На рисунке 1 представлено мнемоническое изображение вариативности соответствия сущностей различных ИР. Принадлежность объектов на рисунке изображена посредствам вложенности графических элементов. Например, в рамках одного информационного контекста вложено несколько информационных сущностей. Сущность из одного ИР может полностью дублировать сущность другого ИР (Е1 и Е2), может частично соответствовать (Е1 и Е3, Е4), а может

А – атрибуты информационной сущности; E – информационные сущности; С – информационные контексты; R – отношения полного, частичного и фрагментного соответствия
Рисунок 1 - Мнемоническое изображение вариантов соответствия сущностей различных информационных ресурсов
быть разделена на несколько сущностей (Е1 и Е5). Каждая из сущностей характеризуется множеством атрибутов, в частности, сущность Е1 характеризуется множеством {Л1,...,Л4}. Каждая сущность включена в один из семантических контекстов (С1, С2, С3).
Подобные отношения между сущностями различных ИР в рамках одной ИС вызывают
ряд недостатков БП: необходимость конвертации контекста, экспертного соотнесения сущ
ностей, предобработки с целью насыщения информационных сущностей; отсутствие воз-
можности получения достаточной информации для выполнения БП.
На рисунке 2 показана цепочка причинноследственных связей семантической разобщённости ИР. Внешняя среда оказывает влияние на БП организации и на ИС, обеспечивающую выполнение БП. Рассматриваемая система для сохранения своего функционирования претерпевает изменения внутри: изменяются компоненты ИС и БП. Предполагается, что на данном этапе формируется семантическая разобщённость ИР, которая может приводить к временным затратам и высокому риску возникновения ошибок [13].
Признаком семантической разобщённости является наличие различных моделей данных одной и той же сущности реального мира в компонентах ИС. Можно классифицировать разобщённость между компонентами ИС на структурную и семантическую.
Например, при взаимодействии двух компонентов ИС, отвечающих за бухгалтерский учёт и непрерывное образование сотрудников, может существовать две модели данных сущности «Сотрудник». Сущности могут различаться как по наименованию семантически идентичных атрибутов (например, «Фамилия», «Имя», «Отчество»), так и иметь различный атрибутивный состав в зависимости от целевого назначения компонента системы (например, «Стаж работы», «Дата прохождения курса переподготовки»).
Интеграция компонентов ИС является обязательным, но не единственным условием для формирования семантической целостности. Для её достижения необходимо согласование сущностей и атрибутов на основе их смысла - формирование единого семантического контекста между всеми информационными сущностями. Работа пользователя с различными компонентами ИС должна восприниматься как работа с единым ИР [14], не требующим трансформации, конвертации, обобщения, насыщения и других процедур обработки информации.
Внешняя среда
| Технические факторы | | Социальные факторы |
Экономические факторы
11 Организационные факторы] [ оказывает влияние
Бизнес-процесс
Концептуальное представление системы

Компонент ИС
Компонент ИС
Компонент ИС
Информационная система, как совокупность ее компонентов
формируется
Проблема семантической разобщенности информационных ресурсов инициирует
-
1) Информационные разрывы 2)Дублирование информации
-
3) Необходимость экспертного соотнесения информации
-
4) Необходимость насыщения информацией перед обработкой
привадит к
-
1) Высоким временным затратам
-
2) Высокому риску возникновения ошибок
Низкой степени эффективност и бизнес-процесса
Критерии эффективности
Рисунок 2 - Причинно-следственные связи семантической разобщённости информационных ресурсов
2 Подходы к интеграции компонентов ИС
На основе анализа подходов к интеграции компонентов ИС, разработана классификация, в основу которой положены результаты исследований [15-17]. Интеграция может быть осуществлена посредством:
-
1) определений и формальной структуризации используемых ИР, которая достигается средствами дополнительного компонента ИС, адаптирующего существующие ИР с использованием некоторого языка и формальной грамматики. На рисунке 3 представлена упрощённая модель первого типа интеграции компонентов ИС, где E - сущность ПрО, A - атрибут сущности ПрО, CMP и Z - компоненты ИС, FN - функция компонента, С – собственный семантический контекст, CU – универсальный семантический контекст.
-
2) определений и формальной структуризации пользовательских интерфейсов, которая достигается копированием и повторным вводом данных из одного компонента ИС в другой. На рисунке 4 представлена упрощённая модель второго типа интеграции компонентов ИС, где BF - бизнес-функция, BP - бизнес-процесс; BF * – конвертирующий контекст BP.
-
3) создания универсальной надстройки на основе формального, предметно-ориентированного графоаналитического метаязыка, которая предполагает организацию взаимодействия между компонентами ИС путём создания интеллектуальной системы интеграции ИР [18]. На рисунке 5 представлена упрощённая модель третьего типа интеграции компонентов ИС, где CMP * - конвертирующий контекст компонент.
Рисунок 4 - Упрощённая модель подхода к интеграции компонентов информационной системы посредством определений и формальной структуризации пользовательских интерфейсов

Рисунок 3 - Упрощённая модель подхода к интеграции компонентов информационной системы посредством семантических определений и формальной структуризации используемых информационных ресурсов
Интеллектуальная инф ормационная

СМР2
С2
Иванов Иван Иванович; Дипломный руководитель Петров Петр Петрович, Тема ИС учета деталей; Утверждена 10.04.2030;
Рисунок 5 - Упрощённая модель подхода к интеграции компонентов информационной системы посредством создания универсальной надстройки
10392767;
Нормконтроль пройден; 10.05.2030
Таким образом, задача проектирования системных интеграций рассматривается как формирование общего контекста между N компонентами ИС с минимальным количеством посредников (прослоек, конвертеров, брокеров, шлюзов). При решении задачи интеграции по принципу «каждый с каждым» между системами необходимо образовать N(N-1)/2 посредников, по принципу двухстороннего взаимодействия - N(N-1).
3 Подход к семантической целостности ИР
Применения рассмотренных подходов интеграции компонентов ИС является не оптимальным по причине высокой сложности результирующей структуры при большом количестве интегрируемых компонентов [19]. Результирующая ИС представляет собой множество существующих компонентов ИС, дополненных кратным множеством компонентов-сопряжений для обеспечения конвертации контекста:
-
■ в случае автоматической (алгоритмической) интеграции - большое количество точек возможных отказов, представляющих собой новые программные модули, обеспечивающие преобразование и приведение обращаемых структур данных;
-
■ в случае автоматизированной (частично автоматизированной или не автоматизированной интеграции) - большое количество пользовательских интерфейсов ИС.
Предлагаемый подход заключается в рассмотрении компонентов ИС и её элементов как множеств на базе аппарата теории категорий, а выстраивание категориальных отношений между сущностями позволяет определять изоморфизмы в структурированной формальной модели. Данное свойство приводит к «поглощению» дублирующих объектов и снижению сложности компонентов ИС посредством структуризации элементов. В качестве целевой модели данных рассматривается реляционная модель как общепринятый стандарт.
Подход направлен на формирование формальной модели ИС с условием отсутствия противоречия и соблюдения полноты, достаточной для выполнения всех бизнес-функций. Подобная структуризация ПрО является обязательным этапом при проектировании ИС. Структуризация может быть достигнута за счёт применения теоретико-категориального аппарата и применения концепций идентичности, агрегации и обобщения . Согласно теория категорий [20, 21], ПрО P w можно рассмотреть в виде категорий, представленных тремя множествами: сущностей ( E ), атрибутов сущностей ( A ) и отношений между сущностями ( R ). Формальное представление ПрО имеет следующий вид: P w = { < E 1 ,..., E i > ; < A 1 ,..., A k > ; < R 1 ,..., R t > } , где i, k, t - мощности множеств сущностей, атрибутов, отношений соответственно.
Осуществлён переход от понятий множеств к понятиям категорий. Категория сущностей ПрО задаётся классом объектов Ob ( E ) , категория атрибутов ПрО - классом объектов Ob ( A ) , категория связей между объектами - классом объектов Ob ( R ) .
Из основных аксиоматических положений можно утверждать, что для любых двух a 1 , a 2 е Ob ( A ) существует множество Ob ( A ) HomA ( a 1 , a 2 ) , элементы которого называются морфизмами из a 1 в a 2 . Согласно этой аксиоме возможно представление отношения между двумя сущностями ПрО в виде морфизмов из категориального анализа логики (принято обозначать стрелками). Морфизм в рамках рассматриваемой задачи означает непрерывное отображение категории сущностей на категорию атрибутов. Таким образом, отношения между сущностями a 1 и a 2 можно записать f : a 1 ^ a 2 или a 1 = Dom ( f ) и a 2 = Cod ( f ) , которые рассматриваются как объект r 1 е Ob ( R ) упорядоченной тройки вида ( A , f, B ). Для любых трёх объектов a 1 , a 2 , a 3 е Ob ( A ) может быть задана следующая композиция:
HomA ( a 1 , a 2 ) х HomA ( a 2 , a 3 ) ^ HomA ( a 1 , a 3 ) ,
( f : a 1 ^ a 2 , g : a 2 ^ a з ) ^ fg : a 1 ^ a з
Аналогично морфизмы f и g могут быть рассмотрены как r 1 , r 2 е Ob ( R ) . Так как под морфизмами понимается отображение, которое позволяет сохранить структуру объекта категории [21], то его, в рамках формируемого подхода, можно интерпретировать как сохранение атрибутивного состава комплексной сущности при её декомпозиции и формирование между атрибутами категориальных отношений. Аналогичные выводы можно сделать и для других двух приведённых категорий.
Для связи трёх категорий ( Ob ( E ), Ob ( A ), Ob ( R )) предлагается использовать функторы. Ковариантный функтор F : E ^ A является отображением, которое сопоставляет каждому объекту e i е E объект F ( e i ) е A , где i - номер элемента множества. Категория является не только множеством объектов, но и множеством формируемых морфизмов [18], каждому морфизму f : e i ^ e j в категории Е соответствует морфизм f ( f ): F ( et ) ^ F ( e j ) в рии А . Функтор между категориями сохраняет тождественные морфизмы (отношения) и структуру композиции морфизмов.
Пример концепции идентичности двух сущностей. Концепция идентичности заключается в определении идентичных фрагментов графа - изоморфизмов. Изоморфными можно назвать два встречных функтора f 1: A ^ E, f 2 : E ^ A, такие, что f1 х f 2 = 1A, f 2 х f 1 = 1E, где х - декартово произведение. Представленный морфизм является функторным изоморфизмом контравариантного функтора А в контравариантный функтор Е. Данное утверждение можно обосновать следующим образом: пусть e 1 объект категории Е; в категории А су ществует единственный морфизм f 1(7): A(Y) ^ E(Y), такой, что f1(Y) х f2 (Y) = 1A(Y), f 2 (Y) х f1(Y) = 1E(Y). Тогда можно определить функторный морфизм f 1: A ^ E. Пример применения идентичности введённых условных обозначений и соответствующая диаграмма функторного морфизма представлены на рисунке 6. На рисунке показано разрешение семан-
тической разобщённости двух информационных сущностей ( E1 и E1’ ), находящихся в различных контекстах; посредством применения концепции идентичности сформирован универсальный контекст C u , где произошло слияние сущностей с наследованием родительских связей ( E2 , E4 ).
Повышение уровня абстракции позволяет сформулировать ряд общих концепций и соответствующих им алгоритмов (алгоритмов на деревьях) с небольшой вычислительной сложностью, не зависящих от ПрО [22]. Возможность практического применения концепций агрегации и обобщения выполняется на базе введённых положений (категории, морфизмы, функторы). Подобного огра-

Рисунок 6 - Пример разрешения семантической разобщённости посредством применения концепции идентичности
ниченного синтаксиса достаточно для выражения любых семантических связей в рамках информационного моделирования.
На рисунке 7 представлен алгоритм предлагаемого подхода к концептуальному моделированию ПрО при проектировании ИС, который показывает последовательность действий при семантической интеграции элементов ИС. В каждой из алгоритмических веток присутствует одна из сформулированных концепций, которую нужно применить к выделенной сущности ПрО (обобщения, идентичности, агрегации), или сущность объединяется в существующую структуру.
Заключение
В работе определена цепочка причинно-следственных связей семантической разобщённости ИР в контексте проектирования ИС. Представлен подход (совокупность модели, метода и алгоритма), который облегчает формирование модели ПрО посредством применения аппарата категориального анализа логики.
Представленные в работе предложения на базе концепций идентичности, агрегации и обобщения позволят сократить количество семантически разобщённых ИР и повысить эффективность БП организации.
Количественный показатель эффективности предлагаемого в работе решения может быть исчислен на основе следующих компонентов:
-
1) количество сущностей ПрО, к ко-
Рисунок 7 - Схема алгоритма предлагаемого подхода к семантической интеграции информационных элементов
торым применён принцип обобщения, и количество обобщённых атрибутов множества сущностей;
-
2) количество сущностей ПрО, к которым применен принцип идентичности, и количество идентичных атрибутов множества сущностей;
-
3) количество сущностей ПрО, к которым применен принцип агрегации, и количество агрегированных атрибутов ряда сущностей.
Каждый принцип направлен на сокращение количества сущностей ПрО и их атрибутивного состава. Следовательно, модель ПрО, лежащая в основе ИС, становится ближе к действительности и, как следствие, повышается эффективность обеспечиваемых БП (сокращаются временные затраты и снижается вероятность возникновения ошибки). Повышается также производительность ИС в виду сокращения количества объектов хранения (вне зави- симости от типа используемой базы данных). Сформулированные положения использованы как основополагающие принципы при создании программного продукта, обеспечивающего структуризацию ПрО [23].
Список литературы Категориальный анализ логики в концептуальном моделировании предметных областей для семантической целостности информационных ресурсов
- Антонов В.В., Конев К.А., Пальчевский Е.В., Родионова Л.Е., Баймурзина Л.И. Обеспечение актуальности знаний о бизнес-процессе предприятия на основе онтологической модели // Онтология проектирования. 2024. Т.14, №1(51). С.107-118. DOI: 10.18287/2223-9537-2024-14-1-107-118.
- Kersten M., Khanagha S., Hooff B., Khapova S. Digital transformation in high-reliability organizations: A longitudinal study of the micro-foundations of failure. The Journal of Strategic Information Systems. 2023. DOI: 10.1016/j.jsis.2023.101756.
- Dove R. Response Ability: The Language, Structure, and Culture of the Agile Organization, 2002. New York: Wiley. DOI: 10.1002/inst.20046241.
- Zelenkov Y.A. Agility of enterprise information systems: A conceptual model, design principles and quantitative measurement. BusinessInformatics, 2018. No.2(44). P.30-44. DOI: 10.17323/1998-0663.2018.2.30.44.
- Запорожцев А.В. Проблемы проектирования автоматизированных систем управления организационно -техническими системами // Вестник ННГУ. 2013. №6-1. C.239-246.
- Liu X., Hu C., Huang J., Liu F. A Semantic Data Integration and Service System Based on Domain Ontology // IEEE First International Conference on Data Science in Cyberspace (DSC), Changsha, China, 2016. P.302-306, DOI: 10.1109/DSC.2016.15.
- Klein M. Combining and relating ontologies: an analysis of problems and solutions // IJCAI-2001Workshop on Ontologies and Information Sharing, Seattle, WA, 2001. P.53-62.
- Горский Д.П. Вопросы абстракции и образования понятий. М.: Изд-во АН СССР. 1961. 352 с.
- Марка Д., Макгоуэн К. Методология структурного анализа и проектирования SADT. М.: МетаТехнология, 1993. 240 с.
- Проблемы методологии системного исследования / Ред. И.В. Блауберг, В.Н. Садовский, Э.Г. Юдин. М.: Мысль. 1970. 456 с.
- Колыбенко Е.Н. Разграничение понятий математического и логического моделирования // Вестник Донского государственного технического университета. 2019. 19(3). С.262-267. DOI: 10.23947/1992-5980-201919-3-262-267.
- Юсупова Н.И., Сметанина О.Н., Агадуллина А.И., Рассадникова Е.Ю. Вопросы моделирования при организации информационной интеллектуальной поддержки управленческих решений в сложных системах // Фундаментальные исследования. 2017. №2. С.107-113.
- Кононов Н.А., Суворова В.А. Разработка формальной модели реализации процесса взаимодействия компонентов сложной системы на примере информационного сопровождения приемной кампании. Молодежный вестник УГАТУ. 2023. №1(27). C.59-64.
- Ouksel A., Sheth A. Semantic Interoperability in Global Information Systems: A Brief Introduction to the Research Area and the Special Section. SIGMOD, 1999, Record. 28. P.5-12.
- Куликов Г.Г, Сапожников А.Ю., Кузнецов А.А., Маврин А.С. Методология проектирования системных моделей рабочих процессов с применением предметно-ориентированных метаязыков // Вестник ЮжноУральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. Челябинск: 2020. С.45-55.
- Арсеньев Д.Г., Шкодырев В.П. Семантическая интероперабельность киберфизических систем как технологической платформы систем промышленной автоматизации // Материалы мультиконференции XVI Всероссийская мультиконференция по проблемам управления, 2023. Т.2. C.44-47.
- Олейников А.Я., Рубан К.А. Модели и стандарты обеспечения интероперабельности // Информатизация образования и науки, 2009. №3 С.24-34.
- Куликов Г.Н., Антонов В.В., Антонов Д.В., Шингареев Ф.Ф. Метод предметно-ориентированной классификации и системного моделирования слабоформализованных информационных потоков в системах автоматизированного производства // Вестник Южно-Уральского государственного университета. Серия: компьютерные технологии, управление, радиоэлектроника. Челябинск: 2016. С. 116-130.
- Vinogradov G.P., Prokhorov A.A. Ontologies in the problems of building a concept domain model // Software & Systems - Программные продукты и системы. 2018. №4. С.677-683. DOI: 10.15827/0236-235X.124.677-683.
- Райков А.Н. Онтологизация научных открытий // Управление развитием крупномасштабных систем (MLSD'2021). М.: Институт проблем управления им. В.А. Трапезникова РАН. 2021. С.342-348.
- Топосы: Категорный анализ логики / Р. Голдблатт; Перевод с англ. В.Н. Гришина, В.В. Шокурова. М.: Мир, 1983. 486 с.
- Кормен Т. и др. Алгоритмы: построение и анализ. 3-е изд: пер. с англ. М.: Вильямс, 2013. 1323 с.
- Свидетельство о государственной регистрации программы для ЭВМ № 2024661463 РФ. «Программа автоматизированного семантического сопоставления сущностей информационных ресурсов на основе информационных моделей»: № 2024660117: заявл. 03.05.2024: опубл. 17.05.2024 / Н. А. Кононов.