Алгоритмизация формирования и прагматической трансформации ограничений существования свойств предметной области
Автор: Семенова В.А., Смирнов С.В.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Инжиниринг онтологий
Статья в выпуске: 3 (37) т.10, 2020 года.
Бесплатный доступ
Областью исследований является интеллектуальный анализ данных, конкретно - развиваемое авторами направление «онтологический анализ данных», что следует понимать как анализ эмпирических данных о неизученной, неструктурированной предметной области с целью построения ее формальной онтологии. Предметом исследования статьи является формирование набора свойств, которые, как предполагается, характеризуют объекты изучаемой предметной области (и, следовательно, подлежат измерению в самом широком смысле этого слова), но с ограничениями на сочетания таких характеристик у объектов - «ограничениями существования» свойств. Задачи исследования состоят в разработке алгоритмов пошагового формирования набора измеряемых свойств с ограничениями существования, алгоритмов модификации такого набора (замещения и удаления свойств), алгоритма преобразования «естественного» описания этого набора как множества с заданными на нём отношениями в форму, удобную для последующего конструктивного, прагматического использования информации об ограничениях существования в онтологическом анализе данных. В работе используются методы теории множеств и бинарных отношений, модели и методы анализа формальных понятий, а также существующая методология применения ограничений существования для построения формальных онтологий. Отличие и новизна предложенных алгоритмов формирования набора свойств с ограничениями существования заключается в «естественном» и эффективном с точки зрения машинной реализации представлении таких наборов в форме графов и матриц инцидентности. Новизна алгоритмов модификации набора свойств с ограничениями существования - в выполненной впервые алгоритмизации уникальных методов расширения набора измеряемых свойств, непосредственно опирающихся на фундаментальные законы классической логики. Сказанное верно и для алгоритма трансформации набора измеряемых свойств в набор групп свойств, однородных по виду экзистенционального сопряжения свойств-членов. Значение полученных результатов состоит в алгоритмическом обеспечении ряда этапов онтологического анализа данных.
Анализ формальных понятий, ограничения существования свойств, онтология, онтологический анализ данных, алгоритмизация
Короткий адрес: https://sciup.org/170178863
IDR: 170178863 | DOI: 10.18287/2223-9537-2020-10-3-361-379
Текст научной статьи Алгоритмизация формирования и прагматической трансформации ограничений существования свойств предметной области
В инжиниринге онтологий сосуществуют два различных математически хорошо обоснованных подхода, основанных на теоретико-множественной семантике.
Наибольшее признание, распространение и значение (в том числе для развития теории и практики в ряде смежных областей) получил в этом смысле анализ формальных понятий (АФП) [1-3]. Более двух десятилетий он служит базой для развития и совершенствования методов построения, сравнения, объединения и т.д. формальных онтологий (см., например, ретроспективную подборку [4-10]). На наш взгляд, этот успех во многом определяется тем, что концепции и модели АФП оказались адекватны чрезвычайно востребованной ныне парадигме анализа данных , или, как теперь принято говорить, «науки о данных»\
Фундаментальная форма представления эмпирической информации в анализе данных - таблица «объекты-свойства» [11, 12] - фактически тождественна модели исходных данных АФП - многозначному формальному контексту
( G , M , V , I ) , (1)
где G = {gi}i = 1,_, r, r = |G| > 1 - множество объектов; M = {m,}, = 1,_, ,, 5 = |M| > 1 - множество признаков объектов («свойств»); V - совокупное множество значений разных свойств, V = и, = 1,_, V, Vj - область существования значений (домен) свойства m,; I - тернарное отношение между G, M и V (I с G х M х V), определённое для всех пар из G х M. Грануляция (1) с помощью концептуального шкалирования [13, 14] формирует2 ключевую структуру АФП -однозначный формальный контекст (G, M, I), где I - бинарное соответствие между G и M (Iс G х M), в котором рассматриваются операторы Галуа ф, ю (общая нотация «'») [1]: ■ фХ) = X' = {m, | m, е M, Vgi е X: I(gi, m,) = True} - общие свойства объектов, составляю щих X с G;
-
■ ю ( Y ) = Y ' = { g i | g i е G , V m , е Y : I ( g i , m , ) = True } - объекты, которые обладают всеми
свойствами из Y с M ;
-
■ для набора объектов X совокупность их общих признаков X ' служит описанием сходства этого набора объектов, а замкнутое множество X '' является кластером сходных объектов.
Анализ соответствия Галуа между булеанами 2 G и 2 M позволяет выявить бикластеры ( X , У ), X с G , Y с M , X = Y ', Y = X ', которые сохраняют информацию об объектах с одинаковым составом свойств и находятся по вложенности составов в отношении частичного порядка. Фундаментальная роль такого анализа (и в целом АФП) состоит в том, что названные его результаты соответствуют в философии и классической логике определению понятия и отношению обобщения на множестве понятий [15, 16]. Т.е. каждый выявленный бикластер ( X , Y ) описывает понятие (точнее - формальное понятие ), у которого X - объем , Y - содержание , и ( X 1 , Y 1 ) < ( X 2, Y 2), если Y 1 ^ Y 2 (или, равно, X 1 с X 2). Если интерпретировать (1) как данные многомерных наблюдений и измерений в исследуемой и моделируемой ПрО [4], то совокупность выявленных формальных понятий и связывающее их бинарное отношение частичного порядка «<» (« is a ») определяет, по меньшей мере, «скелет» формальной онтологии этой ПрО.
Принципиально иной подход в инжиниринге онтологий предлагают авторы [17-19]. В его основе лежит концепция ограничений существования свойств (ОСС) - исходная данность трёх бинарных отношений на множестве принимаемых во внимание свойств объектов ПрО:
-
■ обусловленность C : MхM ^ { True , False }, которая устанавливает, что всякий объект g обладая свойством m , обладает и свойством m k (хотя обратное может быть неверно), т.е.
во введённых обозначениях С ( m , , m k ) ^ V g е G : m , е { g }' ^ m k е { g }'. Обусловленность рефлексивна, несимметрична и транзитивна (рисунок 1a);
-
■ взаимообусловленность Н : M х M > { True , False } - рефлексивное, симметричное и транзитивное отношение, индуцируемое отношением обусловленности: H ( m , , m k ) о
С ( m , , m k ) л С ( m k , m , ) (рисунок 1б);
-
■ несовместимость E : M х M > { True , False }, когда всякий объект g, обладая свойством m , , не может иметь m k в качестве другого свойства, и наоборот, т.е. E ( m , , m k ) о V g е G : m , е { g }' ^ m k t { g }'. Отношение E антирефлексивно, симметрично и нетранзитивно, но характеризуется так называемой «транзитивностью относительно обусловленности» (« EC -транзитивностью»), что означает V x , y , z е M : С ( x , у ) л E ( у , z ) ^ E ( x , z ) (рисунок 1в).

Q - свойство; „.-об- обусловленность; ^— несовместимость;
Рисунок 1 - Примеры ограничений существования свойств (самообусловленность свойств не изображена)
Тогда формирование онтологии ПрО из набора характеризующих её свойств (т.е. свойств объектов ПрО) и набора ограничений существования (т.е. ОСС как набора сопряжённых пар свойств , реализующих экзистенциональные отношения обусловленности и несовместимости свойств) состоит в выявлении всех нормальных подмножеств актуальных свойств ПрО, которые замкнуты и совместимы :
-
■ Y с M замкнуто, если оно содержит все свойства, обусловленные любым элементом Y , т.е. V m , е Y : ( 3 m k е M , m k * m , : С ( m , , m k )) ^ m k е Y ;
-
■ Y с M совместимо, если любые два элемента Y не связаны отношением несовместимости, т.е. V m , е Y : ( 3 m k е M , m k * m , : Е ( m , , m k )) ^ m k t Y .
Нормальные подмножества актуальных свойств ПрО описывают все формальные понятия искомой онтологии, которые по вложенности составов нормальных множеств свойств организуются в граф наследования « is a ».
В контексте вышесказанного наш вклад состоит в развитии онтологического анализа данных (ОАД) - комплекса моделей и методов вывода формальных онтологий ПрО из характеризующих её неполных и противоречивых эмпирических данных, представленных в форме обобщённой таблицы «объекты-свойства» [20, 21]. При этом установлена общность очерченных формальных подходов в аспекте единства их гипотетико-дедуктивной основы и необходимость их совместного использования в ОАД [22, 23]. Последнее объясняет интерес к формированию наборов измеряемых свойств ПрО и ОСС как в аспекте их генезиса и когнитивных задач - эти вопросы рассмотрены в [22, 23], - так и чисто в структурном плане, что является предметом этой работы.
В предлагаемой статье решается задача алгоритмизации пошагового формирования и модификации субъектом ОАД набора свойств с ОСС, а также его преобразования в набор частично пересекающихся групп сопряжённых свойств, обеспечивающих эффективную идентификацию нормальных множеств свойств ПрО. В отличие от техники нормализации, основанной на булевых функциях и уравнениях, которая предложена в [17, 18], используется «естественное» описание ОСС в форме графов (см. рисунок 1) и матриц инцидентности. Это по нашему убеждению предопределяет б ольший когнитивный и «объясняющий» потенциал такого представления для субъекта ОАД, а также эффективную машинную реализацию соответствующих алгоритмов. Кроме того, алгоритмы модификации реализуют не имеющие аналогов методы расширения набора актуальных свойств с ОСС, которые опираются непосредственно на фундаментальные законы классической логики [22, 23].
1 Пошаговое формирование набора свойств с ограничениями существования
Для обозначения свойств объектов исследуемой ПрО, или измеряемых свойств , в данном разделе используются идентификаторы, у которых первым символом является строчная латинская буква, например, x е M.
Здесь и далее до определённого момента не принимается во внимание (в силу локальности действия) имманентная самообусловленность каждого свойства. Тогда нетрудно видеть, что с каждым свойством в наборе свойств с ОСС связаны три множества (рисунок 2):
-
■ C ( x ) — множество свойств, обусловливающих свойство x , 0 < | C ( x ) | < | M - 1,
-
■ C ( x ) - множество свойств, обусловленных свойством x , 0 < | C ( x ) | < | М | - 1,
-
■ Е ( x ) - множество свойств, несовместимых со свойством x , 0 < | Е ( x ) | < | М | - 1,
-
- причём лишь C ( x ) и C ( x ) могут пересекаться. Очевидно несложное выявление C ( x ), C ( x ) и Е ( x ) будем относить к числу базовых алгоритмических примитивов , которые не детализируются.

Рисунок 2 - Множества свойств, ассоциированные в наборе свойств с ограничениями существования с каждым отдельно взятым свойством (пояснение графических образов см. на рисунке 1)
В разделе рассматриваются два следующих элементарных созидательных действия:
-
1) добавление нового свойства в существующий набор измеряемых свойств;
-
2) добавление новой сопряжённости пары свойств - обусловленности или несовместимости - в набор ОСС.
Все этапы последующего изложения иллюстрирует граф на рисунке 3, который описывает матрица инцидентности, представленная на рисунке 4.
-
1.1 Расширение набора свойств
Задача добавления множества новых свойств в набор измеряемых свойств с ОСС, когда не выдвигается требование их какой-либо сопряжённости с уже существующими в этом наборе свойствами, тривиальна. Однако постановку этой задачи можно обобщить, считая, что в добавляемом множестве свойств могут присутствовать «свои» ОСС. Поскольку акты добавления свойств и включения их в экзистенциональные отношения (добавления сопряжённостей) разумно разделять, то такое в целом полезное обобщение задачи целесообразно ограничить. Здесь во внимание следует принять когнитивный смысл расширения набора измеряемых свойств [22, 23], а также практические соображения по упрощению реализации алгоритмических примитивов, используемых при построении матрицы инцидентности, пример которой приведён на рисунке 4. С учётом этого рационально ограничиться тремя возможностями расширения набора измеряемых свойств, алгоритмы которых приводятся ниже.


-
- i -й шаг построения набора свойств и ограничений их существования;
-
- группа сопряжённых свойств как результат одного шага построения набора свойств с ограничениями существования;
-
- пометка сопряжённостей, автоматически достраиваемых в результате i -го шага построения набора свойств с ограничениями существования (здесь вследствие транзитивности обусловленности и относительной транзитивности несовместимости).
Рисунок 3 - Пример пошагового построения набора свойств с ограничениями существования (пояснение ряда графических образов см. на рисунке 1)
Алгоритм «Добавление k несопряжённых свойств», k > 1
-
1) for i := 1 to k
-
2) x : = new P ' P - класс «Свойство»
-
3) M := M и { x } 'добавление свойства x в набор измеряемых свойств
-
4) next i
Алгоритм «Добавление k взаимообусловленных свойств», k > 2
-
2)
-
3)
-
4)
-
5)
-
6)
n := | M
Добавление_k_несопряжённых_свойств 'см. описание выше for i := 1 to k for j := i +1 to k
С(M[n + i], M[n + j]) := True 'сопрягаемые свойства извлекаются из набора M С(M[n + j], M[n + i]) := True 'с помощью примитива [■] next j next i
Алгоритм «Добавление к попарно несовместимых свойств», к > 2
-
1) n := | M
-
2) Добавление к _несопряжённых_свойств
-
3) for i := 1 to к
-
4) for j := i +1 to к
-
5) E ( Mn + i ], Mn + j ]) := True
-
6) next j
-
7) next i
На рисунках 3, 4 шаг 1 добавляет три попарно несовместимых свойства, шаг 2 - четыре несопряжённых свойства, шаг 6 - три взаимообусловленных (ВЗО-) свойства, шаг 8 - два несопряжённых свойства.

Рисунок 4 - Пример пошагового построения матрицы инцидентности «сопряжённости пар свойств - свойства», описывающей набор свойств с ограничениями существования: Н-пара - пара несовместных свойств;
О-пара - пара свойств с обусловленностью, где знак инцидентности «О» указывает обусловленное свойство (пояснение других графических образов см. на рисунке 2)
-
1.2 Добавление сопряжённости пары свойств
Желание субъекта ОАД добавить в набор ОСС сопряжённость пары свойств x , у е M -будь то обусловленность любой «направленности» (О-пара), либо несовместимость (Н-пара) - должно быть отклонено , если:
-
■ указанная сопряжённость уже существует;
-
■ указанная сопряжённость противоречит существующей сопряжённости x и у , т.е. потребована либо несовместимость x и у , а эта пара так или иначе уже состоит в отношении обусловленности, либо наоборот ( V x , у е M : Е ( x , у ) л ( С ( x , у ) v С ( у , x )) = False );
-
■ добавление указанной сопряжённости нарушит законы транзитивности экзистенциальных отношений. Нетрудно показать, что нарушение EC -транзитивности произойдёт лишь при попытке добавления в ОСС О-пары ( x , у ) в случае, когда 3 z е C ( x ) п Е(у ), а нарушение транзитивности обусловленности - при попытке добавления Н-пары ( x , у ) в случае, когда 3 z е C ( x ) п C(у ).
Сказанное вполне определяет порядок проверки допустимости добавления сопряжённости пары свойств, а собственно добавление сопряжённости пары свойств, инициированное субъектом ОАД, в общем случае вызывает необходимость добавления в ОСС других новых сопряжённостей свойств в силу транзитивности экзистенциальных отношений. Эти действия составляют содержание алгоритмов добавления О- и, отдельно, Н-пары свойств.
Алгоритм «Добавление О-пары ( x , у )», x , у е M
-
1) if not С ( x , у ) = True and not E ( x , у ) = True and | C ( x ) п Е ( у ) | = 0 then
-
2) C ( x ) := C ( x ) и { x } ' x и обусловливающие его свойства
-
3) С(у ) := С(у ) и { у } ' у и обусловливаемые им свойства
-
4) 'Добавление в ОСС новых О-пар (включая указанную субъектом ОАД),
'если они там отсутствуют и речь не идёт об образовании самообусловленности; 'тем самым транзитивность обусловленности оказывается выполненной:
for each z 1 in C ( x )
-
5) for each z 2 in С (у )
-
6) if С ( z 1, z 2) = False and z 1 * z 2 then С ( z 1, z 2) := True
-
7) next z 2
-
8) next z 1
-
9) M := 0 'начало формирования множества свойств,
'несовместимых с каждым свойством из С(у )
-
10) for each z 1 in С(у )
-
11) for each z 2 in Е ( z 1) M := M и { z 2} next z 2 'бесповторное добавление свойства z 2
-
12) M := M и { z 2} next z 2 'бесповторное добавление свойства z 2
-
13) next z 2
-
14) next z 1
-
15) 'Добавление в ОСС новых Н-пар ( z 1, z 2) -
- 'несовместимости каждого свойства из C(x) с каждым свойством в M, 'если она в ОСС отсутствует;
'тем самым EC -транзитивность оказывается выполненной:
for each z 1 in C ( x )
-
16) for each z 2 in M
-
17) if E ( z 1, z 2) = False then E ( z 1, z 2) := True
-
18) next z 2
-
19) next z 1
-
20) end if
На рисунках 3, 4 шаг 5 добавляет О-пару ( m _4, m _2), и для выполнения транзитивности экзистенциональных отношений автоматически добавляются О-пара ( m _5, m _2) и Н-пары ( m _4, m _3), ( m _4, m ), ( m _5, m _3), ( m _5, m ). Аналогично при добавлении О-пары ( m _8, m _11)
автоматически формируются О-пары ( m _10, m _11), ( m _9, m _11), а при добавлении О-пары ( m _11, m _12) - О-пары ( m _9, m _12), ( m _10, m _12), ( m _8, m _12), ( m _6, m _12).
Алгоритм «Добавление Н-пары ( x , у )», x , у е M
-
1) if not E ( x , у ) = True and not ( С ( x , у ) = True or С ( x , у ) = True) and | C ( x ) n C(y ) | = 0 then
-
2) C ( x ) := C ( x ) и { x } ' x и обусловливающие его свойства
-
3) C ( у ) := C ( у ) u { у } ' У и обусловливающие его свойства
-
4) 'Добавление в ОСС новых Н-пар (включая указанную субъектом ОАД),
'если они там отсутствуют; тем самым EC -транзитивность оказывается выполненной:
for each z 1 in C ( x )
-
5) for each z 2 in C ( у )
-
6) if E ( z 1, z 2) = False then E ( z 1, z 2) := True
-
7) next z 2
-
8) next z 1
-
9) end if
-
2.1 Удаление сопряжённости пары свойств
На рисунках 3,4 шаг 7 добавляет Н-пару ( m _6, m _8), и для выполнения
EC -транзитивности автоматически добавляются Н-пары ( m _6, m _10), ( m _6, m _9).
2 Алгоритмы модификации набора свойств с ограничениями существования
В данном разделе вначале анализируются такие элементарные модификации набора измеряемых свойств с ОСС как удаление свойства из набора измеряемых свойств и удаление сопряжённости пары свойств из ОСС. Затем рассматриваются более «нагруженные» в когнитивном смысле модификации набора измеряемых свойств и ОСС, возникающие в результате концептуального шкалирования измеряемых свойств, и, наконец, замещение свойства группой взаимообусловленных свойств.
Вне сомнения, изъятие из ОСС сопряжённости свойств x , у е M чревато нарушением транзитивности экзистенциональных отношений измеряемых свойств:
-
■ транзитивность обусловленности нарушится, если из ОСС удалить О-пару ( x , y), являющуюся « замыканием » двухзвенной цепочки обусловленностей, т.е. 3 z е M , z * x , z * у : С ( x , z ) л C ( z , у ) = True ;
-
■ транзитивность несовместимости относительно обусловленности - EC -транзитивность -нарушится, если из ОСС удалить Н-пару ( x , y), являющуюся « замыканием » двухзвенной цепочки «обусловленность-несовместимость», конкретно 3 z е M , z * x , z * у :
С ( x , z ) л E ( z , у ) v С ( у , z ) л E ( z , x ) = True (дизъюнкция в последней формуле объясняется симметричностью несовместимости пары свойств).
Таким образом, основным содержанием алгоритмов удаления сопряжённостей пар свойств из ОСС является проверка допустимости такого действия.
Алгоритм «Удаление О-пары ( x , у )», x , у е M
-
1) if | С (у ) n C ( у ) | = 0 then 'О-пара ( x , у ) не является «замыкающей»
-
2) С ( x , у ) := False 'удаление обусловленности свойством x свойства у
-
3) end if
Алгоритм «Удаления Н-пары ( x , у )», x , у е M
-
1) if | С ( у ) n E ( у ) | + | С (у ) n E ( x ) | = 0 then 'Н-пара ( x , у ) не является «замыкающей»
-
2) E ( x , у ) := False 'удаление несовместимости свойств x и у
-
3) end if
-
2.2 Удаление свойства
Например, в наборе свойств с ОСС на рисунке 3 попытка удаления О-пары ( m _6, m _12) или Н-пары ( m , m _5) будет отклонена, а удаление О-пары ( m _4, m _2) или Н-пары ( m , m _3) возможно.
Удаление свойства x е M - абсолютно неконфликтная модификация набора измеряемых свойств с ОСС, поскольку она предполагает удаление всех сопряжённостей этого свойства, причём отсутствие нарушений транзитивности экзистенциональных отношений измеряемых свойств гарантируется «автоформированием» условия
3 z е M, z Ф x, z Ф у: С(x, z) л C(z, у) = True, С(x, z) л E(z, у) v С(у, z) л E(z, x) = True, а удаление несопряженного свойства из набора измеряемых свойств тривиально.
Алгоритм «Удаление свойства x », x е M
-
1) for each у in С ( x ) 'удаление сопряжения с обусловливаемыми свойствами
-
2) С ( x , у ) := False
-
3) next у
-
4) for each у in C ( x ) 'удаление сопряжения с обусловливающими свойствами
-
5) С(у , x ) := False
-
6) next у
-
7) for each у in E ( x ) 'удаление сопряжения с несовместимыми свойствами
-
8) E(у , x ) := False
-
9) next у
-
10) M := M \ { x }
-
2.3 Когнитивное шкалирование свойств
В [22, 23] обоснована концепция, согласно которой набор измеряемых свойств с ОСС -продукт, возникающий в результате выдвижения субъектом ОАД гипотез о понятийной структуре , описывающей исследуемую ПрО.
Например, добавление в набор измеряемых свойств одного нового свойства знаменует образование множества новых гипотетических понятий, содержания которых возникают как определенные комбинаторные объекты из нового и существовавших измеряемых свойств, а также новых гипотетических понятий, обобщающих такие комбинаторные объекты.
Два (и только два) других способа формирования новых гипотетических понятий - известные в классической логике деление и ограничение существующего понятия [15, 16] - вызывают модификации набора измеряемых свойств, которые следует расценивать как соответственно дизъюнктивное и уточняющее концептуальное шкалирование свойств [22, 23]:
-
■ дизъюнктивное (номинальное) шкалирование свойства выполняется путём разделения его домена на k > 2 непересекающихся частей и приводит к замещению шкалируемого свойства набором k новых несовместимых свойств;
-
■ уточняющее (порядковое) шкалирование свойства устанавливается покрытием его домена двумя областями, первая из которых есть домен целиком, а вторая - какая-то его часть («строгая часть»). Тогда у объектов исследуемой ПрО добавляется новое свойство, которое некоторым образом определяет выделенную часть домена шкалируемого свойства и обусловливает последнее. Обобщением такого приема является уточняющее шкалирование одновременно k > 2 свойств, когда добавляемое новое свойство описывает одновременно все выделенные части (среди которых хотя бы одна строгая) доменов шкалируемых свойств и, следовательно, обусловливает все k шкалируемых свойств.
-
2.3.1 Дизъюнктивное шкалирование свойства
Анализ возможности дизъюнктивного шкалирования свойства x е M иллюстрирует рисунок 5, где, в частности, демонстрируется неопределённость результата шкалирования обусловленного свойства ( | C ( x ) | > 0), возникающая в силу EC -транзитивности отношения несовместимости свойств. Поэтому предлагается постулировать невозможность дизъюнктивного шкалирования обусловленного измеряемого свойства, и алгоритм такого шкалирования начинать с соответствующей проверки.
о

V x
V
y
V
V x 1
V y
{ x 1, x 2, x 3} - свойства, замещающие свойство x
Рисунок 5 - Пример дизъюнктивного шкалирования: замещение тремя несовместимыми свойствами { x 1, x 2, x 3} свойства x , сопряжённого со свойством у ; приведены случаи: x без сопряжения, у е E ( x ), у е C ( x ), у е C ( x ) (пояснение ряда графических образов см. на рисунке 1)
Домены свойств и их покрытия, ^ формируемые в процессе дизъюнктивного шкалирования
Алгоритм «Дизъюнктивное шкалирование свойства x с замещением шкалируемого свойства к новыми свойствами», x е M, к > 2
-
1) if I C ( x ) | = 0 then 'дизъюнктивное шкалирование свойства x возможно
-
2) n := | M i
-
3) Добавление_ k _несопряжённых_свойств 'см. описание выше
-
4) for i := 1 to к
-
5) for each у in E ( x )
-
6) Добавление_Н-пары_( Mn + i ], у ) 'см. описание выше
-
7) next у
-
8) for each у in C ( x )
-
9) Добавление_О-пары_( Mn + i ], у ) 'см. описание выше
-
10) next у
-
11) next i
-
12) Удаление.свойства_ x 'см. описание выше
-
13) end if
-
2.3.2 Уточняющее шкалирование свойства
Анализ, аналогичный тому, что очерчен для дизъюнктивного шкалирования, позволяет установить, что невозможно реализовать обобщённую версию уточняющего шкалирования множества M с M , | M | > 2 измеряемых свойств, если хотя бы два из них несовместимы
(естественно, для уточняющего шкалирования одного свойства, т.е. при | M | = 1, последнее условие не возникает; формально это следует из антирефлексивности отношения несовместимости свойств).
Например, присутствующее на рисунке 3 множество свойств { m _4, m _5, m _6} не может быть подвергнуто уточняющему шкалированию, а множество { m _4, m _5, m 7} шкалировать таким образом допустимо.
В приводимом далее алгоритме смысл проверки возможности уточняющего шкалирования заданного множества M с M свойств передан, но её реализация может быть эффективнее, т.к. первое же обнаружение несовместимости пары свойств в M проясняет ситуацию.
Алгоритм «Уточняющее шкалирование множества свойств M *
с добавлением нового свойства», M с M , | M | > 1
-
1) b := True 'флажок «Шкалирование возможно»
-
2) if | M * | > 2 then
-
3) for each x in M
-
4) for each y e M \ {x}
-
5) if E ( x , y ) = True then b := False
-
6) next y
-
7) next x
-
8) end if
-
9) if b = True then 'уточняющее шкалирование множества M возможно
-
10) n := | M
-
11) Добавление _k _несопряжённых_свойств, k = 1
-
12) for each x in M*
-
13) Добавление_О-пары_( M [ n + 1], x )
-
14) next x
-
15) end if
-
2.4 Замещение свойства группой взаимообусловленных свойств
По определению во множестве гипотетических понятий, отвечающих формируемому субъектом ОАД набору измеряемых свойств с ОСС, содержание отдельно взятого понятия отличается от содержаний других понятий, по меньшей мере, одним свойством. Когда таких отличительных свойств в содержании какого-то понятия несколько, то в аспекте ОСС они взаимообусловлены [22]. Действительно, у всех объектов из объёма этого гипотетического понятия (и только у них среди всех объектов, гипотетически присутствующих в исследуемой ПрО) кроме, возможно, других свойств наличествуют все рассматриваемые отличительные свойства. Следовательно, устанавливая, что наблюдаемый в ПрО объект обладает любым одним таким отличительным свойством, согласно выдвинутой гипотетической картине следует констатировать, что он характеризуется и всеми остальными отличительными свойствами, и, таким образом, любое одно такое отличительное свойство обусловливает все другие, а это означает, что все обсуждаемые отличительные свойства взаимообусловлены.
Опыт показывает, что формируя гипотезы о понятийной структуре, описывающей исследуемую ПрО, субъект ОАД нередко решает, что вместо одного отличительного свойства некоторое гипотетическое понятие о ПрО должно характеризоваться несколькими, например, уточняя, что интересующие его люди должны характеризоваться не только фамилией, но и именем. Поэтому целесообразно при формировании набора измеряемых свойств с ОСС располагать возможностью замещения одного свойства группой ВЗО-свойств.
Очевидно, что в силу транзитивности экзистенциональных отношений между свойствами каждое из ВЗО-свойств, замещающих выбранное измеряемое свойство, «наследует» все его сопряжённости в наборе измеряемых свойств (это также следует из того, что отношение вза- имообусловленности Н в силу характеризующих его свойств симметрии - см. введение - разбивает множество измеряемых свойств на классы эквивалентности). Реализация наследования сопряжённостей замещаемого свойства замещающими его ВЗО-свойствами составляет основное содержание рассматриваемого алгоритма замещения.
Алгоритм «Замещение свойства x группой к ВЗО-свойств», x е M , к > 2
-
1) Добавление к _взаимообусловленных_свойств 'см. описание выше
-
2) y := M[n + к ] 'последнее из замещающих ВЗО-свойств,
'которое далее наследует все сопряжённости замещаемого свойства x ;
'при этом остальные замещающие ВЗО-свойства получат все эти сопряжённости 'автоматически - см. алгоритмы добавления сопряжённостей пар свойств
-
3) for each z in С ( x )
-
4) Добавление_О-пары_( у , z )
-
5) next z
-
6) for each z in C ( x )
-
7) Добавление_О-пары_( z , y )
-
8) next z
-
9) for each z in E ( x )
-
10) Добавление_Н-пары_( z , y )
-
11) next z
-
12) Удаление_свойства_ x
Иллюстрацию замещения измеряемого свойства группой ВЗО-свойств можно найти на рисунке 3, если предположить, что группа ВЗО-свойств { m _8, m _9, m _10} - результат замещении некоторого «протосвойства» m _8910, которое было несовместимо со свойством m _6 и обусловливало свойства m _11, m _12.
3 Трансформация ограничений существования свойств
В отличие от метода построения онтологий, прямо основанного на анализе ОСС [17-19], в ОАД информация об ОСС используется при дефаззификации нестрогого формального контекста, который возникает вследствие неполноты и противоречивости имеющихся эмпирических данных, причём локально для каждого объекта, попавшего в поле зрения исследователя [20, 21]. Однако и та и другая методики связаны выявлением подмножеств свойств, совместимых с ОСС, т.е. нормальных подмножеств измеряемых свойств. Разбор формального определения нормального подмножества свойств (см. введение) позволяет указать в наборе свойств с ОСС субструктуры , которые будучи выявлены, открывают путь к быстрой констатации «нормальности» актуальных подмножеств измеряемых свойств3:
-
■ группа ВЗО-свойств (ВЗО-группа) принадлежит нормальному подмножеству только целиком (что естественно для отдельно взятого свойства, которое формально в силу само-обусловленности следует считать частным случаем ВЗО-группы);
-
■ группа с односторонней обусловленностью (О-группа), в которой одно свойство или, эквивалентно, группа ВЗО-свойств обусловливает другое свойство или, эквивалентно, группу ВЗО-свойств, либо входит в нормальное подмножество целиком , либо своей обусловливаемой частью . Отношение обусловленности между ВЗО-группами обобщает отношение между свойствами в том смысле, что каждое свойство-член одной группы обусловливает все свойства-члены другой (формальный анализ этого отношения можно найти в [19]);
-
■ группа попарно несовместимых свойств (Н-группа) может быть представлена в нормальном подмножестве только одним своим членом.
-
3.1 Выявление групп взаимообусловленных свойств
Таким образом, актуальна задача трансформации «естественного» представления набора измеряемых свойств с ОСС как конечного множества с заданными на нём бинарными отношениями в набор групп свойств, однородных по виду экзистенционального сопряжения свойств-членов. Решение этой задачи в форме матрицы инцидентности «однородные группы свойств - свойства» для набора свойств с ОСС, представленного на рисунках 3, 4, демонстрирует рисунок 6.

Рисунок 6 - Пример описания набора свойств с ограничениями существования в виде матрицы инцидентности «однородные группы свойств - свойства»
Во-первых, каждое в отдельности измеряемое свойство является самостоятельной ВЗО-группой. Во-вторых, ясно, что признаком ВЗО-группы является не только взаимообусловленность входящих в неё свойств, но и отсутствие пересечения с другими ВЗО-группами (исключая, разумеется, некоторые ВЗО-группы, состоящие из одного свойства). Поэтому после выявления очередной ВЗО-группы её свойства-члены следует исключить из дальнейшего анализа, что сокращает трудоёмкость выявления каждой следующей такой группы.
Алгоритм «Выявление ВЗО-групп»
-
1) M := M 'получение копии множества свойств
-
2) do while | M * | > 0
-
3) x := M [1] 'очередное свойство, не состоящее в ранее выявленных ВЗО-группах
-
4) G : = new VZO ' VZO - класс «ВЗО-группа»;
' G используется здесь лишь как множество свойств-членов группы G
-
5) G := G и { x } ' x - ядро и, возможно, единственный член новой ВЗО-группы
-
6) for each y in C ( х )
-
7) for each z in C(y )
-
8) if z = х then G := G и {у }
-
9) next z
-
10) next y
-
11) M * := M * \ G
-
12) loop 'множество свойств конечно
-
3.2 Выделение групп с односторонней обусловленностью
Поскольку по определению О-группа - это две ВЗО-группы, одна из которых обусловливает другую, то алгоритм выделения О-групп строится в предположении, что все ВЗО-группы в наборе измеряемых свойств с ОСС уже выявлены.
Алгоритм «Выявление О-групп»
-
1) for each G 2 in VZOs 'перебор всех построенных ВЗО-групп
-
' G 2 используется здесь лишь как множество свойств-членов группы G 2
-
2) M * := C ( G 2[1]) \ G 2
'множество свойств-членов ВЗО-групп, отличных от ВЗО-группы G 2;
'каждое из этих свойств обусловливает каждый член ВЗО-группы G 2
-
3) for each G 1 in VZOs 'перебор всех построенных ВЗО-групп
' G 1 используется здесь лишь как множество свойств-членов группы G 1
-
4) if | G 1 n M | > 0 then 'ВЗО-группа G Обусловливает ВЗО-группу G 2
-
5) G : = new O ' O - класс «О-группа»
-
6) G. C : = G 2 'обусловливаемые свойства-члены О-группы
-
7) G.C : = G 1 'обусловливающие свойства-члены О-группы
-
8) end if
-
9) next G 1
-
10) next G 2
-
3.3 Выявление групп попарно несовместимых свойств
Проблемой выявления Н-групп в наборе измеряемых свойств с ОСС является не только их пересечение между собой, но, прежде всего, вложенности одних таких групп в другие -как правило, подобные структуры эффективно обрабатываются лишь путём рекурсии. Например, на рисунке 3 Н-группы { m , m _2, m _3} и { m , m _3, m _5} пересекаются, а в Н-группу { m , m _2, m _3} вложены Н-группы { m , m _2}, { m , m _3}, { m _2, m _3}.
Алгоритм «Выявление Н-групп»
-
1) for each x in M
-
2) G := Ассоциированные^_ х _Н-группы
'множество Н-групп, каждая из которых включает свойство х и 'определённое подмножество попарно несовместимых с ним свойств 3) Ns := Ns и G 'бесповторное (по составу свойств-членов) накапливание Н-групп
-
4) next x
Алгоритм рекурсивной функции «Ассоциированные_с_ х_ Н-группы» выявляет как все пересекающиеся, так и вложенные одна в другую Н-группы, включающие в себя свойство х .
Алгоритм «Ассоциированные с х Н-группы», х е M
-
1) Gs : = 0 'множество Н-групп, ассоциированных со свойством х
-
2) for each y in E ( х )
-
3) M := E(y ) n E ( х ) 'свойства, несовместимые как со свойством y , так и со свойством х
-
4) if \M\ < 1 then ' M пусто или содержит одно свойство
-
5) G : = new N ' N - класс «Н-группа»
' G используется здесь и как множество свойств-членов группы G
-
6) G : = G и { y }
-
7) if | M* | = 1 then G : = G ∪ M*
-
8) else
-
9) G : = Ассоциированные с y Н-группы 'рекурсия для свойства y
-
10) end if
-
11) Gs : = Gs ∪ G 'бесповторное накопление Н-групп
-
12) next z
-
13) for each G in Gs
-
14) G : = G ∪ { x }
-
15) next G
-
16) Ассоциированные с x Н-группы : = Gs
Заключение
Представленные в статье алгоритмы формирования набора свойств, подлежащих измерению у объектов исследуемой ПрО, с набором ограничений существования этих свойств призваны обеспечить поддержку и сохранение результатов априорных когнитивных актов субъекта, намеревающегося получить данные измерений, а затем формально вывести из этой эмпирической информации онтологическую модель интересующей его ПрО. Полнота, достаточность и эффективность алгоритмической поддержки этой деятельности субъекта-исследователя достигнута как за счёт теоретического обоснования логического смысла рассматриваемых актов, так и благодаря целесообразному ограничению мыслимых возможностей такой поддержки.
Алгоритмы трансформации исходного «естественного» представления набора измеряемых свойств с ограничениями существования в набор субструктур, однородных по виду эк-зистенционального сопряжения свойств-членов, обеспечивают возможность эффективного практического использования априорных соображений субъекта онтологического анализа эмпирических данных. Основанием для такого вывода является возможность прямого соотнесения внутреннего устройства названных субструктур с прагматически важным и теоретически строгим понятием нормального подмножества измеряемых свойств.
Представленный в статье комплекс алгоритмов предполагается реализовать в разрабатываемой в Институте проблем управления сложными системами РАН системе онтологического анализа данных на массовой программной платформе.
Работа выполнена при финансовой поддержке Министерства науки и высшего образования Российской Федерации (регистрационный номер НИОКТР АААА-А19-119030190053-2).
Список литературы Алгоритмизация формирования и прагматической трансформации ограничений существования свойств предметной области
- Ganter, B. Formal Concept Analysis. Mathematical foundations / B. Ganter, R. Wille. - SpringerVerlag Berlin Heidelberg, 1999.
- Ferré, S. Formal Concept Analysis: From Knowledge Discovery to Knowledge Processing / S. Ferré, M. Huchard, M. Kaytoue, S.O. Kuznetsov, A. Napoli // In: P. Marquis, O. Papini, H. Prade (eds.): A Guided Tour of Artificial Intelligence Research. Vol. II: AI Algorithms. - Springer International Publishing, 2020 - P.411-445.
- Formal Concept Analysis Homepage - http://www.upriss.org.uk/fca/fca.html
- Смирнов, С.В. Онтологический анализ предметных областей моделирования / С.В. Смирнов // Известия Самарского научного центра РАН. - 2001. - Т. 3, № 1. - С.62-70.
- Obitko, M. Ontology Design with Formal Concept Analysis / M. Obitko, V. Snasel, J. Smid // In: V. Snasel, R. Belohlavek (eds.): Proc. of the CLA 2004 Int. Workshop on Concept Lattices and their Applications (Ostrava, Czech Republic, September 23-24, 2004). - VSB-Technical University of Ostrava, Dept. of Computer Science, 2004. - P.111-119.
- Sertkaya, B. A survey on how description logic ontologies benefit from FCA / B. Sertkaya // In: Proc. of the 7th Int. Conf. on Concept Lattices and Their Applications (October 19-21, 2010). - University of Sevilla, 2010. P.2-21.
- Priya, M. A Survey of State of the Art of Ontology Construction and Merging using Formal Concept Analysis / M. Priya, Ch.A. Kumar // Indian journal of science and technology. - 2015. - Vol. 8, Issue 24. - P.1-7.
- Ganter, B. Conceptual Exploration / B. Ganter, S. Obiedkov. - Springer-Verlag Berlin Heidelberg, 2016. - 315 p.
- Bhuyan, Z. FCA Based Ontology Revision / Z. Bhuyan, S.M. Hazarika // In: J.K. Mandal, G. Saha, D. Kandar, A.K. Maji (eds.): Proc. of the Int. Conf. on Computing and Communication Systems I3CS 2016 (NEHU, Shillong, India 2016). Lecture Notes in Networks and Systems, vol 24. - Springer Singapore, 2018. - P.745-755.
- Zhao, M. Matching biomedical ontologies based on formal concept analysis / M. Zhao, S. Zhang, W. Li, G. Chen // Journal of Biomedical Semantics. - 2018. - Vol. 9:11. - 27 p.
- Загоруйко, Н.Г. Когнитивный анализ данных / Н.Г. Загоруйко. - Новосибирск: Академическое изд-во «Гео», 2013.
- Барсегян, А.А. Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д. Тесс, C.И. Елизаров. - СПб.: БХВ-Петербург, 2009. - 512 с.
- Ganter, B. Conceptual scaling / B. Ganter, R. Wille // In: F. Roberts (ed.): Applications of Combinatorics and Graph Theory to the Biological and Social Sciences. - New York Springer-Verlag, 1989. - P.139-167.
- Ignatov, D.I. Introduction to Formal Concept Analysis and Its Applications in Information Retrieval and Related Filds / D.I. Ignatov // In: P. Braslavski, N. Karpov, M. Worring, Y. Volkovich, D.I. Ignatov (eds.): Information Retrieval. Revised Selected Papers 8th Russian Summer School, RuSSIR 2014 (Nizhniy Novgorod, Russia, August 18-22, 2014). - Springer International Publishing, 2015. - P.42-141.
- Гетманова, А.Д. Логика. Углубленный курс / А.Д. Гетманова - М.: КНОРУС, 2016.
- Ивин, А.А. Словарь по логике / А.А. Ивин, А.Л. Никифоров. - М.: Гуманит. изд. центр ВЛАДОС, 1997.
- Lammari, N. Building and maintaining ontologies: a set of algorithms / N. Lammari, E. Metais // Data & Knowledge Engineering. - 2004. - Vol. 48, No. 2. - P.155-176.
- Lammari, N. POEM: an Ontology Manager based on Existence Constraints / N. Lammari, C. du Mouza, E. Metais // In: S.S. Bhowmick, J. Küng, R. Wagner (eds.): Database and Expert Systems Applications. Proc. 19th Int. Conf. DEXA 2008 (Turin, Italy, September 1-5, 2008). Lecture Notes in Computer Science, vol. 5181. - Springer-Verlag Berlin Heidelberg, 2008. - P.81-88.
- Пронина, В.А. Использование отношений между атрибутами для построения онтологии предметной области / В.А. Пронина, Л.Б. Шипилина // Проблемы управления. - 2009. - №1. - С.27-32.
- Самойлов, Д.Е. Анализ неполных данных в задачах построения формальных онтологий / Д.Е. Самойлов, B.А. Семенова, С.В. Смирнов // Онтология проектирования. - 2016. - Т. 6, №3(21). - С.317-339. DOI: 10.18287/2223-9537-2016-6-3-317-339.
- Samoylov, D.E. Defuzzification of the initial context in Formal Concept Analysis / D.E. Samoylov, V.A. Semenova, S.V. Smirnov // In: V Fursov, Y Goshin, D Kudryashov (eds.): Information Technology and Nan-otechnology ITNT 2019: Data Science. Proc. of the Data Science Session at the V Int. Conf. on Information Technology and Nanotechnology (Samara, Russia, May 21-24, 2019). - CEUR Workshop Proceedings, 2019. - Vol. 2416. - P.1-9. - DOI: 10.18287/1613-0073-2019-2416-1-9.
- Samoylov, D.E. Multilevel recursive model of properties existence constraints in machine learning / D.E. Samoylov, V.A. Semenova, S.V. Smirnov // Journal of Physics: Conf. Series 1096 (2018) 012096. DOI: 10.1088/1742-6596/1096/1/012096
- Смирнов, С.В. Две методологии вывода формальных понятий: когда и как они должны работать вместе / C.В. Смирнов // Знания - Онтологии - Теории: Материалы VII международной конференции. - Новосибирск: Институт математики СО РАН, Новосибирский государственный ун-т, 2019. - С.355-363.