Разработка онтологии интегрированного пространства знаний

Автор: Олейник А.Г., Ломов П.А.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 4 (22) т.6, 2016 года.

Бесплатный доступ

В статье описывается продолжение исследований, направленных на формирование интегрированного пространства знаний для информационно-аналитической поддержки научных исследований и разработок по различным направлениям деятельности научного центра. Данная работа посвящена рассмотрению принципов построения и использования онтологической модели интегрированного пространства знаний (онтологии ИПЗ) различных научных областей. Данная онтология используется в качестве базиса для создания конкретных онтологий, создающихся и/или поддерживающихся отдельными исследовательскими учреждениями или научными коллективами. В статье представлена её реализация в виде системы онтологических паттернов содержания (Ontology Content Design Patterns), которые представляют собой небольшие целостные фрагменты онтологии, формализующие обобщённые ситуации предметной области (например, участие в событии, исполнении роли, наличие частей у объекта и др.). Паттерны содержания используются в качестве строительных блоков при разработке онтологий. Рассматривается общая система паттернов онтологии, а также описан общий принцип их применения для представления знаний. Приведены основные преимущества предлагаемого подхода к разработке онтологии ИПЗ, которые заключаются в упрощении её использования и обеспечении качества онтологического описания предметных знаний в разрабатываемых на её основе онтологиях за счёт повторного использования проверенных решений, представленных содержащимися в ней паттернами.

Еще

Онтология, онтологические паттерны, онтологический инжиниринг

Короткий адрес: https://sciup.org/170178734

IDR: 170178734   |   DOI: 10.18287/2223-9537-2016-6-4-465-474

Текст научной статьи Разработка онтологии интегрированного пространства знаний

Выработка системных решений в сфере управления сложными территориально распределенными системами требует совместного использования знаний и данных различных научных областей. Современные информационные технологии предоставляют мощные инструменты автоматизированной интеграции и обработки, как данных, так и декларативных знаний, представленных в «компьютерном» виде. Однако серьёзной проблемой интеграции разнородных декларативных знаний является устранение концептуальной и терминологической неоднозначности при формировании их «компьютерного» представления. Эта проблема обусловлена тем, что эксперты, как правило, формулируют своё видение исследуемой системы и решаемых задач в некотором поле основных понятий, присущих их предметной области (ПрО). При этом возникает терминологическая несогласованность, а порой и понятийная противоречивость элементов формируемой модели. Противоречивость представляемых знаний может быть обусловлена и наличием альтернативных взглядов на свойства системы у экспертов одной ПрО.

В качестве одного из вариантов решения указанной проблемы разработана технология концептуального моделирования на основе функционально-целевого подхода [1]. Данная технология ориентирована на поддержку начальных этапов организации вычислительного эксперимента по исследованию сложных систем. Технология обеспечивает формирование взаимосвязанных формальных схем декларативных моделей, описывающих моделируемую ПрО, решаемые в рамках данной ПрО задачи и используемые для решения этих задач программно-аппаратные средства и данные. В рамках технологии реализованы алгоритмы автоматизированного анализа структуры и разрешимости концептуальных моделей различной структуры, предложены методы синтеза исполнительной среды реализации проблемноориентированных вычислительных экспериментов на основе концептуальных моделей.

В последние десятилетия для структурирования, формализации и унификации представления знаний с целью их многократного и гибкого использования в информационных системах применяются онтологии. Как отмечается, в частности, в работе [2], термин онтология впервые появился в работе Томаса Грубера [3], в которой рассматривались различные аспекты взаимодействия интеллектуальных систем между собой и с человеком. В настоящее время под онтологией понимается описание декларативных знаний, сделанное на формальном языке и снабжённое некоторой классификацией специфицируемых знаний, позволяющей человеку удобно воспринимать их [2]. В качестве языка для описания онтологий наибольшую популярность, благодаря наличию богатых выразительных возможностей и вместе с тем формальной разрешимости, получил язык веб-онтологий OWL (Ontology Web Language). Предложенный и развиваемый консорциумом W3C OWL на сегодняшний день является де-факто стандартом описания онтологий для их использования в Интернет.

Использование общих принципов формализации и языка описания онтологий позволяет существенно упростить решение задачи обеспечения технической интероперабельности информационных систем, работающих с онтологиями. В работе [4] был предложен гибридный вариант организации на основе онтологий архитектуры интегрированного пространства знаний (ИПЗ) мультидисциплинарного научного центра. Такое решение предполагает создание на общей основе отдельных репозиториев научных знаний различных научных областей, каждый из которых поддерживается независимо, и их последующее связывание. Однако проблема семантической интероперабельности, то есть одинаковой интерпретации информационных объектов интегрируемыми системами, остаётся до конца не решенной.

Снизить семантическую разнородность онтологий можно на этапе их разработки, если изначально ориентироваться на их использование в информационных системах, функционирующих в рамках ИПЗ. Следует отметить, что при этом процесс проектирования будет усложняться необходимостью априорного согласования вновь вводимых в некоторую онтологию знаний с уже представленными в онтологиях ИПЗ знаниями. Причём согласование будет требоваться на всех уровнях - от концептуализации понятий описываемой ПрО, реализуемой соответствующим экспертом, до использования программистами принятого в рамках информационного пространства единого протокола обмена сообщениями. Общими для всех онтологий ИПЗ должны быть приёмы моделирования и правила описания понятий, используемые специалистами по онтологическому инжинирингу при формализации вводимых в онтологии ИПЗ понятий. Для упрощения разработки и оперирования прикладными онтологиями, ориентированными на использование в рамках ИПЗ, в работе [5] предлагается рассматривать их как совокупность реализаций онтологических паттернов содержания (Ontology Content Design Patterns, CDP) [6]. Это позволяет экспертам ПрО при формировании онтологии и обращении к ней работать не со специфическими языковыми конструкциями (аксиомами OWL, триплетами RDF), а их комбинациями, имеющими описания своего назначения и способов применения.

В нас т оящей работе предс т авлена о н тологическая модел ь ИПЗ (он т ология И П З), реализуемая в виде системы онтоло г ических п аттернов содержани я . Авторы п олагают, ч то применение предлагаемого подхода к разработ к е онтологии позвол и т не толь к о упрости т ь работу с ней, но и обеспечить качество онтологи ч еского оп и сания за с чёт повто р ного исп о льзования проверенных решений, предст а вленных в ключенн ы ми в онто л огию пат т ернами.

1    Общая структура онтологии ИПЗ

Онто л огия ИПЗ [7] предн а значена д л я интегр а ции и целостного п р едставления знаний, накоплен н ых в различных научных обл а стях. Как правило, с в язующим звеном п р едставляемых в не й гетерогенных знан и й являетс я общность объекта исследован и й, котор ы й является большой и сложной системой. Разработ а нная онт о логия ИП З состоит и з нескол ь ких модулей, опре д елённых в соответ с твии с у р овнем абстракции и х понятий и функц и онального назначен и я их содержимого. К аждый мо д уль пред с тавляет с о бой файл, содержа щ ий отдельную онто л огию, описанную с п омощью я зыка веб- о нтологий OWL. Та к им образ о м, онтология ИПЗ о бразуется путём им п орта данн ы х модулей (рисунок 1).

Рису н ок 1 - Моду л ьная структура онтолог и и ИПЗ

В качестве основы испол ь зована о н тология и нформаци о нных ар т ефактов ( I nformation Artifact O n tology, IAO) [8]. Она в свою очередь яв л яется рас ш ирением о дной из распространённых о н тологий верхнего у р овня - баз о вой формальной он т ологии (Basic Formal Ontology, BFO) [9].

Элементы из онтологии BFO используются для описания абстрактных инвариантных к ПрО объектов, процессов и явлений. Элементы IAO направлены на представление процессов получения информации, их участников, а также информационных источников и носителей. При этом они не только образуют понятийную систему, но и заключают в себе правильные с точки зрения онтологии IAO приёмы представления знаний ПрО. Однако, как это было отмечено в работе [5], изучение таких концепций пользователем онтологии может потребовать серьёзных затрат труда и времени. Поэтому было принято решение выделить целостные фрагменты понятийной системы IAO, представляющие концепты, расширить их с учётом типовой организации научной деятельности в РФ и задач применения онтологии ИПЗ и локализовать их в виде отдельных онтологических паттернов содержания. Каждый такой пат- терн представляется в виде мини-онтологии в отдельном файле и решает одну задачу онтологического моделирования, при этом в нём используются понятия и отношения из IAO.

Поми м о этого, в онтолог и и ИПЗ б ы л выделен модуль, хранящий словарь конкретных понятий и отношений. Его гла в ной зада ч ей является представление нек о торого описания понятия или отношения на естес т венном яз ы ке.

Таким образом, общий пр и нцип пре д ставлени я знаний в онтологи и ИПЗ вкл ю чает следующие ш аги:

  •    создание соответствующи х классов и /или отношений, с о писываю щ ими их текстовыми метка м и (лейблами) и ком м ентариям и в онтологии-словар е ;

  •    подбор подходящего патте р на содер ж ания;

  •    специализация выбранного паттерна, которая с о стоит в определени и отношен и й наследования между его элемента м и и элеме н тами из онтологии-с л оваря.

2    Используемые паттерны содержания онтологии ИПЗ

Рассм о трим основные па т терны с о держания, применя е мые для структур и рования и представ л ения информации о н аучных и с следованиях в рамк а х интегр и рованного пространства знаний. Общая схема разработанны х паттерно в представ л ена на ри с унке 2.

Рисунок 2 - Система п а ттернов содержания онт о логии ИПЗ

Отно ш ение «специализир у ет» (speci a lization) между пат т ернами о з начает, ч т о один из классов и л и одно из свойств в одном па т терне явл я ется подк л ассом ил и подсвойс т вом некоторого класса или свойства др у гого. При этом в остальном п а ттерны ид е нтичны. О тношение «связан» ( related) между патте р нами озн а чает, есл и они име ю т некотор ы е общие к лассы или наследую т некоторые классы д руг друга. В остальном паттер н ы могут р а зличаться [10].

К базовым паттернам сод е ржания, к о торые выступают о с новой дл я других, о риентированных н а непосредственное примене н ие пользователями, относятс я «Инфор м ационная сущность» (Information conten t entity) и «Планиру е мый про ц есс» (Plan n ed process). Данные паттерны целиком представля ю т собой ф рагменты I AO.

Паттерн «Информационная сущность» позволяет определить фрагмент информации, который описывает некоторый объект и должен быть представлен на одном или нескольких материальных носителях информации. Таким образом, становится возможным отразить зависимость между информацией и её носителем, не отождествляя их.

Паттерн «Планируемый п р оцесс» за д аёт происходящий в о времени п роцесс, к о торый реализует некоторый план, зада в аемый сп е цификацией плана. С пецифик а ция план а представляет собо й информационную с ущность, которая в к лючает в качестве ч астей опи с ания цели процесса ( или его этапов) и де й ствий, об е спечиваю щ их дости ж ение эти х целей .

На основе паттерна «План и руемый п роцесс» был разраб о тан патте р н «Проце с с исследования» (Investigation), а так ж е связанн ы й с ним паттерн « Специфи к ация исс л едования» (Investiga t ion specification). Паттерн «Спецификац и я исследо в ания» пр е дставляет собой некоторую к онцепцию исследования (цел ь исследования, объ е кт, предм е т, испол н ители, метод), кото р ая реализуется в ре а льном пр о цессе исс л едования.

С целью возможной детал и зации ча с тей спецификации исследован и я были р а зработаны паттерны «Метод исследования» (Study d esign) и « С пецифик а ция целей » (Objective specification). Пат т ерн «Метод исследо в ания» по з воляет представить и нформац и ю о том, к акие методы и как п ланируется примен я ть в проц е ссе исследования. П аттерн « С пецифика ц ия целей» позволяе т указать распределение задач и ролей ме ж ду участн и ками исс л едования.

Паттерн «Публикация об и сследован и и» позволяет отраз и ть, какие р езультат ы и кем были получ е ны по завершению п р оцесса и с следования, а также ф акты их п убликаци и в различных источниках.

3    Пример применения паттернов для представления знаний в онтологии ИПЗ

Рассм о трим применение р а зработан н ых паттернов на пр и мере патт е рна «Спе ц ификация исследования». UML-схема ег о классов и отношений предста в лена на р и сунке 3.

Рисунок 3 - UML с х ема паттер н а содержания «Специфи к ация исслед о вания»

Стрел к ами обозначены пр е дметные о тношения между п о нятиями п аттерна. О тношение «about» с в язывает информаци о нную су щ ность с объектом, который она. описывае т . Отношение «has- p art» связывает некот о рое поня т ие с его понятиями- ч астями. О т ношение « bearer-of» соединяет понятие-роль с пон я тием, кот о рое высту п ает носит е лем этой р оли.

В соответствии с технологией экстремального проектирования онтологий (eXtreme Design methodology, XD) [11,12] для каждого паттерна определяется набор квалификацион- ных вопросов. Они формулируются на естественном языке и указывают, какую информацию можно получить с помощью онтологии, в которой информация была представлена на основе данного паттерна.

Для паттерна «Специфик а ция иссле д ования» б ыли опре д елены сл е дующие к валификационные в опросы:

  •    Какой предмет в контексте данного о б ъекта пла н ировалос ь исследов а ть?

  •    Каков ы цели/ход/метод ис с ледования?

  •    Какие исследования плани р овались о т носитель н о данной с ущности?

  •    В каких исследованиях п л анировал о сь приме н ять данн ы й метод/ п реследова т ь данную цель?

В целом данный паттерн п озволяет о пределить части сп е цификаци и исследо в ания: описание це л и исследования (O b jective sp e cification), действий (Action s p ecificatio n ), объекта (Investiga t ion object specificati o n) и пред м ета (Investigation su b ject specif i cation) ис с ледования и применяемого метода (Study design).

Прим е нение данного паттерна закл ю чается в создании экземпляр о в соотве т ствующих классов в онтологии. Само с о держание этих экзе м пляров з а даётся н е которым т екстом на естествен н ом языке, который м ожет соо т ветствов а ть, напри м ер, некот о рому разделу заявки на получение гранта, постано в очной ст а тьи. «Привязка» так о го тексто в ого фраг м ента к экземпляру осуществляется пут ё м указани я значени я его анно т ационног о свойства (OWL Annotation property) «Описание» ( Descriptio n ).

Прим е р использования да н ного патт е рна приведён на рис у нке 4.

Рисунок 4 - Приме р использов а ния паттерн а «Специфи к ация исслед о вания»

На данном рисунке представлены э к земпляры, содержа щ ие инфо р мацию о некотором исследовании. При необходим о сти поль з ователь м о жет далее детализи р овать спе ц ификацию исследования за счёт использования пат т ернов «М е тод иссле д ования» ( S tudy desi g n) и «Спецификац и я целей» (Objective s pecificatio n ). Это позволит расширить м н ожество к валификационных в опросов и тем сам ы м позволи т получит ь дополни т ельную и н формаци ю об исследовании.

Рассм о трим применение п аттерна « М етод исследования » (Study d e sign) для получения более детализированного опи с ания спец и фикации исследова н ия. Его с х ема представлена на рисунке 5.

Данный паттерн является специали з ацией паттерна сод е ржания « О писание-Ситуация» (Descripti o n&Situation, DnS) [13]. Осн о ву патте р на DnS с оставляю т понятия ситуации (Situation ) и описания (Descr i ption). Си т уация задаёт некот о рое n-ар н ое отнош е ние (n>2)

между сущностями ПрО. Нап р имер, дви ж ение автомобиля п о городу с о скорость ю более 60 км/час. О п исание задаёт допо л нительну ю интерпр е тацию си т уации в д ругой сис т еме понятий, то ес т ь она переконцепту а лизирует п онятия ситуации по с редством своих пон я тий, которые обыч н о принадлежат дру г ой ПрО. Н апример, о писание « Нарушен и е скорост н ого режима», включающее понятия «Т р анспортн о е средство», «Место движения » , «Скоро с тное ограничение», задаёт новую интер п ретацию р ассмотренной ранее ситуации. В таком случае описание удо в летворяется (отнош е ние «is-sa t isfied-by» ) некоторо й ситуацие й .

Рисунок 5 - U M L схема пат т ерна содер ж ания «Мето д исследова н ия»

Таким образом, понятие « Метод ис с ледования» (Study d esign) свя з ывается ( о тношение «about») с методом (Method description ) и способом его п р именени я (Method application situation), которые она описыв а ет.

Прим е нение данного патт е рна для д е тализации описания метода ис с ледовани я состоит в определе н ии набора экземпля р ов класс а «Концеп т » (Concept), соответ с твующих понятиям, используемым в рамках данно г о метода ( отношение «describ e s»), и пос л едующей и х связкой (отношение «classifies») с экз е мплярами , соответствующими сущностя м ПрО (E n tity), которые составляют (отношение «is-setting-fo r ») ситуацию применения этог о метода. Например, в случае детализации метода « Н аблюден и е», в каче с тве комп о нентов ег о описани я задаются роли наблюдателя и наблюдае м ой сущн о сти и наблюдаемого параметр а , а удовле т воряющая ситуация может включать не к оторую п е рсону, как наблюд а теля, опр е деленный производ-ственный/природный процесс, как набл ю даемую сущность и е го продо л жительно с ть, как параметр.

Прим е нение этого паттер н а позволя е т расшир и ть множе с тво квали ф икацион н ых вопросов следующими:

  •    Как исследовались данные объекты?

  •    Каки м образом данный ме т од плани р уется при м енить в д а нном исс л едовании ?

Прим е р использования да н ного патт е рна приведен на рис у нке 6.

В дан н ом случае экземпл я р класса « Study design» допо л нительно с вязывает с я с экземплярами к лассов «Method desc r iption» и « Method a p plication situation», к о торые пр е дставляют более дет а лизированное и стр у ктуриров а нное описание того, как метод будет при м еняться в данном и с следовании.

Рассм о тренный принцип использова н ия разработанных п а ттернов и збавляет п ользователя от еди н овременной манипу л яции с бо л ьшим количеством п онятий и о тношени й и обеспечивает во з можность постепен н о наращи в ать слож н ость пре д ставления знаний о сущностях ПрО в зависимости от требова н ий задач и .

Рисунок 6 - П р имер испол ь зования паттерна «Мето д исследован и я»

Заключение

Представленная в данной работе о н тология И ПЗ задаёт специфи к у её использования, связанную с наличием большого число пользова т елей, обл а дающих р азличным опытом и знаниями в разных ПрО, а так ж е необхо д имостью согласован и я исполь з уемых им и подходов к представлению знаний в онт о логии. Н а ряду с этим следует обеспечит ь «правил ь ность» таких предс т авлений с точки зре н ия конце п туального и онтологического м оделиров а ния.

Рассм о тренный подход к п остроени ю онтолог и и ИПЗ пу т ём выдел е ния в ней отдельных паттернов содержания позвол я ет упрост и ть её применение п о льзовате л ем. Это о б условлено тем, что п ри использовании т о го или ин о го паттерна пользо в атель опе р ирует ограниченной понятийной системой, в рамк а х которо й решается одна кон к ретная за д ача онтол о гического моделиро в ания и чётко, в вид е набора к в алификац и онных во п росов, оп р еделены р езультаты такого ре ш ения. Наряду с эт и м примен е ние патт е рнов обеспечивает п риемлем ы й уровень качества п олученного онтолог и ческого п редставления ввиду т ого, что к а ждый па т терн представляет собой проверенный и доказав ш ий свою эффектив н ость вари а нт реше н ия задачи, ориентир о ванный на повторно е примене н ие в неко т ором наб о ре практи ч еских слу ч аев.

Работ а выполнена при по д держке Р о ссийского фонда фу н даментал ь ных иссл е дований -грант-16-07-00562, грант 15-07-03321.

Список литературы Разработка онтологии интегрированного пространства знаний

  • Олейник, А.Г. Развитие технологии концептуального моделирования, основанной на функционально-целевом подходе/ А.Г. Олейник, В.А. Путилов // История науки и техники, №1, 2014. - С.37-52.
  • Лапшин, В.А. Онтологии в компьютерных системах. - http://www.interface.ru/home.asp?artId=33244
  • Gruber, T.R. The role of common ontology in achieving sharable, reusable knowledge bases // Principles of Knowledge Representation and Reasoning. Proceedings of the Second International Conference. J.A. Allen, R. Fikes, E. Sandewell - eds. Morgan Kaufmann, 1991, 601-602.
  • Олейник, А.Г. О формировании единого пространства мультипредметных знаний Кольского научного центра РАН / Олейник А.Г., Ломов П.А. // Труды V-й международной конференции "Системный анализ и информационные технологии" САИТ-2013 (19-25 сентября 2013г., г. Красноярск, Россия) - Т.1 - Красноярск: ИВМ СО РАН, 2013. - С. 258-265.
  • Ломов, П.А. Применение паттернов онтологического проектирования для создания и использования онтологий в рамках интегрированного пространства знаний / П.А. Ломов // Онтология проектирования - 2015. -Том 5, №2(16). - с.233-245. - DOI: 10.18287/2223-9537-2015-5-2-233-245
Еще
Статья научная