Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных

Автор: Павлов С.В., Ефремова О.А.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 3 (25) т.7, 2017 года.

Бесплатный доступ

Статья посвящена решению задачи интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных для организации информационной поддержки принятия решений по управлению крупным промышленным регионом. Для осуществления такого рода интеграции на семантическом уровне авторами предложена онтологическая модель, позволяющая описать с единых методологических позиций структуру разнородных баз пространственных данных, выделив в их составе онтологии пространственных, атрибутивных и метаданных. Разработан алгоритм построения и встраивания онтологии в программное обеспечение интеграции разнородных по структуре и тематике пространственных баз данных. Апробация разработанного алгоритма осуществлена на примере создания единой региональной базы пространственных данных в составе Геоинформационной системы органов исполнительной власти Республики Башкортостан.

Еще

Онтология, пространственные данные, базы данных, интеграция, промышленный регион, принятие решений

Короткий адрес: https://sciup.org/170178760

IDR: 170178760   |   DOI: 10.18287/2223-9537-2017-7-3-323-333

Текст научной статьи Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных

В процессе принятия решений по управлению крупным промышленным регионом огромную роль играет вопрос наличия и своевременного предоставления пространственной информации о территории региона (карт территории различных масштабов, снимков из космоса, ортофотопланов), о промышленных и других объектах, расположенных на его территории. На сегодняшний день, как в органах исполнительной власти, так и на предприятиях, существует множество различных источников пространственной информации [1]. В качестве основных особенностей данных источников необходимо отметить их неоднородность и динамическую пополняемость. Для организации информационной поддержки принятия решений по управлению крупным промышленным регионом необходимо объединить данные из разных источников в единую региональную базу данных (БД).

Часть источников представляет собой структурированные данные (реляционные или объектно-ориентированные БД), часть - неструктурированные данные (тексты, документы и др., содержащие в своём составе пространственные данные), а часть являются квазиструкту-рированными (например, различного вида отчёты и атласы).

Широкие возможности для создания интегрированных БД предоставляют современные семантически ориентированные технологии, одной из наиболее перспективных является технология представления знаний в виде онтологий [2-5].

1    Онтологическая модель процесса интеграции пространственных баз данных

Онтологическая модель интегрированной пространственной БД представляет собой совокупность онтологических моделей отдельных информационных систем, пространственных БД, текстов документов, отчетов и атласов, т.е. онтологий отдельных источников пространственной информации (см. рисунок 1).

Рисунок 1 - Онтологическая модель интеграции пространственных баз данных

Интегрирующую онтологическую модель пространственных данных О можно представить в виде следующей совокупности объектов:

  • (1)                             O = ( K , R , F , T , I \

где K = { K i ,.„Kn } - множество концептов или терминов (понятий) предметной области;

F = { f 1 ,^fi } - множество функций отображения множества концептов отдельных источников пространственных данных во множество концептов единой онтологической модели рассматриваемой предметной области. Необходимо отметить, что функция F не является биективной, так как одному концепту результирующей онтологической модели К^, может соответствовать некоторое множество концептов онтологических моделей источников пространственных данных;

T = { T 1 ,...,T z } - множество типов данных;

I = { I 1 ,^,I l } - множество источников пространственных данных.

F: A ^ O, F: B ^ O, F: C ^ O, где A = {A1,...,Aj} - множество концептов предметной области А;

B = { B 1 ,...,B r } - множество концептов предметной области B;

C = { c p..., C f } - множество концептов предметной области C.

Важной особенностью пространственных БД является то, что в их состав входят три типа данных - пространственные, атрибутивные и метаданные, соответственно онтологическая модель отдельного i-го источника пространственных данных - пространственных БД - может быть представлена в следующем виде:

  • (2)                              М Од, = ( О М , О ПД , О АД },

где О - онтология метаданных;

О ПД - онтология пространственных данных;

О АД - онтология атрибутивных данных.

Онтология метаданных - это онтология верхнего уровня, которая содержит базовые понятия и отношения между ними, используемые в дальнейшем при построении онтологий пространственных и атрибутивных данных.

Онтология метаданных (см. рисунок 2) может быть представлена следующим соотноше- нием:

где KM

RM

M

{ к M ,...,

О М = { K М , R М , S М },

K M } - множество концептов метаданных;

{ R M ,..., R WM } - множество { s 1 M ,..., S M } - множество

отношений между концептами метаданных; свойств классов метаданных.

Рисунок 2 - Онтология метаданных базы пространственных данных

Онтология пространственных данных содержит описание основных типов пространственных объектов, их свойств, связей между ними, а также описание свойств используемой топологии. Пример онтологической модели пространственных данных представлен на рисунке 3. Онтология пространственных данных может быть представлена в следующем виде:

  • (4)                             О ПД = { К ПД , К ПД , К ПД }

где К ПД = { К 1ПД, .„, К П } - множество концептов пространственных данных;

К ПД = { R 1П^Д , _. ,R wп^Д } - множество отношений между концептами пространственных данных;

S ^ = { 8 1 ПД , .„ , 8т Пд } - множество свойств классов пространственных данных.

Для всех трёх типов пространственных данных, исходя из того, что для пространственных объектов характерны свои виды отношений [4, 5], множество R можно представить в виде:

  • (5)                           R ПД = {L, V , N ,D,Y,Z} ,

где L - отношение « Касается » (часть объекта из класса пространственных объектов 1 соприкасается с границей объекта из класса пространственных объектов 2, внутренние части объектов не пересекаются);

  • V - отношение « Содержит » (объект из класса пространственных объектов 1 полностью включает в себя объект из класса пространственных объектов 2);

  • N - отношение « Пересекает » (любая часть объекта из класса пространственных объектов 1 соприкасается с любой частью объекта из класса пространственных объектов 2);

  • D - отношение « Внутри » (объект из класса пространственных объектов 2 полностью включает в себя объект из класса пространственных объектов 1);

  • Y - отношение « Пересекает » (внутренняя часть объекта из класса пространственных объектов 1 в какой-либо точке соприкасается с внутренней частью или границей (в случае с полигоном) объекта из класса пространственных объектов 2);

Z - отношение « Перекрывает » (внутренняя часть объекта из класса пространственных объектов 1 частично перекрывает объект из класса пространственных объектов 2, сравниваться могут только объекты с одинаковой геометрией).

Рисунок 3 - Пример онтологической модели пространственных данных

Онтология атрибутивных данных содержит описание основных объектов, их свойств, связей между ними. Онтологию атрибутивных данных предлагается представить следующим соотношением:

  • (6)                        О АД = { K АД , R АД , S АД },

    где К АД

    R АД


    АД ,.


    , К АД } -


    множество концептов атрибутивных данных;


    S АД   { S Д


    \ R.U,...,RW^ } - множество отношений между концептами атрибутивных данных.


    S ^ } - множество свойств классов атрибутивных данных.


Для атрибутивных данных могут быть выделены следующие виды отношений из множества R :

  • (7)                          R АД = {P, H},

где P - множество парадигматических отношений: причинно-следственные, отношения обобщения и агрегации;

Н - синтагматические отношения, заданные дескриптивной логикой.

2 Алгоритм построения и встраивания онтологиив программное обеспечение для интеграции пространственных баз данных

Круг применения онтологий в программном обеспечении (ПО) различного назначения довольно широк [6-9]. Однако вопросам построения и внедрения онтологии в ПО для интеграции пространственных БД уделено недостаточно внимания.

В большинстве случаев современные онтологии строятся одинаково [6,10,11]. Так, в первую очередь определяются область и масштабы создаваемой онтологии и перечисляются важные термины и базовые понятия в онтологии. Затем осуществляется определение классов и отношений между ними, свойств классов и наложение ограничений на их значения. Заключительным этапом является создание отдельных экземпляров или индивидов классов и придание значений атрибутам и свойствам. (см. рисунок 4).

Начало 4 Классификация базовых понятий

Отбор базовых понятий

*    ~

Определение отношений

4    ~

Формирование концептуальной схемы

Рисунок 4 - Алгоритм построения онтологии

Для решения задачи интеграции разрозненных пространственных БД и организации поиска пространственных данных из различных источников необходимо включить процесс создания онтологии в процедуру разработки ПО. Для этого необходимо выполнить следующие этапы.

  • 1)    организовать обработку пространственных данных в составе БД с учётом требований для обеспечения организации интеллектуальной поддержки принятия решений по

управлению регионом.

  • 2)    создать и дополнить онтологию пространственных данных, проверить на достаточность, корректность и непротиворечивость данных.

  • 3)    разработать типовые сценарии обработки пространственных данных в текущей онтологии пространственных данных.

Алгоритм построения и встраивания онтологии в ПО для интеграции пространственных

БД представлен на рисунке 5.

БПД – база пространственных данных

Рисунок 5 – Алгоритм интеллектуализации ГИС на основе онтологии

Применение данного алгоритма при разработке ПО позволяет обеспечить интеграцию пространственных данных из различных источников, а также повысить качество результатов запросов и упростить поиск интересующей пространственной информации.

3    Пример интеграции разнородных по структуре и тематике пространственных баз данных с использованием онтологической модели

Одним из примеров реализации онтологической модели интеграции пространственных БД и алгоритма её встраивания в ПО для интеграции пространственных БД является Геоин-формационная система органов исполнительной власти республики Башкортостан (ГИС ОИВ РБ). Основной целью создания данной системы является обеспечение органов исполнительной власти республики актуальной, достоверной и комплексной геопространственной информацией для оперативного исследования, оценки и обоснования управленческих решений. Для интеграции пространственных БД различных органов исполнительной власти в единую региональную БД была разработана онтологическая модель, на основе которой был разработан каталог ресурсов системы, позволяющий осуществить интеграцию разрозненных пространственных БД [5]. Логическая структура ГИС ОИВ РБ представлена на рисунке 6.

Пример интеграции в ГИС ОИВ РБ пространственных БД двух органов исполнительной власти - Министерства связи и массовых коммуникаций и Министерства природопользования и экологии Республики Башкортостан представлен на рисунке 7. Результаты интеграции пространственных БД этих двух ведомств позволяют выявить места размещения базовых станций операторов сотовой связи, расположенные на территории особо охраняемых природных территорий, а также организовать поддержку принятия решений по размещению объектов связи на территории республики.

Заключение

Предложенная онтологическая модель интеграции разрозненных по структуре и тематике БД позволяет описать с единых позиций структуру разнородных пространственных БД и тем самым обеспечить возможность их дальнейшей интеграции в единую региональную базу. Использование данной модели на практике позволяет снизить затраты за счёт отсутствия необходимости в постоянных корректировках программ, моделей данных, разработки различных конвертеров, а также дублирования информации в различных информационных системах.

s ь га

Рисунок 6 – Логическая структура ГИС ОИВ РБ

Рисунок 7 – Пример интеграции пространственных баз данных двух органов исполнительной власти

Список литературы Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных

  • Павлов, С.В. Интеграция пространственной информации в геоинформационной системе органов исполнительной власти на основе сервис-ориентированной архитектуры / С.В. Павлов, О.А. Ефремова, И.У. Ямалов // Вестник УГАТУ - 2013. Т. 17, №.5(58). - С. 129-139.
  • Смирнов, А.В. Онтологии в системах искусственного интеллекта: способы построения и организации (часть 1) / А.В. Смирнов, М.П. Пашкин, Н.Г. Шилов, Т.В. Левашова // Новости искусственного интеллекта, № 1 (49) 2002. - C.3-13.
  • Кучуганов, М.В. Синтез схем баз данных на основе онтологии / М.В. Кучуганов // Онтология проектирования. - 2016. - Т. 6, №4(22). - С. 475-484. - DOI: 10.18287/2223-9537-2016-6-4-475-484
  • Ефремова, О.А. Применение системного подхода к анализу проблемы использования пространственной информации для поддержки принятия решений региональными органами исполнительной власти. Электронный научный журнал «Инженерный вестник Дона». №2, 2014.http://www.ivdon.ru/ru/magazine
  • Ефремова, О.А. Применение метода фасетной классификации для организации каталога метаданных в составе Геоинформационной системы органов исполнительной власти Республики Башкортостан / О.А. Ефремова, Р.А. Кравченко // Современные проблемы науки и образования. - 2014. - № 5; - http://www.science-education.ru/119-14524.
Еще
Статья научная