Инжиниринг онтологий. Рубрика в журнале - Онтология проектирования

Подход к автоматизированному наполнению графов знаний сущностями на основе анализа таблиц
Статья научная
Использование технологий Semantic Web , в том числе онтологий и графов знаний, является широко распространённой практикой при разработке современных интеллектуальных систем информационного поиска, рекомендательных и вопросно-ответных систем. Процесс разработки онтологий и графов знаний включает использование различных источников информации (например, баз данных, документов, концептуальных моделей). Таблицы являются одним из наиболее доступных и широко распространённых способов хранения и представления информации, а также ценным источником знаний в предметной области. В данной работе предлагается автоматизировать процесс извлечения конкретных сущностей (фактов) из табличных данных для последующего наполнения целевого графа знаний. Для этого разработан новый подход, ключевой особенностью которого является семантическая интерпретация (аннотирование) отдельных элементов таблицы. Приведено описание его основных этапов, показано применение подхода при решении практических задач создания предметных графов знаний, в том числе в области экспертизы промышленной безопасности нефтехимического оборудования и технологических комплексов. Выполнена экспериментальная оценка качества аннотирования на тестовом наборе табличных данных. Полученные результаты показали целесообразность использования предлагаемого подхода и разработанного программного обеспечения для решения задачи извлечения фактов из табличных данных для последующего наполнения целевого графа знаний.
Бесплатно

Статья научная
Социальные сети предоставляют исследователям возможности получения массива текстовых данных для дальнейшего анализа в рамках некоторой предметной области. Каждая предметная область имеет свой специфический профессиональный словарь и стиль написания текста. При определении предметной области текстового материала большую проблему представляет построение словарей, тезаурусов, онтологий. В данной статье под онтологией рассматривается лингвистическая онтология, направленная на определение предметной области текстового материала. Представлен алгоритм для автоматического построения онтологии на основе графа знаний Wikidata . Задача состоит в том, чтобы отобразить множество объектов графа знаний Wikidata на множество сущностей лингвистической онтологии. В статье предложен алгоритм определения степени принадлежности текстового материала предметной области. Эксперименты по оценке времени построения онтологии и применимости полученных лингвистических онтологий к задаче определения степени принадлежности текстовых материалов предметной области показали: время работы алгоритма и количество терминов в сформированной онтологии прямо пропорционально зависят от количества анализируемых свойств и объектов Wikidata ; сформированная лингвистическая онтология применима к задаче определения степени принадлежности текста предметной области.
Бесплатно

Подход к моделированию процесса извлечения информации из текста на основе онтологии
Статья научная
В статье рассматриваются модели и методы представления знаний, ориентированные на задачи автоматической обработки текста и извлечения информации. В рамках предлагаемого подхода извлечение информации рассматривается как процесс пополнения онтологии информацией, представленной в виде объектов - экземпляров понятий предметной области. Для описания данного процесса предложены три базовые модели. Модель представления текста задаёт общую схему обработки текста и обеспечивает отображение полученной информации на текст. Модель представления знаний включает описание предметной лексики, жанровые модели текста и модели фактов, которые позволяют смоделировать процессы извлечения информации в терминах семантических классов предметной лексики и онтологии предметной области. Используемая атрибутивная модель представления данных обеспечивает сохранение информационных потоков данных, возникающих в процессе извлечения информации, и позволяет применять онтологические методы для решения задач снятия неоднозначности интерпретации текста и разрешение кореференции. Таким образом, предложена оригинальная методика, позволяющая пользователям проектировать систему анализа текста и моделировать процессы извлечения информации на основе онтологии предметной области.
Бесплатно

Подход к созданию онтологий на основе электронных таблиц с произвольной структурой
Статья научная
Использование семантических технологий, в том числе онтологий, является широко распространенной практикой при создании современных интеллектуальных систем. Электронные таблицы являются одним из наиболее доступных и распространенных способов представления и хранения информации, который характеризуется большим разнообразием и разнородностью компоновок, стилей и содержания, оставаясь ценным источником структурированных предметных знаний. В работе предлагается автоматизировать процесс формирования онтологий на основе анализа и преобразования электронных таблиц, обладающих произвольной структурой. Представлен подход, обеспечивающий восстановление семантики табличных данных, концептуализацию и формализацию табличного содержания в форме онтологии. Приведены основные этапы подхода и описание разработанных программных средств. Данные средства использовались при решении практической задачи формирования онтологии для диагностирования и оценки технического состояния нефтехимического оборудования. В качестве исходных данных использовались электронные таблицы, извлечённые из отчётов по экспертизе промышленной безопасности нефтехимических комплексов. По результатам апробации сделан вывод о целесообразности использования предлагаемого подхода при прототипировании предметных онтологий.
Бесплатно

Подходы к автоматизации работ с онтологическими ресурсами
Статья обзорная
Онтологические модели находят широкое применение в системах информационного обеспечения, предоставляющих информационные ресурсы и услуги для решения управленческих, проектных и научно-технических задач. В частности, применение онтологий предметных областей распространено в системах поддержки принятия решений. При онтологическом моделировании сложных систем возникает потребность в автоматизации процессов работы с онтологическими ресурсами. В работе рассмотрены основные программные комплексы и методологии онтологического моделирования, подходы к автоматизации процессов создания, наполнения и использования онтологических моделей, отражения темпорального аспекта онтологического представления объектов. Цель работы состоит в рассмотрении методов автоматизации жизненного цикла онтологических ресурсов и анализе степени их адаптации в прикладных онтологиях. Отмечены относительно высокая степень автоматизации работы с онтологическими ресурсами в процессе наполнения онтологии и использование больших языковых моделей в данном процессе. Указано на недостаток описания методик автоматизации процессов конвертации информации из таблиц и схем в онтологические модели, валидации наполнения модели и её переработки. Показаны перспективные направления автоматизации работы с онтологическими ресурсами.
Бесплатно

Поиск зависимостей в данных на основе методов удовлетворения табличных ограничений
Статья научная
Работа посвящена поиску в данных особого типа закономерностей, называемых частыми паттернами. Под частым паттерном понимается некоторая совокупность признаков, которая характеризует большое количество объектов обучающей выборки. Существующие методы выявления паттернов, как правило, не позволяют гибко учитывать необходимые требования к их виду. Изменение условий, которым должны удовлетворять искомые закономерности, приводит к трудоёмкой модификации используемых алгоритмов и снижению производительности вычислений. В статье предлагается подход на основе парадигмы программирования в ограничениях, свободный от перечисленных недостатков. Подход основан на оригинальном способе представления обучающей выборки с помощью специализированных табличных ограничений - сжатых таблиц D -типа, на авторском методе поиска с возвратами, а также на специализированных правилах редукции для табличных ограничений. Особое внимание уделяется решению задачи поиска замкнутых паттернов, которая входит как часть в решение рассматриваемых в работе задач машинного обучения и включает учёт дополнительных требований к виду искомых паттернов. В качестве дополнительных требований к виду паттерна рассматриваются ограничения на частоту встречаемости замкнутого паттерна, а также условия на вхождение некоторого элемента (признака) в паттерн. К основным правилам редукции сжатых таблиц D -типа добавляются правила, учитывающие интересующие особенности анализируемых паттернов. Преимуществом подхода является то, что учёт и анализ новых ограничений позволяет на ранних стадиях процесса поиска исключать из рассмотрения заведомо неперспективные кандидаты в паттерны, что способствует сокращению количества этапов вычислений (узлов дерева поиска) и позволяет снизить расход оперативной памяти, требуемой для реализации этих этапов.
Бесплатно

Построение базы знаний для автономного управления беспилотными транспортными средствами
Статья научная
Представлен подход к построению и использованию базы знаний для автономного управления беспилотными транспортными средствами. В качестве предметной области представлено сельское хозяйство. Отсутствие достаточного количества и уровня квалификации механизаторов приводит к простою техники, снижению урожайности культур и эффективности использования химикатов. Использование беспилотных транспортных средств позволяет уменьшить влияние данных факторов и снизить вредное воздействие на людей, работающих в сельском хозяйстве. В статье основной упор сделан на учёт особенностей и ограничений предметной области при построении траекторий движения беспилотных транспортных средств и управлении средствами обработки. Предложен подход, состоящий из этапов проектирования схемы базы знаний, автоматизации процесса наполнения базы знаний и организации функции логического вывода. Для каждого этапа приведены разработанные модели и алгоритмы, позволяющие сформировать и использовать базу знаний при решении задачи автономного управления беспилотными транспортными средствами. Статья содержит примеры и иллюстрации, призванные повысить наглядность предложенного подхода.
Бесплатно

Статья научная
Рассматривается метод построения статистических моделей многосвязных объектов в виде многомерных регрессионных зависимостей на основе совместного использования измерительных данных и экспертных оценок. Основная идея метода заключается в преобразовании независимо полученных экспертных оценок и измерительных данных к единому виду - закону распределения непрерывной случайной величины. Это делает возможным сформировать корреляционную таблицу на основе решения обратной задачи определения закона распределения функции случайного аргумента. Сформированная корреляционная таблица служит основой построения регрессионной зависимости известными методами регрессионного анализа. Главным результатом работы является впервые предложенный метод построения многомерных регрессионных зависимостей за счѐт совместного использования экспертных оценок и измерительных данных.
Бесплатно

Применение графовых моделей в проектном управлении
Статья научная
Исследуется возможность применения графовых моделей в проектном управлении для решения задачи формирования проектной группы и распределения работ проекта между потенциальными исполнителями. Выделены возможные направления применения онтологического моделирования в проектном управлении. Средствами редактора онтологий Protégé реализована онтология проекта. Исследуется возможность построения векторных представлений элементов простых графов и графов знаний в задаче формирования проектной группы. Задачи исследования: построение графовых моделей проектов - простого графа и графа знаний; применение векторных представлений вершин и отношений графовых моделей для решения задачи распределения работ проекта. Рассматривается возможность применения мер семантической близости в онтологии. Новизна предложенного подхода заключается в использовании при формировании проектной группы данных об участниках реализованных проектов, что повышает вероятность успешной реализации проекта. Представление элементов графа в виде числовых векторов позволяет применить к исследованию предметной области методы машинного обучения. Приводится пример решения задачи формирования рабочей группы проекта, в котором осуществлён выбор исполнителей проектной работы. Все расчёты осуществлены средствами языка Python .
Бесплатно

Статья научная
Представлены результаты экспериментов по оценке применимости методов машинного обучения для решения задачи распознавания аргументативных связей в текстах научной коммуникации. Под аргументативной связью понимается отношение, связывающее посылку и заключение типового рассуждения или аргумента, используемого автором для убеждения аудитории. Для оценки качества применялись характеристики точности, полноты и F -меры, полученные при решении задачи распознавания аргументативных связей между смежными текстовыми фрагментами двух видов: предложений и клауз. Базой эксперимента послужил русскоязычный корпус текстов из области научной коммуникации с размеченной экспертами-лингвистами аргументацией. Для разметки использован инструмент ArgNetBank Studio , позволяющий создавать коллекции текстов с детализированной разметкой аргументации. На основе размеченных текстов построены наборы данных для машинного обучения, в которых соотношение связанных и несвязанных аргументативными отношениями пар фрагментов текста (предложений или клауз) составило 1 к 3. Для повышения качества обучения моделей наборы были сбалансированы двумя способами. В первом случае баланс достигался за счёт того, что из каждого текста отбиралось равное количество пар обоих типов, во втором - пары дублировались. На полученных наборах данных проведены эксперименты по связыванию фрагментов текста методами машинного обучения разных типов. Экспериментально определён диапазон изменения оценок качества при распознавании связанных фрагментов в зависимости от их доли в обучающей и тестовой коллекциях. Установлено, что в рамках существующего дисбаланса в реальных коллекциях значения оценок качества могут изменяться в пределах 40-50%. Новизна работы заключается в исследовании диапазона возможных расхождений в оценках качества при применении разных методов машинного обучения на сбалансированных и несбалансированных обучающих и тестовых коллекциях на русскоязычном материале.
Бесплатно

Статья научная
Описывается применение онтологического подхода к решению задачи генерации событийных данных, поступающих из журналов имитационных экспериментов. В настоящее время в рамках научного направления «Интеллектуальный анализ процессов» развиваются методы и алгоритмы, позволяющие решать задачи машинного обучения применительно к событийным данным. Имитационное моделирование в данном случае может играть важную роль для формирования обучающих выборок. Однако экспериментальные результаты имитации в виде журналов определённой структуры необходимо приводить к виду событийных журналов так, как они понимаются в интеллектуальном анализе процессов. В данной работе приводится постановка задачи формирования онтологического ресурса, позволяющего сформировать журнал событий по результатам имитационных экспериментов с дискретно-событийной моделью, в которой заявки на обработку представлены в виде агентов. Приводится формальное описание онтологии предметной области и алгоритм её доопределения на основе данных журналов имитационной модели. В качестве объекта имитации в работе предлагается рассматривать иерархическую систему принятия решений, в которую поступают задачи различной сложности. Уровень сложности задач является определяющим для выбора уровня иерархии, на котором данную задачу требуется решать. Приводится архитектура разработанной онтологической системы, а также структура понятий с соответствующими семантическими отношениями и наборами экземпляров.
Бесплатно

Статья научная
В работе исследована методика построения нечётких онтологий, а также разработана онтологическая модель оценки состояния вертолётных агрегатов. В статье приведено формальное описание нечётких онтологий и особенностей представления элементов нечётких аксиом в нотации FuzzyOWL. Согласно предложенному подходу, резюмирование состояния сложной технической системы осуществляется посредством логического вывода на базе нечёткой онтологии, объекты, свойства и аксиомы которой определяют параметры функций принадлежности и лингвистические переменные объектов анализа, представленных в виде временных рядов. Разработан программный продукт, обеспечивающий реализацию предложенного подхода. Проведены эксперименты по поиску аномальных ситуаций и поиску возможных неисправных вертолётных агрегатов с использованием разработанного подхода к интеграции нечётких временных рядов и нечёткой онтологии. Впервые получены результаты логического вывода знаний на основе интеграции нечётких временных рядов и нечётких онтологий в задачах анализа диагностики сложных технических систем. Предложенный подход интеграции нечётких временных рядов и нечётких онтологий позволил достоверно распознать аномальные ситуации и найти возможные неисправные агрегаты, соответствующие каждой аномальной ситуации.
Бесплатно

Разработка диагностических интеллектуальных систем на основе онтологий
Статья научная
Создание интеллектуальных проблемно-ориентированных систем различного назначения, направленных на решение слабоструктурированных задач, остаётся актуальной проблемой, эффективность решения которой может быть повышена путём совершенствования подходов (методологий) или создания специализированного программного обеспечения. В работе описывается подход к разработке интеллектуальных диагностических систем, включая базы знаний, на основе онтологических моделей. В качестве методологической основы используется модельно-управляемый подход, в рамках которого произведено переопределение основных этапов, уточнены модели, определены правила трансформации и средства реализации. Реализация предлагаемого подхода осуществлена на примере создания диагностических систем. Под диагностированием понимается определение состояния объекта, в том числе: контроль состояния, поиск места и определение причин нарушения функционирования (отказ, неисправность), прогнозирование состояния. Объекты, подвергаемые диагностированию, описываются в виде последовательности состояний, где состояние - это множество параметров объекта и их значений в заданный момент времени. Особенностью реализации подхода является использование: онтологии в качестве вычислительно-независимой модели, описывающей особенности решаемой задачи; оригинального визуального языка моделирования правил (Rule Visual Modeling Language) для описания платформо-независимых и платформо-зависимых моделей и языка программирования C Language Integrated Production System. Описан пример применения подхода с использованием прототипов программных средств: Knowledge Base Development System и Personal Knowledge Base Designer.
Бесплатно

Разработка онтологии для интернет-ресурса поддержки принятия решений в слабоформализованных областях
Статья научная
В статье представлена онтология области знаний «Поддержка принятия решений в слабоформализованных областях». Рассматриваются вопросы, связанные с контекстом предполагаемого использования онтологии. Данная онтология разрабатывается в качестве концептуальной основы интеллектуального научного Интернет-ресурса, который содержит систематизированную информацию об этой области знаний, предоставляет содержательный доступ к информации, методам её обработки, а также к методам решения типичных задач. В статье показано, что область знаний, описываемая онтологией, является расширением классической теории принятия решений, в фокусе исследований которой находятся вопросы, связанные с формированием, оцениванием и выбором вариантов решения проблемных ситуаций, т.е. заключительными этапами принятия решений. Представленная онтология, наряду с понятиями классической теории принятия решений, описывает средства и методы, которые были получены в смежных научных дисциплинах и которые могут успешно применяться в процессе принятия решений, в том числе и на его начальных этапах. Данная онтология, содержит также понятия, позволяющие описывать программные разработки и Интернет-ресурсы, созданные в рассматриваемой области знаний, что значительно повышает ценность создаваемого ресурса.
Бесплатно

Разработка онтологии интегрированного пространства знаний
Статья научная
В статье описывается продолжение исследований, направленных на формирование интегрированного пространства знаний для информационно-аналитической поддержки научных исследований и разработок по различным направлениям деятельности научного центра. Данная работа посвящена рассмотрению принципов построения и использования онтологической модели интегрированного пространства знаний (онтологии ИПЗ) различных научных областей. Данная онтология используется в качестве базиса для создания конкретных онтологий, создающихся и/или поддерживающихся отдельными исследовательскими учреждениями или научными коллективами. В статье представлена её реализация в виде системы онтологических паттернов содержания (Ontology Content Design Patterns), которые представляют собой небольшие целостные фрагменты онтологии, формализующие обобщённые ситуации предметной области (например, участие в событии, исполнении роли, наличие частей у объекта и др.). Паттерны содержания используются в качестве строительных блоков при разработке онтологий. Рассматривается общая система паттернов онтологии, а также описан общий принцип их применения для представления знаний. Приведены основные преимущества предлагаемого подхода к разработке онтологии ИПЗ, которые заключаются в упрощении её использования и обеспечении качества онтологического описания предметных знаний в разрабатываемых на её основе онтологиях за счёт повторного использования проверенных решений, представленных содержащимися в ней паттернами.
Бесплатно

Статья научная
Проектирование трубопроводных систем энергетики (тепло-, водо-, нефте-, газоснабжения и др.) представляет сложную задачу, требующую при её решении применения специализированного программного обеспечения. Предлагается использовать онтологии для структуризации знаний, которые применяются в процессах автоматизации разработки программного обеспечения, организации вычислительного процесса и информационного наполнения пользовательского интерфейса. Предложенный методологический подход включает следующие составляющие: состав онтологий, инструментальные средства реализации онтологий, методики построения онтологий (метаонтологии, онтологии конкретных классов, онтологии проектных задач, онтологии программного обеспечения). Показано, что применение онтологий позволяет получить следующие результаты: единую платформу для исследования и разработки новых методов, алгоритмов, математических моделей трубопроводных систем и их элементов; возможность автоматизации доступа к данным для разных типов систем и решаемых задач; автоматизированное построение программной системы. Представлен пример применения онтологий при разработке программного обеспечения. Приведена архитектура программной системы для решения задач проектирования трубопроводных систем различных типов и назначений.
Бесплатно

Разработка предметных графов знаний на основе семантического аннотирования табличных данных
Статья научная
В статье описывается подход и программное средство для автоматизированного пополнения предметно-ориентированных графов знаний новыми фактами, извлечёнными из семантически аннотированных табличных данных. Для семантического аннотирования столбцов таблиц предлагается использовать комбинацию из трёх эвристических методов, использующих результаты распознавания именованных сущностей в ячейках, лексическое сопоставление и группировку характеристик. Предлагаемый подход реализован в виде специального обработчика, входящего в состав программной платформы Talisman . Представлен пример и экспериментальная оценка предлагаемого подхода на этапе семантического аннотирования столбцов с использованием тестового набора табличных данных, который включает шесть тематических категорий: «сотрудники организации», «открытые вакансии», «рынок автомоделей», «известные учёные», «продажа книг», «рейтинг теннисистов». В качестве метрик оценки использовались точность, полнота и F -мера. Итоговая оценка по всем шести категориям составила: точности - 79%, полноты - 63%, F -меры - 70%. Полученные результаты показывают перспективность использования разработанного подхода для пополнения предметно-ориентированных графов знаний новыми фактами, извлечёнными из семантически аннотированных табличных данных. Приведены ограничения предлагаемого подхода.
Бесплатно

Статья научная
Рассматривается необходимость автоматизированного получения знаний интеллектуальными информационными системами из распределённой среды Web. Оценивается целесообразность использования онтологического анализа для представления таких знаний. Обосновывается необходимость пополнения этих знаний из более динамичных источников информации, предусматривающих автоматизированную обработку информации, к которым относятся семантические Wiki-ресурсы. Такая обработка информации требует разработки модели и методов сопоставления элементов Wiki с элементами онтологии. Проанализированы выразительные возможности технологической среды Semantic MediaWiki, которые могут использоваться для семантической разметки естественно-языковой и мультимедийной информации. Предложен метод семантической разметки Wiki-ресурсов с помощью элементов онтологическей модели предметной области, которая базируется на установлении соответствий между элементами формальной модели такой онтологии и элементами Semantic MediaWiki (категориями, семантическими свойствами, ссылками и т.п.). Разработан метод усовершенствования онтологии предметной области на основе Wiki-ресурса, семантически размеченного элементами этой онтологии. Приведена апробация разработанных моделей и методов на примере разработки электронной версии Большой украинской энциклопедии на платформе Semantic MediaWiki. Новизна работы заключается в способе сопоставления элементов онтологической модели предметной области с элементами семантического Wiki-ресурса, а также в методе усовершенствования онтологии предметной области, применяемой для семантической разметки Wiki-ресурса, на основе изменений и дополнений, которые вносятся в этот ресурс.
Бесплатно

Статья научная
Представлена концептуальная архитектура оболочки для интерактивных систем верификации математических доказательств и создаваемого с её помощью развиваемого тематического портала знаний. Описан процесс реализации всех программных и информационных компонентов оболочки на облачной платформе IACPaaS с использованием предоставляемых ею технологий и инструментальных средств их поддержки. Рассмотрен процесс разработки начального состояния портала знаний по верификации математических доказательств с использованием средств оболочки, способ использования портала знаний заинтересованными членами математического сообщества, а также механизмы изменения состояния портала его администратором. В состав начального состояния портала знаний входят: модель онтологии базы математических знаний, включающая спецификацию начального состояния языка представления математических знаний, редактор модели онтологии базы математических знаний, редактор базы математических знаний, редактор базы способов рассуждений, решатель задач оболочки, реализующий процесс конструирования доказательств в терминах модели онтологии доказательств. Также в состав начального состояния портала знаний входят начальное состояние базы математических знаний и начальное состояние базы способов рассуждений. Развитие портала знаний осуществляется по названным информационным компонентам. В этом процессе могут принимать участие все заинтересованные члены математического сообщества с помощью системы личных кабинетов платформы IACPaaS, в которых каждый пользователь может независимо развивать свою персональную копию текущего состояния общего портала знаний. Передача новых результатов в общий портал контролируется его администратором.
Бесплатно

Семантическое ядро цифровой платформы
Статья научная
Дано обобщённое описание интегрированного комплекса декларативных и процедурных средств, в совокупности обеспечивающих согласованное информационное (семантическое) представление сложных объектов на всех этапах их жизненного цикла. Знания (факты) представляются системой онтологий разного уровня, а структура - таксономиями и классификациями. Онтология определяется как система трёх взаимосвязанных систем (функциональной, понятийной и знаковой), а система таксономий представляет классы объектов и процессов, характерных для основных «координат» деятельности. Информационный поиск, как компонент семантического ядра, рассматривается как сложный самосогласованный процесс конструирования нового знания, где знание - это информация (тексты находимых документов), связываемая с контекстом задачи и представлениями пользователя. Такой контекст целенаправленно или косвенно задаётся пользователем посредством предопределённых семантических структур (таксономий, онтологий) либо посредством динамически формируемых компонентов (словников, выборок и т.д.). Это составляет существо семантического когнитивного поиска, когда система не только реализует отбор документов традиционными методами поиска, но и формирует образ информационной потребности, что, в свою очередь, позволит системе синтезировать комплексные, аспектно-ориентированные ответы. Предлагаются автоматизированные технологии поддержки лингвистического обеспечения, основанные на дистрибутивно-статистическом анализе как потоков объектного знания и неявного знания (извлекаемого системой в процессе взаимодействия), так и компонентов понятийно-терминологических систем. Представленные в статье средства апробированы в рамках разработанного программного комплекса xIRBIS-ML, предназначенного для организации семантического поиска в массивах данных сложных инженерных объектов.
Бесплатно