Инжиниринг онтологий. Рубрика в журнале - Онтология проектирования

Публикации в рубрике (63): Инжиниринг онтологий
все рубрики
Нечёткий анализ формальных понятий при разработке онтологий

Нечёткий анализ формальных понятий при разработке онтологий

Офицеров В.П., Смирнов С.В.

Статья научная

Анализ формальных понятий (АФП) - строгая математическая теория анализа данных, в которой отражен классический подход к понятию как к фундаментальному эпистемологическому элементу, определяемому объемом и содержанием. АФП пригоден для вывода формальных онтологий из экспериментальных данных, представляющих предметные области, и в этом смысле нечёткий АФП (НАФП) - адаптация метода к реальному характеру этой информации. Новым является исследование генезиса нечёткости формальных контекстов, что вызывает необходимость включения в орбиту вывода онтологий специальных этапов первичной обработки данных. Показано, что некоторые причины рассматриваемой нечёткости имманентны технологии порождения формального контекста из экспериментальных данных. Другие факторы этой нечёткости выявлены в ходе морфологического анализа базовой эмпирической структуры - таблицы «объекты-свойства». Показано, что интерпретация дополнительной информации возможна с помощью элементарных приёмов нечёткого вывода. С критических позиций проанализированы варианты применения НАФП для построения нечётких онтологий.

Бесплатно

О классе, классификации и систематизации

О классе, классификации и систематизации

Микони С.В.

Статья научная

Рассмотрены определения понятия классификации в отечественных источниках. Обнаружены существенные различия в имеющихся трактовках, связанные с обозначением классификации, как процесса, так и его результата. Предложено именовать эти понятия разными терминами. Для устранения неточностей в определении классификации, её методов и связи с систематизацией знания предложено привлечь математические модели класса, классифицирования и системы. Рассматриваются модели формирования классов, используемые различными методами классифицирования объектов. Систематизированы свойства методов классифицирования и получаемых с их применением классификаций. Рассмотрен метод деления объёма понятий. На конкретном примере показана ошибка, допущенная в цитируемой работе за счёт неправильного выбора модели формирования класса. Рассмотрены индуктивные методы классифицирования объектов и метод архетипа. На основании анализа модели системы показывается соотношение классификации и систематизации, которое иллюстрируется на примере периодической системы химических элементов Д.И. Менделеева. Уточнены понятия классификации.

Бесплатно

Онтологии для разработки и генерации адаптивных пользовательских интерфейсов редакторов баз знаний

Онтологии для разработки и генерации адаптивных пользовательских интерфейсов редакторов баз знаний

Грибова В.В., Паршкова С.В., Федорищев Л.А.

Статья научная

Рассматривается метод создания автоматически генерируемых адаптивных пользовательских интерфейсов редакторов баз знаний, построенных на основе онтологического подхода, с целью улучшения качества работы по формированию и редактированию баз знаний с учётом специфики предметной области, характеристик пользователя-эксперта и других параметров. Приведено описание концепции авторского подхода к генерации адаптивных интерфейсов используемых онтологий, баз знаний и моделей, как ключевых элементов предложенного подхода. В онтологии знаний о проектировании интерфейса вводятся новые абстрактные элементы, определяющие интерфейсные задачи без явного их визуального и функционального представления. Каждый абстрактный элемент этой онтологии имеет несколько вариантов представления - адаптаций абстрактных элементов. Онтология графических элементов пользовательского интерфейса определяет конкретное визуальное и функциональное представление абстрактных элементов в виде готовых повторно используемых таких элементов. База знаний о проектировании интерфейса содержит правила его формирования в зависимости от структуры онтологии предметной области, характеристик пользователя, требований удобства и простоты использования. Модель интерфейса описывает структуру сформированного адаптивного интерфейса в соответствии с внесёнными индивидуальными предпочтениями пользователя и другой дополнительной информацией. Все рассмотренные онтологии и базы знаний реализованы на платформе IACPaaS .

Бесплатно

Онтологии управления качеством компьютерных данных об изделии

Онтологии управления качеством компьютерных данных об изделии

Шильников П.С.

Статья научная

Расширение применения компьютерной техники в информационном сопровождении жизненного цикла изделия приводит к возникновению и росту проблем, вызванных зависимостью компьютерных документов от средств интерпретации этих документов. В статье рассмотрено качество компьютерных данных об изделии (PDQ - Product Data Quality). Под качеством данных об изделии понимается отсутствие дефектов качества данных. Дефект качества данных - это существование таких особенностей компьютерной модели изделия, которые препятствуют последующей обработке модели. Под управлением качеством компьютерных данных понимается чередование транзакций обнаружения и устранения дефектов качества данных. Сформулированы основные задачи, решение которых будет способствовать повышению качества компьютерных данных конструкторской документации об изделии. Для повышения качества компьютерных данных об изделии необходимо определить влияние дефектов качества данных на выполнение последующей обработки компьютерных документов, взаимосвязь дефектов качества данных, последовательность транзакций управления качеством данных и возможность искажения модели изделия в результате устранения дефектов качества данных. Новым [Н36] в статье является комплексный подход к задаче управления качеством компьютерных данных об изделии. При формулировании задач использовались публикации, результаты, полученные по итогам НИОКР, а также опыт многолетней эксплуатации и усовершенствования программных модулей проверки, исправления и импорта файлов в CAD-системы APM Studio.

Бесплатно

Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных

Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных

Павлов С.В., Ефремова О.А.

Статья научная

Статья посвящена решению задачи интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных для организации информационной поддержки принятия решений по управлению крупным промышленным регионом. Для осуществления такого рода интеграции на семантическом уровне авторами предложена онтологическая модель, позволяющая описать с единых методологических позиций структуру разнородных баз пространственных данных, выделив в их составе онтологии пространственных, атрибутивных и метаданных. Разработан алгоритм построения и встраивания онтологии в программное обеспечение интеграции разнородных по структуре и тематике пространственных баз данных. Апробация разработанного алгоритма осуществлена на примере создания единой региональной базы пространственных данных в составе Геоинформационной системы органов исполнительной власти Республики Башкортостан.

Бесплатно

Онтологическая система "знания-деятельность"

Онтологическая система "знания-деятельность"

Максимов Н.В., Лебедев А.А.

Статья научная

Рассматривается подход к построению онтологического описания рациональной деятельности. Подобное описание может служить дополнительным источником для входа в информационное пространство, расширяет класс возможных индексов для описания документов и позволяет осуществлять контекстный поиск. Рассмотрены назначение и особенности использования онтологий при описании предметной области, как с теоретической, так и с прикладной точки зрения. Обозначены критерии для выделения типов онтологий. Исходя из принципов схематизма познания, разработана система онтологий представления знаний, объединяющая язык, формы представления знаний и схемы процессов. Показано, что такая система онтологий даёт возможность практического использования онтологий в вычислительных средах. Для комплексного описания производственной (рациональной) деятельности представлены онтологии артефакта и процессов, разрабатываемые на основе анализа государственных и международных стандартов. Онтология артефакта представляет собой описание объекта - средства и результата целенаправленной деятельности, онтология процессов - формализованное описание жизненного цикла деятельности. С помощью онтологии артефакта становится возможным представить логическую структуру деятельности, а с помощью онтологии процессов - временную структуру, которые совместно определяют две стороны описания сложной деятельности. Предложенная онтология процессов включает иерархически связанную совокупность этапов жизненного цикла деятельности, объекты и субъекты деятельности каждого этапа и исполняет роль «навигационной карты» для субъектов деятельности, позволяя им ориентироваться в сложных организационных структурах.

Бесплатно

Онтологические модели трансформации данных о состоянии технических объектов

Онтологические модели трансформации данных о состоянии технических объектов

Жукова Н.А.

Статья научная

Для наблюдения за техническими объектами на них устанавливается множество датчиков, которые позволяют собирать данные о состоянии этих объектов. В зависимости от свойств собираемых данных и решаемых практических задач определяются процессы их обработки. При изменении данных или требований к результатам их обработки процессы перестраиваются. Для обеспечения эффективной обработки предложены метод и модель трансформации данных. Они предусматривают формальное описание последовательностей трансформаций в общем виде, а также их представление в виде процессов обработки. Для практической реализации метода предложено представлять трансформации в виде связанных онтологических моделей, включающих функциональную, информационную и процессно-сервисные модели. Построение моделей осуществляется с использованием правил, множество которых представляется в виде управляющей модели. Приводится онтологическая модель для трансформации данных, представленных в виде временных рядов. Структуру еѐ классов определяют классификаторы, определѐнные для исходных временных рядов и их представлений, а также методов, алгоритмов и процедур их обработки и оценки результатов. Приводится пример обработки результатов измерений значений параметров давления технического объекта космического назначения при проведении технического контроля его состояния.

Бесплатно

Онтологический инжиниринг для поддержки принятия стратегических решений в энергетике

Онтологический инжиниринг для поддержки принятия стратегических решений в энергетике

Массель Л.В., Ворожцова Т.Н., Пяткова Н.И.

Статья научная

В статье описывается понятие онтологического инжиниринга как одного из методов формализации и моделирования знаний и возможности его применения для целей поддержки принятия решений в энергетике. Выполнен онтологический инжиниринг проблемы ситуационного управления, предложенного авторами для поддержки принятия стратегических решений по развитию энергетики с учётом требований энергетической безопасности. Использование принципов ситуационного управления соответствует общей схеме исследований проблемы энергетической безопасности и принятия стратегических решений, связанных с оценкой состояния объектов энергетики и топливно-энергетического комплекса в целом, а также с выбором основных направлений их дальнейшего функционирования и развития. В статье представлены в графическом виде онтологии, отражающие основные понятия ситуационного управления, включая ситуационный анализ и ситуационное моделирование, а также вариант онтологии ситуации, рассмотренной с позиции исследования проблемы энергетической безопасности. Разработанный и представленный комплекс онтологий позволяет интегрировать основные, достаточно разнородные понятия исследуемой предметной области в единую систему, называемую онтологическим пространством знаний, для дальнейшего использования при разработке программного обеспечения для исследований и поддержки принятия решений в энергетике.

Бесплатно

Онтологический подход к оценке тематики научного текста

Онтологический подход к оценке тематики научного текста

Кузнецов О.П., Суховеров В.С.

Статья научная

В работе предлагается подход к определению тематики научного текста, использующий онтологию предметной области. Излагается оригинальный принцип построения онтологии прикладных наук, при котором дерево онтологии содержит три обязательных ветви: «Фундаментальные теории», «Прикладные теории», «Области приложений», классами онтологии являются темы, а экземплярами классов - термины соответствующих тем. Описывается строение онтологии наук об управлении. Приводятся фрагменты онтологии управления и её словаря. Предполагается, что научный текст релевантен теме, если он содержит термины этой темы. Предлагается метод оценки степени релевантности научного текста различным темам, основанный на подсчёте числа вхождений в документ терминов этих тем. Результатом работы этого метода является «профиль документа» - вектор релевантностей документа темам онтологии. Описывается автоматическая система анализа тематики научных текстов из области теории и практики управления, разработанная на основании предложенного подхода. Обсуждаются лингвистические проблемы поиска терминов. Приведены некоторые статистические данные обработки тематических разделов журнала «Автоматика и телемеханика» и пример построения профиля для конкретной статьи журнала. Отмечаются возможные направления улучшения оценок релевантности.

Бесплатно

Онтологическое проектирование гибридных семантически совместимых интеллектуальных систем на основе смыслового представления знаний

Онтологическое проектирование гибридных семантически совместимых интеллектуальных систем на основе смыслового представления знаний

Голенков В.В., Гулякина Н.А., Давыденко И.Т., Шункевич Д.В., Еремеев А.П.

Статья научная

Работа посвящена проблеме обеспечения семантической совместимости интеллектуальных систем. Показано, что обеспечение совместимости интеллектуальных систем и разработка соответствующих стандартов является ключевым направлением развития технологий проектирования интеллектуальных систем. Формально уточнено понятие смыслового представления информации в памяти интеллектуальной системы, которое обеспечивает однозначность представления информации с использованием заданного набора понятий. Показана возможность автоматической интеграции знаний в рамках смыслового представления знаний, которая сводится к склеиванию синонимичных знаков. Показана возможность автоматической интеграции различных моделей обработки знаний, если эти модели представляют собой коллективы агентов, ориентированных на обработку знаний, представленных в памяти интеллектуальных систем в смысловой форме, и взаимодействующих между собой через указанную память. Предложена Технология OSTIS, ориентированная на разработку семантических компьютерных систем. Предложена концепция Экосистемы OSTIS, представляющей собой коллектив взаимодействующих интеллектуальных систем, построенных по Технологии OSTIS и поддерживающих эволюцию и совместимость интеллектуальных систем в ходе их эксплуатации в рамках данной экосистемы. Рассмотрены примеры использования Технологии OSTIS при разработке прикладных интеллектуальных систем.

Бесплатно

Онтологическое проектирование подсистемы оценки обстановки интеллектуальных агентов

Онтологическое проектирование подсистемы оценки обстановки интеллектуальных агентов

Лебедев С.В., Пантелеев М.Г.

Статья научная

Рассматривается онтологический подход к проектированию подсистем оценки обстановки (ПОО) интеллектуальных агентов (ИА), функционирующих в динамических многоагентных средах, в том числе в условиях группового противодействия. Подход основан на выделении аспектов построения ПОО, инвариантных конкретным областям применения агентов и решаемым ими задачам. В качестве теоретического базиса процесса проектирования предложено семейство моделей, формализующих различные аспекты построения и функционирования ПОО, с учётом представления разных компонентов внутренней модели мира агента, особенностей организации процесса вычислений и этапов проектирования ПОО. Предложенные модели позволяют с единых позиций проектировать ПОО для разных ИА с использованием онтологий. Выделены два класса онтологий, поддерживающих процесс проектирования: онтология ПОО и онтологии конкретных предметных областей. Онтология ПОО обеспечивает интеграцию в инвариантный каркас программного кода, реализующего функции оценки обстановки для конкретного агента. Онтология предметной области расширяет онтологию ПОО и поддерживает автоматическую генерацию программного кода и его интеграцию в инвариантный каркас ПОО. Генерация программного кода ПОО для конкретного ИА обеспечивается предложенными отображениями онтологических классов и свойств в программные структуры. Рассмотрен прототип инструментальной платформы разработки ПОО, реализованный с использованием языков представления и обработки онтологий OWL, SPARQL, SPIN и языка программирования Java. Подход иллюстрируется построением ПОО агента, функционирующего в среде виртуального футбола.

Бесплатно

Онтология и анимация прецедентов

Онтология и анимация прецедентов

Кучуганов В.Н.

Статья научная

В работе описана мета-онтология, предназначенная для накопления, классификации, контроля и поиска прецедентов, представляющих экземпляры конкретных ситуаций и сценариев, которые возникают при практической деятельности в той или иной предметной области. Особенностью онтологий, создаваемых на её основе, является наличие прагматических - алгоритмических, геометрических, предикатных, графовых - моделей понятий, с помощью которых, дополнительно к средствам логического вывода, можно осуществлять «анимацию» прецедентов для визуального контроля и поддержки принятия решений. Алгоритмические модели могут быть заданы формулой, программой, анимационным файлом в формате GIF. Геометрические модели задаются файлами в форматах XML, SVG, JPG и др. Графы также могут быть заданы в формате XML и ему подобных. Предикатные модели - это логические выражения, задаваемые в строковом виде. В результате синтаксического и семантического анализа текста формируется прагматическая семантическая модель, которая отображает атрибутивный граф ситуации или сценария. В этом графе вершинами являются предметы, процессы и отношения, а рёбрами - связи между ними. Описаны эксперименты с использованием системы Protege для разработки онтологий.

Бесплатно

Онтология объединения информационных подсистем: принципы и примеры

Онтология объединения информационных подсистем: принципы и примеры

Набатов А.Н., Веденяпин И.Э.

Статья научная

Статья посвящена вопросам объединения онтологий, которые используются при проектировании отдельных систем, входящих в корпоративную информационную систему. Данная задача возникает при построении единой онтологии для проектирования информационных систем в процессе интеграции различных информационных решений, а также при последовательном проектировании корпоративной информационной системы разными разработчиками в разное время. Предполагается, что онтологии построены по единым принципам и на основе единого тезауруса. Задача построения единой онтологии может представлять значительные трудности, связанные с необходимостью объединять онтологии, описывающие разные подсистемы предприятия. Рассмотрены вопросы формального определения возможности объединения онтологий без их предварительной доработки. Предложен критерий возможности объединения, разработана методика его расчёта на основе экспертных оценок. Рассмотрены примеры объединения онтологий с расчётом предложенного критерия. Новизна результатов заключается в разработке принципа и критерия объединения онтологий, разработке методики применения предложенного критерия.

Бесплатно

Онтология пользовательских интерфейсов в кибернетической модели интеллектуальных систем

Онтология пользовательских интерфейсов в кибернетической модели интеллектуальных систем

Костенко К.И., Белкин В.Ю.

Статья научная

Предложена модель интеллектуальной системы, поддерживающей высокоуровневое управление процессами профессионального применения многообразия знаний о программных интерфейсах с внешними пользователями. Унифицированная абстрактная модель системы базируется на согласованном семействе инвариантов модели формализма представления знаний, включающем: систему классов морфизмов абстрактных знаний и доменов морфизмов таких классов; инвариантов многомерной архитектуры компонентов интеллектуальных систем, включающей межкомпонентные потоки знаний и процессы синтеза знаний внутри компонентов; инвариантов агентов управления потоками и процессами обработки абстрактных знаний. Базу знаний модели составляют фрагменты онтологии предметных и профессиональных знаний, распределённые между компонентами многомерной архитектуры. Архитектура компонентов модели опирается на значения измерений, соответствующих аспектам абстрактности, структурированности и уровня знаний. В онтологиях отражаются представления о структурах памяти и процессах мышления, применяемых для моделирования схем профессиональной деятельности специалиста. Основой формализации таких представлений являются фундаментальные понятия философии, лингвистики, когнитивной психологи, математики, инженерии систем. Это позволяет сформировать содержательно полную систему классов информационных структур и процессов синтеза сложных знаний, поддерживающих извлечение, анализ и применение знаний о пользовательских интерфейсах в интеллектуальной системе. Процессами синтеза моделируется достижение разнообразных когнитивных целей, необходимых для осуществления профессиональной деятельности специалистов. Многообразие таких целей моделируется системой шаблонов высокоуровневой реализации. Они составлены из целей базовых типов, реализуемых с использованием когнитивных операций над знаниями, синтезируемыми из элементов онтологий. В качестве унифицированного представления знаний применяются структуры знаний в формате семантических иерархий. Когнитивные цели реализуются комбинациями операций над структурированными знаниями, адаптированными к специальным классам структур.

Бесплатно

Оптимизация отображения онтологий методом роя частиц

Оптимизация отображения онтологий методом роя частиц

Семенова А.В., Курейчик В.М.

Статья научная

Работа посвящена интеграции данных распределённых гетерогенных информационных источников на основе онтологий. Метод вычисления семантической близости концептов позволяет количественно оценить сходство между понятиями. Предложена технология оценки семантической близости концептов двух онтологий, отличительной особенностью которой является автоматическое определение весовых коэффициентов с использованием метода роя частиц. С помощью предложенного подхода генерируются векторы весовых коэффициентов, которые соответствуют разным коэффициентам семантической близости. Полученные весовые коэффициенты используются для объединения разных коэффициентов семантической близости. Новизна заключается в том, что применённый метод роя частиц позволяет автоматически определять весовые коэффициенты семантической близости концептов двух онтологий. Таким образом, для каждого концепта одной онтологии формируется множество релевантных семантических концептов другой онтологии. Благодаря этому возможно получать наборы оптимальных и квазиоптимальных решений.

Бесплатно

Особенности наследования информации в задачах интеграции систем технической подготовки производства

Особенности наследования информации в задачах интеграции систем технической подготовки производства

Щкин А.В.

Статья научная

Рассматриваются особенности наследования информации в технической подготовке производства при передаче данных из систем конструкторского проектирования (CAD) в системы технологической подготовки производства (CAM). К этим особенностям относятся объектно-ориентированный характер передаваемой информации и влияние PLM-контекстов на семантику инженерных данных. Объектно-ориентированный подход подразумевает наличие в процессах передачи информации «родителей» и их «потомков» и ассоциативных связей между ними, что делает возможным повторное использование проектных решений. UML-представление позволяет наглядно описать различные схемы наследования информации при интеграции CAM-систем с системами конструкторского проектирования. Эти схемы необходимо учитывать при реализации сквозных конструкторско-технологических проектов с высоким уровнем ассоциативности данных. Передача информации между подсистемами цифрового PLM-пространства предприятия происходит под влиянием информационных контекстов. Дано определение PLM-контекста как онтологии этапа жизненного цикла изделия, выступающего внешней информационной средой по отношению к интегрируемым приложениям. Разработан предварительный вариант онтологии предметной области, связанной с технологической подготовкой производства. Информацию об этапах жизненного цикла изделия предложено хранить непосредственно внутри 3D-модели объекта в форматах онтологического представления знаний на базе стандарта XML. Особенности наследования конструкторской информации рассматриваются на примере интеграции разрабатываемой CAM-системы с её базовой CAD-платформой КОМПАС-3D. Предложена стратегия автоматизации процесса влияния PLM-контекстов на значения передаваемых данных.

Бесплатно

Оценка длины обучающей последовательности в задаче распознавания образов (биоиндикация)

Оценка длины обучающей последовательности в задаче распознавания образов (биоиндикация)

Розенберг Г.С.

Статья научная

Задача создания системы распознавания образов распадается на ряд подзадач: формализации предметной области, формирования обучающей выборки, обучения системы распознавания, снижения размерности пространства признаков, собственно задача распознавания (по степени сходства распознаваемого объекта с обучающей выборкой), контроля качества распознавания, адаптации, обратной задачи распознавания, кластерного и конструктивного анализа, когнитивного анализа. В статье рассматривается формализация одной из подзадач (формирования обучающей выборки). С помощью предложенной вероятностной модели сделан вывод о «почти линейной зависимости» длины обучающей последовательности и размерности пространства признаков. Получена оценка длины обучающей последовательности для реалистичных значений параметров модели.

Бесплатно

Платформа для исследования аргументации в научно-популярном дискурсе

Платформа для исследования аргументации в научно-популярном дискурсе

Сидорова Е.А., Ахмадеева И.Р., Загорулько Ю.А., Серый А.С., Шестаков В.К.

Статья научная

Рассматривается программная система, предназначенная для поддержки исследования аргументации в русскоязычных научно-популярных текстах. Эта система базируется на онтологии, построенной на современных принципах моделирования аргументации. Данная онтология содержит формальные описания типовых схем рассуждений, на основе которых выполняется аннотирование текстов, анализ представленной в них аргументации и оценка её убедительности относительно заданной аудитории. Предлагается методика аргументативной разметки текста, которая обеспечивает выделение в нем утверждений и построение на их основе графа аргументации с использованием знаний о типовых схемах рассуждений. Описывается набор веб-инструментов, обеспечивающих создание тематических корпусов текстов, визуализацию используемой онтологии аргументации, построение графа аргументации, выделение в текстах индикаторов аргументации, а также поиск различных сущностей в корпусах текстов в терминах онтологии. Аналитические инструменты представлены средствами сбора статистической информации о встречаемости типовых элементов аргументации в корпусе текстов, средствами исследования индикаторов аргументации и средствами анализа убедительности аргументации. Представлена оригинальная методика исследования аргументации в научно-популярном дискурсе, базирующаяся на онтологии аргументации и поддержанная специализированной веб-платформой.

Бесплатно

Подход к автоматизированному наполнению графов знаний сущностями на основе анализа таблиц

Подход к автоматизированному наполнению графов знаний сущностями на основе анализа таблиц

Дородных Н.О., Юрин А.Ю.

Статья научная

Использование технологий Semantic Web , в том числе онтологий и графов знаний, является широко распространённой практикой при разработке современных интеллектуальных систем информационного поиска, рекомендательных и вопросно-ответных систем. Процесс разработки онтологий и графов знаний включает использование различных источников информации (например, баз данных, документов, концептуальных моделей). Таблицы являются одним из наиболее доступных и широко распространённых способов хранения и представления информации, а также ценным источником знаний в предметной области. В данной работе предлагается автоматизировать процесс извлечения конкретных сущностей (фактов) из табличных данных для последующего наполнения целевого графа знаний. Для этого разработан новый подход, ключевой особенностью которого является семантическая интерпретация (аннотирование) отдельных элементов таблицы. Приведено описание его основных этапов, показано применение подхода при решении практических задач создания предметных графов знаний, в том числе в области экспертизы промышленной безопасности нефтехимического оборудования и технологических комплексов. Выполнена экспериментальная оценка качества аннотирования на тестовом наборе табличных данных. Полученные результаты показали целесообразность использования предлагаемого подхода и разработанного программного обеспечения для решения задачи извлечения фактов из табличных данных для последующего наполнения целевого графа знаний.

Бесплатно

Подход к автоматическому построению лингвистической онтологии для определения интересов пользователей социальных сетей

Подход к автоматическому построению лингвистической онтологии для определения интересов пользователей социальных сетей

Наместников А.М., Пирогова Н.Д., Филиппов А.А.

Статья научная

Социальные сети предоставляют исследователям возможности получения массива текстовых данных для дальнейшего анализа в рамках некоторой предметной области. Каждая предметная область имеет свой специфический профессиональный словарь и стиль написания текста. При определении предметной области текстового материала большую проблему представляет построение словарей, тезаурусов, онтологий. В данной статье под онтологией рассматривается лингвистическая онтология, направленная на определение предметной области текстового материала. Представлен алгоритм для автоматического построения онтологии на основе графа знаний Wikidata . Задача состоит в том, чтобы отобразить множество объектов графа знаний Wikidata на множество сущностей лингвистической онтологии. В статье предложен алгоритм определения степени принадлежности текстового материала предметной области. Эксперименты по оценке времени построения онтологии и применимости полученных лингвистических онтологий к задаче определения степени принадлежности текстовых материалов предметной области показали: время работы алгоритма и количество терминов в сформированной онтологии прямо пропорционально зависят от количества анализируемых свойств и объектов Wikidata ; сформированная лингвистическая онтология применима к задаче определения степени принадлежности текста предметной области.

Бесплатно

Журнал