Подход к моделированию процесса извлечения информации из текста на основе онтологии
Автор: Сидорова Е.А.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Инжиниринг онтологий
Статья в выпуске: 1 (27) т.8, 2018 года.
Бесплатный доступ
В статье рассматриваются модели и методы представления знаний, ориентированные на задачи автоматической обработки текста и извлечения информации. В рамках предлагаемого подхода извлечение информации рассматривается как процесс пополнения онтологии информацией, представленной в виде объектов - экземпляров понятий предметной области. Для описания данного процесса предложены три базовые модели. Модель представления текста задаёт общую схему обработки текста и обеспечивает отображение полученной информации на текст. Модель представления знаний включает описание предметной лексики, жанровые модели текста и модели фактов, которые позволяют смоделировать процессы извлечения информации в терминах семантических классов предметной лексики и онтологии предметной области. Используемая атрибутивная модель представления данных обеспечивает сохранение информационных потоков данных, возникающих в процессе извлечения информации, и позволяет применять онтологические методы для решения задач снятия неоднозначности интерпретации текста и разрешение кореференции. Таким образом, предложена оригинальная методика, позволяющая пользователям проектировать систему анализа текста и моделировать процессы извлечения информации на основе онтологии предметной области.
Извлечение информации, модель текста, словарь предметной лексики, модель факта, пополнение онтологии
Короткий адрес: https://sciup.org/170178773
IDR: 170178773 | DOI: 10.18287/2223-9537-2018-8-1-134-151
Список литературы Подход к моделированию процесса извлечения информации из текста на основе онтологии
- Petasis, G. Ontology Population and Enrichment: State of the Art/G. Petasis, V. Karkaletsis, G. Paliouras, A. Krithara, E. Zavitsanos//In Knowledge-driven multimedia information extraction and ontology evolution. -LNAI 6050. -Springer-Verlag Berlin, 2011. -P.134-166.
- Мельчук, И.А. Опыт теории лингвистических моделей: «Смысл-Текст». Семантика, синтаксис/И.А. Мельчук. -М.: Школа «Языки русской культуры», 1999. -992 с.
- Нариньяни, А.С. ТЕОН-2: от Тезауруса к Онтологии и обратно/А.С. Нариньяни//Труды международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. -М.: Наука, 2002. -Т.1. -С.307-313.
- Загорулько, Ю.А. Семантическая технология разработки интеллектуальных систем, ориентированная на экспертов предметной области/Ю.А. Загорулько//Онтология проектирования. -2015. -Т.5. -№1 (15). -С.30-46.
- Добров, Б.В. Онтологии и тезаурусы: модели, инструменты, приложения: учебное пособие/Б. В. Добров, В. В. Иванов, Н.В. Лукашевич, В.Д. Соловьев. -М.: Интернет-университет информационных технологий; БИНОМ. Лаборатория знаний, 2009. -173 с.