Методы и средства виртуальной семантической интеграции данных из распределенных разнородных источников
Автор: Светлана Игоревна Чуприна, Ксения Вадимовна Гимашева
Журнал: Вестник Пермского университета. Серия: Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Компьютерные науки и информатика
Статья в выпуске: 1 (68), 2025 года.
Бесплатный доступ
Статья посвящена вопросам автоматизации обработки текстовых данных из распределенных разнородных источников на принципах их виртуальной семантической интеграции. Основная цель интеграции данных заключается в предоставлении пользователю унифицированного доступа к распределенным данным как к единому виртуальному хранилищу для выполнения запросов на естественном языке безотносительно формата хранения данных и их местоположения. В статье рассматриваются основные подходы, ориентированные на виртуальную семантическую интеграцию данных, и описана предлагаемая концепция построения онтологически управляемого инструментального окружения на базе технологии фабрик данных, что позволяет унифицировать и автоматизировать обработку данных за счет промежуточного слоя онтологий. Описывается реализация предложенной концепции в виде инструментального средства NuCoBoShell с сервисом запросов на естественном языке, который в отличие от поисковых сервисов интернет предоставляет возможность получения более полных ответов на запросы посредством автоматического извлечения необходимой информации из виртуальных источников, представляющих собой результат семантической интеграции не только разнородных веб-ресурсов, но и текстовых документов, хранящихся в доступных хранилищах данных и на локальном компьютере пользователя, без необходимости их физического копирования в единое хранилище.
Семантическая интеграции данных, виртуальная интеграция, онтология, онтологически управляемое решение, технология фабрик данных
Короткий адрес: https://sciup.org/147247355
IDR: 147247355 | DOI: 10.17072/1993-0550-2025-1-145-159
Список литературы Методы и средства виртуальной семантической интеграции данных из распределенных разнородных источников
- Тузовский А.Ф., Ямпольский В.З. Интеграция информации с использованием технологий semantic web // Проблемы информатики. 2011. № 2. С. 51–58.
- Ballard C. IBM Informix: Integration through data federation / C. Ballard, N. Davies, M. Gavazzi, J. Stephani, M. Lurie // IBM International Technical Support Organizat, 2003. 270 p. URL: http://www.iiug.org/library/ids/technical/sg247032.pdf (дата обращения: 30.06.2024).
- Patel A., Debnath, N.C., Bhushan, B. (Eds.). Semantic Web Technologies: Research and Applications (1st ed.). CRC Press. 2022. 404 p. DOI: 10.1201/9781003309420.
- Gruber T.R. A Translation approach to portable ontology specifications // Knowledge Acquisition. 1993. Vol. 5, № 2. P. 199–220.
- Большакова Е.И. Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие / Е.И. Большакова, К.В. Воронцов, Н.Э. Ефремова, Э.С. Клышинский, Н.В. Лукашевич, А.С. Сапин М.: НИУ ВШЭ, 2017. 269 с.
- Chuprina S.I. Using Data Fabric Architecture to Create Personalized Visual Analytics Systems in the Field of Digital Medicine // Scientific visualization. 2023. Vol. 15(5). P. 50–63. DOI: 10.26583/sv.15.5.05.
- Найденова, К.А., Невзорова О.А. Машинное обучение в задачах обработки естественного языка: обзор современного состояния исследований // Учен. зап. Казан. ун-та. Серия Физико-матем. науки. 2008. № 4. С. 5–24.
- Нурутдинов А.Р., Латыпов Р.Х. Перспективы биоинспирированного подхода в разработке систем искусственного интеллекта (обзор тенденций) // Учен. зап. Ка-зан. ун-та. Сер. Физико-матем. науки. 2022. Т. 164, кн. 2–3. С. 244–265. DOI: 10.26907/2541-7746.2022.2-3.244-265.
- Semantic Web W3C. URL: https://www.w3.org/standards/ (дата обращения: 30.06.2024).
- Calvanese D., De Giacomo G., Lenzerini M. Ontology of integration and integration of ontologies // Proc. of the 14th Int. Workshop on Description Logics (DL 2001). 1-3 Au-gust 2001, Stanford, CA, USA. Vol. 49. P. 10–19.
- Чуприна С.И., Гимашева К.В. Применение методов визуального анализа данных для выявления потребности в семантической интеграции данных // Труды между-нар. конф. по компьютерной графике и машинному зрению "Графикон 2024".17–19 сентября 2024, Омск. С. 389–402. DOI: 10.25206/978-5-8149-3873-2-2024-389-402.
- Gomes-Perez A., Fernandez-Lopez M., Corcho O. Ontological Engineering: with examples from the areas of Knowledge Management, e-Commerce and the Semantic Web (1st ed.). Springer-Verlag, London. 2004. 403 p.
- Davies J. Lightweight Ontologies // Theory and Applications of Ontology: Computer Applications. 2010. P. 197-229. DOI: 10.1007/978-90-481-8847-5_9.
- Ryabinin K., Chuprina S. Development of ontology-based multiplatform adaptive scientific visualization system // Journal of Computational Science. Elsevier. 2015. Vol. 10. P. 370–381. DOI: 10.1016/j.jocs.2015.03.003.
- Ryabinin K., Chuprina S., Belousov K. Ontology-Driven Automation of IoT-Based Human-Machine Interfaces Development // Computational Science – ICCS 2019 / Edit by J. M. F. Rodrigues. – Cham: Springer International Publishing, 2019. P. 110–124.
- Chuprina S.I. Ontology-Driven Visual Analytics Software Development / S. Chuprina, K. Ryabinin, K. Matkin, D. Koznov// Programming and Computer Software. 2022. Т. 48, № 3. P. 208–214. DOI: https://doi.org/10.1134/ S0361768822030033.
- Ryabinin K., Chuprina S., Labutin I. Tackling IoT Interoperability Problems with Ontology-Driven Smart Approach // Science and Global Challenges of the 21st Century - Science and Technology / Edit by A. Rocha, E. Isaeva. Cham: Springer International Publishing. 2022. P. 77–91.