Подход к созданию онтологий на основе электронных таблиц с произвольной структурой

Автор: Видия А.В., Дородных Н.О., Юрин А.Ю.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 2 (40) т.11, 2021 года.

Бесплатный доступ

Использование семантических технологий, в том числе онтологий, является широко распространенной практикой при создании современных интеллектуальных систем. Электронные таблицы являются одним из наиболее доступных и распространенных способов представления и хранения информации, который характеризуется большим разнообразием и разнородностью компоновок, стилей и содержания, оставаясь ценным источником структурированных предметных знаний. В работе предлагается автоматизировать процесс формирования онтологий на основе анализа и преобразования электронных таблиц, обладающих произвольной структурой. Представлен подход, обеспечивающий восстановление семантики табличных данных, концептуализацию и формализацию табличного содержания в форме онтологии. Приведены основные этапы подхода и описание разработанных программных средств. Данные средства использовались при решении практической задачи формирования онтологии для диагностирования и оценки технического состояния нефтехимического оборудования. В качестве исходных данных использовались электронные таблицы, извлечённые из отчётов по экспертизе промышленной безопасности нефтехимических комплексов. По результатам апробации сделан вывод о целесообразности использования предлагаемого подхода при прототипировании предметных онтологий.

Еще

Приобретение знаний, семантические технологии, онтологический инжиниринг, онтология, электронная таблица, экспертиза промышленной безопасности

Короткий адрес: https://sciup.org/170178885

IDR: 170178885   |   УДК: 004.89   |   DOI: 10.18287/2223-9537-2021-11-2-212-226

An approach to creating freeform spreadsheet ontology

The use of semantic technologies including ontologies is a widespread practice in modern intelligent system engineering. Spreadsheets are one of the most accessible and common ways of representing and storing information which are characterized by a wide variety and heterogeneity of layouts, styles and content while remaining a valuable source of domain knowledge. The paper proposes to automate the process of ontology engineering based on the analysis and transformation of spreadsheets with an arbitrary layout. For this purpose a new approach is presented that provides the restoration of the semantics of tabular data, conceptualization, and formalization of tabular content in the form of ontology. The main stages of the proposed approach and a description of the software are presented. The developed software was used to solve the practical problem of ontology engineering for diagnosing and assessing the technical condition of petrochemical equipment. Spreadsheets extracted from reports on industrial safety inspection of petrochemical complexes were used as the initial data. Based on the results of approbation, it was concluded that it is advisable to use the proposed approach when prototyping subject ontologies.

Еще

Список литературы Подход к созданию онтологий на основе электронных таблиц с произвольной структурой

  • Гаврилова, Т.А. Инженерия знаний. Модели и методы / Т.А. Гаврилова, Д.В. Кудрявцев, Д.И. Муромцев. -СПб.: Лань, 2016. - 324 с.
  • Schreiber, G. The KACTUS View on the 'O' Word / G. Schreiber, B.J. Wielinga, W.N.H. Jansweijer // In: Proceedings of IJCAI95 Workshop on Basic Ontological Issues in Knowledge Sharing, 1995. - P.159-168.
  • Lopez, M.F. Building a chemical ontology using METHONTOLOGY and the ontology design environment / M.F. Lopez, A. Gomez-Perez, J.P. Sierra, A.P. Sierra // IEEE Intelligent Systems. - 1999. - Vol. 14(1). - P.37-46.
  • Staab, S. Knowledge processes and ontologies / S. Staab, R. Studer, H.-P. Schnurr, Y. Sure // IEEE Intelligent Systems. - 2001. - Vol. 16(1). - P.26-34.
  • Suárez-Figueroa, M.C. Ontology engineering in a networked world / M.C. Suárez-Figueroa, A. Gómez-Pérez, E. Motta, A. Gangemi // Springer-Verlag Berlin Heidelberg. - 2012.
  • Grau, B.C. OWL 2: The next step for OWL / B.C. Grau, I. Horrocks, B. Motik, B. Parsia, P. Patel-Schneider, U. Sattler // Web Semantics: Science, Services and Agents on the World Wide Web. - 2008. - Vol. 6(4). - P.309-322.
  • Web Data Commons. - http://webdatacommons.org.
  • Han, L. RDF123: From spreadsheets to RDF / L. Han, T. Finin, C. Parr, J. Sachs, A. Joshi // In: Proceedings of the 7th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 5318. - SpringerVerlag Berlin Heidelberg, 2008. - P.451-466.
  • Lebo, T. Converting governmental datasets into Linked Data / T. Lebo, G. Williams // In: Proceedings of the 6th International Conference on Semantic Systems, 2010. - P.1-3.
  • Scharffe, F. Enabling Linked Data publication with the Datalift platform / F. Scharffe, G. Atemezing, R. Troncy, F. Gandon, S. Villata, B. Bucher, F. Hamdi, L. Bihanic, G. Képéklian, F. Cotton, J. Euzenat, Z. Fan, P.Y. Vandenbussche, B. Vatant // In: Proceedings of the AAAI workshop on semantic cities. In 26th Conference on Artificial Intelligence, W10: Semantic Cities. - 2012. - P.25-30.
  • Spread2RDF. - https://github.com/marcelotto/spread2rdf.
  • Bowers, S. Owlifier: Creating OWL-DL ontologies from simple spreadsheet-based knowledge descriptions / S. Bowers, J.S. Madin, M.P. Schildhauer // Ecological Informatics. - 2010. - Vol. 5(1). - P.19-25.
  • Jupp, S. Populous: A tool for building OWL ontologies from templates / S. Jupp, M. Horridge, L. Iannone, J. Klein, S. Owen, J. Schanstra, K. Wolstencroft, R. Stevens // BMC Bioinformatics. - 2011. - Vol. 13. - P.1-12.
  • Zhang, X. Ontology based data conversion from spreadsheet to OWL / X. Zhang, R. Di, X. Feng // In: Proceedings of the 2012 Seventh China Grid Annual Conference. - 2012. - P.76-79.
  • Tahar, K. An Approach to support collaborative ontology construction / K. Tahar, M. Schaaf, F. Jahn, C. Kücherer, B. Paech, H. Herre, A. Winter // Studies in health technology and informatics. - 2016 - Vol. 228. -P.369-373.
  • Langegger, A. XLWrap - Querying and Integrating Arbitrary Spreadsheets with SPARQL / A. Langegger, W. Woß // In: Proceedings of the 8th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 5823. - Springer-Verlag Berlin Heidelberg, 2009. - P.359-374.
  • O'Connor, M.J. Mapping Master: A flexible approach for mapping spreadsheets to OWL / M.J. O'Connor, C. Halaschek-Wiener, M.A. Musen // In: Proceedings of the 9th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 6497. - Springer-Verlag Berlin Heidelberg, 2010. - P.194-208.
  • Dimou, A. RML: A generic language for integrated RDF mappings of heterogeneous data / A. Dimou, M.V. Sande, P. Colpaert, R. Verborgh, E. Mannens, R.V.D. Walle // In: Proceedings of the Workshop on Linked Data on the Web, Co-located with the 23rd International World Wide Web Conference. - 2014. - P.1-5.
  • Fiorelli, M. Sheet2RDF: A flexible and dynamic spreadsheet import & lifting framework for RDF / M. Fiorelli, T. Lorenzetti, M.T. Pazienza, A. Stellato, A. Turbati // In: Proceedings of the 28th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems. Lecture Notes in Computer Science, vol. 9101. - Springer-Verlag Berlin Heidelberg, 2015. - P.131-140.
  • Bischof, S. Mapping between RDF and XML with XSPARQL / S. Bischof, S. Decker, T. Krennwallner, N. Lopes, A. Polleres // Journal on Data Semantics. - 2012. - Vol. 1(3). - P.147-185.
  • Lefrangois, M. A SPARQL extension for generating RDF from heterogeneous formats / M. Lefrangois, A. Zimmermann, N. Bakerally // In: Proceedings of the 14th International Conference, European Semantic Web Conference (ESWC). Lecture Notes in Computer Science, vol. 10249. - Springer-Verlag Berlin Heidelberg, 2017. -P.35-50.
  • Tarql: SPARQL for Tables. - http://tarql.github.io/.
  • Generating RDF from Tabular Data on the Web. - https://www.w3.org/TR/csv2rdf/.
  • W3C ConverterToRdf. - https://www.w3.org/wiki/ConverterToRdf.
  • Shigarov, A.O. Rule-based spreadsheet data transformation from arbitrary to relational tables / A.O. Shigarov, A.A. Mikhailov // Information Systems. - 2017. - Vol. 71. - P.123-136.
  • Tijerino, Y.A. Towards ontology generation from tables / Y.A. Tijerino, D.W. Embley, D.W. Lonsdale, Y. Ding, G. Nagy // World Wide Web: Internet and Web Information Systems. - 2005. - Vol. 8(8). - P.261-285.
  • Shigarov, A.O. TabbyXL: Software platform for rule-based spreadsheet data extraction and transformation / A.O. Shigarov, V.V. Khristyuk, A.A. Mikhailov // SoftwareX. - 2019. - Vol. 10. - 100270.
  • Dorodnykh, N.O. Conceptual model engineering for industrial safety inspection based on spreadsheet data analysis / N.O. Dorodnykh, A.Yu. Yurin, A.O. Shigarov // In: Proceedings of the 6th International Conference on Modelling and Development of Intelligent Systems (MDIS 2019). Communications in Computer and Information Science, vol. 1126. - Springer-Verlag Berlin Heidelberg, 2020. - P.51-65.
  • Stanford Named Entity Recognizer. - https://nlp.stanford.edu/software/CRF-NER.html.
  • Дородных, Н.О. Разработка схем онтологий на основе преобразования электронных таблиц / H.О. Дородных, А.В. Видия, А.Ю. Юрин // Программные продукты и системы. - 2021. - № 1. - С.124-131.
  • Yurin, A.Yu. Personal knowledge base designer: Software for expert systems prototyping / A.Yu. Yurin, N.O. Dorodnykh // SoftwareX. - 2020. - Vol. 11. - 100411.
  • Берман, А. Ф. Информационно-аналитическая поддержка экспертизы промышленной безопасности объектов химии, нефтехимии и нефтепереработки / А.Ф. Берман, К.А. Кузнецов, О.А. Николайчук, А.И. Павлов, А.Ю. Юрин // Химическое и нефтегазовое машиностроение. - 2018. - № 8. - С.30-36.
  • Грищенко, М.А. Разработка интеллектуальных диагностических систем на основе онтологий / М.А. Грищенко, Н.О. Дородных, С.А. Коршунов, А.Ю. Юрин // Онтология проектирования. - 2018. - Т. 8. -№ 2(28). - С.265-284. DOI: 10.18287/2223-9537-2018-8-2-265-284.
Еще