Подход к созданию онтологий на основе электронных таблиц с произвольной структурой
Автор: Видия А.В., Дородных Н.О., Юрин А.Ю.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Инжиниринг онтологий
Статья в выпуске: 2 (40) т.11, 2021 года.
Бесплатный доступ
Использование семантических технологий, в том числе онтологий, является широко распространенной практикой при создании современных интеллектуальных систем. Электронные таблицы являются одним из наиболее доступных и распространенных способов представления и хранения информации, который характеризуется большим разнообразием и разнородностью компоновок, стилей и содержания, оставаясь ценным источником структурированных предметных знаний. В работе предлагается автоматизировать процесс формирования онтологий на основе анализа и преобразования электронных таблиц, обладающих произвольной структурой. Представлен подход, обеспечивающий восстановление семантики табличных данных, концептуализацию и формализацию табличного содержания в форме онтологии. Приведены основные этапы подхода и описание разработанных программных средств. Данные средства использовались при решении практической задачи формирования онтологии для диагностирования и оценки технического состояния нефтехимического оборудования. В качестве исходных данных использовались электронные таблицы, извлечённые из отчётов по экспертизе промышленной безопасности нефтехимических комплексов. По результатам апробации сделан вывод о целесообразности использования предлагаемого подхода при прототипировании предметных онтологий.
Приобретение знаний, семантические технологии, онтологический инжиниринг, онтология, электронная таблица, экспертиза промышленной безопасности
Короткий адрес: https://sciup.org/170178885
IDR: 170178885 | DOI: 10.18287/2223-9537-2021-11-2-212-226
Список литературы Подход к созданию онтологий на основе электронных таблиц с произвольной структурой
- Гаврилова, Т.А. Инженерия знаний. Модели и методы / Т.А. Гаврилова, Д.В. Кудрявцев, Д.И. Муромцев. -СПб.: Лань, 2016. - 324 с.
- Schreiber, G. The KACTUS View on the 'O' Word / G. Schreiber, B.J. Wielinga, W.N.H. Jansweijer // In: Proceedings of IJCAI95 Workshop on Basic Ontological Issues in Knowledge Sharing, 1995. - P.159-168.
- Lopez, M.F. Building a chemical ontology using METHONTOLOGY and the ontology design environment / M.F. Lopez, A. Gomez-Perez, J.P. Sierra, A.P. Sierra // IEEE Intelligent Systems. - 1999. - Vol. 14(1). - P.37-46.
- Staab, S. Knowledge processes and ontologies / S. Staab, R. Studer, H.-P. Schnurr, Y. Sure // IEEE Intelligent Systems. - 2001. - Vol. 16(1). - P.26-34.
- Suárez-Figueroa, M.C. Ontology engineering in a networked world / M.C. Suárez-Figueroa, A. Gómez-Pérez, E. Motta, A. Gangemi // Springer-Verlag Berlin Heidelberg. - 2012.
- Grau, B.C. OWL 2: The next step for OWL / B.C. Grau, I. Horrocks, B. Motik, B. Parsia, P. Patel-Schneider, U. Sattler // Web Semantics: Science, Services and Agents on the World Wide Web. - 2008. - Vol. 6(4). - P.309-322.
- Web Data Commons. - http://webdatacommons.org.
- Han, L. RDF123: From spreadsheets to RDF / L. Han, T. Finin, C. Parr, J. Sachs, A. Joshi // In: Proceedings of the 7th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 5318. - SpringerVerlag Berlin Heidelberg, 2008. - P.451-466.
- Lebo, T. Converting governmental datasets into Linked Data / T. Lebo, G. Williams // In: Proceedings of the 6th International Conference on Semantic Systems, 2010. - P.1-3.
- Scharffe, F. Enabling Linked Data publication with the Datalift platform / F. Scharffe, G. Atemezing, R. Troncy, F. Gandon, S. Villata, B. Bucher, F. Hamdi, L. Bihanic, G. Képéklian, F. Cotton, J. Euzenat, Z. Fan, P.Y. Vandenbussche, B. Vatant // In: Proceedings of the AAAI workshop on semantic cities. In 26th Conference on Artificial Intelligence, W10: Semantic Cities. - 2012. - P.25-30.
- Spread2RDF. - https://github.com/marcelotto/spread2rdf.
- Bowers, S. Owlifier: Creating OWL-DL ontologies from simple spreadsheet-based knowledge descriptions / S. Bowers, J.S. Madin, M.P. Schildhauer // Ecological Informatics. - 2010. - Vol. 5(1). - P.19-25.
- Jupp, S. Populous: A tool for building OWL ontologies from templates / S. Jupp, M. Horridge, L. Iannone, J. Klein, S. Owen, J. Schanstra, K. Wolstencroft, R. Stevens // BMC Bioinformatics. - 2011. - Vol. 13. - P.1-12.
- Zhang, X. Ontology based data conversion from spreadsheet to OWL / X. Zhang, R. Di, X. Feng // In: Proceedings of the 2012 Seventh China Grid Annual Conference. - 2012. - P.76-79.
- Tahar, K. An Approach to support collaborative ontology construction / K. Tahar, M. Schaaf, F. Jahn, C. Kücherer, B. Paech, H. Herre, A. Winter // Studies in health technology and informatics. - 2016 - Vol. 228. -P.369-373.
- Langegger, A. XLWrap - Querying and Integrating Arbitrary Spreadsheets with SPARQL / A. Langegger, W. Woß // In: Proceedings of the 8th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 5823. - Springer-Verlag Berlin Heidelberg, 2009. - P.359-374.
- O'Connor, M.J. Mapping Master: A flexible approach for mapping spreadsheets to OWL / M.J. O'Connor, C. Halaschek-Wiener, M.A. Musen // In: Proceedings of the 9th International Semantic Web Conference (ISWC). Lecture Notes in Computer Science, vol. 6497. - Springer-Verlag Berlin Heidelberg, 2010. - P.194-208.
- Dimou, A. RML: A generic language for integrated RDF mappings of heterogeneous data / A. Dimou, M.V. Sande, P. Colpaert, R. Verborgh, E. Mannens, R.V.D. Walle // In: Proceedings of the Workshop on Linked Data on the Web, Co-located with the 23rd International World Wide Web Conference. - 2014. - P.1-5.
- Fiorelli, M. Sheet2RDF: A flexible and dynamic spreadsheet import & lifting framework for RDF / M. Fiorelli, T. Lorenzetti, M.T. Pazienza, A. Stellato, A. Turbati // In: Proceedings of the 28th International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems. Lecture Notes in Computer Science, vol. 9101. - Springer-Verlag Berlin Heidelberg, 2015. - P.131-140.
- Bischof, S. Mapping between RDF and XML with XSPARQL / S. Bischof, S. Decker, T. Krennwallner, N. Lopes, A. Polleres // Journal on Data Semantics. - 2012. - Vol. 1(3). - P.147-185.
- Lefrangois, M. A SPARQL extension for generating RDF from heterogeneous formats / M. Lefrangois, A. Zimmermann, N. Bakerally // In: Proceedings of the 14th International Conference, European Semantic Web Conference (ESWC). Lecture Notes in Computer Science, vol. 10249. - Springer-Verlag Berlin Heidelberg, 2017. -P.35-50.
- Tarql: SPARQL for Tables. - http://tarql.github.io/.
- Generating RDF from Tabular Data on the Web. - https://www.w3.org/TR/csv2rdf/.
- W3C ConverterToRdf. - https://www.w3.org/wiki/ConverterToRdf.
- Shigarov, A.O. Rule-based spreadsheet data transformation from arbitrary to relational tables / A.O. Shigarov, A.A. Mikhailov // Information Systems. - 2017. - Vol. 71. - P.123-136.
- Tijerino, Y.A. Towards ontology generation from tables / Y.A. Tijerino, D.W. Embley, D.W. Lonsdale, Y. Ding, G. Nagy // World Wide Web: Internet and Web Information Systems. - 2005. - Vol. 8(8). - P.261-285.
- Shigarov, A.O. TabbyXL: Software platform for rule-based spreadsheet data extraction and transformation / A.O. Shigarov, V.V. Khristyuk, A.A. Mikhailov // SoftwareX. - 2019. - Vol. 10. - 100270.
- Dorodnykh, N.O. Conceptual model engineering for industrial safety inspection based on spreadsheet data analysis / N.O. Dorodnykh, A.Yu. Yurin, A.O. Shigarov // In: Proceedings of the 6th International Conference on Modelling and Development of Intelligent Systems (MDIS 2019). Communications in Computer and Information Science, vol. 1126. - Springer-Verlag Berlin Heidelberg, 2020. - P.51-65.
- Stanford Named Entity Recognizer. - https://nlp.stanford.edu/software/CRF-NER.html.
- Дородных, Н.О. Разработка схем онтологий на основе преобразования электронных таблиц / H.О. Дородных, А.В. Видия, А.Ю. Юрин // Программные продукты и системы. - 2021. - № 1. - С.124-131.
- Yurin, A.Yu. Personal knowledge base designer: Software for expert systems prototyping / A.Yu. Yurin, N.O. Dorodnykh // SoftwareX. - 2020. - Vol. 11. - 100411.
- Берман, А. Ф. Информационно-аналитическая поддержка экспертизы промышленной безопасности объектов химии, нефтехимии и нефтепереработки / А.Ф. Берман, К.А. Кузнецов, О.А. Николайчук, А.И. Павлов, А.Ю. Юрин // Химическое и нефтегазовое машиностроение. - 2018. - № 8. - С.30-36.
- Грищенко, М.А. Разработка интеллектуальных диагностических систем на основе онтологий / М.А. Грищенко, Н.О. Дородных, С.А. Коршунов, А.Ю. Юрин // Онтология проектирования. - 2018. - Т. 8. -№ 2(28). - С.265-284. DOI: 10.18287/2223-9537-2018-8-2-265-284.