Формирование лексического модуля прикладной онтологии для её обучения

Бесплатный доступ

Трудоёмкость разработки онтологий связана с их обучением, которое предполагает автоматизацию решения задач извлечения онтологических понятий и отношений из естественно-языковых текстов. Для созданной онтологии, используемой в информационной системе, с большой долей вероятности возникнет необходимость расширения её понятийной системы ввиду усложнения или изменения процессов обработки данных. Последующее применение текстового анализа для обнаружения новых понятий и включения их в онтологию, т.е. связывания их с существующими понятиями, потребует идентификации последних в предложениях естественно-языковых текстов. В данной работе рассматривается задача автоматизации формирования лексического модуля прикладной онтологии, включающего формализованные представления онтологических понятий в естественно-языковых текстах. Представлен обзор работ, посвящённых использование лексической информации о компонентах онтологии при решении задач, связанных с анализом текстовых данных. Рассмотрены способы применения модели OntoLex-Lemon для определения структуры лексических представлений понятий онтологии. Предложена процедура формирования лексических представлений на основе анализа текстов предметной области, учитывающая наличие у понятий имён, состоящих из нескольких слов. Приведены результаты применения полученного модуля для автоматического формирования обучающего набора нейросетевой языковой модели, используемой в задаче обучения онтологии для обнаружения новых понятий в корпусе предметных текстов.

Еще

Короткий адрес: https://sciup.org/170201896

IDR: 170201896   |   DOI: 10.18287/2223-9537-2023-13-4-520-530

Список литературы Формирование лексического модуля прикладной онтологии для её обучения

  • Wong W., Liu W., Bennamoun M. Ontology learning from text: A look back and into the future // ACM Comput. Surv. 2012. Vol.44(4). P.1-36. DOI:10.1145/2333112.2333115.
  • Фреге Г. Смысл и денотат. Пер. с нем. Е.Э. Разлоговой // Семиотика и информатика. 1977. Вып.8. C.181–210.
  • Cimiano P. et al. Linguistic linked open data cloud // Linguistic linked data: Representation, generation and applications. Cham: Springer International Publishing, 2020. P.29–41.
  • Declerck T., Siegel M., Gromann D. OntoLex-Lemon as a possible bridge between WordNets and full lexical descriptions. Conference: 10th Global WordNet Conference (GWC)At: Wroclaw, Poland. 2019. 7 p.
  • Chen L.J., Hoon G.K. Feature Expansion using Lexical Ontology for Opinion Type Detection in Tourism Reviews Domain: 8 // International Journal of Advanced Computer Science and Applications (IJACSA). The Science and Information (SAI) Organization Limited, 2020. Vol.11(8). DOI:10.14569/IJACSA.2020.0110877.
  • Lexical Ontology Layer – A Bridge between Text and Concepts | SpringerLink. https://link.springer.com/chapter/10.1007/978-3-642-34624-8_20.
  • Badra F. Ontology and Lexicon: The Missing Link // 9th International Conference on Terminology and Artificial Intelligence, TIA 2011, Paris, 10 November 2011. P.16–18.
  • Klimek B. et al. Challenges for the representation of morphology in ontology lexicons. Proceedings of eLex 2019. P.570-591.
  • Walter S., Unger C., Cimiano P. M-ATOLL: A framework for the lexicalization of ontologies in multiple languages // The semantic web – ISWC 2014 / ed. Mika P. et al. Cham: Springer International Publishing, 2014. P.472–486. DOI:10.1007/978-3-319-11964-9_30.
  • Honnibal M., Montani I. spaCy 2: Natural language understanding with Bloom embeddings, convolutional neural networks and incremental parsing. 2017.
  • Lomov P., Malozemova M., Shishaev M. Training and Application of Neural-Network Language Model for Ontology Population // Software Engineering Perspectives in Intelligent Systems / ed. Silhavy R., Silhavy P., Prokopova Z. Cham: Springer International Publishing, 2020. P.919–926. DOI:10.1007/978-3-030-63319-6_85.
  • Корпус русскоязычных статей Интернет-издания Lenta.ru: https://kaggle.com/yutkin/corpus-of-russian-newsarticles-from-lenta.
  • Tedeschi S. et al. Named Entity Recognition for Entity Linking: What Works and What’s Next // Findings of the Association for Computational Linguistics: EMNLP 2021. Punta Cana, Dominican Republic: Association for Computational Linguistics, 2021. P.2584–2596. DOI:10.18653/v1/2021.findings-emnlp.220.
  • Bhattacharya I., Getoor L. Entity Resolution // Encyclopedia of Machine Learning / ed. Sammut C., Webb G.I. Boston, MA: Springer US, 2010. P. 321–326.
  • Barlaug N., Gulla J.A. Neural Networks for Entity Matching: A Survey // ACM Trans. Knowl. Discov. Data. 2021. Vol.15(3). P.52:1-52:37.
  • Gottapu R.D., Dagli C., Ali B. Entity Resolution Using Convolutional Neural Network // Procedia Computer Science. 2016. Vol.95. P.153–158. DOI:10.1016/j.procs.2016.09.306.
  • Hadi M.U. et al. Large Language Models: A Comprehensive Survey of its Applications, Challenges, Limitations, and Future Prospects. 2023. DOI:10.36227/techrxiv.23589741.
  • Lv K. et al. Full Parameter Fine-tuning for Large Language Models with Limited Resources: arXiv:2306.09782. arXiv, 2023. DOI: 10.48550/arXiv.2306.09782.
  • Shin T. et al. AutoPrompt: Eliciting Knowledge from Language Models with Automatically Generated Prompts: arXiv:2010.15980. arXiv, 2020. DOI:10.18653/v1/2020.emnlp-main.346.
  • Li F., Hogg D.C., Cohn A.G. Ontology Knowledge-enhanced In-Context Learning for Action-Effect Prediction: Proceedings Paper // Advances in Cognitive Systems. Arlington, Virginia: ACS-2022, 2022.
  • Zouhar V. et al. A Formal Perspective on Byte-Pair Encoding: arXiv:2306.16837. arXiv, 2023.
Еще
Статья научная