Формирование лексического модуля прикладной онтологии для её обучения
Автор: Ломов П.А.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Прикладные онтологии проектирования
Статья в выпуске: 4 (50) т.13, 2023 года.
Бесплатный доступ
Трудоёмкость разработки онтологий связана с их обучением, которое предполагает автоматизацию решения задач извлечения онтологических понятий и отношений из естественно-языковых текстов. Для созданной онтологии, используемой в информационной системе, с большой долей вероятности возникнет необходимость расширения её понятийной системы ввиду усложнения или изменения процессов обработки данных. Последующее применение текстового анализа для обнаружения новых понятий и включения их в онтологию, т.е. связывания их с существующими понятиями, потребует идентификации последних в предложениях естественно-языковых текстов. В данной работе рассматривается задача автоматизации формирования лексического модуля прикладной онтологии, включающего формализованные представления онтологических понятий в естественно-языковых текстах. Представлен обзор работ, посвящённых использование лексической информации о компонентах онтологии при решении задач, связанных с анализом текстовых данных. Рассмотрены способы применения модели OntoLex-Lemon для определения структуры лексических представлений понятий онтологии. Предложена процедура формирования лексических представлений на основе анализа текстов предметной области, учитывающая наличие у понятий имён, состоящих из нескольких слов. Приведены результаты применения полученного модуля для автоматического формирования обучающего набора нейросетевой языковой модели, используемой в задаче обучения онтологии для обнаружения новых понятий в корпусе предметных текстов.
Короткий адрес: https://sciup.org/170201896
IDR: 170201896 | DOI: 10.18287/2223-9537-2023-13-4-520-530
Список литературы Формирование лексического модуля прикладной онтологии для её обучения
- Wong W., Liu W., Bennamoun M. Ontology learning from text: A look back and into the future // ACM Comput. Surv. 2012. Vol.44(4). P.1-36. DOI:10.1145/2333112.2333115.
- Фреге Г. Смысл и денотат. Пер. с нем. Е.Э. Разлоговой // Семиотика и информатика. 1977. Вып.8. C.181–210.
- Cimiano P. et al. Linguistic linked open data cloud // Linguistic linked data: Representation, generation and applications. Cham: Springer International Publishing, 2020. P.29–41.
- Declerck T., Siegel M., Gromann D. OntoLex-Lemon as a possible bridge between WordNets and full lexical descriptions. Conference: 10th Global WordNet Conference (GWC)At: Wroclaw, Poland. 2019. 7 p.
- Chen L.J., Hoon G.K. Feature Expansion using Lexical Ontology for Opinion Type Detection in Tourism Reviews Domain: 8 // International Journal of Advanced Computer Science and Applications (IJACSA). The Science and Information (SAI) Organization Limited, 2020. Vol.11(8). DOI:10.14569/IJACSA.2020.0110877.
- Lexical Ontology Layer – A Bridge between Text and Concepts | SpringerLink. https://link.springer.com/chapter/10.1007/978-3-642-34624-8_20.
- Badra F. Ontology and Lexicon: The Missing Link // 9th International Conference on Terminology and Artificial Intelligence, TIA 2011, Paris, 10 November 2011. P.16–18.
- Klimek B. et al. Challenges for the representation of morphology in ontology lexicons. Proceedings of eLex 2019. P.570-591.
- Walter S., Unger C., Cimiano P. M-ATOLL: A framework for the lexicalization of ontologies in multiple languages // The semantic web – ISWC 2014 / ed. Mika P. et al. Cham: Springer International Publishing, 2014. P.472–486. DOI:10.1007/978-3-319-11964-9_30.
- Honnibal M., Montani I. spaCy 2: Natural language understanding with Bloom embeddings, convolutional neural networks and incremental parsing. 2017.
- Lomov P., Malozemova M., Shishaev M. Training and Application of Neural-Network Language Model for Ontology Population // Software Engineering Perspectives in Intelligent Systems / ed. Silhavy R., Silhavy P., Prokopova Z. Cham: Springer International Publishing, 2020. P.919–926. DOI:10.1007/978-3-030-63319-6_85.
- Корпус русскоязычных статей Интернет-издания Lenta.ru: https://kaggle.com/yutkin/corpus-of-russian-newsarticles-from-lenta.
- Tedeschi S. et al. Named Entity Recognition for Entity Linking: What Works and What’s Next // Findings of the Association for Computational Linguistics: EMNLP 2021. Punta Cana, Dominican Republic: Association for Computational Linguistics, 2021. P.2584–2596. DOI:10.18653/v1/2021.findings-emnlp.220.
- Bhattacharya I., Getoor L. Entity Resolution // Encyclopedia of Machine Learning / ed. Sammut C., Webb G.I. Boston, MA: Springer US, 2010. P. 321–326.
- Barlaug N., Gulla J.A. Neural Networks for Entity Matching: A Survey // ACM Trans. Knowl. Discov. Data. 2021. Vol.15(3). P.52:1-52:37.
- Gottapu R.D., Dagli C., Ali B. Entity Resolution Using Convolutional Neural Network // Procedia Computer Science. 2016. Vol.95. P.153–158. DOI:10.1016/j.procs.2016.09.306.
- Hadi M.U. et al. Large Language Models: A Comprehensive Survey of its Applications, Challenges, Limitations, and Future Prospects. 2023. DOI:10.36227/techrxiv.23589741.
- Lv K. et al. Full Parameter Fine-tuning for Large Language Models with Limited Resources: arXiv:2306.09782. arXiv, 2023. DOI: 10.48550/arXiv.2306.09782.
- Shin T. et al. AutoPrompt: Eliciting Knowledge from Language Models with Automatically Generated Prompts: arXiv:2010.15980. arXiv, 2020. DOI:10.18653/v1/2020.emnlp-main.346.
- Li F., Hogg D.C., Cohn A.G. Ontology Knowledge-enhanced In-Context Learning for Action-Effect Prediction: Proceedings Paper // Advances in Cognitive Systems. Arlington, Virginia: ACS-2022, 2022.
- Zouhar V. et al. A Formal Perspective on Byte-Pair Encoding: arXiv:2306.16837. arXiv, 2023.