Моделирование многоязычного интеллектуального контент-анализа

Бесплатный доступ

В настоящей статье представлен опыт разработки модели интеллектуального контент-анализа - необходимого ресурса компьютерных технологий обработки неструктурированной информации. Отличительной чертой модели является возможность ее применения для анализа текстов на различных национальных языках и механизм извлечения соответствующего задаче анализа контента, не представленного эксплицитно на поверхностном уровне текста. Модель состоит из двух основных компонентов: базы знаний, включающей ориентированную на предметную область многоязычную онтологию, онтолексиконы, динамические фреймы, а также правила обработки текстов и представления результатов контент-анализа. Методология разработки многоязычной модели и собственно процедуры контент-анализа описаны на примере их применения к корпусу новостных сообщений предметной области «Терроризм» на английском языке.

Еще

Интеллектуальный контент-анализ, моделирование, многоязычность, онтология, терроризм

Короткий адрес: https://sciup.org/147234383

IDR: 147234383   |   УДК: 004.82   |   DOI: 10.14529/ling210208

On modeling multilingual intelligent content analysis

This article presents an experience of developing a model for intelligent content analysis, which is a necessary resource for computer technologies of processing unstructured information. A distinctive feature of the model is the possibility of its application for the analysis of texts in various national languages and the mechanism for extracting task-oriented content that is not explicitly presented at the surface level of the analyzed text. The model consists of two main components: first, a knowledge base that includes a domain-oriented multilingual ontology, ontolexicons, dynamic frames, and, second, rules for text processing and presentation of content analysis results. The methodology for developing a multilingual model and the actual procedure of content analysis are described in regard to their application to the corpus of news reports on terrorist attacks in English.

Еще

Список литературы Моделирование многоязычного интеллектуального контент-анализа

  • Зиновьева А.Ю. Анализ неоднозначности концептуальной разметки русскоязычного текста / А.Ю. Зиновьева, С.О. Шереметьева, Е.Д. Неручева // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. - 2020. - Т. 6, № 3 (23). - С. 38-60.
  • Погорецкий, В.Г. Контент-анализ - методические основания исследования в электронных СМИ / В.Г. Погорецкий // Труды ИСА РАН. - 2006. - Т. 26. - С. 95-111.
  • Gauch, H.G. Scientific Method in Practice / H.G. Gauch. - Cambridge University Press, 2002. - 456 p.
  • Green, P.S. The Practice of Ontological Analysis / P.S. Green, M. Rosemann, M. Undulska. - 2005. - https://pdfs.semanticscholar.org/513c/a04a8132a723cf47d9d9504983a98dd9ec08.pdf.
  • Hsieh, H.-F. Three Approaches to Qualitative Content Analysis / H.-F. Hsieh, S.E. Shannon // Qualitative Health Research. - 2005. - Vol. 15 (9). - P. 1277-1288.
  • Mayring, Ph. Qualitative content analysis: theoretical foundation, basic procedures and software solution / Ph. Mayring. - Klagenfurt, 2014. - 144 p.
  • Nirenburg, S. Ontological Semantics / S. Nirenburg, V. Raskin. - Cambridge: MIT Press, 2004. - 440 p.
  • Sheremetyeva, S. On Modelling Domain Ontology Knowledge for Processing Multilingual Texts of Terroristic Content / S. Sheremetyeva, A. Zinoveva // Communications in Computer and Information Science. - Springer, Cham, 2018. - Vol. 859. - P. 368-379.
  • Sheremetyeva, S. Towards creating interoperable resources for conceptual annotation of multilingual domain corpora / S. Sheremetyeva // The Proceedings of the 16th Joint ACL-ISO Workshop Interoperable Semantic Annotation (ISA-16), Marseille, 2020. - P. 102-109.
  • The NEWS ontology: Design and applications / N. Fernández, D. Fuentes, L. Sánchez, J.A. Fisteus // Expert Systems with Applications. - 2010. - Vol/ 37 (12). - P. 8694-8704.
Еще