Создание программы интеллектуального анализатекстовой документации по вопросам захоронения РАО

Автор: Нужный А. С., Сорокин Д. И.

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Информатика и управление

Статья в выпуске: 1 (45) т.12, 2020 года.

Бесплатный доступ

Представлена программа контекстного и тематического анализа текстовой документации. Программа обрабатывает документы PDF-формата, сохраняет обратный индекс корпуса данных, а также иную служебную информацию, предоставляющую пользователю возможность поиска фрагментов текста, отвечающих введенному запросу или выбранной теме. При тематическом поиске программа ищет тексты, похожие на обучающие примеры, ранее отнесенные пользователем к выбранной теме. Тематический анализ текстового корпуса позволяет обнаруживать наличие или отсутствие в нем тех или иных типовых тем, оценивать полноту содержащейся информации.

Обработка естественного языка, семантический анализ, контекстный поиск, машинное обучение

Короткий адрес: https://sciup.org/142223093

IDR: 142223093

Список литературы Создание программы интеллектуального анализатекстовой документации по вопросам захоронения РАО

  • Bird S., Loper E., Klein E. Natural Language Processing with Python. O'Reilly Media Inc., 2009.
  • Robertson S.E., Walker S., Hancock-Beaulieu M. Okapi at TREC-7. In Proceedings of the Seventh Text Retrieval Conference. Gaithersburg, USA, 1998.
  • Features, Events and Processes (FEPs) for Geologic Disposal of Radioactive Waste, NEA International FEP Database: Version 2.1. NEA OECD, 2006.
  • Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // Analysis of Images. Social Networks and Texts. 2015. P. 320-332.
  • Jones K.S. A statistical interpretation of term specificity and its application in retrieval // Journal of Documentation. 1972. 28:11-21.
  • Hofmann T. Probabilistic latent semantic analysis // Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval. 1999.
  • Blei D.M., Ng A.Y., Jordan M.I., Lafferty J. Latent Dirichlet Allocation // Journal of Machine Learning Research. 3 (4-5): P. 993-1022. (January 2003).
  • Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space // Proceedings of Workshop at ICLR, 2013.
  • Нужный А.С. Байесовская регуляризация в задаче аппроксимации функции по точкам с помощью ортогонализованного базиса // Матем. моделирование. 2011. 23:9. P. 33-42.
  • Kohonen T. Self-Organizing Maps. Springer, 1997 (2-nd edition).
  • Нужный А.С., Розанов В.Б., Степанов Р.В., Шумский С.А. Построение полупараметрических моделей развития неустойчивости Рэлея-Тейлора с помощью нейросетевой обработки результатов численного эксперимента // Матем. моделирование. 2004. 16:7. P. 21-30.
  • Нужный А.С., Розанов В.Б., Степанов Р.В., Шумский С.А Использование самообучаемых интеллектуальных моделей для прогнозирования развития НРТ индуцированного турбулентного перемешивания // Физика плазмы. 2005. Т. 31, № 4. С. 342-349.
Еще
Статья научная