Создание программы интеллектуального анализатекстовой документации по вопросам захоронения РАО
Автор: Нужный А. С., Сорокин Д. И.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Информатика и управление
Статья в выпуске: 1 (45) т.12, 2020 года.
Бесплатный доступ
Представлена программа контекстного и тематического анализа текстовой документации. Программа обрабатывает документы PDF-формата, сохраняет обратный индекс корпуса данных, а также иную служебную информацию, предоставляющую пользователю возможность поиска фрагментов текста, отвечающих введенному запросу или выбранной теме. При тематическом поиске программа ищет тексты, похожие на обучающие примеры, ранее отнесенные пользователем к выбранной теме. Тематический анализ текстового корпуса позволяет обнаруживать наличие или отсутствие в нем тех или иных типовых тем, оценивать полноту содержащейся информации.
Обработка естественного языка, семантический анализ, контекстный поиск, машинное обучение
Короткий адрес: https://sciup.org/142223093
IDR: 142223093
Список литературы Создание программы интеллектуального анализатекстовой документации по вопросам захоронения РАО
- Bird S., Loper E., Klein E. Natural Language Processing with Python. O'Reilly Media Inc., 2009.
- Robertson S.E., Walker S., Hancock-Beaulieu M. Okapi at TREC-7. In Proceedings of the Seventh Text Retrieval Conference. Gaithersburg, USA, 1998.
- Features, Events and Processes (FEPs) for Geologic Disposal of Radioactive Waste, NEA International FEP Database: Version 2.1. NEA OECD, 2006.
- Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // Analysis of Images. Social Networks and Texts. 2015. P. 320-332.
- Jones K.S. A statistical interpretation of term specificity and its application in retrieval // Journal of Documentation. 1972. 28:11-21.
- Hofmann T. Probabilistic latent semantic analysis // Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval. 1999.
- Blei D.M., Ng A.Y., Jordan M.I., Lafferty J. Latent Dirichlet Allocation // Journal of Machine Learning Research. 3 (4-5): P. 993-1022. (January 2003).
- Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space // Proceedings of Workshop at ICLR, 2013.
- Нужный А.С. Байесовская регуляризация в задаче аппроксимации функции по точкам с помощью ортогонализованного базиса // Матем. моделирование. 2011. 23:9. P. 33-42.
- Kohonen T. Self-Organizing Maps. Springer, 1997 (2-nd edition).
- Нужный А.С., Розанов В.Б., Степанов Р.В., Шумский С.А. Построение полупараметрических моделей развития неустойчивости Рэлея-Тейлора с помощью нейросетевой обработки результатов численного эксперимента // Матем. моделирование. 2004. 16:7. P. 21-30.
- Нужный А.С., Розанов В.Б., Степанов Р.В., Шумский С.А Использование самообучаемых интеллектуальных моделей для прогнозирования развития НРТ индуцированного турбулентного перемешивания // Физика плазмы. 2005. Т. 31, № 4. С. 342-349.