Модели текстов и текстовых коллекций для поиска и анализа информации
Автор: Крейнес М.Г.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Математическое моделирование эколого-экономических систем: экономика
Статья в выпуске: 3 (35) т.9, 2017 года.
Бесплатный доступ
Рассмотрена система математических моделей, ориентированных на решение задач по описанию тематики и содержания текстов на естественных зыках и текстовых кол- лекций, поиску и анализу текстовой информации, оценке качества текстов и текстовых коллекций.
Текст, текстовая коллекция, естественный язык, модель, семиотика текста, семиотика текстовых коллекций, содержание текста, тематика коллекции, тематическое моделирование, содержательный поиск
Короткий адрес: https://sciup.org/142214970
IDR: 142214970
Список литературы Модели текстов и текстовых коллекций для поиска и анализа информации
- Шайкевич А.Я., Андрющенко В.М., Ребецкая Н.А. Дистрибутивно-статистический анализ языка русской прозы 1850-1870. М.: Языки славянской культуры, 2013.
- Успенский В.А. Предварение для читателей «Нового литературного обозрения» к се-миотическим посланиям А.Н. Колмогорова//Новое литературное обозрение. 1997. № 24. С. 123-215.
- Blei D.M. Probabilistic topic models//Comm. ACM. 2012. V. 55, N 4. P. 77-84.
- Handbook of latent semantic analysis/ed. by Landauer T.K., McNamara D.S., Dennis S., Kintsch W. Hove: Psychology Press, 2013.
- Mikolov T., Sutskever I., Chen K., Corrado G.S., Dean J. Distributed representations of words and phrases and their compositionality//In: Advances in neural information processing systems, 2013. P. 3111-3119.
- Salton G., Buckley C. Term-weighting approaches in automatic text retrieval//Information Processing & Management. 1998. V. 24, N 5. P. 513-523.
- Воронцов К.В. Аддитивная регуляризация тематических моделей коллекций текстовых документов//Доклады РАН. 2014. Т. 455, № 3. С. 268-271.
- Bengio Y., Ducharme R., Vincent P., Jauvin C. A neural probabilistic language model//Journal of Machine Learning Research. 2003. V. 3. P. 1137-1155.
- Le Q., Mikolov T. Distributed representations of sentences and documents//Proc. of 31-st International Conference on Machine Learning, Beijing. JMLR: W&CP, 2014. V. 32.
- Колмогоров А.Н. Теория информации и теория алгоритмов. М.: Наука, 1987.
- Joulin A., Grave E., Bojanowski P., Mikolov T. Bag of tricks for effi t text classification//arXiv:1607.01759v3. Preprint of Cornell University. Cornell, 2016.
- Bojanowski P., Grave E., Joulin A., Mikolov T. Enriching word vectors with subword information//arXiv:1607.04606v1. Preprint of Cornell University. Cornell, 2016.
- Aswani K.Ch., Srinivas S. On the performance of latent semantic indexing-based information retrieval//Journal of Computing and Information Technology -CIT. 2009. V. 17, N 3. P. 259-264.
- Крейнес М.Г., Афонин А.А. Патент на полезную модель № 62263 «Система формирования семантических данных для поиска и анализа текстовых документов». 2007.
- Крейнес М.Г. Информационная технология смыслового поиска и индексирования текстовой информации в электронных библиотеках: ключи от текста//Научный сервис в сети Интернет. М.: Изд-во МГУ. 1999. С. 214-218.
- Joulin A., Grave E., Bojanowski P., Douze M., Jegou H., Mikolov T. FASTTEXT.ZIP: Compressing text classifi models//arXiv:1612.03651v1. Preprint of Cornell University. Cornell, 2016.
- Kreines M.G. Intellectual information technologies and scientific electronic publishing: Changing world and changing model//Proc. 6-th International ICCC/IFIP Conf. on Electronic Publishing. Berlin: Verlag fur Wissenschaft und Forschung, 2002. P. 135-142.
- Петров А.Н., Крейнес М.Г., Афонин А.А. Семантический поиск неструктурированной текстовой информации на естественных языках в задачах организации экспертизы при реализации научно-технических программ.//Информатизация образования и науки. 2013. Т. 18, № 2. С. 54-67.
- Петров А.Н., Крейнес М.Г., Афонин А.А. Вычислительные модели семантики текстовых источников информации для информационно-аналитического обеспечения научно-технической экспертизы//Матем. моделирование. 2016. Т. 28, № 6. С. 33-52.
- Крейнес М.Г., Афонин А.А. Кластеризация текстовых коллекций: помощь при содержательном поиске и аналитический инструмент//В сб.: «Интернет-порталы: содержание и технологии». М.: Просвещение, 2007. Вып. 4. С. 510-537.
- Mimno D., Wallach H., Talley E., Leenders M., McCallum A. Optimizing semantic coherence in topic models//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, Edinburgh, Scotland, UK, 2011. P. 262-272.
- Newman D., Noh Y., Talley E., Karimi S., Baldwin T. Evaluating topic models for digital libraries//Proceedings of the 10th Annual Joint Conference on Digital libraries. JCDL 10. NY. USA. ACM, 2010. P. 215-224.
- Крейнес М.Г., Крейнес Е.М. Модель управления выбором референтных коллекций для объективной оценки качества научно-технических публикаций по библиометрическим и наукометрическим показателям//Изв. РАН. ТИСУ. 2016. № 5. С. 73-89.
- Крейнес М.Г., Крейнес Е.М. Модель управления построением объективной оценки качества научно-технических документов на основе анализа их содержательного контекста//Изв. РАН. ТИСУ. 2016. № 6. С. 97-106.