Нейросетевой метод семантического вероятностного вывода в задаче улучшения релевантности результатов поискового запроса
Автор: Калимолдаев Максат Нурадилович, Пак Александр Александрович, Нарынов Сергазы Сакенович
Журнал: Проблемы информатики @problem-info
Рубрика: Средства и системы обработки и анализа данных
Статья в выпуске: 3 (24), 2014 года.
Бесплатный доступ
Алгоритмы информационного поиска нацелены на получении наиболее релевантной выдачи документов по текстовому запросу. В большинстве прикладных семантических информационных систем пользователь для подготовки выборки документов производит итеративное уточнение параметров поискового запроса с целью улучшения релевантности документов для дальнейшего семантического анализа. Формирование качественного запроса из-за омонимической неоднозначности, большого разнообразия контекстов, значительной синонимичности слов и фраз является нетривиальной задачей. В языках поисковых запросов реализована грамматика логики высказываний. В данной статье предложен алгоритм уточнения поискового запроса, его подход основан на индуктивно-логическом выводе с использованием ручной бинарной классификации результатов первичной выдачи.
Информационный поиск, нейронные сети, индуктивная логика
Короткий адрес: https://sciup.org/14320254
IDR: 14320254
Список литературы Нейросетевой метод семантического вероятностного вывода в задаче улучшения релевантности результатов поискового запроса
- MOOERS C. The theory of digital handling of non-numerical information and its implications to machine economics//Proc. of the meeting of the Assoc. for Comp. Machinery at Rutgers University. 1950. New Jersey.
- MARON M. E., KUHNS J. L. On relevance, probabilistic indexing and information retrieval//Journ. of the ACM. 1960. V. 7, N. 3. P. 216-244.
- ROBERTSON S. E. AND SPARCK JONES K. Relevance weighting of search terms//Journ. of the American Soc. for Information Science. 1977. V. 27. N. 3. P. 129-146.
- ROBERTSON S. E. AND WALKER S. Some Simple Effective Approximations to the 2-Poisson Model for Probabilistic Weighted Retrieval//Proc. of the 17th Annual Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. 1994. P. 232-241.
- ROBERTSON S. E., ZARAGOZA H. AND TAYLOR M. Simple BM25 extension to multiple weighted fields//Proc. of the 2004 ACM CIKM Intern. Conf. on Inf. and Knowledge Management. 2004. P 42-49.
- JONES K.S., WALKER S., ROBERTSON S.E. A probabilistic model of information retrieval: development and comparative experiments//Inf. Process. Manage. N. 36(6). 2000. P. 779-808.
- JONES K.S., WALKER S., ROBERTSON S.E. A probabilistic model of information retrieval: development and comparative experiments. Part 2//Inf. Process. Manage. N. 36(6). 2000. P. 809-840.
- RIJSBERGEN C.J. Information Retrieval. Second Edition. London: Butterworths, 1979.
- ROBERTSON S.E., ZARAGOZA H. The probabilistic relevance framework: BM25 and beyond//Foundation and Trends in information retrieval. 2009. V. 3. N. 4. P. 333-389.
- Class BM25Similarity . Режим доступа: http://lucene.apache.org/core/4_0_0/core/org/apache/lucene/search/similarities/BM25Similarity.html. (Дата обращения: 29.08.2014).
- SHANNON C.E., WEAVER W. The Mathematical Theory of Communication. Urbana: University of Illinois Press, 1964.
- E. E. VITYAEV. Knowledge extraction from data. Computer Knowledge Model of cognitive process. Novosibirsk, 2006. P. 293.
- Демин А. В., Витяев Е. Е. Логическая модель адаптивной системы управления//Нейроинформатика (электрон. журн.). 2008. Т. 3, № 1. С. 79-107.