Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter
Автор: Миниахметов Руслан Марсович, Цацина Елизавета Олеговна
Статья в выпуске: 2 т.3, 2014 года.
Бесплатный доступ
В данной работе рассмотрена смешанная языковая модель, применяемая для поиска экспертов в таких областях как анализ социальных сетей и информационный поиск, предложена адаптация этой модели для социальной сети Twitter. Рассмотрены метрики популярности в социальной сети Twitter. Предложена формула оценки популярности пользователей социальой сети Twitter с учетом оценки релевантности их сообщений заданной теме, а также описан прототип системы для сбора данных и оценки популярности по предложенной формуле.
Анализ социальных сетей, информационный поиск, интеллектуальный анализ данных, поиск экспертов, анализ популярности
Короткий адрес: https://sciup.org/147160534
IDR: 147160534 | УДК: 004.021
Twitter users popularity estimation using expert finding
In this paper we have considered mixed language model that is used for experts finding in areas such as social network analysis and information retrieval, and proposed an adaptation of this modelfor the social network Twitter. We also have reviewed Twitter popularity metrics and proposedTwitter users' popularity estimation approach based on expert finding, which allows to rank usersaccording to the probability of user being an expert in given query, and have implemented aprototype for data collection and popularity estimation, based on our approach.
Список литературы Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter
- Zhang, J. Expert Finding in A Social Network/J. Zhang, J. Tang, J. Li//Lecture Notes in Computer Science. -2007. -Vol. 4443. -P. 1066-1069.
- Bozzon, A. Choosing the Right Crowd: Expert Finding in Social Networks/A. Bozzon, M. Brambilla, S. Ceri, M. Silvestri, G. Vesci//Proceedings of the 16th International Conference on Extending Database Technology (EDBT '13). -2013. -P. 637-648.
- Zhang, J. A Mixture Model for Expert Finding/J. Zhang, J. Tang, L. Liu, J. Li//Proceedings of the 12th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD '08). -2008. -P. 466-478.
- Manning, C. Introduction to Information Retrieval/C. Manning, P. Raghavan, H. Sch¨utze -Cambridge University Press, 2008. -496 p.
- Ponte, J. A Language Modeling Approach to Information Retrieval/J. Ponte, W. Croft//Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '98). -1998. -P. 275-281.
- Hiemstra, D. A Linguistically Motivated Probabilistic Model of Information Retrieval/D. Heimstra//Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries.-1998. -P. 569-584.
- Steck, H. Item Popularity and Recommendation Accuracy/H. Steck//Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries (RecSys '11). -2011. -P. 125-132.
- Cha, Y. Incorporating Popularity in Topic Models for Social Network Analysis/Y. Cha, B. Bin, C. Hsieh, J. Cho//Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '13). -2013. -P. 223-232.
- Документация Python библиотеки для работы с Twitter API URL: http://pythonhosted.org//tweepy/(дата обращения: 24.04.2014).
- Документация Twitter REST API URL: https://dev.twitter.com/docs/api/1.1 (дата обращения: 24.04.2014).
- Stonebraker, M. The POSTGRES Next-generation Database Management System/M. Stonebraker, G. Kemnitz//Communications of the ACM. -1991. -Vol. 34, No. 10. -P. 78-92.
- Borodin, A. Online Computation and Competitive Analysis/A. Borodin, R. El-Yaniv -Cambridge University Press, 1998. -432 p.
- Янцен, Д.Д. Алгоритм репрезентативного сэмплинга для параллельных систем баз данных/Д.Д. Янцен, М.Л. Цымблер//Параллельные вычислительные технологии (ПаВТ'2014): труды международной научной конференции (1-3 апреля 2014 г., г. Ростов-на-Дону). -Челябинск: Издательский центр ЮУрГУ, 2014. -С. 381.
- Пан, К.С. Подход к разбиению сверхбольших графов с помощью параллельных СУБД/К.С. Пан//Вестник ЮУрГУ. Серия “Вычислительная математика и информатика”. -2012. -№ 47(306). Вып. 2. -С. 127-132.
- Рейтинг популярности пользователей в социальной сети Twitter «Twitaholic» URL: http://twitaholic.com/(дата обращения: 24.04.2014).
- Документация Python библиотеки для интеллектуального анализа данных «scikitlearn» URL: http://scikit-learn.org/stable/documentation.html (дата обращения: 24.04.2014).
- Zhu, H. Finding Experts in Tag Based Knowledge Sharing Communities/H. Zhu, E. Chen, H. Cao//Proceedings of the 5th International Conference on Knowledge Science, Engineering and Management (KSEM '11). -2011. -P. 183-195.
- Han, J. Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach/J. Han, J. Pei, Y. Yin, R. Mao//Data Mining and Knowledge Discovery. -2005. -Vol. 8, No. 1. -P. 53-87.
- Blei, D. Latent Dirichlet Allocation/D. Blei, A. Ng, Y. Yin, M. Jordan//The Journal of Machine Learning Research. -2003. -Vol. 3. -P. 993-1022.