Модель регрессионного анализа тональности текста для оценки уровня удовлетворенности клиента
Автор: Бабина О.И.
Журнал: Вестник Южно-Уральского государственного университета. Серия: Лингвистика @vestnik-susu-linguistics
Рубрика: Прикладная лингвистика
Статья в выпуске: 4 т.21, 2024 года.
Бесплатный доступ
Статья посвящена моделированию автоматизированного извлечения тональной информации об удовлетворенности клиента из текста отзыва. В условиях стремительного роста объемов текстовой информации анализ тональности текста становится ключевым инструментом принятия решений в сфере маркетинга, социологии, политологии и в других областях. Это обусловливает интерес к разработке точных и масштабируемых методов анализа тональности как одного из ключевых направлений обработки естественного языка сегодня. Целью данного исследования является разработка модели анализа тональности текста для решения задачи предсказания степени удовлетворенности пользователя медицинским учреждением по тексту отзыва, с применением гибридного подхода на основе лексиконов и машинного обучения. Работа выполнена на материале корпуса отзывов о частных клиниках Челябинска с портала 2GIS объемом 100 тыс. словоупотреблений. Единицы корпуса с помощью предметно-ориентированного тонального лексикона отнесены к четырем тональным классам (сильно отрицательная, умеренно отрицательная, умеренно положительная и сильно положительная оценка). В данной работе предложена модель множественной линейной регрессии для предсказания степени удовлетворенности пользователя на основе параметров, в качестве которых выступают доли тонально размеченных единиц в тексте. Модель построена и обучена методом гребневой регрессии с настройкой параметра регуляризации через кросс-валидацию. Построенная модель показала высокую точность предсказаний пользовательских рейтингов медцентров со среднеквадратической ошибкой 0,0226 и коэффициентом детерминации 0,8182. Таким образом, предложенная модель на основе гибридного подхода подтвердила свою эффективность в предсказании оценок удовлетворенности по текстам.
Анализ тональности текста, оценка удовлетворенности, гибридный подход, предметно-ориентированный тональный лексикон, множественная линейная регрессия, гребневая регрессия, медицинский центр, отзыв
Короткий адрес: https://sciup.org/147246150
IDR: 147246150 | DOI: 10.14529/ling240409
Список литературы Модель регрессионного анализа тональности текста для оценки уровня удовлетворенности клиента
- Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. СПб.: Питер, 2022. 480 с. [Niko-lenko S., Kadurin A., Arkhangelskaya E. Glubokoe obuchenie [Deep Learning]. Saint-Petersburg: Piter, 2022. 480 p.]
- Самигулин Т.Р., Джурабаев А.Э.У. Анализ тональности текста методами машинного обучения // Научный результат. Информационные технологии. 2021. Т. 6, № 1. С. 55-62. [Samigulin T.R. Djurabaev A.E.U. [Sentiment Analysis of Text by Machine Learning Methods]. Research Result. Information Technologies. 2021, vol. 6, no. 1, pp. 55-62. (in Russ.)] DOI: 10.18413/2518-1092-2021-6-1-0-7.
- Шереметьева С.О., Бабина О.И. Платформа для концептуального аннотирования многоязычных текстов. // Вестник Южно-Уральского государственного университета. Сер. Лингвистика. 2020. Т. 17, № 4. С. 53-60. [Sheremetyeva S.O., Babina O.I. [A platform for knowledge assisted conceptual annotation of multilingual texts]. Bulletin of South Ural State University. Series Linguistics. 2020, vol. 17, no. 4, pp. 53-60. (in Russ.)]
- Baccianella S., Esuli A., Sebastiani F. SentiWordNet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining. Proceedings of the Seventh International Conference on Language Resources and Evaluation, LREC'10, Valetta, Malta, 17-23 May 2010. Valettta: LREC, 2010. P. 2200-2204.
- Burns J.C., Kelsey T. Comparison of Commercial Decoder-only Large Language Models for Multilingual Sentiment Analysis of Short Text // Research Square. 31 August 2024, preprint. URL: https://www.researchsquare.com/article/rs-4849789/v1 (accessed on 12 Oct 2024). DOI: 10.21203/rs.3.rs-4849789/v1.
- Du K., Xing F., Mao R., Cambria E. Financial Sentiment Analysis: Techniques and Applications. ACM Computing Surveys. 2024, vol. 56, iss. 9, art. no. 220. DOI: 10.1145/3649451.
- El-Affendi M.A., Alrajhi K., Hussain A. A Novel Deep Learning-Based Multilevel Parallel Attention Neural (MPAN) Model for Multidomain Arabic Sentiment Analysis. IEEE Access. 2021, vol. 9, pp. 7508-7518. DOI: 10.1109/ACCESS.2021.3049626.
- Gooljar V., Issa T., Ramanan S.H., Abu-Salih B. Sentiment-based predictive models for online purchases in the era of marketing 5.0: a systematic review. Journal of Big Data. 2024, vol. 11, art. no. 107. DOI: 10.1186/s40537-024-00947-0.
- Grljevic O., Bosnjak Z., Kovacevic A. Opinion mining in higher education: A corpus-based approach. Enterprise Information Systems. 2020, vol. 16, iss. 5, art. no. 1773542. DOI: 10.1080/17517575.2020.1773542.
- Gudankwar A. S., Mendhe P.M. Oghare L.N., Yemde A.R. Sentiments of Public Opinion. International Journal of Scientific Research in Computer Science, Engineering and Information Technology. 2024, vol. 10, no. 2, pp. 459-461. DOI: 10.32628/CSEIT2410239.
- Jazuli A., Widowati, Kusumaningrum R. Auto Labeling to Increase Aspect-Based Sentiment Analysis Using K-Nearest Neighbors Method. The 7th International Conference on Energy, Environment, Epidemiology and Information System (ICENIS 2022), Semarang, Indonesia, 9-10 August 2022 (E3S Web of Conference 359). EDP Sciences, 2022. Art. no. 05001. DOI: 10.1051/e3sconf/202235905001.
- Kastrati Z., Ahmedi L., Kurti A., Kadriu F., Murtezaj D., Gashi F. A deep learning sentiment analyser for social media comments in low-resource languages. Electronics. 2021, vol. 10, iss. 10, art. no. 1133. DOI: 10.3390/electronics10101133.
- Loukachevitch N., Levchik A. Creating a General Russian Sentiment Lexicon. Proceedings of Language Resources and Evaluation Conference LREC-2016, Portoroz, Slovenia, 23-28 May 2016. ELRA, 2016. P. 11711176.
- Loukili M., Faygal Messaoudi, Mohammed El Ghazi. Machine Learning based Recommender System for E-Commerce. International Journals of Artificial Intelligence. 2023, vol. 12, no. 4, pp. 1803-1811. DOI: 10.11591/ijai.v12.i4.pp1803-1811.
- Mohamed A., Zain Z.M., Shaiba H., Alturki N., Aldehim G. et al. LexDeep: hybrid lexicon and deep learning sentiment analysis using twitter for unemployment-related discussions during COVID-19. Computers, Materials & Continua. 2023, vol. 75, no. 1, pp. 1577-1601. DOI: 10.32604/cmc.2023.034746.
- Rusnachenko N., Golubev A., Loukachevitch N. Lare Language Models in Targeted Sentiment Analysis. arXiv:2404.12342 [cs.CL], 2024. URL: https://arxiv.org/abs/2404.12342 (accessed on 12 Oct 2024).
- Salur M.U., Aydin I. A novel hybrid deep learning model for sentiment classification. IEEE Access. 2020. Vol. 8. P. 58080-58093. DOI: 10.1109/ACCESS.2020.2982538.
- Samsir, Irmayani D., Edi F., Harahap J.M., Jupriaman, Rangkuti R.K., Ulya B., Watrianthos R. Naives Bayes Algorithm for Twitter Sentiment Analysis. Virtual Conference on Engineering, Science and Technology (ViCEST'2020). (Journal of Physics: Conference Series 1933). IOP Publishing, 2021. Art. no. 012019. DOI: 10.1088/1742-6596/1933/1/012019.
- Sari A.W., Hermanto T.I., Defriani M. Sentiment Analysis of Tourist Reviews Using K-Nearest Neighbors Algorithm And Support Vector Machine. Sinkron: Jurnal dan Penelitian Teknik Informatika. 2023, vol. 8, no. 3, pp. 1366-1378. DOI: 10.33395/sinkron.v8i3.12447.
- Sheremetyeva S.O., Babina O.I. On automated creation of gold-standard corpus for multi-aspect sentiment analysis. Proceedings of the international conference "Internet and Modern Society". Saint-Petersburg: ITMO, 2024. (in print)
- Wijati D, Atika P.D., Setiawati S, Rasim. Sentiment Analysis of Application Reviews using the K-Nearest Neighbors (KNN) Algorithm. Penelitian Ilmu Komputer, Sistem Embedded and Logic. March 2024. Vol. 12, no. 1. P. 209-218. DOI: 10.33558/piksel.v12i1.9490.
- Yan Ch., Liu J., Liu W., Liu X. Research on Public Opinion Sentiment Classification based on Attention Parallel Dual-Channel Deep Learning Hybrid Model. Engineering Applications on Artificial Intelligence. 2022, vol. 116, art. no. 105448. DOI: 10.1016/j.engappai.2022.105448.
- Yavari A., Hassanpour H., Rahimpour Cami B., Mahdavi M. Election Prediction Based on Sentiment Analysis using Twitter Data. International Journal of Engineering. 2022, vol. 35, no. 2, pp. 372-379. DOI: 10.5829/ije.2022.35.02b.13.
- Zainuddin N., Selamat A. Ibrahim R. Hybrid sentiment classification on twitter aspect-based sentiment analysis. Applied Intelligence. 2018, vol. 48, pp. 1218-1232. DOI: 10.1007/s10489-017-1098-6.