Диалоговая система Dream в конкурсе Alexa Prize Challenge 2019
Автор: Куратов Ю.М., Юсупов И.Ф., Баймурзина Д.Р., Кузнецов Д.П., Чернявский Д.В., Дмитриевский А., Ермакова Е.С., Игнатов Ф.С., Карпов Д.А., Корнев Д.А., Ле Т.А., Пугин П.Ю., Бурцев М.С.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Информатика и управление
Статья в выпуске: 3 (51) т.13, 2021 года.
Бесплатный доступ
Создание диалоговой системы, способной быстро, связно и осмысленно вести диалог на общие темы, является одной из фундаментальных проблем в области искусственного интеллекта (ИИ). Недавний прогресс в обработке естественного языка, обусловленный применением глубоких нейронных сетей, в частности больших языковых моделей, расширил возможности для решения многих сложных проблем разговорного ИИ. Международный конкурс «Alexa Prize Socialbot Grand Challenge» дает уникальную возможность проверить передовые исследовательские идеи в реальных условиях. В этой работе подробно описана диалоговая система DREAM, и представлены результаты её взаимодействия с реальными пользователями. Диалоговая система DREAM реализована как многофункциональный диалоговый агент с модульной микросервисной архитектурой. Агент DREAM управляет десятком аннотаторов, отвечающих за предварительную обработку текста, и более чем 25 навыками для генерации ответов в контексте разговора на общие темы. Отзывы и оценки пользователей Alexa позволили нам постепенно развивать нашего диалогового агента путем увеличения количества разговорных навыков и улучшения переходов между ними. В результате диалоги стали длиннее на 50%, а средний рейтинг вырос с ~ 3 из 5 на начальном этапе в декабре 2019 года до ~ 3.4 из 5 в последние две недели апреля 2020 года. Финальная версия диалоговой системы DREAM - это гибридная система, сочетающая компоненты на основе правил, глубокого обучения и баз знаний.
Диалоговая система, чат-бот
Короткий адрес: https://sciup.org/142231493
IDR: 142231493 | DOI: 10.53815/20726759_2021_13_3_62
Список литературы Диалоговая система Dream в конкурсе Alexa Prize Challenge 2019
- Pichl J.j Marek P., Konrad J. [et al.]. Alquist 2.0: Alexa prize socialbot based on subdialogue models // 2nd Proceedings of Alexa Prize (Alexa Prize 2018). 2018.
- Chen C.-Y., Yu D., Wen W. [et al.}. Gunrock: Building a human-like social bot by leveraging largescale real user data // 2nd Proceedings of Alexa Prize (Alexa Prize 2018). 2018.
- Dai A.M., Le Q.V. Semi-supervised sequence learning // Advances in neural information processing systems. 2015. P. 3079-3087.
- Peters M., Neumann M., Iyyer M. [et al.}. Deep contextualized word representations // Proceedingsof the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. V. 1 (Long Papers). 2018. P. 2227-2237.
- Radford A., Narasimhan K., Salimans T., Sutskever I. Improving language understanding bvgenerative pre-training // URL https://s3-us-west-2. amazonaws. com/openaiassets/rese-arch-covers/languageunsupervised/language understanding paper, pdf. 2018.
- Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for language understanding // Proceedings of the 2019 Conference of theNorth American Chapter of the Association for Computational Linguistics: Human Lan-guage Technologies, Volume 1 (Long and Short Papers). Minneapolis, Minnesota : Association for Computational Linguistics, 2019. Jun. P. 4171-4186. Access mode: https://www.aclweb.org/anthologv/N19-1423.
- Gopalakrishnan K., Hedayatnia B., Chen Q. [et al.}. Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations // Proc. Interspeech 2019. 2019. P. 1891-1895. Accessmode: http://dx.doi.org/10.21437/Interspeech.2019-3079.
- Zhang S., Dinan E., Urbanek J. [et al.}. Personalizing dialogue agents: I have a dog, do you have pets too? // Proceedings of the 56th Annual Meeting of the Association for ComputationalLinguistics. V. 1: Long Papers. Melbourne, Australia : Association for Computa-tional Linguistics, 2018. Jul. P. 2204-2213. Access mode: https://www.aclweb.org/anthologv/P18-1205.
- Dinan E., Roller S., Shuster K. [et al.}. Wizard of wikipedia: Knowledge-powered conversation alagents // arXiv preprint arXiv:1811.01241. 2018.
- Reddy S., Chen D., Manning C.D. Coqa: A conversational question answering challenge // CoRR. 2018. V. abs/1808.07042.—1808.07042.
- Choi E., He H., Iyyer M. [et al.}. Quae: Question answering in context // CoRR. 2018. V. abs/1808.07036.—1808.07036.
- MacAvaney S., Yates A., Cohan A., Goharian N. Cedr: Contextualized embeddings for document ranking // Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2019. P. 1101-1104.
- Nogueira R., Cho K. Passage re-ranking with bert // arXiv preprint arXiv:1901.04085. 2019.
- Kuratov Y., Yusupov I., Baym,u,rzina D. [et al.}. Dream technical report for the alexa prize 2019 // Alexa Prize Proceedings. 2020.
- Burtsev M., Seliverstov A., Airapetyan R. [et al.}. Deeppavlov: Open-source library for dialoguesvstems // Proceedings of ACL 2018, System Demonstrations. 2018. P. 122-127.
- Bosselut A., Rashkin H., Sap M. [et al.}. COMET: Commonsense transformers for automatic knowledge graph construction // Proceedings of the 57th Annual Meeting of the Associationfor Computational Linguistics. Florence, Italy : Association for Computational Linguistics, 2019. Jul. P. 4762-4779. Access mode: https://www.aclweb.org/anthologv/P19-1470.
- Speer R., Chin J., Havasi C. Conceptnet 5.5: An open multilingual graph of general knowledge // Thirty-First AAAI Conference on Artificial Intelligence. 2017.
- Ke G., Meng Q., Finley T. [et al.}. Lightgbm: A highly efficient gradient boosting decision tree // Advances in Neural Information Processing Systems 30 / Ed. by I. Guvon, U.V. Luxburg, S. Bengio et al. Curran Associates, Inc., 2017. P. 3146-3154. Access mode:http://papers.nips.cc/paper/6907-lightgbm-a-highly-efficient-gradient-boosting-decision-tree.pdf.
- Pennington J., Socher R., Manning C.D. Glove: Global vectors for word representation // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2014. P. 1532-1543.
- Sang E.F.T.K., Meulder F.D. Introduction to the conll-2003 shared task: Language-independent named entity recognition // Proceedings of Conference on Computational NaturalLanguage Learning. 2003. P. 142-147.
- Danescu-Niculescu-Mizil C., Lee L. Chameleons in imagined conversations: A new approachto understanding coordination of linguistic style in dialogs // Proceedings of the Workshopon Cognitive Modeling and Computational Linguistics, ACL 2011. 2011. Access mode:https://www.cs.cornell.edu/ cristian/Cornell_Movie-Dialogs_Corpus.html.
- Li Y., Su H., Shen X., Li W., Cao Z., Niu Sh. Dailvdialog: A manually labelled multi-turn dialogue dataset // Proceedings of The 8th International Joint Conference on Natural Language Processing (IJCNLP 2017). 2017. Access mode: http://yanran.li/dailvdialog.html.
- Gopalakrishnan K., Behnam H., Chen Q., Gottardi A., Kwatra S., Venkatesh A., Gabriel R., Hakkani-Tur D. Topical-chat: Towards knowledge-grounded open-domain conversations // Proceedings of Interspeech. 2019.
- Radford A., Wu J., Child R. [et al.}. Language models are unsupervised multitask learners 11 OpenAI Blog. 2019. V. 1. P. 8.
- Adiwardana D.D.F., Luong M.-T., So D.R. [et al.}. Towards a human-like open-domain chatbot // ArXiv. 2020. V. abs/2001.09977.
- Burtsev M., Logacheva V., Malykh V. [et al.}. The first conversational intelligence challenge // The NIPS'17 Competition: Building Intelligent Systems. Springer, Cham, 2018. P. 25-46.
- Dinan E., Logacheva V., Malykh V. [et al.}. The second conversational intelligence challenge (convai2) 11 The NeurIPS'18 Competition. Springer, Cham, 2020. P. 187-208.
- Logacheva V., Burtsev M., Malykh V. [et al.}. A dataset of topic-oriented human-to-chat-bot dialogues. 2018.
- Logacheva V., Malykh V., Litinsky A., Burtsev M. Convai2 dataset of non-goal-oriented human-to-bot dialogues // The NeurIPS'18 Competition. Springer, Cham, 2020. P. 277-294.
- Cer D. M., Yang Y., yi Kong S. [et al.}. Universal sentence encoder // ArXiv. 2018. V. abs/1803.11175.
- Socher R., Perelygin A., Wu J. [et al.}. Recursive deep models for semantic compositionalitv overa sentiment treebank // Proceedings of the 2013 conference on empirical methods in natural language processing. 2013. P. 1631-1642.
- Zhang Y., Song L., Song D., Guo P., Zhang J., Zhang P. Scenariosa: A large scale conversational database for interactive sentiment analysis // arXiv preprint arXiv:1907.05562. 2019.
- Khatri C., Hedayatnia B., Venkatesh A. [et al.}. Advancing the state of the art in open domain dialog systems through the alexa prize // ArXiv. 2018. V. abs/1812.10757.
- Khatri C., Goel R., Hedayatnia B. [et al.}. Contextual topic modeling for dialog systems // 2018 IEEE Spoken Language Technology Workshop (SLT). IEEE. 2018. P. 892-899.
- Khatri C., Hedayatnia B., Goel R. [et al.}. Detecting offensive content in open-domain conversations using two stage semi-supervision // ArXiv. 2018. V. abs/1811.12900.
- Yi S., Goel R., Khatri C. [et al.}. Towards coherent and engaging spoken dialog response generation using automatic conversation evaluators // Proceedings of the 12th International Conferenceon Natural Language Generation. Tokyo, Japan : Association for Computational Linguistics,2019. Oct. Nov. P. 65-75. Access mode: https: / / www.aclweb.org/anthology/W19-8608.
- Weizenbaum J. Eliza — a computer program for the study of natural language communication between man and machine // Communications of the ACM. 1966. V. 9, N 1. P. 36-45.
- Wolf T., Sanh V., Chaumond J., Delangue C. Transfertransfo: A transfer learning approach forneural network based conversational agents // arXiv preprint arXiv:1901.08149. 2019.
- Welleck S., Weston J., Szlam A., Cho K. Dialogue natural language inference // Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. Florence, Italy : Association for Computational Linguistics, 2019. Jul. P. 3731-3741. Access mode: https://www.aclweb.org/anthologv/P19-1363.
- Henderson M., Casanueva I., Mrksic N. [et al.\. Convert: Efficient and accurate conversational representations from transformers // arXiv preprint arXiv: 1911.03688. 2019.
- Dinan E., Roller S., Shuster K., Fan A., Auli M., Weston J. Wizard of wikipedia: Knowledge-powered conversation agents // Proceedings of ICLR. 2018.
- Ram A., Prasad R., Khatri C. [et al.\. Conversational ai: The science behind the alexa prize. 2018. 1801.03604.