Построение и использование диалогового графа для улучшения оценки качества в целенаправленном диалоге

Автор: Юсупов И.Ф., Трофимова М.В., Бурцев М.С.

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Информатика и управление

Статья в выпуске: 3 (47) т.12, 2020 года.

Бесплатный доступ

Представлен метод извлечения диалогового графа из текстового корпуса. Диалоговый граф визуализирует основные темы для каждого шага в диалоге и переходы между ними. Предложенный метод извлечения диалогового графа использует набор различных алгоритмов кластеризации вместе с эвристиками. Метод применим для корпусов разных тематик и размеров. Рассмотрена визуализация полученных диалоговых графов для нескольких корпусов. В качестве демонстрации приведен пример использования признаков, извлеченных из диалогового графа в генеративной нейронной сети. Их применение повысило оценку качества BLEU на корпусе MultiWOZ 2 в задаче генерации ответов на 15%.

Еще

Диалоговые системы, структура диалога, визуализация, диалоговый граф

Короткий адрес: https://sciup.org/142230088

IDR: 142230088

Список литературы Построение и использование диалогового графа для улучшения оценки качества в целенаправленном диалоге

  • Ardissono L., Boella G., Lesmo L. A plan-based agent architecture for interpreting natural language dialogue // International Journal of Human-Computer Studies. 2000. V. 52. N 4. P. 583-635.
  • Camilleri G. Dialogue systems and planning // International Conference on Text, Speech and Dialogue. Berlin, Heidelberg : Springer, 2002. P. 429-436.
  • Vinyals O., Le Q. A neural conversational model // arXiv preprint arXiv:1506.05869. 2015.
  • Bouraoui J.L., Lemaire V. Cluster-based graphs for conceiving dialog systems. Workshop DMNLP at European Conference on Machine Learning (ECML). 2017.
  • Cer D. [et al.\. Universal sentence encoder for English // Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2018. P. 169-174.
  • Devlin J. [et al.\. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). 2019. P. 4171-4186.
  • MacQueen J. [et al.\. Some methods for classification and analysis of multivariate observations // Proceedings of the fifth Berkeley symposium on mathematical statistics and probability. 1967. V. 1. N 14. P. 281-297.
  • Vorontsov K. [et al.\. Bigartm: Open source library for regularized multimodal topic modeling of large collections // International Conference on Analysis of Images, Social Networks and Texts. Springer, Cham, 2015. P. 370-381.
  • Bastian M., Heymann S., Jacomy M. Gephi: an open source software for exploring and manipulating networks // Third international AAAI conference on weblogs and social media. 2009.
  • Novikov A. PvClustering: data mining library // Journal of Open Source Software. 2019. V. 4. N 36. P. 1230.
  • Burtsev M. [et al.\. The first conversational intelligence challenge // The NIPS'17 Competition: Building Intelligent Systems. Springer, Cham, 2018. P. 25-46.
  • Logacheva V. [et al.\. ConvAI Dataset of Topic-Oriented Human-to-Chatbot Dialogues // The NIPS'17 Competition: Building Intelligent Systems. Springer, Cham, 2018. P. 47-57.
  • Yusupov I., Kuratov Y. NIPS Conversational Intelligence Challenge 2017 Winner System: Skill-based Conversational Agent with Supervised Dialog Manager // Proceedings of the 27th International Conference on Computational Linguistics. 2018. P. 3681-3692.
  • Dinan E. [et al.\. The second conversational intelligence challenge (convai2) // The NeurIPS'18 Competition. Springer, Cham, 2020. P. 187-208.
  • Budzianowski P. [et al.\. MultiWOZ-A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling // Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. 2018. P. 5016-5026.
  • Luong M.T., Pharn H., Manning C.D. Effective Approaches to Attention-based Neural Machine Translation // Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. 2015. P. 1412-1421.
  • Sutskever I., Vinyals O., Le Q.V. Sequence to sequence learning with neural networks // Advances in neural information processing systems. 2014. P. 3104-3112.
  • Pennington J., Socher R., Manning C.D. Glove: Global vectors for word representation // Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP). 2014. P. 1532-1543.
  • Burtsev M. [et al.\. Deeppavlov: Open-source library for dialogue systems // Proceedings of ACL 2018, System Demonstrations. 2018. P. 122-127.
  • Papineni K. [et al.\. BLEU: a method for automatic evaluation of machine translation // Proceedings of the 40th annual meeting on association for computational linguistics. Association for Computational Linguistics, 2002. P. 311-318.
Еще
Статья научная