Подход к обработке обратной связи пользователя для повышения качества результатов работы алгоритма кластеризации

Бесплатный доступ

Набор данных может иметь более одного «правильного» варианта разбиения на группы в результате работы метода кластеризации в зависимости от целей исследователя. В случае неудовлетворенности результатами исследователю приходится вносить изменения в пространство признаков для корректировки результата. Зачастую эта связь не прозрачна, что приводит к большому числу итераций. В данной работе представлен подход на базе нейронных сетей, позволяющий итеративно учитывать обратную связь без корректировки пространства признаков.

Кластеризация, интерактивная кластеризация, кластеризация с ограничениями, нейронные сети, глубинное обучение, глубинная кластеризация, глубинное представление, обратная связь

Короткий адрес: https://sciup.org/148314248

IDR: 148314248   |   DOI: 10.37313/1990-5378-2020-22-5-94-105

Список литературы Подход к обработке обратной связи пользователя для повышения качества результатов работы алгоритма кластеризации

  • AljalboutE., Golkov V., Siddiqui Y., Strobel M., Cremers D. Clustering with Deep Learning: Taxonomy and New Methods // arXiv:1801.07648, 2018.
  • Bae J., Helldin T., RiveiroM. Nowaczyk S., BouguellaM., Falkman G. Interactive Clustering: A Comprehensive Review // ACM Comput. Surv., 2020, Vol. 53, No. 1.
  • Bagherjeiran A., Eick C. F., Chen C.-S., Vilalta R. Adaptive clustering: obtaining better clusters using feedback and past experience // Fifth IEEE International Conference on Data Mining (ICDM'05), Houston, TX, 2005.
  • Balcan M.F., Blum A. Clustering with Interactive Feedback. // Freund Y., Györfi L., Turan G., Zeugmann T. (eds) Algorithmic Learning Theory. Lecture Notes in Computer Science, vol 5254. Springer, Berlin, Heidelberg, 2008.
  • Basu S., Banerjee A., Mooney R. Semi-supervised Clustering by Seeding // In Proceedings of 19th International Conference on Machine Learning, 2002.
  • Basu S., Davidson I., Wagstaff K. Constrained Clustering: Advances in Algorithms, Theory, and Applications // CRC Press, 2008.
  • Basu S., Fisher D., Drucker S.M., Lu H. Assisting Users with Clustering Tasks by Combining Metric Learning and Classification. // Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence, 2010.
  • Dasgupta S., Ng V. Which Clustering Do You Want? Inducing Your Ideal Clustering with Minimal Feedback // arXiv:1401.5389, 2014. -https://arxiv. org/abs/1401.5389.
  • Demiriz A., Bennett K.P., Embrechts M.J. A Genetic Algorithm Approach for Semi-Supervised Clustering. // International Journal of Smart Engineering System Design, 2002, vol. 4.
  • Dizaji K.G., Herandi A., Deng C., Cai W., Huang H. Deep Clustering via Joint Convolutional Autoencoder Embedding and Relative Entropy Minimization. // IEEE International Conference on Computer Vision (ICCV), Venice, 2017.
  • Dudarin P.V., Tronin V.G., Svyatov K.V. A Technique to Pre-trained Neural Network Language Model Customization to Software Development Domain // Kuznetsov S., Panov A. (eds) Artificial Intelligence. RCAI 2019. Communications in Computer and Information Science, vol 1093. Springer, Cham, 2019.
  • Fatehi K., Bozorgi A., Zahedi M.S., Asgarian E. Improving semi-supervised constrained k-means clustering method using user feedback. // Journal of Computing and Security, 2014, Volume 1, Number 4.
  • Greff K., van Steenkiste S., Schmidhuber J. Neural Expectation Maximization. // Advances in Neural Information Processing Systems 30, 2017.
  • Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition. // Springer Series in Statistics book series, 2009.
  • HofferE., AilonN. Deep Metric Learning Using Triplet Network // In: Feragen A., Pelillo M., Loog M. (eds) Similarity-Based Pattern Recognition. Lecture Notes in Computer Science, vol 9370. Springer, Cham, 2015.
  • Huang Y. Mixed-Iterative Clustering // PhD thesis at Language Technologies Institute School of Computer Science Carnegie Mellon University Pittsburgh, PA 15213, 2010.
  • Leela V., Sakthipriya K., Manikandan R. Comparative Study of Clustering Techniques in Iris Data Sets // World Applied Sciences Journal 29 (Data Mining and Soft Computing Techniques), 2014.
  • Li L., Kameoka H. Deep Clustering with Gated Convolutional Networks // IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Calgary, 2018.
  • MeierB.B., Elezi I., Amirian M., Dürr O., Stadelmann T. Learning Neural Models for End-to-End Clustering. // Artificial Neural Networks in Pattern Recognition edited by Pancioni L., Schwenker F., Trentin E., Lecture Notes in Computer Science, vol 11081. Springer, Cham, 2018.
  • Nebu C.M., Joseph S. Semi-supervised clustering with soft labels // International Conference on Control Communication & Computing India (ICCC), Trivandrum, 2015.
  • Pedregosa F., Varoquaux G, Gramfort A., Michel V., Thirion B., Grisel O., Blondel M., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M., Duchesnay Ё. Scikit-learn: Machine Learning in Python. // Journal of Machine Learning Research, 2011, vol. 12.
  • Pedrycz W. Algorithms of fuzzy clustering with partial supervision // Pattern Recognition Letters, Volume 3, 1985.
  • Suresh T., Meena Abarna K.T. LSTM Model for Semantic clustering of user-generated content using AI Geared to wearable Device // Semanticscholar. org Corpus ID: 212585860, 2017. - URL: https:// www.semanticscholar.org/paper/LSTM-Model-for-Semantic-clustering-of-content-using-Suresh-Abar na/7b72349284b78803fe2581a041e5c7a19a081bdc
  • Wang Z., Mi H., Ittycheriah A. Semi-supervised Clustering for Short Text via Deep Representation Learning // Proceedings of The 20th SIGNLL Conference on Computational Natural Language Learning, Association for Computational Linguistics, Berlin, Germany, 2016.
  • Xie J., Girshick R., Farhadi A. Unsupervised deep embedding for clustering analysis // ICML'16: Proceedings of the 33rd International Conference on International Conference on Machine Learning, 2002.
  • Xu J., Xu B., Wang P., Zheng S., Tian G., Zhao J. Self-Taught Convolutional Neural Networks for Short Text Clustering // IEEE Neural Networks, 2017, Volume 88.
  • Yang C., Shi X., Jie L., Han J. I Know You'll Be Back: Interpretable New User Clustering and Churn Prediction on a Mobile Social Application // the 24th ACM SIGKDD International Conference, 2018.
  • Yang J., Parikh D., Batra D. Joint Unsupervised Learning of Deep Representations and Image Clusters // IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, 2016.
  • Yang B., Fu X., Sidiropoulos N.D., Hong M. Towards K-means-friendly spaces: Simultaneous deep learning and clustering // Proceedings of the 34th International Conference on Machine Learning, Volume 70, 2017
  • Дударин П.В., Пинков А.П., Ярушкина Н.Г. Методика и алгоритм кластеризации объектов экономической аналитики // Автоматизация процессов управления. 2017. №1.
  • Дударин П.В., Ярушкина Н.Г. Алгоритм построения иерархического классификатора коротких текстовых фрагментов на основе кластеризации нечеткого графа // Радиотехника. 2017. № 6.
  • Дударин П.В., Тронин В.Г., Святов К.В., Белов В.А., Шакуров Р.А. Подход к оценке трудоемкости задач в процессе разработки программного обеспечения на основе нейронных сетей // Автоматизация процессов управления. 2019. № 3.
  • Дударин П.В., Ярушкина Н.Г. Подход к трансформации кластерного дерева признаков в векторное пространство признаков // Радиотехника. 2018. № 6.
  • Шелехова Н.В., Римарева Л.В. Управление технологическими процессами производства алкогольной продукции с применением информационных технологий // Хранение и переработка сельхозсы-рья, Пищевая промышленность. 2017. № 3.
  • Шелехова Н.В., Поляков В.А., Серба Е.М., Шелехова Т.М., Веселовская О.В., Скворцова Л.И. Информационные технологии в аналитическом контроле качества алкогольной продукции // Пищевая промышленность. 2018. №8.
Еще
Статья научная