Поиск зависимостей в данных на основе методов удовлетворения табличных ограничений

Автор: Зуенко А.А., Зуенко О.Н.

Журнал: Онтология проектирования @ontology-of-designing

Рубрика: Инжиниринг онтологий

Статья в выпуске: 3 (49) т.13, 2023 года.

Бесплатный доступ

Работа посвящена поиску в данных особого типа закономерностей, называемых частыми паттернами. Под частым паттерном понимается некоторая совокупность признаков, которая характеризует большое количество объектов обучающей выборки. Существующие методы выявления паттернов, как правило, не позволяют гибко учитывать необходимые требования к их виду. Изменение условий, которым должны удовлетворять искомые закономерности, приводит к трудоёмкой модификации используемых алгоритмов и снижению производительности вычислений. В статье предлагается подход на основе парадигмы программирования в ограничениях, свободный от перечисленных недостатков. Подход основан на оригинальном способе представления обучающей выборки с помощью специализированных табличных ограничений - сжатых таблиц D -типа, на авторском методе поиска с возвратами, а также на специализированных правилах редукции для табличных ограничений. Особое внимание уделяется решению задачи поиска замкнутых паттернов, которая входит как часть в решение рассматриваемых в работе задач машинного обучения и включает учёт дополнительных требований к виду искомых паттернов. В качестве дополнительных требований к виду паттерна рассматриваются ограничения на частоту встречаемости замкнутого паттерна, а также условия на вхождение некоторого элемента (признака) в паттерн. К основным правилам редукции сжатых таблиц D -типа добавляются правила, учитывающие интересующие особенности анализируемых паттернов. Преимуществом подхода является то, что учёт и анализ новых ограничений позволяет на ранних стадиях процесса поиска исключать из рассмотрения заведомо неперспективные кандидаты в паттерны, что способствует сокращению количества этапов вычислений (узлов дерева поиска) и позволяет снизить расход оперативной памяти, требуемой для реализации этих этапов.

Еще

Программирование в ограничениях, извлечение паттернов, правила редукции, машинное обучение, табличные ограничения

Короткий адрес: https://sciup.org/170200578

IDR: 170200578   |   DOI: 10.18287/2223-9537-2023-13-3-392-404

Список литературы Поиск зависимостей в данных на основе методов удовлетворения табличных ограничений

  • Russel S., Norvig P. Artificial Intelligence: A Modern Approach. 3rd ed. Prentice Hall, 2010. 1132 p.
  • Bisaria J., Shivastava N., Pardasani K.R. A rough set model for constraint driven mining of sequentioal patterns. Int. J. of Computer and Network Sequrity. 2009; 1(1).
  • Gan W., Lin J.C. W., Fournier-Viger P., Chao H.C., Tseng V.S., Yu P.S. A survey of utility-oriented pattern mining. Transactions on Knowledge and Data Engineering. 2021. Vol. 33(4). P.1306-1327. DOI: 10.1109/TKDE.2019.2942594.
  • Hien A., Loudni S., Aribi N., Lebbah Y., Laghzaoui M., Ouali A., Zimmermann A. A Relaxation-Based Approach for Mining Diverse Closed Patterns. In: book Machine Learning and Knowledge Discovery in Databases. February 2021. P.36-54. D0I:10.1007/978-3-030-67658-2_3.
  • Belaid M., Bessiere C., Lazaar N.: Constraint Programming for Association Rules. In: Proc. Of the Int. Conf. on Data Mining. May 2019. P.127-135. D0I:10.1137/1.9781611975673.15.
  • Jabbour S., Mazouri F., Sais L. Mining Negatives Association Rules Using Constraints. Procedia Computer Science. 2018. Vol.127. P.481-488. DOI: 10.1016/j.procs.2018.01.146.
  • Zuenko A. Representation and processing of qualitative constraints using a new type of smart tables. In: Proc. of the 4th Int. Conf. on Computer Science and Application Engineering. October 2020. P.1-7. D0I:10.1145/3424978.3425023.
  • Mackworth A. Consistency in networks of relations // Artificial Intelligence. 8(1), 1977. P.99-118.
  • Кузнецов С.О. Автоматическое обучение на основе формальных понятий // Автоматика и телемеханика, 2001. № 12, С.3-27. DOI: 10.1023/A:1012435612567.
  • Yap R., Wang W. Generalized Arc Consistency algorithms for table constraints: a summary of algorithmic ideas. In: Proc. of the AAAI Conf. of Artificial Intelligence. April 2020. P.13590-13597. DOI:10.1609/aaai.v34i09.7086.
  • Ingmar L., Schulte C. Making compact-table compact. In: Proc. of the Int. Conf. of Principle and Practice of Constraint Programming. Cham. 2015 August 23. P.271-287. DOI: 10.1007/978-3-319-98334-9_14.
  • Mairy J.-B., Deville Y., Lecoutre C. The smart table constraint. In: Proc. of the Int. Conf. of Integration of Constraint Programming, Artificial Intelligence, and Operations Research. Cham. 2015 April 16. P.271-287. DOI:10.1007/978-3-319-18008-3_19.
  • Bennai S., Amroun K., Loudni S. Exploiting Data Mining Techniques for Compressing Table Constraints. In: Proc. of the 31st Int. Conf. on Tools with Artificial Intelligence. November 2019. P.42-49. DOI:10.1109/ICTAI.2019.00015.
  • Кулик Б.А., Зуенко А.А., Фридман А.Я. Алгебраический подход к интеллектуальной обработке данных и знаний. Санкт-Петербург: Изд-во Политехнического ун-та, 2010. 235 c.
  • Agrawal R., Imieli'nsky T., Swami A. Mining association rules between sets of items in large databases. In: Proc. of the 1993 ACM SIGMOD Int. Conf. on Management of Data. Washington, United States, January 1993.
  • Зуенко А.А. Метод машинного обучения для выявления замкнутых множеств общих признаков объектов с применением технологии программирования в ограничениях // Автоматика и телемеханика, 2022. №12. С.156-168. DOI: 10.31857/S000523102212011X.
Еще
Статья научная