Исследование моделей и процедур самоконфигурации генетического программирования для формирования деревьев принятия решений в задачах интеллектуального анализа данных
Автор: Липинский Л.В., Кушнарева Т.В.
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 3 т.17, 2016 года.
Бесплатный доступ
Исследуются механизмы самоконфигурации алгоритма генетического программирования для автоматизированного формирования деревьев принятия решений. Рассматриваются известные и хорошо зарекомендовавшие себя в задачах самоконфигурирования генетического алгоритма модели Population-Level Dynamic Probabilities (PDP) и Individual-Level Dynamic Probabilities (IDP). За счет общности процедур выбора эволюционных операторов данные подходы достаточно просто обобщаются на все эволюционные алгоритмы в целом и на алгоритм генетического программирования в частности. Однако указанные процедуры ограничены в выборе конфигурации и управлении ходом эволюции. Такие пути развития эволюционного поиска, как перезапуск, введение в популяцию новых случайных индивидов, кардинальное изменение параметров и изменение ресурсов поиска (добавление итераций, расширение популяции и т. п.), сложно включить в PDP и IDP. Кроме того, процесс принятия решения, т. е. изменение конфигурации поискового алгоритма, скрыт от пользователя. Пользователь может наблюдать лишь результаты этого выбора. Рассматривается альтернативный подход к самоконфигурированию эволюционных алгоритмов с помощью нечеткого контроллера. Процедура принятия решения и управления конфигурацией поиска в нечетких логических системах аналогична рассуждению эксперта и легко обобщается на большинство путей и настроек эволюционного поиска, которые применяет в своей работе опытный пользователь. Кроме того, пользователь может включить в нечеткий контроллер те эвристические правила и процедуры, которые сам использует в своей практике. Показывается принципиальная возможность применения нечеткой системы управления для самоконфигурирования алгоритма генетического программирования в задаче автоматизированного формирования деревьев принятия решения. Предложен минимальный набор нечетких правил и лингвистических переменных, позволяющий управлять эволюционным поиском. Обсуждается потенциал нечеткого контроллера и пути повышения эффективности процедуры самоконфигурации. Сравнение эффективности процедур самоконфигурирования проводится на практических задачах - классификации ирисов Фишера и прогнозировании побочных эффектов при лечении эпилепсии. Проводится анализ статистической значимости различий в эффективности подходов и обсуж- даются результаты. Гибридный эволюционный алгоритм автоматизированного формирования деревьев принятия решений на основе генетического программирования с реализованными процедурами самоконфигурации может быть применен в различных областях, в том числе и в ракетно-космической отрасли.
Генетический алгоритм, генетическое программирование, деревья принятия решений, нечеткий контроллер, самоконфигурация
Короткий адрес: https://sciup.org/148177597
IDR: 148177597
Список литературы Исследование моделей и процедур самоконфигурации генетического программирования для формирования деревьев принятия решений в задачах интеллектуального анализа данных
- Кушнарева Т. В., Липинский Л. В. Алгоритм генетического программирования для автоматизированного формирования деревьев принятия решения//Материалы XVIII Междунар. науч. конф., посвященной 90-летию со дня рождения генерального конструктора ракетно-космических систем академика М. Ф. Решетнева/СибГАУ. Красноярск, 2014. Т. 2. С. 84-86.
- Гибридный эволюционный алгоритм автоматизированного формирования деревьев принятия решения/Липинский Л. В. //Вестник СибГАУ. 2014. № 5 (57). С. 85-92.
- Кушнарева Т. В., Липинский Л. В. Автоматизированное формирование деревьев принятия решения для прогнозирования побочных эффектов при лечении эпилепсии//Актуальные проблемы авиации и космонавтики: материалы XI Междунар. науч.-практ. конф., посвященной празднованию 55-летия Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева/СибГАУ. Красноярск, 2015. Т. 1. С. 334-336.
- Кушнарева Т. В., Липинский Л. В. Анализ и интерпретация результатов при автоматизированном формировании деревьев принятия решений методом генетического программирования//Материалы XIX Междунар. науч. конф., посвященной 55-летию Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева/СибГАУ. Красноярск, 2015. Т. 2. С. 57-59.
- Кушнарева Т. В. О применении деревьев принятия решения в задачах медицинской диагностики//Проспект Свободный -2015: материалы науч. конф., посвященной 70-летию Великой Победы (15-25 апр. 2015, г. Красноярск)/Сиб. федер. ун-т. Красноярск, 2015. C. 31-32.
- Niehaus J., Banzhaf W. Adaption of operator probabilities in genetic programming//Proceeding EuroGP ’01: Proceedings of the 4th European Conference on Genetic Programming. London: Springer-Verlag Publ, 2001. Vol. 2038 of LNCS. P. 325-336.
- Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия. Телеком. 2006. C. 91-106.
- Yuceer C., Oflazer K. A rotation, scaling and translation invariant pattern classification system//Pattern Recognition. 1993. Vol. 26. P. 687-710.
- Zadeh L. A. Fuzzy sets//Information and control. 1965. Vol. 8. P. 338-353.
- Zadeh L. A. The concept of linguistic variables and its application to approximate reasoning//Information sciences. 1975. No 8(3). P. 199-249.
- Fisher R. A. The Use of Multiple Measurements in Taxonomic Problems//Annals of Eugenics. 1936. Vol. 7, iss. 2. P. 179-188.
- Академик . URL: http://dic.academic.ru/dic.nsf/enc_medicine/36047/Эпилепсия (дата обращения: 10.1.2013).
- Гмурман В. Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов. М.: Высш. шк., 2003. С. 303-304.
- Прикладная статистика: Основы моделирования и первичная обработка данных/С. А. Айвазян М.: Финансы и статистика, 1983. 471 с.
- Румшиский Л. З. Математическая обработка результатов эксперимента. М.: Наука, 1971. 192 с.