Об однородных ансамблях при использовании метода бустинга в приложении к классификации несбалансированных данных
Автор: Никулин В.Н., Палешева С.А., Зубарева Д.С.
Журнал: Вестник Пермского университета. Серия: Экономика @economics-psu
Рубрика: Экономико-математическое моделирование
Статья в выпуске: 4 (15), 2012 года.
Бесплатный доступ
В работе приведены результаты международного соревнования по анализу данных в рамках конференции PAKDD-2007, подготовленных и предоставленных потребительской финансовой компанией с целью поиска лучших решений проблемы перекрестной продажи. Кроме того, рассмотрены два других соревнования на платформе Kaggle, которые также имеют финансовую интерпретацию
Ансамбль и элементарный классификатор, градиентные методы оптимизации, бустинг, случайный лес, дерево решений
Короткий адрес: https://sciup.org/147201319
IDR: 147201319
Список литературы Об однородных ансамблях при использовании метода бустинга в приложении к классификации несбалансированных данных
- Шешукова Т.Г., Колесень Е.В. Экономический потенциал предприятия: сущность, компоненты, структура//Вестн. Перм. ун-та. Сер. Экономика. 2011. Вып. 4. С. 118-127.
- Barinova O. Incorporating posterior estimates into adaboost//Pattern Recognition and Image Analysis. 2009. Vol. 19 (3). P. 421-434.
- Biau G., Devroye L., Lugosi G. Consistency of random forests and other averaging classifiers//Journal of Machine Learning Research. 2007. Vol. 9. P. 2015-2033.
- Breiman L. Bagging predictors//Machine Learning. 1996. Vol. 24. P. 123-140.
- Breiman L. Random forests//Machine Learning. 2001. Vol. 45(1). P. 5-32.
- Djukova E. V., Zhuravlev Yu. I., Sotnezov R. M. Construction of an ensemble of logical correctors on the basis of elementary classifiers//Pattern Recognition and Image Analysis. 2011. Vol. 21(4). P. 599-605.
- Freund Y., Schapire R. A decision-theoretic generalization of online learning and an application to boosting//J. Comput. System Sciences. 1997. Vol. 55. P. 119-139.
- Friedman J., Hastie T., Tibshirani R. Additive logistic regression: a statistical view of boosting//Annals of Statistics. 2000. Vol. 28. P. 337-374.
- Frohlich B., Rodner E., Kemmler M., Denzler J. Large scale gaussian process classification using random decision forests//Pattern Recognition and Image Analysis. 2012. Vol. 22 (1). P. 113-120.
- Guyon I., Weston J., Barnhill S., Vapnik V. Gene selection for cancer classification using support vector machines//Machine Learning. 2002. Vol. 46. P. 389-422.
- Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer-Verlag, 2001.
- Nikulin V. Learning with mean-variance filtering, SVM and gradient-based optimization//International Joint Conference on Neural Networks. Vancouver, BC, Canada. 2006. July 16-21. IEEE. P. 4195-4202.
- Nikulin V. Classification of imbalanced data with random sets and mean-variance filtering//International Journal of Data Warehousing and Mining. 2008. Vol. 4. P. 63-78.
- Nikulin V., McLachlan G., Shu K.-N. Ensemble Approach for the Classification of Imbalanced Data. Proceedings of the 22nd Australasian Joint Conference on Artificial Intelligence, Lecture Notes in Artificial Intelligence, Springer-Verlag, edited by A.Nicholson and X.Li. Melbourne, 2009. P. 291-300.