Неоднородный ансамблевый алгоритм классификации разнотипных данных
Автор: Альсова Ольга Константиновна, Стубарев Игорь Михайлович
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 6-1 т.19, 2017 года.
Бесплатный доступ
В статье предложен неоднородный ансамблевый алгоритм, предназначенный для классификации разнотипных данных. Алгоритм основан на итерационном применении одиночных (базовых) классификаторов на исходной обучающей выборке и включении в ансамбль только тех классификаторов, относительная ошибка которых не превосходит заданный порог. С использованием алгоритма выполнено построение нескольких ансамблей классификаторов на выборке из архива данных по машинному обучению и на реальных медицинских данных. Сравнительное тестирование показало преимущества использования предложенного ансамблевого алгоритма по сравнению с одиночными классификаторами (повышение точности классификации, уменьшение дисперсии ошибки классификатора).
Одиночный (базовый) алгоритм классификации, неоднородный ансамблевый алгоритм, bootstrap - выборка, дерево решений, логистическая регрессия, нейронная сеть
Короткий адрес: https://sciup.org/148205376
IDR: 148205376
Список литературы Неоднородный ансамблевый алгоритм классификации разнотипных данных
- Multiple Classifier Systems/J. Kittler & F. Roli (editors)//Proc. of 2nd International Workshop, MCS2001, (Cambridge, UK, 2-4 July 2001)/Lecture Notes in Computer Science. V. 2096. Springer-Verlag, Berlin.
- Vishwath P., Murty M.N., Bhatnagar С. Fusion of multiple approximate nearest neighbor classifier for fast and efficient classification//Information fusion. 2004. V. 5. Pp. 239-250.
- Quinlan J.R. Bagging, boosting and C4.5//Proceedings of AAA/IAAI. 1996. V. 1. Pp. 725-730.
- Breiman L. Bagging predictors//Machine Learning.1996.V. 24, No. 2. Pp. 123-140.
- Tumer K., N.C. Oza Decimated input ensembles for improved generalization//Proceedingsof the International Joint Conference on Neural Networks. Washington, DC. 1999.
- Чистяков С.П. Случайные Леса: Обзор//Труды Карельского научного центра РАН. 2013. № 1. C. 117 -136.
- Батыгин Р.И., Альсова О.К. Программная система классификации разнотипных данных на основе ансамбля алгоритмов (ECA -Ensemble Classification Algorithms): Свидетельство о государственной регистрации программы для ЭВМ № 2017610788. 2017.
- Batygin R.I., Alsova O.K. Software system for different types of data classification based on the ensemble algorithms//Actual problems of electronic instrument engineering (APEIE-2016): proceedings. Novosibirsk, 2016. V. 1. Part 2. Pp. 506-509.
- Альсова О.К., Альсов С.А. Алгоритм мультиномиальной классификации разнотипных медицинских данных//Естественные и технические науки. 2015. № 11. С.386-389.
- Альсова О.К. Алгоритмы кластеризации разнотипных медицинских данных на примере решения медицинской задачи//Труды СПИИРАН, 2014. № 6. С. 156-169.