Классификация больших данных телекоммуникационной компании с помощью технологии Data Mining

Автор: Самаркин Михаил Евеньевич, Тарасов Вениамин Николаевич

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Технологии телекоммуникаций

Статья в выпуске: 3 т.14, 2016 года.

Бесплатный доступ

С помощью технологии data mining анализируется информация о клиентах телекоммуникационной компании. К методу кластерного анализа k-средних применен нестандартный метод инициализации центроидов k-means++. Разработаны программа на языке C#, которая преобразует исходные данные компании в формат Comma-Separated Values (CSV), и программа на языке Python для кластеризации данных с подключенной библиотекой sklearn. Представлен обученный на больших данных классификатор на основе метода опорных векторов SVM.

Кластерный анализ, метод k-средних, метод инициализации центроидов k-means++

Короткий адрес: https://sciup.org/140191909

IDR: 140191909   |   DOI: 10.18469/ikt.2016.14.3.05

Список литературы Классификация больших данных телекоммуникационной компании с помощью технологии Data Mining

  • Метод инициализации центроидов K-means++//URL: https://ru.wikipedia.org/wiki/K-means++ (д.о. 10.03.2016).
  • Метод кластеризации K-средних//URL: https://ru.wikipedia.org/wiki/K-means (д.о. 02.02.2016).
  • Метод опорных векторов//URL: http://www.machinelearning.ru/wiki/index.php?title=SVM (д.о. 11.01.2016).
  • Машинное обучение (Воронцов К.В., курс лекций)//URL: http://www. machinelearning.ru/wiki/index.php?title(д.о. 11.01.2016).
  • Richert W., Coelho L.P. Building Machine Learning Systems with Python. 2013. -290 p.
  • Leskovec J., Rajaraman A., Ullman J.D. Mining of Massive Datasets. 2014. -476 p.
  • Flach P. Machine Learning. The Art and Science of Algorithms that Make Sense of Data. 2012. -409 p.
  • McKinney W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. 2012. -400 p.
  • Тарасов В.Н., Самаркин М.Е. Подходы к кластеризации больших данных по событиям в сети//Тезисы XXIII РНТК ПГУТИ, 2016. -С. 253.
  • Тарасов В.Н. Об одном из способов повышения надежности классификационного анализа//Интеллект. Инновации. Инвестиции. №4, 2014. -С. 107-111.
Статья научная