Применение задач оптимизации в кластерном анализе
Автор: Сдвижков Олег Александрович
Журнал: Сервис в России и за рубежом @service-rusjournal
Рубрика: Образование и кадры
Статья в выпуске: 7 (54), 2014 года.
Бесплатный доступ
Кластерный анализ [3] является сравнительно новым разделом математики, в котором изучаются методы разбиения совокупности объектов, заданных конечными наборами признаков, на однородные группы (кластеры). Кластерный анализ широко применяется в психологии, социологии, экономике (сегментация рынка) и многих других областях, в которых возникает задача классификации объектов по их признакам. Методы кластеризации реализованы в пакетах STATISTICA [1] и SPSS [2], они возвращают разбиения на кластеры, дисперсионную статистику кластеризации и дендрограммы иерархических алгоритмов кластеризации. Макросы MS Excel основных методов кластеризации и примеры применения приведены в монографии [5]. Одной из центральных проблем кластерного анализа является определение по некоторому критерию числа кластеров, обозначим это число через K, на которые разбивается заданное множество объектов. Существуют несколько десятков подходов [4] к определению числа K. В частности, согласно [6] число кластеров K - минимальное число, для которого выполняется , где - минимальное значение суммарной дисперсии при разбиении на K кластеров, N - число объектов. К числу кластеров автоматически приводит последовательное применение аномальных кластеров [4]. В 2010 году предложен и экспериментально проверен метод получения числа K посредством применения функции плотности [4]. В статье предлагаются два простых подхода к определению K, когда каждый кластер имеет не менее двух объектов. В первом число K определяется через кратчайшие гамильтоновы циклы, во втором - через минимальные остовные деревья. Приведены примеры кластеризации с подробными пошаговыми решениями и графическими иллюстрациями. Показано применение макроса VBA Excel, возвращающего минимальное остовное дерево, к задачам кластеризации. В статью вошел код макроса, снабженный комментариями к основным блокам.
Кластер, линейное программирование, кратчайший цикл, минимальное остовное дерево
Короткий адрес: https://sciup.org/14057865
IDR: 14057865 | DOI: 10.12737/7483
Список литературы Применение задач оптимизации в кластерном анализе
- Вуколов, Э.А. Основы статистического анализа: практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL. -М.: ИНФРА-М, 2004.
- Дубов, И.Ю. Обработка статистической информации с помощью SPSS. -М.: НТ Пресс, 2004.
- Мандель, И.Д. Кластерный анализ. -М.: Финансы и статистика, 1988.
- Миркин, Б.Г. Методы кластер-анализа для поддержки принятия решений. -М.: изд. дом «Высшая школа экономики», 2011.
- Сдвижков, О. А. Дискретная математика и математические методы экономики с применением VBA Excel. -М.: ДМК Пресс, 2012.
- Hartigan J. A. Clustering Algorithms. N.Y.: J. Wiley & Sons, 1975.