Сравнение методов кластеризации K-Means и Gaussian Mixture для анализа спутниковых снимков
Автор: Белоусов Е.C., Добрынин Д.В.
Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse
Рубрика: Моделирование и анализ данных
Статья в выпуске: 2, 2026 года.
Бесплатный доступ
В работе проведён сравнительный анализ двух алгоритмов кластеризации без учителя – K-Means и Gaussian Mixture Model (GMM) – применительно к задаче выделения природных объектов на спутниковых снимках. Признаковое пространство сформировано из попиксельных спектральных характеристик и локальных статистик (среднее и эксцесс яркости в окне 15×15) с последующей стандартизацией. Оптимальное число кластеров (k = 12) подобрано методом локтя. Для каждого алгоритма построены модели на спектральных признаках (S-варианты) и на расширенном пространстве (C-варианты), качество оценено по индексам Silhouette, Davies–Bouldin и Calinski–Harabasz и визуально. Дополнительно проверена устойчивость моделей при переносе на новое изображение. Показано, что выбор алгоритма должен определяться прикладной задачей: S-KMeans – быстрая базовая кластеризация, C-GMM – детекция границ объектов, S-GMM – масштабирование на новые снимки.
Кластеризация, K-means, гауссовы смеси, дистанционное зондирование Земли, спутниковые снимки, признаковое пространство, обучение без учителя, сегментация изображений
Короткий адрес: https://sciup.org/14135744
IDR: 14135744 | УДК: 004.85, 528.85, 519.237.8
Comparison of K-Means and Gaussian Mixture clustering methods for satellite image analysis
This paper presents a comparative analysis of two unsupervised clustering algorithms – K-Means and the Gaussian Mixture Model (GMM) – applied to the task of extracting natural objects from satellite imagery. The feature space is built from pixel-wise spectral channels and local statistics (mean and kurtosis of brightness in a 15×15 window) followed by standardisation. The optimal number of clusters (k = 12) is selected via the elbow method. For each algorithm two models are trained – one on the spectral channels only (S-variants) and one on the extended feature space (C-variants). Performance is evaluated using the Silhouette, Davies–Bouldin and Calinski–Harabasz indices together with visual inspection. The stability of the models under transfer to a new image is also tested. The results show that the choice of algorithm should be driven by the applied task: S-KMeans is best for fast baseline clustering, C-GMM for object-boundary detection, and S-GMM for transfer to new satellite images.