Кластеризация регионов Российской Федерации по уровню социально-экономического развития с использованием методов машинного обучения

Автор: Кетова Каролина Вячеславовна, Касаткина Екатерина Васильевна, Вавилова Дайана Дамировна

Журнал: Экономические и социальные перемены: факты, тенденции, прогноз @volnc-esc

Рубрика: Региональная экономика

Статья в выпуске: 6 т.14, 2021 года.

Бесплатный доступ

В работе решена задача кластеризации регионов Российской Федерации по социально-экономическому развитию с учетом отраслевой структуры валового регионального продукта. Инструментом решения задачи кластеризации являются классические методы машинного обучения. Исходная база данных включает реальные статистические данные по социально-экономическому развитию субъектов РФ и отраслевой структуре их валового регионального продукта за 2019 год. Для выявления кластеров регионов по социально-экономическому развитию применены современные методы машинного обучения, реализованные на высокоуровневом языке программирования Python с подключением библиотек для работы с данными: Pandas, Sklearn, SciPy и др. Выполнена предобработка исходной информации: оцифровка категорий данных, переход к удельным величинам, стандартизация показателей. Исходный набор данных за 2019 год содержит 5525 записей по 65 показателям социально-экономического развития 85 регионов РФ. На основе метода главных компонент выделено 15 базовых индикаторов социально-экономического развития региона, по ним методом k-средних определены пять региональных кластеров: первый кластер характеризируется высокой долей в структуре ВРП оптовой и розничной торговли, операций с недвижимым имуществом, профессиональной, научной и технической деятельности; второй кластер специализируется на обрабатывающем производстве, оптовой и розничной торговле, деятельности по операциям с недвижимым имуществом, сельском и лесном хозяйстве; третий можно описать как кластер со смешанной экономикой, для которого характерны средние значения по основным социально-экономическим показателям в РФ; в регионах, относящихся к четвертому кластеру, наблюдается высокий уровень безработицы, при этом выявлена высокая доля государственного управления и обеспечения военной безопасности, социального обеспечения; пятый кластер специализируется на добыче полезных ископаемых.

Еще

Социально-экономические показатели, отраслевая структура, валовой региональный продукт, машинное обучение, кластерный анализ, метод главных компонент

Короткий адрес: https://sciup.org/147236375

IDR: 147236375   |   DOI: 10.15838/esc.2021.6.78.4

Список литературы Кластеризация регионов Российской Федерации по уровню социально-экономического развития с использованием методов машинного обучения

  • Golova I.M., Sukhovey A.F. Differentiation of innovative development strategies considering specific characteristics of the Russian regions. Economy of Region, 2019, vol. 15, pp. 1294—1308. DOI: 10.17059/ 2019-4-25
  • Mariev O., Pushkarev A. Clustering Russian regions by innovative outputs using a multi indicator approach. In: Proceedings of the 7th International Conference Innovation Management, Entrepreneurship and Sustainability (IMES), 2019. Pp. 519-533.
  • Кетова К.В., Вавилова Д.Д. Оценка тенденций изменения человеческого капитала социально-экономической системы на основе применения алгоритма нейросетевого прогнозирования // Экономические и социальные перемены: факты, тенденции, прогноз. 2020. Т. 13. Вып. 6. С. 117-133. DOI: 10.15838/esc.2020.6.72.7
  • Shubat O.M., Bagirova A.P., Akishev A.A. Methodology for analyzing the demographic potential of Russian regions using fuzzy clustering. Economy of Region, vol. 15, pp. 178-190. DOI: 10.17059/2019-1-14
  • Кетова К.В., Трушкова Е.В. Решение логистической задачи топливоснабжения распределенной региональной системы теплоснабжения // Компьютерные исследования и моделирование. 2012. Т. 4. № 2. С. 451-470.
  • Локосов В.В., Рюмина Е.В., Ульянов В.В. Кластеризация регионов России по показателям качества жизни и качества населения // Народонаселение. 2019. Т. 22. № 4. С. 4-17.
  • Костина С.Н., Трынов А.В. Кластерный анализ динамики рождаемости четвертых и последующих детей в регионах Российской Федерации // Экономические и социальные перемены: факты, тенденции, прогноз. 2021. Т. 14. № 3. С. 232-245. DOI: 10.15838/esc.2021.3.75.14
  • Лавриненко П.А., Рыбакова Д.А. Сравнительный анализ региональных различий в сферах здоровья населения, экологии и здравоохранения // Экономические и социальные перемены: факты, тенденции, прогноз. 2015. № 5 (41). С. 198-210.
  • Петрыкина И.Н. Кластерный анализ регионов Центрального федерального округа по уровню развития человеческого капитала // Вестник Воронежского государственного университета. Экономика и управление. 2013. № 1. С. 72-80.
  • Демичев В.В., Маслакова В.В., Нестратова А.А. Кластеризация регионов России по уровню эффективности сельского хозяйства // Бухучет в сельском хозяйстве. 2020. № 12. С. 58-66. DOI: 10.33920/sel-11-2012-06
  • Аксенов И.А. Кластеризация внешнеэкономической деятельности регионов // Экономика и менеджмент систем управления. 2016. № 1-3. С. 309-315.
  • Марченко Е.М., Белова Т.Д. Кластеризация регионов с учетом показателей энергоэффективности // Региональная экономика: теория и практика. 2016. № 1 (424). С. 51-60.
  • Paul S., Alvi A.M., Nirjhor M.A., Rahman S., Orcho A.K., Rahman R.M. Analyzing accident prone regions by clustering. Advanced Topics in Intelligent Information and Database Systems, 2017, vol. 710, pp. 3-13.
  • Орлова И.В., Филонова Е.С. Кластерный анализ регионов Центрального федерального округа по социально-экономическим и демографическим показателям // Статистика и экономика. 2015. № 5. С. 111-115. DOI: 10.21686/2500-3925-2015-5-136-142
  • Ultsch A., Lotsch J. Machine-learned cluster identification in high-dimensional data. Journal of Biomedical Informatics, 2017, vol. 66, pp. 95-104. DOI: 10.1016/j.jbi.2016.12.011
  • Khan I., Luo Z., Shaikh A.K., Hedjam R. Ensemble clustering using extended fuzzy k-means for cancer data analysis. Expert Systems with Applications, 2021, vol. 172, 114622. DOI: 10.1016/j.eswa.2021.114622
  • Ming F., Stephen T.A Machine learning based asset pricing factor model comparison on anomaly portfolios. Economics Letters, 2021, vol. 204, 109919. DOI: 10.1016/j.econlet.2021.109919
  • Blekanov I., Krylatov A., Ivanov D., Bubnova Y. Big data analysis in social networks for managing risks in clothing industry. IFACPapersOnLine, 2019, vol. 52 (13), pp. 1710-1714. DOI: 10.1016/j.ifacol.2019.11.447
  • Arthur D., Vassilvitskii S. K-means++: The advantages of careful seeding. In: Conference: Proceedings of the Eighteenth Annual ACM-SIAM Symposium on Discrete Algorithms, SODA 2007, New Orleans, Louisiana, USA. DOI: 10.1145/1283383.1283494
  • Ozgur O., Akkoc U. Inflation forecasting in an emerging economy: Selecting variables with machine learning algorithms. International Journal of Emerging Markets, 2020. DOI: 10.1108/LTOEM-05-2020-0577
  • Faizullin R.V. Simulator of the navigation equipped with LIDAR of the mobile robot based on the neural network. IOP Conference Series: Materials Science and Engineering, 2020, vol. 873, no. 1. DOI: 10.1088/1757-899X/873/1/012023
  • De Sousa J.M., Santos R.L.D., Lopes L.A., Machado V.P., Silva I.S. Automatic labelling of clusters with discrete and continuous data using supervised machine learning. In: Proceedings of the 35th International Conference of the Chilean Computer Science Society (SCCC). 2016.
  • Lee C.H., Steigerwald D.G. Inference for clustered data. Stata Journal, 2018, vol. 18, no. 2, pp. 447—460. DOI: 10.1177/1536867X1801800210
  • Mitra D., Chu Y, Cetin K. Cluster analysis of occupancy schedules in residential buildings in the United States. Energy and Buildings, 2021, vol. 236, 110791. DOI: 10.1016/j.enbuild.2021.110791
  • Ofetotse E.L., Essah E.A., Yao R. Evaluating the determinants of household electricity consumption using cluster analysis. Journal of Building Engineering, 2021, vol. 43, 102487. DOI: 10.1016/j.jobe.2021.102487
  • Aivazian S., Afanasiev M., Kudrov A. Indicators of the main directions of socio-economic development in the space of characteristics of regional differentiation. Applied Econometrics, 2019, vol. 54, pp. 51—69. DOI: 10.24411/1993-7601-2019-10003
  • Касаткина Е.В., Вавилова Д.Д. Информационно-аналитическая система прогнозирования обобщающих показателей социально-экономического развития региона // Проблемы управления. 2015. № 4. С. 25-34.
  • Omuya E.O., Okeyo G.O., Kimwele M.W. Feature selection for classification using principal component analysis and information gain. Expert Systems with Applications, 2021, vol. 174, 114765. DOI: 10.1016/j.eswa.2021.114765
Еще
Статья научная