Модели машинного обучения в задаче прогнозирования природно-ресурсного потенциала пермского края
Автор: Копотева Анна Владимировна, Максимов Александр Александрович, Сиротина Наталья Александровна
Рубрика: Управление в социально-экономических системах
Статья в выпуске: 4 т.21, 2021 года.
Бесплатный доступ
В статье рассматривается проблема повышения качества моделирования и прогнозирования комплексного показателя природно-ресурсного потенциала региона за счет использования некоторых моделей машинного обучения с учителем. Актуальность решаемой задачи объясняется тем, что традиционно используемые для данных целей модели демонстрируют либо слишком низкое качество, либо сложны в настройке и оценке их параметров. Цель исследования: определение моделей машинного обучения, обеспечивающих оптимальные значения различных метрик качества моделирования. Материалы и методы. Для целей исследования рассмотрены модели множественной линейной регрессии, дерева принятия решений, случайного леса, градиентного бустинга и многослойного персептрона. В качестве метрик качества выбраны коэффициент детерминации R2, арифметический квадратный корень из средней квадратической ошибки моделирования RMSE, средняя абсолютная ошибка моделирования MAE и относительная погрешность прогнозирования на 1 и 2 временных интервала. Исследование выполнено на примере зависимости комплексного показателя природно-ресурсного потенциала Пермского края от системы определяющих его факторов на временном интервале с 2001 по 2018 г. в среде Jupiter Notebook средствами библиотек Pandas и Scikit-learn. Для обеспечения сопоставимости результатов моделирования был произведен отбор факторов на основании их корреляционного анализа. Подбор оптимальных параметров моделей произведен на основании данных с 2001 по 2016 г., качество прогнозирования проверялось по данным 2017 и 2018 гг. Результаты. По результатам проведенного исследования оказалось, что модель классической множественной линейной регрессии демонстрирует худшие результаты по всем рассмотренным метрикам качества. Наибольшее значение коэффициента детерминации, минимальные значения корня из средней квадратичной и средней абсолютной ошибки моделирования демонстрирует модель дерева решений. При этом минимальная относительная погрешность прогнозирования на 2017 г. обеспечивается моделью градиентного бустинга, на 2018 г. - моделью многослойного персептрона. Заключение. Проведенное исследование позволяет утверждать, что нелинейные модели машинного обучения для задачи моделирования и прогнозирования комплексного показателя природно-ресурсного потенциала демонстрируют лучшие аппроксимационные и прогностические свойства по сравнению с множественной линейной регрессией и могут быть использованы для повышения качества управления природными ресурсами.
Машинное обучение, метрики качества, регрессионный анализ, природно-ресурсный потенциал, пермский край
Короткий адрес: https://sciup.org/147236493
IDR: 147236493 | DOI: 10.14529/ctcr210411
Список литературы Модели машинного обучения в задаче прогнозирования природно-ресурсного потенциала пермского края
- Samus, T. Assessing the natural resource use and the resource efficiency potential of the Deser-tec concept / T. Samus, B. Lang //Solar Energy. - 2013. - Vol. 87. - Р. 176-183.
- Березовский, П.В. Экономическая оценка вторичных минеральных ресурсов: моногр. / П.В. Березовский. - СПбГГИ им. Г.В. Плеханова, 2009. - 161 с.
- Соколова, Н.В. Природно-ресурсный потенциал территории: содержание понятия, методы оценки /Н.В. Соколова //Вестник Ленинградского университета. - 1988. - № 3. - С. 125-130.
- Xie, X. Comparison of random forest and multiple linear regression models for estimation of soil extracellular enzyme activities in agricultural reclaimed coastal saline land / X. Xie, T. Wu, M. Zhu et al. // Ecological Indicators. - 2021. - Vol. 120, 106925.
- Ракаева, Т.Г. Регрессионно-дифференциальная модель динамики горной промышленности Пермского края / Т.Г. Ракаева, В.Ф. Беккер // Системный анализ в науке и образовании. - 2019. -№ 2. - С. 45-51.
- Biswas, M.H. Mathematical Modeling Applied to Sustainable Management of Marine Resources / M.H. Biswas, M.R. Hossain, M.K. Mondal //Procedia Engineering. - 2017. - Vol. 194. - Р. 337-344.
- Красильников, П.А. Геоинформационное обеспечение экономической оценки природно-ресурсного потенциала территорий Пермского края / П.А. Красильников // Экономика региона. -2009. - № 1. - С. 143-151.
- Kumar, N. Applications of Remote Sensing and GIS in Natural Resource Management / N. Kumar, S.S. Yamaс, A. Velmurugan // Journal of the Andaman Science Association. - 2015. - Vol. 20 (1). -Р. 1-6.
- Multi-criteria decision support for geothermal resources exploration based on remote sensing, GIS and geophysical techniques along the Gulf of Suez coastal area, Egypt / S. Abuzied, M. Kaiser, E. Shendi, M. Abdel-Fattah // Geothermics. - 2020. - Vol. 88, 101893.
- Akhter, R. Precision agriculture using IoT data analytics and machine learning / R. Akhter, S.A. Sof // Journal of King Saud University - Computer and Information Sciences. - 2021, 101016.
- Modeling groundwater potential using novel GIS-based machine-learning ensemble techniques / A. Arabameri, S.C. Pal, F. Rezaie et al. // Journal of Hydrology: Regional Studies. - 2021. - Vol. 36, 100848.
- Application of remote sensing and machine learning algorithms for forest fire mapping in a Mediterranean area / M. Mohajane, R. Costache, F. Karimi et al. // Ecological Indicators. - 2021. -Vol. 129, 107869.
- Machine learning for large-scale crop yield forecasting / D. Paudel, H. Boogaard, A. de Wit et al. //Agricultural Systems. - 2021. - Vol. 187, 103016.
- Classical and machine learning modeling of crude oil production in Nigeria: Identification of an eminent model for application / C.P. Obite, A. Chukwu., D.C. Bartholomew et al. // Energy Reports. -2021. - Vol. 7. - P. 3497-3505.
- Сиротина, Н.А. Применение конечно-разностных моделей для краткосрочного прогнозирования природно-ресурсного потенциала Пермского края / Н.А. Сиротина, А.В. Копотева, А.В. Затонский // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». - 2021. - Т. 21, № 2. - С. 154-166. DOI: 10.14529/ctcr210215
- Wu, X. Top 10 algorithms in data mining /X. Wu, V. Kumar, Quinlan R. et al. // Knowledge and Information Systems. - 2008. - Vol. 14. - Р. 1-37.
- Biau, G. Analysis of a Random Forests Model / G. Biau // Journal of Machine Learning Research. - 2012. - Vol. 13. - P. 1063-1095.
- Natekin, A. Gradient Boosting Machines, A Tutorial / A. Natekin, A. Knoll // Frontiers in neurorobotics. - 2013. - Vol. 7. - P. 21.
- Multilayer perceptron and neural networks /P. Marius, V. Balas, L. Perescu-Popescu, N. Mas-torakis // WSEAS Transactions on Circuits and Systems. - 2009. - Vol. 8. - Р. 579-588.
- Сиротина, Н.А. Оценка вклада горнодобывающей отрасли в природно-ресурсный потенциал региона / Н.А. Сиротина, А.В. Копотева, А.В. Затонский // Горный информационно-аналитический бюллетень (научно-технический журнал). - 2020. - № 8. - С. 163-178. DOI: 10.25018/0236-1493-2020-8-0-163-178