Крупномасштабное цифровое картографирование содержания органического углерода почв с помощью методов машинного обучения
Автор: Чинилин А.В., Савин И.Ю.
Журнал: Бюллетень Почвенного института им. В.В. Докучаева @byulleten-esoil
Статья в выпуске: 91, 2018 года.
Бесплатный доступ
Приведены результаты цифрового картографирования содержания органического углерода в пахотных горизонтах почв и оценки точности получаемых моделей с использованием методов машинного обучения для участка Среднерусской возвышенности Воронежской области. Цифровое картографирование основывалось на 22 точках почвенного опробования, используемых для обучения и проверки моделей, а также на нескольких наборах переменных-предикторов, в качестве которых выступали цифровая модель рельефа, производные от нее и данные дистанционного зондирования различного пространственного разрешения. Для построения моделей пространственного варьирования исследуемого свойства использовали несколько методов, основанных на деревьях решений: ансамбль деревьев решений, бустинг регрессионных деревьев и байесовские регрессионные деревья. Оценку точности полученных картографических моделей определяли методом перекрестной проверки, при этом в качестве показателей точности использовали коэффициент детерминации, среднюю абсолютную ошибку и корень среднеквадратичной ошибки. По результатам моделирования выявлено, что с использованием переменных-предикторов, представленных цифровой моделью рельефа, ее производными и данными Landsat 8 удалось получить более устойчивые модели, причем коэффициент детерминации изменяется от 0.6 до 0.7, RMSEcv, т.е. ошибка прогноза от 0.5791 до 0.6520. Лучшая модель получена с помощью метода байесовских регрессионных деревьев; тогда как для переменных-предикторов, представленных цифровой моделью рельефа, ее производными и данными Sentinel 2 - от 0.47 до 0.55, ошибка прогноза от 0.7031 до 0.7909. Выявлено, что в описанных моделях по различным наборам данных наиболее значимыми оказывались разные переменные-предикторы.
Пространственное прогнозирование, цифровая модель рельефа, метод ансамблей деревьев решений, бустинг
Короткий адрес: https://sciup.org/143161876
IDR: 143161876 | DOI: 10.19047/0136-1694-2018-91-46-62
Список литературы Крупномасштабное цифровое картографирование содержания органического углерода почв с помощью методов машинного обучения
- Добровольский Г.В., Урусевская И.С. География почв. М.: Изд-во Моск. ун-та, 2015. 458 c.
- Жоголев А.В. Актуализация региональных почвенных карт на основе спутниковых и геоинформационных технологий (на примере Московской области): Автореф. дис.. к. с.-х. н. М., 2016. 22 c.
- Савин И.Ю., Прудникова Е.Ю. Об оптимальном сроке спутниковой съемки для картографирования пахотных почв//Бюл. Почв. ин-та им. В.В. Докучаева. 2014. № 74. С. 66-77.
- Флоринский И.В. Гипотеза Докучаева -центральная идея цифрового прогнозного почвенного картографирования (к 125-летию публикации). Почвоведение. 2012. № 4. С. 500-506.
- Arrouays D., Savin I., Leenaars J., McBratney A.B. (eds.) GlobalSoilMap -Digital Soil Mapping from Country to Globe. Balkem: CRC Press, 2018. 174 p.
- Arrouays D., McKenzie N., Hempel J., Richer de Forges A., McBratney A. GlobalSoilMap: basis of the global spatial soil information system. Balkem: CRC Press, 2014. 494 p.
- Breiman L. Random Forests//Machine Learning. 2001. № 1 (45). C. 5-32 DOI: 10.1023/A:1010933404324
- Bui E.N., Henderson B.L., Viergever K. Knowledge discovery from models of soil properties developed through data mining//Ecological Modelling. 2006. № 3 (191). C. 431-446 DOI: 10.1016/j.ecolmodel.2005.05.021
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016. 785-794 с DOI: 10.1145/2939672.2939785
- Chipman H.A., George E.I., McCulloch R.E. BART: Bayesian additive regression trees//The Annals of Applied Statistics. 2010. № 1 (4). C. 266-298 DOI: 10.1214/09-AOAS285
- Conrad O., Bechtel M., Bock M., Dietrich H., Fischer E. System for Automated Geoscientific Analyses (SAGA) v. 2.1.4//Geoscientific Model Development. 2015. № 7 (8). C. 1991-2007 DOI: 10.5194/gmd-8-1991-2015
- Gobin A. Participatory and spatial-modeling methods for land resources analysis. PhD thesis. Katholik Universiteit, Leuven, 2000. 282 c.
- Grinand C., Arrouays D., Laroche D., Martin M.P. Extrapolating regional soil landscapes from an existing soil map: Sampling intensity, validation procedures, and integration of spatial context//Geoderma. 2008. № 1 (143). C. 180-190 DOI: 10.1016/j.geoderma.2007.11.004
- Hengl T., Heuvelink G.B.M., Kempen B., Leenaars J.G.B., Walsh M. Mapping Soil Properties of Africa at 250 m Resolution: Random Forests Significantly Improve Current Predictions//PLOS ONE. 2015. № 6 (10). C. e0125814 DOI: 10.1371/journal.pone.0125814
- Hengl T., Mendes de Jesus J., Heuvelink G.B.M., Ruiperez Gonzalez M., Kilibarda M. SoilGrids250m: Global gridded soil information based on machine learning//PLOS ONE. 2017. № 2 (12). C. e0169748 DOI: 10.1371/journal.pone.0169748
- Hengl T., Leenaars K., Shepherd K.D., Walsh M., Heuvelink G.B.M. Soil nutrient maps of Sub-Saharan Africa: assessment of soil nutrient content at 250 m spatial resolution using machine learning//Nutrient Cycling in Agroecosystems. 2017. № 1 (109). C. 77-102 DOI: 10.1007/s10705-017-9870-x
- Jenny H. Factors of Soil Formation//Soil Science. 1941. № 5 (52). C. 415 DOI: 10.1097/00010694-194111000-00009
- Kuhn M. Building Predictive Models in R Using the caret Package//Journal of Statistical Software. 2008. № 5 (28) DOI: 10.18637/jss.v028.i05
- Lagacherie P., Holmes S. Addressing geographical data errors in a classification tree for soil unit prediction//International Journal of Geographical Information Science. 1997. № 2 (11). C. 183-198 DOI: 10.1080/136588197242455
- McBratney A., Mendonça Santos M., Minasny B. On digital soil mapping//Geoderma. 2003. № 1-2 (117). C. 3-52 DOI: 10.1016/S0016-7061(03)00223-4
- Minasny B., McBratney A.B. A conditioned Latin hypercube method for sampling in the presence of ancillary information//Computers & Geosciences. 2006. № 9 (32). C. 1378-1388 DOI: 10.1016/j.cageo.2005.12.009
- Core R., Team R. A language and environment for statistical computing//2016.
- Sollich P., Krogh A. Learning with ensembles: How overfitting can be useful, Proceedings of the 1995 Conference, Vol. 8, 1996. 190-196 с.
- Taghizadeh-Mehrjardi R., Minasny B., McBratney A.B., Triantafilis J. Digital soil mapping of soil classes using decision trees in central Iran//Proceedings of the 5th Global Workshop on Digital Soil Mapping, 2012. C. 197-202 DOI: 10.1201/b12728-40
- Vermote E., Justice C., Claverie M., Franch B. Preliminary analysis of the performance of the Landsat 8/OLI land surface reflectance product//Remote Sensing of Environment. 2016. № 185. C. 46-56 DOI: 10.1016/j.rse.2016.04.008