Разработка и оценка индекса листовой поверхности LAI растительного покрова России на основе разноугловых наблюдений КМСС (Метеор-М) и нейросетевой инверсии модели PROSAIL

Автор: Плотников Д.Е., Чжоу Ц., Колбудаев П.А., Лупян Е.А., Матвеев А.М., Зимин М.В., Жуков Б.С., Кондратьева Т.В., Лебедев С.В.

Журнал: Компьютерная оптика @computer-optics

Рубрика: Численные методы и анализ данных

Статья в выпуске: 3 т.49, 2025 года.

Бесплатный доступ

В работе впервые описан метод дистанционной оценки индекса листовой поверхности LAI по данным прибора КМСС российской спутниковой системы Метеор-М с пространственным разрешением 60 метров. В основе метода лежит решение обратной задачи переноса излучения в растительном пологе с заданными краевыми условиями на основе модели переноса излучения PROSAIL, дистанционных измерений спектральной яркости прибором КМСС и известных условий наблюдения и освещения. В качестве алгоритма инверсии была использована параметризованная и обученная модель на основе полносвязной нейронной сети. При создании обучающей выборки использовался полный ортогональный план для описания комбинаций входных параметров модели, при этом были учтены распределения и сораспределения характеристик по результатам метаанализа для отражения имеющихся в природе взаимосвязей. В работе была исследована эффективность двух различных схем наблюдения – классической надирной и характерной для прибора КМСС-М разноугловой с углами ±8,67°. Была показана достаточно высокая модельная точность оценки LAI: RMSE=1, MAE=0,705 и R2=0,722. На основе разработанного метода был рассчитан и исследован продукт LAI по данным КМСС-2 с разрешением 60 метров на территорию России за 2022 год. Попиксельное сравнение результатов оценки LAI по данным КМСС-2 с продуктом NASA LAI (MODIS MCD15A3H) за бесснежный период 2022 года также указывает на достаточно высокие характеристики полученного в результате работы продукта: RMSE=1,065, MAE=0,669 и R2=0,668. Разработанный в рамках настоящей работы метод создания продукта LAI по данным прибора КМСС повысит эффективность и оперативность приложений, связанных с высокодетальным дистанционным экологическим мониторингом на основе данных российских спутниковых систем.

Еще

LAI, КМСС, PROSAIL, Метеор-М, разноугловые наблюдения, нейросетевая инверсия, ортогональный план, растительный покров, биофизические характеристики

Короткий адрес: https://sciup.org/140310492

IDR: 140310492   |   DOI: 10.18287/2412-6179-CO-1621

Текст научной статьи Разработка и оценка индекса листовой поверхности LAI растительного покрова России на основе разноугловых наблюдений КМСС (Метеор-М) и нейросетевой инверсии модели PROSAIL

Растительность является фундаментальным компонентом наземных экосистем и играет важную роль в энергообмене в зоне поверхность-атмосфера, углеродном и гидрологическом циклах. Поэтому своевременная и точная информация о характеристиках растительного покрова имеет первостепенное значение для оценки экологической обстановки и климатических исследований [1, 2, 3].

По данным Всемирной организации наблюдения за Землёй (GTOS) и Всемирной организации наблюдений за климатом (GCOS), индекс листовой поверхности LAI (Leaf Area Index) является важнейшей климатической переменной (ECVs) и одним из ключевых параметров растительности, отражающим ее способность осуществлять биофизические процессы, такие как фотосинтез, дыхание и транспирация [4]. Точная оценка LAI в региональном и глобальном масштабах важна для моделирования экосистем, био- геохимических циклов, сельскохозяйственного мониторинга и смежных приложений [5,6].

Дистанционное зондирование, благодаря возможности обеспечивать непрерывные наблюдения на макроуровне, является безальтернативным по своей эффективности средством оперативной оценки этих биофизических параметров в региональном и глобальном масштабе. Глобальные продукты LAI были ранее созданы с использованием различных спутниковых систем, в частности продукты MODIS (Terra\Aqua), GEOV1 (Proba-V), MERIS (Envisat) и другие [7, 8, 9]. Однако в российской и зарубежной литературе до настоящего момента не было работ, посвященных методам и технологиям оценки LAI растительного покрова на континентальном уровне пространственного охвата по данным российских спутниковых систем. Кроме этого, подавляющая часть существующих продуктов-аналогов для зарубежных спутниковых систем имеют, как правило, относительно низкое пространственное разрешение (сотни метров). Разработанные в рамках настоящей работы методы для создания продукта LAI по данным приборов серии КМСС с высоким пространственным разрешением повысят привлекательность приложений, связанных с высокодетальным дистанционным экологическим мониторингом на основе данных российских спутниковых систем.

Входящие в состав российского космического комплекса «Метеор-3М» спутники серии Метеор-М обеспечивают глобальные наблюдения за атмосферой и поверхностью Земли и способны на регулярной основе получать гидрометеорологическую и геофизическую информацию планетарного охвата. Группировка включает в себя аппараты Метеор-М №2, Метеор-М №2-2, Метеор-М №2-3 и Метеор-М №2-4; два последних аппарата из этой серии активны и работают на круговой солнечно-синхронной полярной орбите высотой 820–830 км, при этом как минимум два аппарата серии присоединятся к группировке в ближайшие несколько лет. Находящиеся на их борту приборы серии КМСС обеспечивают получение мультиспектральных данных в зеленом (0,535– 0,575 мкм), красном (0,630–0,680 мкм) и ближнем ИК (0,760–0,900 мкм) спектральных каналах [10] с пространственным разрешением около 60 м и полосой обзора шириной 960– 1020 км. Таким образом, изображения приборов КМСС характеризуются востребованным сочетанием показателей пространственного разрешения и повторяемости наблюдений, благодаря чему территория России полностью покрывается результатами съёмки с пространственным разрешением 60 метров в течение 2–3 дней (одним прибором), обеспечивая детальный и оперативный мониторинг страны. К настоящему моменту в ИКИ РАН разработаны и развёрнуты методические и технологические решения по потоковому созданию прошедших валидацию [11,12] продуктов приборов

КМСС-М и КМСС-2 уровня L2A (геопривязанные и атмосферно-скорректированные), которые лежат в основе продуктов следующих уровней обработки. В частности, восстановленные временные серии спектрально-отражательных характеристик земной поверхности по данным приборов КМСС позволяют решать задачи распознавания и мониторинга быстро-меняющихся объектов растительного покрова [13]. Таким образом, указанные продукты КМСС обеспечивают возможность решения задачи дистанционной оценки LAI растительного покрова России с высокой пространственной детализацией.

1.    Методы дистанционной оценки LAI

Спектрально-отражательные характеристики растительного полога тесно связаны с биохимическими и морфологическими свойствами полога и его составляющих, а также яркостью подстилающей поверхности. Регистрируемый на основе оптических данных дистанционного зондирования индекс листовой поверхности, в свою очередь, определяется архитектурой растения и биохимическими параметрами его элементов. Для дистанционной оценки LAI необходимо установление связи между значениями этого индекса и спектрально-отражательными характеристиками полога. В общем случае эта обратная задача относится к классу недоопределённых, и для её решения требуется дополнительно задать граничные условия.

Для определения индекса листовой поверхности по данным дистанционного зондирования было разработано множество алгоритмов, которые можно разделить на две категории: эмпирические методы и методы, основанные на физических моделях [14]. Эмпирические методы оценки LAI основаны на статистической взаимосвязи между LAI и вегетационными индексами (VI), обычно локально калиброванной с помощью натурных измерений индекса листовой поверхности. Эмпирический метод заменяет сложный процесс переноса излучения внутри полога, прост в реализации и обеспечивает удовлетворительную точность оценки LAI при обеспечении локализации во времени и пространстве. Использование VI позволяет ослабить влияние эффекта затенения полога, яркости подстилающей почвы, атмосферных условий и угловых эффектов. При этом в эмпирических методах используются VI, рассчитанные на основе отражения в одном направлении и в ограниченном числе каналов, что не позволяет в полной мере задействовать муль-тиспектральную и разноугловую информацию, доступную при использовании ряда спутниковых приборов и геометрических схем наблюдения.

Методы, основанные на физических моделях, используют моделирование переноса излучения внутри растительного полога, установление связи между отражательной способностью растительного покрова и соответствующими значениями LAI, а затем – инвер- сию модели переноса излучения. Из-за комплексности и многофакторности физических моделей переноса излучения её прямая инверсия для нахождения LAI в алгебраической форме невозможна и обычно выполняется косвенно с использованием трёх основных подходов:

  • 1)    метода итеративной оптимизации (OPT);

  • 2)    метода таблиц поиска (LUT);

  • 3)    методов машинного обучения [14, 15].

Метод OPT основан на итеративой минимизации функции потерь на уровне каждого пиксела, для чего необходимо выполнить множество прогонов модели переноса излучения, что непрактично для потоковых вычислений ввиду значительных вычислительных затрат. Для практического применения популярными методами оценки LAI являются методы LUT и методы машинного обучения, которые основаны на базе данных симуляций физических моделей. Концептуально методы LUT – это простейшая техника поиска решения для заданного набора измерений отражательной способности, которая заключается в выборе ближайшего случая в базе данных на основе минимизации функции потерь, а затем – извлечении поставленного в соответствие набору значения LAI. Таблицы LUT требуют тщательной оптимизации как при построении (выбор частоты дискретизации), так и при реализации алгоритма поиска и построения функции потерь для уменьшения временных затрат при их использовании. Методы машинного обучения могут эффективно аппроксимировать сложные нелинейные функции и оптимизировать параметры алгоритма инверсии на основе обучающих выборок для достижения необходимого уровня эффективности и точности оценки LAI по данным дистанционного зондирования. В этом случае обучающие выборки описывают граничные условия и позволяют решить недоопределённую задачу инверсии модели переноса излучения.

В работе [16] предложена следующая классификация типов моделей переноса излучения в растительном пологе:

  • 1)    геометрические модели;

  • 2)    модели мутной среды для однородных пологов;

  • 3)    гибридные модели типа 1 и 2 для неоднородных пологов;

  • 4)    модели трассировки лучей (например, метод Монте–Карло).

Оптимальными по вычислительным затратам и возможностям являются модели мутной среды и гибридные модели. Часто используемой моделью в этой категории является модель PROSAIL, которая сочетает в себе модель оптических свойств листа PROSPECT и модель взаимодействия излучения с растительным пологом SAIL.

Используемые для решения задачи инверсии методы машинного обучения включают нейронные сети (NN), а также метод опорных векторов и деревья ре- шений. Нейронные сети для инверсии модели переноса излучения ранее успешно применялись для оценки LAI по данным спутниковых приборов Vegetation (SPOT), MERIS (Envisat) и MSI (Sentinel-2) [7–9]. Нейросетевая инверсия на основе модели PROSAIL используется в настоящей работе для оценки LAI по данным приборов KMCC.

Кроме этого, дополнительные возможности представляет различие геометрии наблюдения приборами КМСС-2 и КМСС-М: в отличие от классической надирной схемы наблюдений КМСС-2, разнозональные изображения КМСС-М, формируясь в единой фокальной плоскости, разведены под углом ±8,67° вдоль направления полёта, обеспечивая одновременно разноугловую схему наблюдения [10, 11, 12]. В области дистанционного мониторинга и оценки растительности такие возможности являются привлекательными, поскольку они должны обеспечивать более точное дистанционное определение биофизических характеристик растительного покрова.

Таким образом, целями настоящей работы являются:

  • 1)    разработка метода дистанционного определения LAI по данным приборов серии КМСС путём нейросетевой инверсии модели переноса излучения PROSAIL и его оценка на больших территориях;

  • 2)    оценка эффективности разноугловой схемы мультиспектральных наблюдений при определении LAI.

  • 2.    Методы и модели 2.1.    Модель PROSAIL
  • 2.2.    Полный ортогональный план

Модель PROSAIL является результатом объединения двух разномасштабных моделей: модели SAIL переноса излучения в масштабах растительного полога, где полог представляется как непрерывный, горизонтальный и равномерно распределенный слой оптически мутной среды с заданной геометрией и оптической плотностью для моделирования взаимодействия с падающим солнечным излучением, и модели PROSPECT переноса излучения в масштабах зелёного листа, где лист представляет собой несколько поглощающих пластин с шероховатыми поверхностями, разделенных соответствующим количеством слоёв воздуха: такая модель позволяет описать анизотропное рассеяние от внутренней структуры листа и достаточно точно учесть входные биохимические параметры, характеризующие внутреннее строение листа [17].

PROSAIL объединяет эти две модели, обеспечивая возможность расчета спектров растительного покрова на основе информации о биохимических параметрах листа и характеристиках полога. Поскольку PROSAIL является одной из наиболее популярных моделей для инверсии биохимических и геометрических характеристик полога, к настоящему моменту разработано несколько различных версий программной реализации PROSAIL . В данном исследовании использовалась Python-версия модели PROSAIL, а библиотека модели была установлена в среду Python 3 для повышения скорости вычислений .

Ранее было отмечено, что обучающая выборка необходима для обучения модели, обеспечивая задание граничных условий для корректного решения недоопределённой задачи инверсии. В настоящем исследовании схема построения выборки для различных комбинаций параметров основана на полностью ортогональном подходе [18], который заключается в следующем:

  • 1)    сначала диапазоны значений каждой из входных переменных разделяются на страты (отрезки);

  • 2)    затем формируется набор комбинаций, включающий выбор страты из каждой переменной по одному разу (число комбинаций равно произведению числа страт всех параметров) и, наконец;

  • 3)    выбирается фактическое значение каждой переменной из диапазона соответствующей страты в соответствии с законом распределения рассматриваемой переменной.

  • 2.3.    Нейросетевая инверсия

  • 2.4.    Параметризация нейросети

  • 0.4-2.5.мкм 3.    Формирование обучающего набора

На этапе решения прямой задачи с помощью PROSAIL моделируются значения КСЯ для всех комбинаций входных параметров. Полный ортогональный план создания обучающей выборки позволяет учесть все взаимодействия между переменными, при этом диапазон вариации каждой переменной плотно и почти случайно заполнен в соответствии с заданными законами распределения величин (см. параграф 3 Формирование обучающего набора).

Модельный спектр отражения растительного полога создаётся моделью PROSAIL в режиме прямой задачи, затем созданный спектр сворачивается с функцией спектральной чувствительности (ФСЧ) соответствующих спектральных каналов KMCC для получения модельных значений КСЯ. Нелинейная связь между значениями LAI и входными параметрами, включая значения КСЯ, параметризуется с помощью нейросети для получения модели инверсии. Это основная логика, на которой базируется весь алгоритм инверсии, блок-схема алгоритма представлена на рис. 1.

При определении оптимальной архитектуры нейросети для решения задачи инверсии PROSAIL использовался метод библиотеки keras_tuner «Hyperband» [19]. На начальном этапе этот метод перебирает все параметры, используя малое число эпох для выбора наиболее перспективных сочетаний параметров, отбрасывая малоперспективные, после чего заканчивается исследование наиболее перспективных, обеспечивая нахождение оптимальных значений параметров. В процессе поиска оптимизировались следующие параметры: функция активации, коэффициент dropout, количество нейронов в скрытых слоях, скорость обучения, функция оптимизации, вариант случайного распределения параметров нейросети при инициализации, количество скрытых слоев, применение skip-connection.

Спектр отражения

Рис. 1. Блок-схема алгоритма нейросетевой инверсии LAI на основе модели PROSAIL

При построении выборки требуется учёт диапазонов и распределений значений входных параметров модели PROSAIL, которые должны максимально соответствовать их природным статистическим законам в целях корректного отражения интегральных распределений биомов на поверхности Земли.

Для установления распределений оптических свойств листьев был проведен обзор литературы, поиск, сбор и объединение опубликованных в табличном или ином виде распределений входных параметров (метаанализ) с целью изучения характеристик распределения физико-химических (концентрации хлорофилла ( C ab ), содержания сухого вещества ( C m ), содержание воды ( C w ), каротиноидов ( C ar ), антоцианов ( Ant ), коричневого пигмента ( C brown ), мезофильной структуры листа ( N )) и геометрических (LAI, средний угол наклона листьев (LIDFa), хот-спот параметр (Hspot)) параметров листа, а также характеристик подстилающей поверхности, включая спектр (ρ s ) и яркость почвы ( Bs ).

  • 3.1.    Физико-химические параметры листа

  • 3.2.    Оптические и геометрические параметры растительного полога

    Наиболее полно распределение LAI описано в обзорной работе [22], где было собрано около 1000 экспериментальных значений LAI для 300 научных источников. Эти значения соответствовали почти 400 уникальным полевым измерениям, выполненным в период 1932–2000 гг. В работе показано, что измеренные значения LAI равномерно распределены в диапазоне от 1 до 7, а низкие значения LAI (<1) встречаются нечасто. С другой стороны, в этом наборе данных есть несколько чрезвычайно высоких и редких значений LAI (со значениями до 40).

Результаты метаанализа показывают, что распределения Cab и Cm примерно гауссовы (рис. 2a и рис. 2б), однако они зависят от типа растительности. В частности, для хлорофилла (Cab, рис. 2а) среднее значение для светло-зелёных листьев близко к 40 мг∙см–2, в то время как среднее значение для листьев вечнозеленых широколиственных лесов близко к 70 мг∙см–2 [20]. Содержание сухого вещества (Cm, рис. 2б) имеет среднее значение, близкое к 0,005 г∙см–2 для листопадных широколиственных лесов и 0,012 г∙см–2 для вечнозеленых широколиственных лесов. Распределения, основанные на обобщении литературных данных и небольшом количестве образцов выборки по вечнозеле- ным широколиственным лесам, хорошо согласуются с наблюдениями [20].

Содержание воды C w было привязано к содержанию сухого вещества, исходя из того, что относительное содержание воды в зеленых листьях близко к 75%.

В работе [21] была дана оценка распределениям содержания каротиноидов C ar и антоцианов Ant в листьях, используя наборы данных проектов ANGERS и VIRGINIA ( C ar и Ant , рис. 2), и аналогично распределениям C ab и C m , распределения C ar и Ant оказались близки к гауссову распределению.

Однако несмотря на то, что этот набор данных представляет собой большой объем экспериментальных инструментальных данных, он не является отражением реального глобального распределения LAI по причинам, указанным в работе [23]:

  • 1)    измерения во время эксперимента проводились для растительности, поэтому голая почва (LAI = 0), которая составляет около 30 % поверхности суши планеты, в нём не учтена [24, 25];

  • 2)    измерения, использованные в данном исследовании, получены с использованием различных приборов для измерения LAI, и поэтому точности и достоверности оценок внутри набора различны; кроме этого, некоторые измерения сделаны без поправки на неслучайное распределение листьев (true LAI), в то время как другие сделаны с этой поправкой (effective LAI) [26, 27];

  • 3)    наконец, распределение, полученное в результате данного исследования, не является репрезентативным для фактического распределения на поверхности Земли в течение года, поскольку измерения соответствуют отдельным уникальным датам в течение вегетационного цикла в зависимости от целей авторов исследований.

    Рис. 2. а), б) Распределения Cab и Cm из работы [20] (для Cab синим дополнительно приведено распределение по тропическим лесам); в), г) Car и Ant из работы [21]; д) LAI с учётом работ [23, 26, 27], е) LIDFa из работы [23]



    а)


    В работе [23] проведено сравнение распределений, полученных по данным [22], с распределениями, полученными из набора данных VALERI ( http://www.avignon.inra.fr ). Последний соответствует коллекции измерений effective LAI с пространственным разрешением 20 метров, выполненных в период с 2000 по 2008 год на различных типах растительности, включая основные биомы, и использовался для проверки продуктов дистанционного зондирования. Распределения VALERI значительно отличаются от распределений [22], так как true LAI выше значений effective LAI. Кроме того, набор данных VALERI

  • 3.3.    Параметры почвы и фона

включает значительную часть типов растительности с низкими значениями LAI, таких как зерновые культуры, кустарники и степная растительность, которые составляют значительную часть поверхности Земли. Поэтому, несмотря на ограниченную пространственно-временную выборку, она лучше соответствует ожиданиям от базы данных для обучения алгоритма инверсии [23]. В данном исследовании распределение LAI в обучающем наборе данных должно быть похожим на рис. 2 д для того, чтобы максимально близко воспроизвести реальные характеристики распределения LAI на поверхности Земли.

Для моделирования реального распределения в данном исследовании диапазон значений LAI был разделен на два интервала: 0 –0,5 и 0,5 – 15. В интервале низких значений 0 – 0,5 тип распределения LAI установлен равномерным, а в интервале 0,5 – 15 – гауссовым. Это, с одной стороны, повышает вероятность принятия значения в области низких значений LAI, а с другой – делает распределение LAI в обучающей базе данных более соответствующим характеристикам распределения для растительности Земли.

Из рис. 2 е видно, что низкие значения LIDFa (до 40°) встречаются нечасто. Пик наблюдается при LID- Fa = 60°, что соответствует сферическому распределению. Из-за ограниченности пространственной и временной выборки эти распределения можно считать лишь ориентировочными [23]. В данном исследовании распределение LIDFa аппроксимировалось гауссовым распределением.

В литературе практически не встречаются примеры распределения хот-спот параметра Hspot (физический смысл которого – отношение средних размеров листьев к высоте полога) на поверхности Земли, поскольку эта переменная используется только в моделях переноса излучения. Кроме того, эта переменная оказывает влияние только в тех случаях, когда дистанционные измерения проводятся вблизи плоскости Солнце-объект-спутник. Один из немногих примеров описан в работе [23], где этот параметр преимущественно принимает значения, сосредоточенные в диапазоне 0,1 – 0,5. В данной работе распределение параметра Hspot аппроксимировано гауссовым распределением из указанной выше работы.

Фоновая отражательная способность соответствует всем незелёным (бесхлорофильным) материалам, составляющим подложку растительного полога.

Оптические свойства подстилающей поверхности, помимо спектра почвы, определяются тремя параметрами – геометрической конфигурацией наблюдения, шероховатостью почвы и её влажностью. В работах [18, 28] было показано, что три указанных параметра возможно объединить через упрощенную концепцию «яркости» Bs (Soil brightness) – параметра, не зависящего от длины волны, позволяющего в форме единого мультипликатора модифицировать (повысить или понизить) значения спектральной яркости в спектре подстилающей почвы относительно базовых значений. Используемый в настоящей работе вид распределения Bs, его средние значения и дисперсия детально описаны в работе [29] (рис. 3 а ).

В качестве спектра фона было использовано семь почвенных спектров, отобранных в работе [23] из базы данных отражения почв университета INRA Avignon [29, 30] в качестве стандартных спектров отражения всех имеющихся почв (рис. 3 б ).

а)

б)

Рис. 3. а) Распределение Bs из работы [29] и б) 7 типичных спектров почвы из базы данных почв университета INRA Avignon

  • 3.4.    Сораспределения входных параметров модели PROSAIL

Перед началом формирования обучающей выборки путём многократных запусков модели PROSAIL на основе комбинации всех параметров (см. табл. 1) требуется их коррекция, потому что в указанной комбинации не будут учтены существующие в реальной природе взаимосвязи между некоторыми параметрами, что может привести к созданию «невозможных» биомов, т.е. несуществующих граничных условий. Например, очень плотный лесной полог не может соответствовать низкому содержанию хлорофилла и планофильной ориентации листьев. Соответствующие параметры должны быть поставлены в зависимость от значений LAI, для чего в работе [23] было предложено варьировать границы диапазонов значений этих параметров в зависимости от величины LAI с помощью простого линейного уравнения (1), которое модифицирует значение случайно выбранного созависимого параметра V на значение V *, сохраняя вид распределения:

V - V min (0)    =     V * - V min ( LAI )

V max (0) V min (0)    V max ( LAI ) V min ( LAI ) ’

таким образом, уравнение нижней ограничивающей прямой (рис. 4) выглядит следующим образом:

LAI                           .

Vmin (LAI) = Vmin (0) + —-— (Vmin (LAImax ) - Vin (0)) ,(2) LAImax а уравнение верхней ограничивающей прямой (рис. 4) выглядит следующим образом:

V max ( LAI ) = V UG) +

LAI

+ yyz ( V max ( LAI max ) - V max (0)) LAI max

Для оценки граничных значений созависимых параметров авторами работ [21, 23, 26] изучались попарные распределения параметров и LAI, в том числе на основе набора данных VALERI (табл. 1).

Таким образом, после учёта сораспределений параметров их ортогональные комбинации могут быть использованы в модели PROSAIL в режиме прямой задачи для создания обучающей выборки.

  • 3.5.    Распределения угловых характеристик наблюдения и освещения для изображений

спутниковой системы Метеор-М №2 (КМСС)

Определение геометрических характеристик наблюдения опирается на данные технической документации приборов КМСС и аппаратов серии Ме-теор-М, включая ожидаемые линейные и угловые размеры полей зрения индивидуальных камер КМСС и размер спаренного участка (зоны перекрытия полей зрения камер) после этапа автоматического георефе-ренцирования полученных камерами изображений [11, 12]. Линейная ширина поля зрения каждой из камер и ширина спаренного участка сравниваются с ожидаемыми значениями; анализируемая сцена считается подходящей для дальнейшего анализа и вы- числения углов освещения (SZA) и наблюдения (VZA), если отклонение указанных характеристик от ожидаемых не превышает 5%. Зенитный и азимутальный углы Солнца находятся на основе астрономических формул по известным времени съёмки и географическим координатам пиксела. Далее для пиксела определяется фазовый угол (RAA) на основе угла визирования и положения Солнца. В случае КМСС-М фазовый угол и угол наблюдения в пикселе определяются для каждого канала независимо с учетом известного углового значения межканального параллакса и направления движения спутника.

Рис. 4. Иллюстрация к формулам (1 – 3) пересчёта значений переменных в случае совместного распределения

Табл. 1. Распределение значений входных переменных, а также параметры их сораспределений для модели PROSAIL, используемой для создания обучающей базы данных

Объект

Параметр

Описание

Мин

Макс

Среднее

Дисперсия

Число страт

Закон

min при LAI max

IS

max при LAI max

Лист

N (-)

число мезофильных пластин в листе

1,2

1,8

1,5

0,3

3

Гаусс

1,3

1,8

Cab(мг/см2)

общее содержание хлорофилла a и b

20

90

45

30

4

Гаусс

45

90

Car(мг/см2)

содержание каротиноидов

2

20

6

3

4

Гаусс

6

20

Cbrown (-)

относительное количество коричневого пигмента

0

2

0

0,3

3

Гаусс

0

0,2

Cw(г/см2)

эквивалентная толщина воды

0,6

0,85

0,75

0,08

4

Гаусс

0,7

0,08

Cm(г/см2)

содержание сухого вещества

0,003

0,011

0,005

0,005

4

Гаусс

0,005

0,011

Ant(мг/см2)

содержание антоцианов

0

8

0,5

2

4

Гаусс

0,5

8

Полог

LAI(м22)

индекс листовой поверхности

0

15

2

3

7

Равномерное (0-0,5) Гаусс(0,5-15)

-

-

LIDFa(град)

средний угол наклона листьев

30

80

60

30

3

Гаусс

55

65

Hspot (-)

хот-спот параметр

0,1

0,5

0,2

0,5

1

Гаусс

0,1

0,5

Почва

Bs (-)

коэффициент яркости фона

0,5

3,5

1,2

2

4

Равномерное

0,5

1,2

В результате анализа данных за годовой интервал наблюдений прибором КМСС территории северной Евразии была собрана статистика, характеризующая реальную геометрию освещения и наблюдений спут- никовой системой Метеор-М, в которой для каждого разноуглового мультиспектрального наблюдения создавалось аналогичное по времени и территории надирное мультиспектральное наблюдение (рис. 5).

Рис. 5. Распределения измеренных характеристик наблюдения прибором КМСС территории северной Евразии

Эти два скоординированных набора использовались для обучения двух соответствующих нейросетевых моделей инверсии PROSAIL, описывающих две исследуемые геометрические схемы наблюдений в целях расчёта их эффективности для оценки LAI.

4.    Формирование обучающей базы данных

Для создания обучающей выборки в соответствии с полным ортогональным планом выполнялась нижеописанная последовательность действий, повторяемая для каждой комбинации параметров. Сначала выбиралась дата – полный год (365 дней) разбивался на 4 равных интервала, после чего внутри отрезка финальная дата выбиралась случайным образом. Далее на основании даты случайным образом выбира- лось соответствующее ей случайное мультиспек-тральное наблюдение из набора реальных наблюдений за один год съёмки, описанного в предыдущем параграфе. Здесь под наблюдением имеется в виду скоординированная пара двух записей: первая – с разноугловой геометрией, вторая – с классической надирной; каждая запись включает в себя угол наблюдения VZA, зенитный угол Солнца SZA, а также фазовый угол RAA. Далее случайным образом в качестве фонового спектра подстилающей поверхности выбирался один из семи стандартных спектров, показанных на рис. 3б. Входные параметры для модели PROSAIL в трех категориях – полог, лист и почва – генерировались в соответствии со схемой выборки из табл. 1. Затем значения каждого сораспределён-ного параметра корректировались в соответствии с законом сораспределения этой величины с LAI. Рис. 6 иллюстрирует распределение и совместное распределение каждой переменной в окончательно сформированном полном наборе обучающих данных. После окончания формирования таблицы было запущено моделирование спектра в режиме прямой задачи: сгенерированные комбинации параметров вводились в модель PROSAIL для расчета соответствующих значений спектрального отклика в трёх спектральных каналах КМСС и для двух конфигураций наблюдений: разноугловой и надирной.

Учитывая количество страт в табл. 1, было создано 774144 образца. Для обучения модели было использовано 4/5 случайно отобранных образцов, а оставшиеся 1/5 образцов – для тестирования и оценки модели.

Рис. 6. Распределение и совместное распределение переменных характеристик почвы, полога и листьев в обучающем наборе данных

5.    Архитектура нейросети

В качестве модели для инверсии PROSAIL была использована полносвязная нейронная сеть с несколькими скрытыми слоями, архитектура которой была оптими зирована методом Hyperband библиотеки keras_tuner. Оптимизировались следующие параметры: вид функ ции активации (relu, tanh, softplus), значение коэффици ента dropout (0, 0,1, 0,2, 0,3, 0,4, 0,5), число скрытых слоёв (1, 2, 3, 4), число нейронов в каждом скрытом слое (128, 256, 512), скорость обучения (10-2, 10-3, 10-4), вид функции оптимизации (Adam, Adamx, Nadam), тип распределения параметров нейросети при инициализации (he_normal, glorot_normal, random_normal) и применение «проброса связей» через скрытые слои «skip-connection» (да, нет).

Полученная в результате оптимизации архитектура нейросети приведена на рис. 7.

6.    Результаты 6.1.    Результаты параметризации нейросети

В процессе оптимизации методом Hyperband были найдены следующие параметры: функция активации – relu, коэффициент dropout – 0,5, число скрытых слоев – 4, число нейронов в скрытых слоях – комбинация (для каждого из четырёх) 128, 512, 256, 256, скорость обучения – 10–4, функция оптимизации – Nadam, тип распределения параметров нейросети при инициализации – glorot_normal, применение skip-connection – Да.

Re LU

DropOut 128

Concat138

(ReLU )

DropOut 512

Co ncat 640

ReLU )

DropOut 256

Concat 768

(ReLU )

DropOut 256

Concat 512

| Linear|

Рис.7. Архитектура полносвязной нейросети для инверсии модели PROSAIL

  • 6.2.    Оценка ошибок модели и сравнение эффективности надирной и разноугловой схем наблюдений

На основе пары скоординированных обучающих наборов для надирной и разноугловой схемы наблюдений были построены две соответствующие модели инверсии LAI на основе нейросетей с идентичными архитектурами, описанными выше. Для оценки эффективности инверсии LAI этими схемами результаты восстановления LAI сравнивались с исходными значениями LAI, поданными в модель PROSAIL в процессе создания обучающего набора с расчётом метрик точности, включая RMSE, MAE и R 2 (см. табл. 2).

Несмотря на систематическое преимущество разноугловой схемы над классической надирной для всех указанных видов метрик ошибок, можно увидеть, что модельные ошибки оценки LAI надирной и разноугловой схем отличаются незначительно.

Диаграмма рассеяния ошибок оценки LAI на основе разноугловой схемы приведена на рис. 8а. На рис. 8б приведён график значений ошибок оценки LAI в терминах знаковой разности между исходным и восстановленным значением индекса листовой поверхности (LAI-PredictedLAI), включая динамику среднего значения ошибки (Mean), медиану (Median) и среднеквадратическое отклонение (Std.dev).

Табл. 2.Значения метрик ошибок моделей инверсии для вычисления LAI на основе двух геометрических схем наблюдения

Метрика ошибок

Надирная схема

Разноугловая схема

RMSE

1,00428

1,00051

MAE

0,7102

0,7053

R2

0,7203

0,7227

Графики демонстрируют стандартное для методов инверсии распределение динамики ошибок, в которых точность инверсии до значений LAI ≈ 6 остаётся достаточно высокой при значениях стандартного отклонения менее 1. Эффекта раннего насыщения значений инверсии, характерного для статистических методов на основе VI, не наблюдается, хотя неопределенность оценок увеличивается с ростом значений LAI (рис. 8 б ). Таким образом, найденная архитектура нейросети является достаточно эффективной при описании сложной нелинейной функциональной зависимости между значениями спектрального отклика и значениями LAI.

а)

б)

Рис. 8. а) Диаграмма рассеяния при сопоставлении исходных (LAI) и предсказанных (Predicted LAI) значений индекса на основе всего обучающего набора, б) динамика ошибок предсказания LAI

  • 6.3.    Оценка продукта LAI КМСС путём сравнения с продуктом MCD15A3H

    Несмотря на то, что разноугловая схема наблюдений продемонстрировала систематически более высокую точность инверсии по сравнению с классической надирной схемой, приборы серии КМСС-М более не планируются к установке на перспективных аппаратах серии Метеор-М, при этом начиная с 2023 года аппарат Метеор-М №2 с этим прибором выведен из эксплуатации. Таким образом, для решения оперативных задач дистанционной оценки LAI растительного покрова более перспективной является оценка точности LAI по результатам надирной схемы наблюдений.

Для независимой широкомасштабной оценки описанного в настоящей работе продукта LAI, созданного по данным надирных наблюдений прибором КМСС-2 на основе нейросетевой инверсии модели переноса излучения, был обработан набор всех доступных атмосферно-скорректированных мультис-пектральных измерений прибором КМСС-2 за полный 2022 год для территории России, что составило около 60 тысяч гранул-дат КМСС при размере каждой гранулы 1×1° или примерно 2000×2000 пикселей КМСС. В качестве опоры для сопоставления был использован продукт LAI NASA MCD15A3H [31] – четырёхдневные композитные изображения LAI по данным прибора MODIS (аппараты Terra и Aqua) с пространственным разрешением 500 метров. Каждому изображению MCD15A3H для территории России ставилось в соответствие одномоментное покрытие данными LAI, полученное по данным КМСС-2, соответствующее первому дню 4-дневного интервала. Пары сравниваемых изображений были переведены в географическую проекцию с одинаковым размером пикселя (0,004312°), при этом облачность, тени, а также сбойные пиксели были исключены из сравнения с использованием флагов качества и масок мешающих факторов. Интегральные результаты сравнения всех пар изображений за бесснежный период наблюдения территории России с шагом ~2 недели представлен на рис. 9.

Рис. 9. Диаграмма рассеяния при сопоставлении измерений LAI по данным КМСС-2 и MODIS (продукт MCD15A3H)

Диаграмма рассеяния указывает на достаточно высокий уровень соответствия между продуктами MODIS и КМСС, а интегральные значения метрик ошибок практически совпадают с модельными значениями ошибок модели инверсии LAI по данным КМСС, причём ошибка MAE не превысила модельную: RMSE= 1,065, MAE=0,669, R 2=0,668. Наилучшее совпадение наблюдается для нижней части распределения значений LAI (0–3 единиц), а максимальные различия можно заметить в диапазоне 3–5 единиц. Требуется дальнейший анализ пространственного распределения этих ошибок, однако высокие значения LAI на территории России обычно ассоциируются с участками лесной растительности. При этом необходимо отметить, что для лесов России практически отсутствуют распределенные подспутниковые измерения LAI, и любой соответствующий продукт требует независимой инструментальной оценки и валидации на соответствующих биомах, включая взятый в качестве опоры продукт MCD15A3H.

Заключение

В настоящей работе впервые описан метод дистанционной оценки индекса листовой поверхности LAI по данным приборов серии КМСС российской спутниковой системы Метеор-М с пространственным разрешением 60 метров. Исследована эффективность двух различных геометрических схем наблюдения – классической надирной и характерной для прибора КМСС-М разноугловой с углами ±8,67°. Несмотря на систематическое преимущество разноугловой схемы над классической надирной для всех рассчитанных метрик ошибок, модельные ошибки оценки LAI надирной и разноугловой схемами отличаются незначительно, при этом была достигнута достаточно высокая модельная точность оценки LAI: RMSE = 1, MAE = 0,705 и R2 = 0,722, которая также подтверждается результатами сравнительного анализа с продуктом-аналогом MCD15A3H. На основе разработанного метода был впервые построен и исследован продукт LAI по данным КМСС-2 с разрешением 60 метров на территорию России за 2022 год. Созданный продукт доступен для научных исследований в системах дистанционного мониторинга растительного покрова семейства Вега .

Авторы ожидают, что разработанный в рамках настоящего исследования метод оценки LAI по данным прибора КМСС повысит эффективность и оперативность приложений, связанных с высокодетальным дистанционным экологическим мониторингом на основе данных российских спутниковых систем.

Исследование выполнено за счет гранта Российского научного фонда № 23-27-00412 с использованием ресурсов ЦКП «ИКИ-Мониторинг» [32] и оборудования ЦКП МГУ имени М.В. Ломоносова «Геопортал».

Статья научная