Малопараметрический метод оконтуривания сельскохозяйственных полей на спутниковых снимках с помощью исторических данных MSAVI2

Автор: Павлова Мария Александровна, Тимофеев Валерий Андреевич, Бочаров Дмитрий Александрович, Сидорчук Дмитрий Сергеевич, Нурмухаметов Альмир Линарович, Никоноров Артем Владимирович, Ярыкина Мария Сергеевна, Кунина Ирина Андреевна, Смагина Анна Александровна, Загарев Михаил Александрович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений, распознавание образов

Статья в выпуске: 3 т.47, 2023 года.

Бесплатный доступ

В данной работе рассматривается проблема оконтуривания сельскохозяйственных полей на спутниковых снимках. Для решения этой задачи применяется подход, основанный на анализе исторических данных. В работе показано, что на таких данных можно добиться высокого качества с помощью простого малопараметрического метода. Метод состоит из детектора полей и детектора границ. Детекция полей основана на определении порога Оцу, а для определения границ используется детектор краев Кэнни. В связи с нехваткой доступных наборов данных нами был подготовлен и опубликован собственный набор данных, состоящий из 18859 экспертно аннотированных полей на снимках Sentinel-2. Для сравнения оконтуривания на мгновенных и исторических данных был реализован один из наиболее современных методов, основанный на глубоком обучении. Эксперимент показал, что использование исторических данных позволяет получить более высокое качество с более низкими затратами. Предлагаемый малопараметрический метод требует значительно меньше обучающих данных по сравнению с методом на мгновенных данных. Подготовленный набор данных и реализация алгоритма на языке Python были выложены в открытый доступ.

Еще

Оконтуривание сельскохозяйственных полей, малопараметрический алгоритм, компьютерное зрение, дистанционное зондирование земли, исторические данные, открытый набор данных

Короткий адрес: https://sciup.org/140300065

IDR: 140300065   |   DOI: 10.18287/2412-6179-CO-1235

Текст научной статьи Малопараметрический метод оконтуривания сельскохозяйственных полей на спутниковых снимках с помощью исторических данных MSAVI2

Развитие современного сельского хозяйства напрямую зависит от эффективного использования территории, для чего необходимы надежные и своевременные данные дистанционного зондирования Земли (ДЗЗ) [1, 2]. Системы спутникового зондирования предоставляют регулярные данные, охватывающие большие территории в течение длительного периода времени. Системы зондирования авиационными средствами, включая беспилотные аппараты, обладают большей точностью (до сантиметров на пиксель [3]), однако имеют меньший территориальный и временной охват.

Снимки ДЗЗ подвержены различного рода искажениям из-за влияния атмосферных явлений, сложных условий наблюдения (наличия затенений, дымки, облачности и т.д.), а также несовершенства системы регистрации. Это значительно усложняет задачу их дальнейшего анализа [4, 5]. Активно разрабатываются методы компенсации искажений и устранения артефактов для повышения качества регистрируемых данных [6–10], включая методы коррекции атмосферных эффектов [11 – 13], обнаружения и компенсации облачности и теней [14– 16], шумоподавления [17].

В данной статье рассматривается проблема оконтуривания сельскохозяйственных полей на изображениях ДЗЗ. В англоязычной литературе эту проблему обозначают терминами delineation или outlining of agricultural fields. Задача оконтуривания близка задаче сегментации, но обладает своей спецификой. Требуется детектировать любые возделываемые поля на фоне любых невозделываемых участков и как можно точнее определить границы возделываемых областей.

Одним из источников информации о землях сельскохозяйственного назначения являются кадастровые карты, фиксирующие границы полей. Эта информация нуждается в регулярном обновлении. Обычно используется ручная разметка полей с использованием спутниковых снимков, но этот подход имеет ряд недостатков. Ручная разметка очень трудоёмка и неэффективна для больших территорий, таких как округа и регионы [19]. Выполнение автоматической разметки является одной из областей применения алгоритмов оконтуривания полей. Другая область, где оконтуривание сельскохозяйственных полей является актуальной проблемой, – это предобработка данных для классификации сельскохозяйственных культур. Например, в работе [20] показано, что использование объектов, извлеченных из детектированных ранее контуров, позволяет улучшить результат по сравнению с анализом отдельных пикселей.

Среди работ по оконтуриванию сельскохозяйственных полей можно выделить несколько подходов. Методы на основе границ [20–23] обнаруживают границы полей путем анализа карт градиента. Такие методы обычно используют различные фильтры, например, операторы Шарра [24] или Кэнни [25]. Эти методы чувствительны к шуму, что приводит к детектированию ложноположительных границ полей [26]. Алгоритмы на основе областей [27, 29, 30] группируют поля из соседних пикселей, для которых выполняются некоторые критерии однородности. Такие алгоритмы часто основаны на методах сегментации или классификации. Проблемой этого подхода тоже являются ошибки чрезмерной сегментации [31]. Также применяются гибридные методы, сочетающие элементы алгоритмов на основе областей и на основе границ [26, 32–34]. Каждый из перечисленных подходов может быть реализован как в виде малопараметрического метода [32], так и в виде метода машинного обучения [27], включая глубокое обучение [22, 35, 36]. Существуют также методы, сочетающие нейронные сети и классические подходы компьютерного зрения [37, 38].

Поскольку сельскохозяйственные культуры сильно изменяют свой внешний вид в течение сезона, для оконтуривания полей имеет смысл использовать исторические данные. В статье [28] авторы исследовали влияние исторических данных на качество распознавания полей. В этой работе сравнивались результаты двух нейронных сетей U-Net, которые использовали одну и ту же пространственную область для обучения. Одна из сетей обучалась на одном RGB-изображении; вторая – на трех RGB-изображениях одной и той же местности, снятой в разные моменты времени. Результаты этой статьи показывают, что модель, использующая как пространственные, так и исторические данные, обеспечивает более высокую точность по сравнению с моделью, обученной только на пространственных данных.

В другом исследовании применения исторических данных [32] авторы предлагают гибридный метод автоматического оконтуривания сельскохозяйственных полей по временным рядам Web-Enabled Landsat Data (WELD). На вход алгоритму поступали каналы R, G, NIR, Mid-IR, а также индекс NDVI с еженедельным временным разрешением и диапазоном в 5 лет. На первом этапе строится карта границ полей, а также карта полей, получаемая специальной нормировкой NDVI. Далее к этим картам применялся метод сегментации VRGAC. Поскольку этот метод склонен к ошибкам недостаточной сегментации, следующим этапом применялся алгоритм водораздела для разложения сегментов, принадлежащих нескольким полям, на изолированные сегменты. Также применялась специальная обработка полей круглой формы и морфологическая фильтрация. Несмотря на малое число параметров и отсутствие необходимости в обучении, воспроизвести и применить данный метод на исторических данных другого типа представляется затруднительным.

В статье [24] авторы также используют исторические данные для оконтуривания полей. В качестве данных используются семь безоблачных снимков Sentinel-2 за вегетационный период 2016–2017 гг. Сначала для каждой даты были выделены границы полей по четырем каналам R, G, B, NIR; затем путем суммирования была получена агрегированная карта границ, двадцати восьми слоев границ (4 канала и 7 дат). Полученная агрегированная карта границ подавалась на вход алгоритма сегментации для вычисления карты потенциальных сельскохозяйственных зон. В дальнейшем эти зоны классифицировались на возделываемые и невозделываемые с использованием дерева классификации и регрессии (CART). В качестве признаков классификации были выбраны агрегированные за время наблюдения статистики NDVI: минимум, максимум, диапазон и стандартное отклонение для каждого пикселя. Авторы сравнили шесть комбинаций детектора границ (операторы Шарра или Кэнни) и алгоритма сегментации (watershed, multiresolution или multi-threshold). В результате наилучшее качество было показано в сочетании детекции Кэнни и сегментации водоразделом. Авторы также отметили, что применение исторических данных более эффективно, чем использование мгновенных данных.

Известные методы с использованием исторических данных либо включают отдельные компоненты, основанные на машинном обучении [24], либо представляют собой нейронные сети [28]. При этом наборы данных, использованные для обучения в этих работах, либо вообще не публиковались, либо уже недоступны. Мы предлагаем простой малопараметрический алгоритм, состоящий из трех частей. В первой части выполняется обнаружение потенциальных сельскохозяйственных полей по агрегированным данным вегетационного индекса. Вторая часть представляет собой расчет карты агрегированных границ.

Основываясь на результатах работы [24], мы используем для этой цели детектор Кэнни. В третьей части происходит уточнение границ полей с помощью полученной ранее карты границ. В отличие от [24, 32], вместо индекса NDVI мы предлагаем использовать MSAVI2 (Modified Soil-adjusted Vegetation Index 2) – вегетационный индекс с поправкой на почву.

Для оценки качества оконтуривания мы используем попиксельные метрики качества DICE и Overall accuracy. Также мы предлагаем объектную метрику, которая сначала сопоставляет поля с помощью коэффициента Жаккара, а затем вычисляет DICE не по-пиксельно, а на уровне объектов-полей. Найти данные для обучения и тестирования алгоритмов оконтуривания оказалось проблематично. Поэтому мы создали и опубликовали наш набор данных на основе снимков Sentinel-2. Набор данных включает разметку для 18859 полей нескольких сельскохозяйственных зон, расположенных в России и на Украине.

Сравнение оконтуривания по мгновенным данным с оконтуриванием по историческим данным уже проводилось в том или ином виде в работах [28, 32]. Было показано, что использование исторических данных позволяет повысить качество. В нашей работе мы дополнительно показываем, что, помимо повышения качества, использование исторических данных позволяет облегчить процесс настройки алгоритма. Предложенный алгоритм сравнивался с решением на основе глубокого обучения с мгновенными данными на вход [22]. Наш алгоритм показывает более высокий результат с точки зрения избыточной и недостаточной сегментации, при этом требуя в 7 раз меньше обучающих данных.

Работа имеет следующую структуру: параграф 1 знакомит с данными, используемыми для экспериментов; параграф 2 описывает предложенный алгоритм; в параграфе 3 представлена информация о проведенном эксперименте, в том числе сведения о реализации современного решения и описание показателей качества. В параграфе 4 представлены результаты эксперимента. Наконец, в заключении обобщаются результаты исследования.

1.    Исторические данные

В работах, посвященных оконтуриванию полей, использовались данные различных спутников: SPOT [31, 39], LANDSAT [32], WorldWide-2/3 [21, 34], Sentinel-2 [20, 29, 35]. В нашем исследовании использовались данные программ дистанционного зондирования Sentinel-2A и Sentinel-2B, запущенных в 2015 и 2017 годах соответственно.

Данные Sentinel-2 имеют разрешение по времени в среднем 5 дней. Для каждой даты съемки предоставляется набор мгновенных данных, состоящий из 13 изображений в формате Jpeg2000, снятых в разных спектральных диапазонах и с пространственным разрешением от 60 м / пиксель до 10 м / пиксель с максимальным размером 10800 ×10800 пикселей, см. табл. 1. Данные были геометрически скорректированы и приведены к системе координат Military Grid Reference System (MGRS), в которой площадь изображенной на них поверхности составила 100×100 км. Для обработки облачного покрова использовались маски облачности, предоставляемые вместе с муль-тиспектральными изображениями

Табл. 1. Спецификации спутникового диапазона Sentinel-2

Номер канала

Канал

Центральная длина волны, нм

Разрешение, м/пиксель

0

B1 – Coastal aerosol

443

60

1

B2–Blue

490

10

2

B3 – Green

560

10

3

B4–Red

665

10

4

B5 –Vegetation Red Edge

705

20

5

B6 –Vegetation Red Edge

740

20

6

B7–Vegetation Red Edge

783

20

7

B8–NIR

842

10

8

B8a – Narrow NIR

865

20

9

B9 – Water Vapor

940

60

10

B10 – SWIR Cirrus

1375

60

11

B11 – SWIR

1610

20

12

B12 – SWIR

2190

20

Анализ экспериментальных разделов других работ показал, что точное сравнение подходов затруднено, в основном из-за недоступности выборок данных, используемых в этих работах. В работах [1, 27, 29, 32, 34, 35] разметка получена вручную и недоступна; в [33] не описано происхождение правильных ответов для оценки алгоритма; в [20, 21, 26, 35] нет ссылок на конкретные наборы данных. Мы выполнили собственную разметку полей для четырех регионов Украины и России (см. рис. 1). В данном исследовании мы использовали фрагменты, равные 1/4 площади исходного спутникового снимка. Каждый из этих фрагментов представлял собой квадратное изображение размером 57300×57300 м с пространственным разрешением 10 м / пиксель. Участки выбирались таким образом, чтобы на каждом из них, помимо полей, были и другие типы объектов: городская местность, водная поверхность, болота и леса.

Разметка выполнялась экспертами на изображениях RGB, сделанных в безоблачные ясные дни. В табл. 2 приведены географические координаты рассматривае- мых областей, а также даты тех снимков, на основе которых производилась разметка. В табл. 3 представлена статистика по количеству полей и их размерам.

Для экспериментов и проверки алгоритмов был выбран период наблюдения с 01 января 2016 г. по 31

декабря 2020 г. Из четырех фрагментов два использовались для настройки параметров, а два других – для тестирования. На рис. 1 показано расположение рассматриваемых фрагментов на карте, а также разделение на обучающую и тестовую выборки.

Табл. 2. Координаты фрагментов спутниковых снимков и даты тех снимков, на основе которых была произведена разметка

Код фрагмента

Координаты фрагмента (широта, долгота)

Дата размеченного изображения

36UWB

[51 , 44875; 33 , 75522]

[51 , 44054;34 , 57954]

[50 , 92548;34 , 56203]

[50 , 93354; 33 , 74684]

21 сентября 2020

37UDU

[52 , 77559; 38 , 29526]

[52 , 77759;39 , 14469]

[52 , 26246;39 , 14301]

[52 , 26049; 38 , 30345]

7 июня 2020

37UES

[50 , 97909; 38 , 99972]

[52 , 77759;39 , 14469]

[50 , 46100;39 , 80700]

[50 , 46380; 38 , 99972]

27 июня 2020

38ULB

[51 , 41588; 42 , 12371]

[51 , 43321;42 , 94708]

[50 , 91828;42 , 96983]

[50 , 90127; 42 , 15556]

7 октября 2020

Табл. 3. Количественные характеристики разметки

Код фрагмента

Количество полей

Средняя площадь полей, км2

Медианная площадь полей, км2

36UWB

6984

0,27

0,11

37UDU

4411

0,43

0,18

37UES

3957

0,44

0,31

38ULB

3507

0,61

0,39

Рис. 1. Относительное расположение фрагментов из подготовленного набора данных. Обучающая выборка обозначена штриховкой, тестовая выборка обозначена точками

показана схема предлагаемого алгоритма. Каждому из трех этапов посвящен один из следующих подпараграфов.

Алгоритм был реализован на языке Python3.8. Исходный код доступен по ссылке Экспертная разметка полей для настройки (7918 контуров полей) и тестирования (10941 контуров полей), которая используется в экспериментальной части этого исследования, доступна по ссылке Репозиторий разметки также включает предварительно вычисленные агрегированные изображения, использованные в качестве входных данных в настоящей работе.

Рис. 2. Блок-схема предлагаемого алгоритма оконтуривания сельскохозяйственных полей

  • 2.1.    Вычисление маски полей

Поля на одном изображении могут находиться в различных стадиях вегетации и сельскохозяйственной обработки. Это приводит к значительной изменчивости наблюдаемых значений индекса MSAVI2 как между полями (низкая вегетация на ранних стадиях выращивания или высокая на стадиях пика), так и в пределах одного поля, например, из-за процесса уборки урожая. Усреднение исторических данных позволяет сгладить эту изменчивость как между полями, так и внутри полей. Итак, агрегирование производится путем вычисления выборочного среднего:

ki, J' - 1 I j = v Z i i , J , k i , J 5= 0

где Iz - мгновенные данные индекса MSAVI2 (используются только те даты, для которых доля облачных пикселей не более 80 %), k i, j – количество безоблачных измерений, доступных для пикселя (i, j). На рис. 3 проиллюстрирован процесс агрегации исторических индексов.

Далее для получения маски полей к агрегированному индексу применяется пороговое отсечение пикселей с низкими значениями вегетации. Такие значения соответствуют водным поверхностям, бетонным участкам и т.д. Для отсечения используется порог t low . После этого оставшиеся пиксели с помощью метода Оцу [41] разделяются на два класса: сельскохозяйственные культуры и дикорастущие растения. Порог, определяемый методом Оцу, обозначим как t O . Предполагается, что пиксели из класса дикорастущих растений обладают более высокими значениями индекса вегетации. Пример гистограммы с описанными пороговыми разделениями приведен на рис. 4.

Обозначим маски потенциальных полей и областей низкой вегетации как M и L :

Маска потенциальных полей:

J 1, если I J t o ;

M i j =1             J

1 0, иначе.

Маска областей низкой вегетации:

если lajg ttow ;

иначе.

Для повышения достоверности локализации водоемов и других участков местности с низкой средней вегетацией использовалась морфологическая дилатация маски L со структурным элементом s размера w :

L = L © s ( w ) .

Результирующая маска полей получается поэлементным вычитанием маски областей малой вегетации из маски M :

F i , j = M i , j - L i,j .

Примеры масок M, L и F приведены на рис . 5.

Рис. 3. Схема агрегирования вегетационного индекса на основе критерия достоверности данных и агрегированный вегетационный индекс MSAVI2 с 2016 по 2020 год включительно

Рис. 4. Гистограмма интенсивностей агрегированного индекса MSAVI2. Штрихпунктирная линия представляет пороговое значение t low ; штриховая линия представляет пороговое значение Оцу t O

а)

в)

Рис. 5. Иллюстрации поиска областей полей: агрегированный индекс MSAVI2 Ĩ avg (а), маска областей низкой вегетации L (б ), маска потенциальных полей M (в), результирующая маска полей F (г)

2.2. Вычисление маски границ

В соответствии с результатами работы [24] для получения карт границ мы используем детектор краев Кэнни [25]. Однако в отличие от вышеуказанного ис следования мы извлекаем края из предварительно вычисленных изображений MSAVI2, а не из каналов RGB и NIR спутниковых изображений .

Агрегация границ производится следующим обра зом : карта границ вычисляется для каждого мгновен ного изображения MSAVI2; полученные мгновенные карты границ усредняются ; усредненная карта бина ризуется по методу Оцу . Для компенсации возмож ных сдвигов к результирующей бинарной карте при меняется дилатация . Для уменьшения разрывов , а также для фильтрации шумовых границ применяется морфологическое замыкание .

Маска облаков , предоставляемая вместе со спутниковыми снимками , имеет ограниченную точность . Чтобы минимизировать искажения гра ниц полей , вызванных присутствием на изображе нии границ облаков и их теней , мы использовали данные только за те даты , для которых облачность составила менее 1 %.

В отличие от этапа вычисления маски полей , где мгновенные данные сначала агрегируются , а затем обрабатываются , на данном этапе сначала границы выделяются на мгновенных данных , а затем агреги руются уже карты границ . Такой подход позволяет получить более точную итоговую карту по сравнению с локализацией границ на агрегированном изображе нии ( см . рис . 6).

а)

Рис. 6. Сравнение подходов к извлечению карты границ: агрегированный MSAVI2 Ĩ avg (а); границы Кэнни на агрегированном индексе E( Ĩ avg) (б); бинарная карта агрегированных границ Кэнни Ẽ b (в)

  • 2.3.    Уточнение границ полей

  • 2.4.    Настройка параметров алгоритма

Для уточнения границ полей маска границ вычитается из маски полей . Растровое изображение R уточненных полей рассчитывается следующим образом:

R i , j = max ( 0, Рм - E^) ,                         (6)

где F – маска полей, а b – маска границ.

Далее на изображении R выделяются восьмисвязные компоненты. Для каждой компоненты определяется ее векторный контур. Ошибочные контуры (слишком маленькие или с самопересечением) исправляются или отфильтровываются. Чтобы избавиться от шума, вызванного избыточной сегментацией, ложными срабатываниями и маловероятными большими полями, векторные контуры фильтруются по площади с использованием порогов t mariena и t maraexa .

Описанный алгоритм оконтуривания имеет следующие параметры:

  •    w – радиус кругового структурного элемента, используемого при морфологическом замыкании;

  •    tlow – нижний порог вегетации;

  •    g - параметр оператора Кэнни, стандартное отклонение оператора Гаусса, применяемое к исходному изображению при предварительной обработке;

  •    tmarinea и tmaraexa – минимальный и максимальный пороги площади возделываемых регионов.

  • 3.    Сравнение методов оконтуривания
  • 3.1.    Реализация метода оконтуривания по мгновенным данным

  • 3.2.    Оценка качества оконтуривания

Значения этих параметров были подобраны экспертно по результатам работы алгоритма на двух настроечных фрагментах (рис. 1): а = 1, w = 2 пикселя, t ow = 0,1569, ^ a = 0,05 км2, Ca = 10 3 км2.

Основной проведенный нами эксперимент посвящен сравнению качества двух подходов: оконтуривание с мгновенными данными на вход и оконтуривание с историческими данными на вход. В качестве метода на исторических данных выступает наш малопараметрический алгоритм, а в качестве метода с мгновенными данными на вход выступает алгоритм оконтуривания полей на основе глубокого обучения, предложенный в работе [22].

Чтобы сравнить наш метод с одним из современных решений, мы воспроизвели метод, описанный в работе [22]. В отличие от предлагаемого метода, в работе [22] в качестве входных данных используются мгновенные снимки. В рамках данного метода входное изображение разделяется на перекрывающиеся патчи, на каждом из которых вычисляются границы полей с помощью обученной нейронной сети. Затем по специальной схеме результаты на отдельных патчах объединяются в результирующее изображение. Контуры полей на каждом патче вычисляются с использованием сверточной нейронной сети на основе модели U-Net [42] с применением энкодера VGG-16 [43], предобученного на наборе данных ImageNet.

В исходной работе авторы обучали нейросеть на наборе данных SIGPAC Navarre, который на данный момент недоступен. Мы использовали наш собственный датасет примерно такого же размера. Для аугментации данных, как и в исходной работе, были применены групповые преобразования Dih4 и повороты на случайный угол. В отличие от исходной работы мы использовали при обучении только два класса: поле и не поле, в то время как в [22] был добавлен третий класс – буфер по границам сельскохозяйственных участков. Авторы ввели этот класс, чтобы компенсировать неточности разметки, поскольку их обучающий набор данных содержал не полностью размеченные изображения. Наши снимки были размечены более полно, поэтому мы использовали только два класса.

Сначала мы пытались использовать для обучения тот же обучающий набор данных, который был использован для настройки параметров нашего алгоритма (см. параграф 1). Этого количества данных оказалось недостаточно, и процесс обучения не сходился. Проблема была решена путем увеличения ко- личества обучающих данных приблизительно в 7 раз. Мы обучали нейросеть в течение 88 эпох с помощью пакета PyTorch: в качестве оптимизатора был выбран алгоритм Adam с параметрами по умолчанию и шагом оптимизатора 1e-4. Как и в исходной работе, мы использовали функцию потерь LovaszSoftmax [44].

Среди подходов к оценке выделения границ можно выделить пиксельный [28, 45 – 49] и объектный [50 – 52] в соответствии с типом анализируемых данных. К пиксельным метрикам относятся DICE, Overall accuracy (OA), Intersection over union (IoU). Основным их преимуществом является простота реализации и быстрота вычислений. Серьезным недостатком пиксельных метрик является низкая чувствительность к ошибкам избыточной и недостаточной сегментации (см. рис.7).

  • а) б)

  • 3.2.1.    DICE obj : объектно-ориентированная метрика для оценки качества определения границ

Рис. 7. Иллюстрация избыточной (a) и недостаточной (б) сегментации; серый полигон изображает эталонное поле; красные линии – результат алгоритма оконтуривания

Объектные метрики точнее оценивают ошибки избыточной и недостаточной сегментации. Вычисление этих метрик, как правило, состоит из двух этапов, на первом из которых выполняется сопоставление распознанных и эталонных объектов по некоторому критерию [50, 53]. Второй этап представляет собой оценку качества тех распознанных объектов, которых удалось успешно сопоставить с эталонными. На втором этапе могут вычисляться различные метрики, основанные на оценке соответствия как площадей объектов ( Sunder , Sover [32, 50], AFI [54]), так и их границ (MAE [24], BDE [22], L [32]). Ложноположительные и ложноотрицательные ошибки при этом не учитываются. Для отдельной оценки ошибок такого рода в некоторых работах вводятся дополнительные показатели [32, 24].

В этой статье мы предлагаем метрику DICE obj , которая, с одной стороны, обладает преимуществом объектных подходов, а именно чувствительна к ошибкам избыточной и недостаточной сегментации. С другой стороны, она позволяет получить единую оценку качества, учитывающую в том числе ложноположительные и ложноотрицательные срабатывания алгоритма.

Множества эталонных полей и полей, найденных алгоритмом, с мощностями N ref и N exp обозначены как

1             Nref                         1             Nexp ref |f ref , • • •, f ref | и exp fje,p , • • •, f exp J соответственно. Сопоставление эталонных и распознанных полей выполняется на основе коэффициента Жаккара:

J ( a , b )

S ( a n b ) S ( a и b ) ,

где S ( x ) – площадь полигона x .

Поля f rief и f exjp считаются однозначно сопоставленными при выполнении следующего условия: J ( f ref , f jp ) > 0,5 и не существует другого такого поля f remf или f ekxp , для которого выполнялось бы J ( ff , f j ) > 0,5 или J ( f f , f kp ) > 0,5 соответственно. Обозначим множество однозначно сопоставленных элементов из F ref и F exp как F one2one :

one 2 one

{ p 1 , p 2,---, pN o,ne 2 „„, } , p V    ( fref , f lap )v ,

где N one2one – количество сопоставленных полей. Результирующее значение качества распознавания полей вычисляется по следующей формуле:

DICEobj = 2 None 2 one - 100%.                     (9)

N exp + Nref

Это значение составляет 100%, если каждому полю из F ref можно однозначно сопоставить поле из F exp .

4.    Результаты экспериментов

Результирующие значения описанных метрик представлены в табл. 4. Предложенный малопараметрический алгоритм с историческими данными на вход обозначен как LP . Алгоритмом оконтуривания полей на основе глубокого обучения, предложенный в работе [22], принимающий на вход мгновенные данные, обозначен как DL . Метрики рассчитывались для двух фрагментов, выбранных для тестирования (см. рис. 1).

Табл. 4. Результаты оценки качества алгоритмов оконтуривания

Metric

LP

DL [22]

DICE obj

51,25

46,28

DICE

86,41

88,74

OA

0,86

0,87

Алгоритм LP показывает наилучший результат по метрике DICEobj, то есть предлагаемый алгоритм лучше находит и разделяет поля. По пиксельным метрикам алгоритм DL немного опережает LP. Как упоминалось в предыдущем параграфе, пиксельные метрики имеют низкую чувствительность к ошибкам недостаточной и избыточной сегментации. Этот эффект может быть продемонстрирован на результатах работы сравниваемых алгоритмов. На рис. 8 приведен небольшой фрагмент одного из тестовых изображений и границы, полученные алгоритмами LP и DL, а также разметка (черная линия). Результат алгоритма DL (красная линия) содержит явные ошибки недостаточной сегментации, которых не наблюдается у LP (синяя линия). В то же время значения DICE, рассчитанные для этого отдельного фрагмента, ошибочно показывают, что результат DL лучше: 97% для DL и 94% для LP. Значения метрики DICEobj, напротив, позволяют правильно проранжировать результаты алгоритмов на этом отдельном фрагменте: 20% для DL и 49% для LP.

Продолжим качественный анализ результатов, обратившись к рис. 9. На этом фрагменте также видно, что алгоритм DL (красная штриховая линия) часто объединяет поля, тогда как LP (синяя штриховая линия) лучше разделяет поля, но иногда детектирует рваную границу там, где она должна быть прямой, как на верхнем правом и нижнем левом фрагментах рисунка. На рис. 10 также можно заметить неточ- ность границ, найденных LP, а также множество ложноположительных полей, найденных алгоритмом DL прямо посреди леса.

DICE obj – 20 % и 49 % соответственно

Рис. 9. Сравнение границ DL и LP. Красная штриховая линия – ответы DL, синяя штриховая линия – ответы LP. Обе штриховые линии прозрачны, а разметка не приводится, чтобы лучше было видно, как результаты алгоритмов соответствуют реальным полям, различимым на изображении

Рис. 10. Сравнение результатов DL и LP с разметкой.

Красная штриховая линия – ответы DL , синяя пунктирная линия – ответы LP , сплошная черная линия – эталонная

разметка

Также мы провели эксперимент по сравнению предложенного алгоритм LP с тремя его модификациями, в каждой из которых изменена одна из частей алгоритма. В табл. 5 приведены описания этих модификаций и результаты оценки их качества. Как видно из таблицы, наибольшее влияние на общее качество как по метрике DICE obj , так и по DICE оказывает использование исторических данных вместо мгновенных (23,54 % для мгновенных данных и 51,25 % для исторических). Второй по важности особенностью полного алгоритма LP оказывается тот факт, что детектирование границ проводится на мгновенных данных, после чего агрегируются уже карты границ (29,63 % против 51,25 %). Это не соответствует ре-

Рис. 8. Сравнение результатов DL и LP с эталонной разметкой (черная линия). Красная линия – ответ DL, синяя – ответ LP. Для приведенного фрагмента значение DICE составляет 97 % для DL и 94 % для LP, значение зультатам по DICE, которая показывает близкие значения для всех модификаций с историческими дан- ными. Однако, как было показано выше (рис. 8), мет рика DICE обладает существенными недостатками.

Табл. 5. Сравнение различных модификаций предложенного алгоритма для выделения наиболее существенных особенностей основной конфигурации алгоритма

Модификация алгоритма

DICE obj

DICE

Алгоритм LP без исторических данных (на вход поступают мгновенные снимки)

23,54

53,32

Алгоритм LP без агрегации детектированных границ (карта границ вычисляется по агрегированному индексу)

29,63

88,31

Алгоритм LP без дилатации детектированных границ

48,27

87,65

Основная конфигурация алгоритма LP

51,25

86,41

В дальнейшем качество оконтуривания может быть улучшено за счет объединения глубокого обучения и предложенного метода, а именно за счет включения обученной нами U-Net модели в качестве модуля детектора полей в наш метод. С другой стороны, улучшение точности маски границ также позволит повысить качество. Такого улучшения можно ожидать, например, при замене обычного метода Оцу, использующегося при бинаризации агрегированных границ, на алгоритм, обобщенный для случая несбалансированных классов [55]. Еще одна возможность для развития связана с формой полей. Для разных стран и территорий характерны разные формы, но в пределах одного региона поля часто похожи, за счет чего можно ограничить пространство поиска решений, как это было сделано в исследовании по распознаванию дорожной разметки [56, 57]. Кроме того, поиск мгновенных границ можно выполнять на специальной проекции мультиспектрального изображения, полученной методом контраст-сохраняющей визуализации [58].

Заключение

В данной работе рассмотрена задача оконтуривания сельскохозяйственных полей по открытым спутниковым данным Sentinel-2. Предложен малопараметрический алгоритм, основанный на использовании классических инструментов обработки изображений и исторических данных индекса MSAVI2. Предлагаемый алгоритм относится к гибридному подходу, то есть обнаружение границ и потенциальных полей выполняется независимо. Для обнаружения границ мы предлагаем использовать детектор Кэнни, а для обнаружения полей — бинаризацию по методу Оцу.

Проведенный нами эксперимент подтвердил, что подход на исторических данных, представленный нашим малопараметрическим алгоритмом, даёт более точные результаты, чем оконтуривание по мгновенным данным, представленное современным нейросетевым решением. При этом для настройки параметров предложенного алгоритма требуется выборка в 7 раз меньше, чем для обучения метода на мгновенных данных. Предложенный алгоритм прост в реализации и не требует использования ресурсоёмких вычислительных машин, оснащенных GPU.

Мы предоставляем исходный код алгоритма и экспертную разметку полей. Репозиторий разметки также содержит предварительно вычисленные примеры изображений, которые используются в качестве входных данных для алгоритма.

Исследование выполнено при поддержке Российского научного фонда (проект № 20-61-47089).

Список литературы Малопараметрический метод оконтуривания сельскохозяйственных полей на спутниковых снимках с помощью исторических данных MSAVI2

  • Garcia-Pedrero A, et al. The outlining of agricultural plots based on spatiotemporal consensus segmentation. Remote Sens 2018; 10: 1991. DOI: 10.3390/rs10121991.
  • Steven MD, Clark JA, eds. Applications of remote sensing in agriculture. Elsevier; 2013.
  • Rokhmana CA. The potential of UAV-based remote sensing for supporting precision agriculture in Indonesia. Procedia Environ Sci 2015; 24: 245-253. DOI: 10.1016/j.proenv.2015.03.032.
  • Campbell JB, Wynne RH. Introduction to remote sensing. Guilford Press; 2011.
  • Cracknell AP. Introduction to remote sensing. CRC Press; 2007.
  • Davis SM, et al. Remote sensing: the quantitative approach. McGraw-Hill College; 1978.
  • Elachi C, Van Zyl JJ. Introduction to the physics and techniques of remote sensing. John Wiley & Sons; 2021.
  • Camps-Valls G, et al. Remote sensing image processing. Morgan & Claypool Publishers; 2011. DOI: 10.2200/S00392ED1V01Y201107IVM012.
  • Schowengerdt RA. Remote sensing: models and methods for image processing. Academic Press; 2006.
  • Michishita R, et al. Empirical comparison of noise reduction techniques for NDVI time-series based on a new measure. ISPRS J Photogramm Remote Sens 2014; 91: 17-28. DOI: 10.1016/j.isprsjprs.2014.01.003.
  • Martins VS, et al. Assessment of atmospheric correction methods for Sentinel-2 MSI images applied to Amazon Floodplain Lakes. Remote Sens 2017; 9: 322. DOI: 10.3390/rs9040322.
  • Lantzanakis G, Mitraka Z, Chrysoulakis N. Comparison of physically and image based atmospheric correction methods for Sentinel-2 satellite imagery. In Book: Karacostas T, Bais A, Nastos PT, eds. Perspectives on atmospheric sciences. Springer International Publishing Switzerland; 2017: 255-261. ISBN: 978-3-319-35095-0.
  • Sola I, et al. Assessment of atmospheric correction methods for Sentinel-2 images in Mediterranean landscapes. Int J Appl Earth Obs Geoinf 2018; 73: 63-76. DOI: 10.1016/j.jag.2018.05.020.
  • Silva GF, et al. Near real-time shadow detection and removal in aerial motion imagery application. ISPRS J Photogramm Remote Sens 2018; 140: 104-121. DOI: 10.1016/j.isprsjprs.2017.11.005.
  • Guo R, Dai Q, Hoiem D. Paired regions for shadow detection and removal. IEEE Trans Pattern Anal Mach Intell 2013; 35: 2956-2967. DOI: 10.1109/TPAMI.2012.214.
  • Bocharov DA, et al. Cloud shadows detection and compensation algorithm on multispectral satellite images for agriculture regions. J Commun Technol Electron 2022; 67: 728-739. DOI: 10.1134/S1064226922060171.
  • Deshpande AM, Patale SR, Roy S. Removal of line striping and shot noise from remote sensing imagery using a deep neural network with post-processing for improved restoration quality. Int J Remote Sens 2021; 42: 7357-7380. DOI: 10.1080/01431161.2021.1957512.
  • Crommelinck S, et al. Review of automatic feature extraction from high-resolution optical sensor data for UAVbased cadastral mapping. Remote Sens 2016; 8: 689. DOI: 10.3390/rs8080689.
  • Torre M, Radeva P. Agricultural-field extraction on aerial images by region competition algorithm. Proc 15th Int Conf on Pattern Recognition (ICPR-2000) 2000; 1: 313-316. DOI: 10.1109/ICPR.2000.905337.
  • Wagner MP, Oppelt N. Extracting agricultural fields from remote sensing imagery using graph-based growing contours. Remote Sens 2020; 12: 1205. DOI: 10.3390/rs12071205.
  • Joel D. Semi-automatic detection of field boundaries from highresolution satellite imagery. PhD Thesis, Wageningen University 2015. DOI: 10.13140/RG.2.1.4931.8804.
  • Garcia-Pedrero A, et al. Deep learning for automatic outlining agricultural parcels: Exploiting the land parcel identification system. IEEE Access 2019; 7: 158223-158236. DOI: 10.1109/ACCESS.2019.2950371.
  • Ji CY. Delineating agricultural field boundaries from TM imagery using dyadic wavelet transforms. ISPRS J Photogramm Remote Sens 1996; 51(6): 268-283. DOI: 10.1016/0924-2716(95)00017-8.
  • Watkins B, Van Niekerk A. A comparison of object-based image analysis approaches for field boundary delineation using multi-temporal Sentinel-2 imagery. Comput Electron Agric 2019; 158: 294-302. DOI: 10.1016/j.compag.2019.02.009.
  • Canny J. A computational approach to edge detection. IEEE Trans Pattern Anal Mach Intell 1986; PAMI-8: 679-698. DOI: 10.1109/TPAMI.1986.4767851.
  • Waldner F, Diakogiannis FI. Deep learning on edge: Extracting field boundaries from satellite images with a convolutional neural network. Remote Sens Environ 2020; 245: 111741. DOI: 10.1016/j.rse.2020.111741.
  • García-Pedrero A, Gonzalo-Martín C, Lillo-Saavedra M. A machine learning approach for agricultural parcel delineation through agglomerative segmentation. Int J Remote Sens 2017; 38: 1809-1819. DOI: 10.1080/01431161.2016.1278312.
  • Aung HL, et al. Farm parcel delineation using spatiotemporal convolutional networks. Proc IEEE/CVF Conf on Computer Vision and Pattern Recognition Workshops (CVPRW-2020) 2020: 340-349. DOI: 10.1109/CVPRW50498.2020.00046.
  • Belgiu M, Csillik O. Sentinel-2 cropland mapping using pixel-based and object-based time-weighted dynamic time warping analysis. Remote Sens Environ 2018; 204: 509-523. DOI: 10.1016/j.rse.2017.10.005.
  • Watkins B, Van Niekerk A. Automating field boundary delineation with multi-temporal Sentinel-2 imagery. Comput Electron Agric 2019; 167: 105078. DOI: 10.1016/j.compag.2019.105078.
  • North HC, Pairman D, Belliss SE. Boundary delineation of agricultural fields in multitemporal satellite imagery. IEEE J Sel Top Appl Earth Obs Remote Sens 2019; 12: 237-251. DOI: 10.1109/JSTARS.2018.2884513.
  • Yan L, Roy DP. Automated crop field extraction from multi-temporal Web Enabled Landsat Data. Remote Sens Environ 2014; 144: 42-64. DOI: 10.1016/j.rse.2014.01.006.
  • Singh S, Suresh M, Jain K. Land Information Extraction with Boundary Preservation for High Resolution Satellite Image. International Journal of Computer Applications 2015; 120: 39-43. DOI: 10.5120/21243-4014.
  • Persello C, et al. Delineation of agricultural fields in smallholder farms from satellite images using fully convolutional networks and combinatorial grouping. Remote Sens Environ 2019; 231: 111253. DOI: 10.1016/j.rse.2019.111253.
  • Wagner MP, Oppelt N. Deep learning and adaptive graphbased growing contours for agricultural field extraction. Remote Sens 2020; 12: 1990. DOI: 10.3390/rs12121990.
  • Zhang H, et al. Automated delineation of agricultural field boundaries from Sentinel-2 images using recurrent residual U-Net. Int J Appl Earth Obs Geoinf 2021; 105: 102557. DOI: 10.1016/j.jag.2021.102557.
  • Yerlygin LA, Teplyakov LM. Improvement of a line segment detector based on a neural network by adding engineering features [In Russian]. Sensory Systems 2021; 35: 50-54. DOI: 10.31857/S0235009221010042.
  • Teplyakov L, et al. Line detection via a lightweight CNN with a Hough layer. Proc SPIE 2020; 11605, 116051B. DOI: 10.1117/12.2587167.
  • North HC, Pairman D, Belliss SE. Paddock segmentation using multi-temporal satellite imagery. Proc IEEE Geoscience and Remote Sensing Symposium 2014: 1596-1599. DOI: 10.1109/IGARSS.2014.6945951.
  • Qi J, et al. A modified soil adjusted vegetation index. Remote Sens Environ 1994; 48: 119-126. DOI: 10.1016/0034-4257(94)90134-1.
  • Otsu N. A threshold selection method from gray-level histograms. IEEE Trans Syst Man Cybern Syst 1979; 9: 62-66.
  • Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation. In Book: Medical image computing and computer-assisted intervention – MICCAI 2015. Cham, Switzerland: Springer; 2015: 234-241. DOI: 10.1007/978-3-319-24574-4_28.
  • Simonyan K, Zisserman A. Very deep convolutional networks for large-scale-image recognition. arXiv Preprint. 2014. Sorce: https://arxiv.org/abs/1409.1556. DOI: 0.48550/arXiv.1409.1556.
  • Rakhlin A, Davydow A, Nikolenko S. Land cover classification from satellite imagery with U-net and lovász- Softmax loss. Proc CVPR Workshops 2018: 262-266.
  • Masoud KM, Persello C, Tolpekin VA. Delineation of agricultural field boundaries from Sentinel-2 images using a novel super-resolution contour detector based on fully convolutional networks. Remote Sens 2019; 12(1): 59. DOI: 10.3390/rs12010059.
  • Yao J, et al. The classification method study of crops remote sensing with deep learning, machine learning, and Google Earth engine. Remote Sens 2022; 14(12): 2758. DOI: 10.3390/rs14122758.
  • Zhang Z, et al. Cloudformer V2: Set prior prediction and binary mask weighted network for cloud detection. Mathematics 2022; 10(15): 2710.1.
  • Kuang B, et al. Rock segmentation in the navigation vision of the planetary rovers. Mathematics 2021; 9(23): 3048. DOI: 10.3390/math9233048.
  • Zhang Z, et al. HA-RoadFormer: Hybrid attention transformer with multi-branch for large-scale high-resolution dense road segmentation. Mathematics 2022; 10(11): 1915. DOI: 10.3390/math10111915.
  • Clinton N, et al. Accuracy assessment measures for objectbased image segmentation goodness. Photogramm Eng Remote Sens 2010; 76(3): 289-299.
  • Long J, et al. Delineation of agricultural fields using multitask BsiNet from high-resolution satellite images. Int J Appl Earth Obs Geoinf 2022; 112: 102871. DOI: 10.1016/j.jag.2022.102871.
  • Tetteh GO, Gocht A, Conrad C. Optimal parameters for delineating agricultural parcels from satellite images based on supervised Bayesian optimization. Comput Electron Agric 2020; 178: 105696. DOI: 10.1016/j.compag.2020.105696.
  • Zhan Q, et al. Quality assessment for geo-spatial objects derived from remotely sensed data. Int J Remote Sens 2005; 26(14): 2953-2974. DOI: 10.1080/01431160500057764.
  • Lucieer A, Stein A. Existential uncertainty of spatial objects segmented from satellite sensor imagery. IEEE Trans Geosci Remote Sens 2002; 40(11): 2518-2521. DOI: 10.1109/TGRS.2002.805072.
  • Ershov EI, et al. A generalization of Otsu method for linear separation of two unbalanced classes in document image binarization. Computer Optics 2021; 45(1): 66-76. DOI: 10.18287/2412-6179-CO-752.
  • Panfilova E, Shipitko OS, Kunina I. Fast Hough transformbased road markings detection for autonomous vehicle. Proc SPIE 2020; 11605: 116052B. DOI: 10.1117/12.2587615.
  • Panfilova EI, Kunina IA. Using window hough transform for detecting elongated boundaries in an image [In Russian]. Sensory Systems 2020; 34: 340-353. DOI: 10.31857/S0235009220030075.
  • Sidorchuk DS, Volkov VV, Nikonorov AV. Comparison of the nonlinear contrast-preserving visualization method for multispectral images with well-known decolorization algorithms [In Russian]. Information Processes 2020; 20: 41-54.
Еще
Статья научная