Классификация гиперспектральных данных дистанционного зондирования Земли

Автор: Бучнев А.А., Пяткин В.П.

Журнал: Журнал Сибирского федерального университета. Серия: Техника и технологии @technologies-sfu

Статья в выпуске: 5 т.12, 2019 года.

Бесплатный доступ

Рассматривается система классификации гиперспектральных данных дистанционного зондирования Земли (ДЗЗ), включающая автоматическую (кластерный анализ) и контролируемую классификации. Оценивается применимость классификатора Байеса для нормально распределенных векторов признаков к обработке этих данных. Описана реализация классификатора спектрально-углового картирования.

Дистанционное зондирование, гиперспектральные данные, кластерный анализ, алгоритм к-средних, классификация с обучением, классификатор байеса, классификатор спектрально-углового картирования

Короткий адрес: https://sciup.org/146281217

IDR: 146281217 | DOI: 10.17516/1999-494X-0109

Текст научной статьи Классификация гиперспектральных данных дистанционного зондирования Земли

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0).

Эффективность дистанционных исследований Земли из космоса во многом определяется используемыми методами обработки данных дистанционного зондирования Земли (ДЗЗ). Функциональные возможности разработанного в ИВМиМГ СО РАН совместно с ФГБУ «НИЦ «Планета» Росгидромета РФ программного комплекса PlanetaMonitoring для обработки данных ДЗЗ дают возможность использовать при их обработке практически функционально полный набор операций [1]. Программный комплекс PlanetaMonitoring реализует технологии предварительной и тематической обработки многоспектральных (МС) данных оптического, инфракрасного и микроволнового диапазонов. В настоящее время на орбитах находится более ста космических аппаратов ДЗЗ, большая часть которых оснащена МС-сканерами, позволяющими получать МС-изображения с высоким (0,3-10 м) пространственным разрешением и с небольшим количеством спектральных каналов. В последние годы в практику ДЗЗ активно внедряется гиперспектральная (ГС) аппаратура, спутники оснащаются ГС-сканерами, обеспечивающими съемку в видимом и инфракрасном диапазонах спектра [2, 3]. Отличительной особенностью ГС-изображений является их низкое пространственное разрешение (несколько десятков метров) и высокое спектральное разрешение (несколько сотен, а в перспективе – несколько тысяч каналов). Определенный импульс исследованиям по созданию алгоритмов, методов и технологий для обработки ГС-спутниковых данных в нашей стране был получен в связи с успешным запуском в последние годы российских космических аппаратов, оснащенных ГС-аппаратурой. Это спутники серии «Ресурс-П» № 1, № 2 и № 3 (запущен 13.03.2016). Спутник оснащен МС-сканером (пространственное разрешение 3 м, 5 каналов в диапазоне 0,45-0,9 мкм и в панхроматическом режиме (0,58-0,8 мкм) – 0,9 м) и ГС-сканером (пространственное разрешение 30 м, до 255 каналов со спектральным разрешением 5-10 нм в диапазоне 0,4-1,1 мкм). Цель настоящего исследования – оценить возможность использования системы классификации (контролируемой и неконтролируемой), реализованной в программном комплексе PlanetaMonitoring, в классификации ГС-данных ДЗЗ.

Известно, что непосредственное использование традиционных алгоритмов для обработки данных ГС-сканеров приводит к определенным трудностям, связанным с большой размерностью векторов измерений [3]. В рамках создания программного комплекса PlanetaMonitoring по обработке данных ДЗЗ была разработана система классификации, включающая классификацию с обучением (контролируемую классификацию) [4] и автоматическую классификацию (кластерный анализ) [5]. Контролируемая классификация реализует стратегию максимального правдоподобия Байеса для нормально распределенных векторов признаков в классах. Оценки параметров классификатора (векторов средних и ковариационных матриц в классах) получаются на основе обучающих выборок. В основе кластерного анализа лежит использование алгоритма К-средних.

Эти классификаторы, разработанные для обработки данных ДЗЗ с относительно небольшим количеством спектральных диапазонов (МС-данные), были достаточно легко адаптированы для обработки ГС-образов, полученных сканерами с высоким спектральным разрешением. Однако такое прямое использование классификаторов сопровождается следующими негативными обстоятельствами:

1. Высокие вычислительные затраты, обусловленные большой размерностью векторов признаков N (например, сканер ГСА спутника Ресурс-П № 3 имеет N= 255 спектральных
2. Для классификации с обучением требуются большие объемы обучающих данных. Чтобы избежать сингулярностей при вычислении матриц, обратных к ковариационным, минимальный объем обучающих выборок в классах должен равняться N +1 вектору. Известно, что для получения хороших оценок ковариационных матриц в мультиспек-тральных данных (N~10) объем обучающей выборки V в классе должен быть таким, чтобы выполнялось следующее условие для соотношения размерности: V/N>=100 [6] . Ясно, что для выполнения подобного условия в ГС-данных (N~100) объем обучающей выборки должен быть увеличен не менее чем на порядок.

каналов). Расстояние Махалонобиса, используемое для оценки близости векторов признаков к центрам классов, является значением квадратичной формы с весовой матрицей размерности N*N. Расстояние Махалонобиса также один из типов метрик, используемых нами в реализации алгоритма К-средних.

Этих затруднений можно избежать путем извлечения из ГС-данных признаков, позволяющих построить набор векторов, размерность которых соответствует размерности МС-образа. С этой целью полный набор спектральных диапазонов разбивается на блоки (соседние блоки могут пересекаться), каждый из которых представлен в результирующем векторе признаков одним значением. Это значение может быть: 1) средним по блоку; 2) максимальным значением в блоке; 3) главной компонентой в блоке; 4) центральным значением в блоке. Кроме того, предоставляется возможность выбора главных компонент исходного набора ГС-векторов данных в соответствии с упорядоченной по убыванию последовательностью собственных чисел ковариационной матрицы. Количество выбираемых главных компонент определяется суммарной дисперсией.

К полученному так МС-образу в полной мере применимы функции системы контролируемой классификации программного комплекса PlanetaMonitoring. Хотя подобное снижение размерности ГС-образов используется достаточно часто (см., например, [7]), применять его следует с осторожностью из-за возможных потерь полезной информации. В частности, метод главных компонент, являясь линейным преобразованием, может разрушать нелинейности, присутствующие в данных [8].

В последнее время в состав системы контролируемой классификации комплекса PlanetaMonitoring нами включен еще один классификатор: классификатор спектральноуглового картирования [9]. Первоначально разработанный специально для классификации ГС-данных этот классификатор не содержит какой-либо специфики этих данных и может быть использован для классификации и МС-данных. В качестве расстояния р ( x,y i ) вектора признаков x до прототипа y_i класса i берут угловое расстояние:

p f x,y i ) = arccos

T x У1

UW-IW

Вектор x зачисляется в класс, для которого угловое расстояние р(x,yi) является минимальным. В качестве прототипов классов (ссылочных векторов) авторы алгоритма [8] использовали библиотеку лабораторных спектров. Мы в своей реализации алгоритма в качестве прототипов классов используем векторы средних, полученных на основе обучающих и контрольных выборок классов. Для работы с обучающими и контрольными полями применяется тот же инструментарий, что и для классификатора Байеса [4]. Классификатор ра-– 538 – ботает в двух режимах: тестовом и рабочем. По результатам тестового режима вычисляется вероятность правильной классификации и строится матрица ошибок. Анализируя соответствующие показатели и выполняя при необходимости корректировки обучающих выборок классов, можно добиться необходимого уровня правильной классификации. В рабочем режиме классификатор обрабатывает весь набор данных, используя построенные прототипы классов. При этом может быть взято заданное пороговое значение угла a: если для вектора признаков x минимальное значение угла miniρ(x,yi) > a, то этот вектор заносится в класс отклоненных векторов.

Для вычислительных экспериментов применяли один из файлов известного набора данных спектрометра AVIRIS [10]. Размер файла 614*2678, размерность векторов измерений 210. Из этого файла были сформированы два набора векторов признаков размером 614*2678 векторов: один с размерностью векторов признаков 184 (на основе визуального анализа спектральных составляющих векторов измерений) и второй с размерностью векторов признаков 21 (взяты главные компоненты из каждых 10 последовательных спектральных составляющих). Вычисления производились в рамках модели параллельного программирования OpenMP под управлением ОС Windows-10 на компьютере с 4-ядерным процессором i3-2100. В таблице приведены затраты времени в 1 с на контролируемую классификацию указанных наборов данных классификаторами Байеса и спектрально-углового картирования в зависимости от числа выделяемых классов.

На рис. 1-4 демонстрируются результаты работы классификаторов (показаны нижние фрагменты полных рисунков). На рис. 1 представлено изображение спектрального канала с номером 72 исходного набора данных. Рис. 2 – результат кластеризации набора векторов признаков размерности 184 (выделялось 10 кластеров). Рис. 3 – результат, полученный применением классификатора Байеса к набору векторов признаков размерности 184. Белым цветом выделен класс отклоненных векторов. Чтобы избежать затруднений, связанных с выбором обучающих и контрольных полей в пространстве многомерных векторов признаков, для ввода этих полей использовалась карта кластеризации рис. 2. Априорные вероятности классов задавались с использованием выходных данных операции кластеризации. Вероятность правильной классификации составила 0.86 (0.998 для обучающих и 0.722 для контрольных полей). Рис. 4 – результат, полученный применением спектрально-углового классификатора к набору векторов признаков размерности 184. Были использованы те же обучающие и контрольные поля, что и в построении рис. 3. Вероятность правильной классификации составила 0.737 (0.821 для обучающих и 0.653 для контрольных полей).

Таблица

Table

Размерность векторов признаков	Классификатор Байеса		Спектрально-угловой классификатор
Размерность векторов признаков	15 классов	10 классов	15 классов	10 классов
184	246	152	3.60	2.40
21	3.65	2.50	0.50	0.34

Включение технологии классификации ГС-данных ДЗЗ в состав программного комплекса PlanetaMonitoring позволяет расширить возможности системы классификации комплекса по построению карты тематических классов данных ДЗЗ различного спектрального разрешения.

Работа выполнена в рамках государственного задания ИВМиМГ СО РАН (проект 03152016-0003) при финансовой поддержке Российского фонда фундаментальных исследований (код проекта 16-07-00066).

Список литературы Классификация гиперспектральных данных дистанционного зондирования Земли

Асмус В.В., Бучнев А.А., кровотынцев В.А., Пяткин В.П., Салов Г.И. PlanetaМonitoring: программный комплекс обработки спутниковых данных. Проблемы информатики, 2013, 3, 85-99.
Бондур В.Г. Современные подходы к обработке больших потоков гиперспектральной и многоспектральной аэрокосмической информации. Исследование Земли из космоса, 2014, 4-16.
Шовенгердт Р.А. Дистанционное зондирование. Модели и методы обработки изображений. М.: Техносфера, 2010. 560 с.
Асмус В.В., Бучнев А.А., Пяткин В.П. контролируемая классификация данных дистанционного зондирования Земли. Автометрия, 2008, 4, 60-67.
Асмус В.В., Бучнев А.А., Пяткин В.П. кластерный анализ данных дистанционного зондирования Земли. Автометрия, 2010, 2, 58-66.
Асмус В.В. Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды. Дис…д-ра физ.мат. наук. Москва, 2002. 75 с.
Мельников П.В., Пестунов И.А., Рылов С.А. Экспериментальное сравнение методов классификации гиперспектральных изображений высокого пространственного разрешения по спектральным и пространственным признакам. Региональные проблемы дистанционного зондирования Земли: сб. материалов III Междунар. научной конф. красноярск, СФУ, 2016, 28-33.
J.P. Marques de Sa. Pattern Recognition. Concepts, Methods and Applications. Berlin, Springer, 2001, 318 p.
Kruse, FА., Lefkoff A.B., Boardman J.W., Heidebrecht K.B., Shapiro A.T., Barloon P.J. and Goetz A.F.H. The Spectral Image Processing System (SIPS) -interactive viualization and analysis of imaging spectrometer data. Remote Sensing of Environment, 1993, 44, 145-163.
AVIRIS: Airborne visible/Infrared Imaging Spectrometer . Access: https://aviris.jpl.nasa.gov/data/get_aviris_data.html

Еще

Статья научная