Тематическая классификация гиперспектральных изображений по показателю сопряжённости

Автор: Фурсов Владимир Алексеевич, Бибиков Сергей Алексеевич, Байда Оксана Александровна

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений: Восстановление изображений, выявление признаков, распознавание образов

Статья в выпуске: 1 т.38, 2014 года.

Бесплатный доступ

Исследуется алгоритм тематической классификации гиперспектральных изображений, основанный на применении в качестве меры близости показателя сопряжённости с подпространством, образованным векторами признаков заданного класса. Рассматриваемая мера близости по существу является обобщением метода спектрального угла (Spectral Angle Mapper), реализованного в пакете обработки гиперспектральных данных ENVI. В данном случае, вместо вычисления косинуса угла между двумя векторами, вычисляется косинус угла между распознаваемым вектором и подпространством. В работе описаны различные модификации предлагаемого метода: с разбиением класса на подклассы и с приведением векторов, представляющих все гиперпиксели изображения, к нулевому среднему. Приводятся результаты экспериментов на тестовых гиперспектральных изображениях, иллюстрирующие возможность достижения более высокого качества классификации по сравнению с методом спектрального угла.

Еще

Гиперспектральные изображения, классификация, метод спектрального угла, показатель сопряжённости

Короткий адрес: https://sciup.org/14059208

IDR: 14059208

Текст научной статьи Тематическая классификация гиперспектральных изображений по показателю сопряжённости

Постановка задачи

В последние годы всё большую актуальность приобретает задача тематической классификации гиперспектральных изображений. Число публикаций по этой тематике быстро нарастает. В качестве примера приведём классическое учебное пособие [1] и одну из работ коллективов Московского государственного университета геодезии и картографии, Московского физико-технического института ЗАО «НПО «Лептон» [2].

Многоспектральные и гиперспектральные изображения, получаемые при дистанционном зондировании земной поверхности, позволяют решать широкий круг тематических задач геологии, климатологии, лесного хозяйства, океанологии, землепользования, контроля водных ресурсов и т. д. При этом для автоматизированной сегментации часто используются алгоритмы пороговой обработки, гиперпараллелепи-педного метода и кластерного анализа. Популярным программным комплексом, в котором реализованы функции кластерного анализа для обработки гиперспектральных изображений, является пакет ENVI [3].

Программный комплекс ENVI включает функции обработки и глубокого анализа гиперспектральных снимков, радиометрической и геометрической коррекции, улучшения качества изображений, дешифрирования и классификации и др. Для решения указанных задач в пакете могут использоваться различные алгоритмы. Одним из таких алгоритмов, который предлагается для решения задач тематической классификации, является алгоритм классификации с помощью метода спектрального угла [4], [5]. При этом задача ставится и решается следующим образом.

Введём в рассмотрение N ×1-вектор, характеризующий j -й гиперпиксель изображения:

xj = [ x1 ( j ) , x 2 ( j )’—’ xi ( j ) ’-’ xN ( j ) ] T , (1) где xi(j) - значение интенсивности отражения регистрируемого объекта в i-м спектральном диапазоне в j-й точке гиперспектрального изображения по пространственной координате. Задача контролируемой классификации состоит в конструировании решающей функции f : Rn ֏{0,1,2,…,k}, которая для каждого вектора xj вырабатывает решение о его принадлежности к некоторому классу.

Будем полагать, что для каждого типа (класса) задано M обучающих векторов, так, что для каждого k -го класса может быть составлена N × M -матрица:

X k = [ x 1 ( k ), x 2( k ),..., x M ( k )], k = 1, K .           (2)

Реализованный в ENVI алгоритм классификации, основанный на методе спектрального угла, описывается следующим образом. Для каждого класса вычисляется вектор ͞ x ( k ):

1M x (k) = 77 Exj (k), k = 1, K ,                  (3)

M ~"t j который является прототипом k-го класса. Гиперпиксель, характеризующийся вектором признаков xj, относят к k-му классу, если достигается максимум пока- зателя спектрального угла:

= cos 1

/ i------------------------------\ -1 "A

N       N

JE X2 (j)E X2 (k)

V i =1              i =1

NL

E X ( j ) X ( k )

i = 1

V

В настоящей работе исследуется алгоритм, который можно рассматривать как его обобщение. В данном случае вместо вычисления угла между классифицируе- мым вектором и средним вектором класса предлагается вычислять угол между вектором и подпространством, натянутым на множество векторов из этого класса.

Данный метод был впервые описан в работе [6]. Дальнейшее развитие получил в работах [7], [8]. В работах [9], [10], [11] описано применение метода для распознавания лиц. В настоящей работе приводятся результаты экспериментов на тестовых гиперспектральных изображениях, показывающие более высокое качество классификации по сравнению с методом спектрального угла.

Описание алгоритма классификации

Предлагаемый классификатор основан на использовании так называемого показателя сопряжённости с подпространством, натянутым на векторы признаков образов объектов из заданного класса. Пусть x j - вектор признаков, являющийся образом j -го гиперпикселя, предъявленного для установления близости к k -му классу, а X k N × M -матрица (2), составленная из обучающих векторов (гиперпикселей) этого класса.

Алгоритм строится на основе следующих соотношений. Для каждого ( k -го) класса формируется N × M матрица Q k :

Q k = X k [ X T X k ] - 1 X T , k = 1, K . (5)

Решающая функция f ( x ) строится следующим образом. Вектор x j является образом искомого объекта (гиперпикселя) и принадлежит m -му классу, т.е. f ( x ) = m , m = 1,2,... k , если

R m ( j ) = ma x R k ( j ) , (6) где

R k ( j ) = "Qx . (7) x T j x j

Таким образом, для построения процедуры распознавания необходимо на этапе обучения для каждого предполагаемого типа (класса) с использованием матрицы (2) построить по соотношению (5) N × M -матрицу Q k . Подчеркнём, что для каждого вектора x j признаков, являющегося образом некоторого гиперпикселя, максимум показателя сопряжённости R k ( j ) ищется по всем классам гиперспектрального изображения.

Нетрудно заметить, что при использовании описанного алгоритма качество классификации будет существенным образом зависеть от способа задания матриц классов (2). Простейший способ формирования матриц X k – случайный выбор заданного числа векторов на участке изображения, принадлежащего известному классу. Для полной характеристики класса в этом случае число отбираемых векторов должно быть достаточно большим. Однако это увеличивает вычислительную сложность алгоритма и может приводить к ошибкам классификации вследствие ухудшения обусловленности матрицы X T k X k .

Снижение вычислительной сложности и повышение качества классификации может быть достигнуто путём разбиения класса на подклассы. Процедура строится следующим образом. На первом шаге из всего множества M векторов выбираются два (обозначим их x 1 , x M ) наиболее «удалённых» вектора, для которых величина

R 1, M = xXl x M ^/U x lll ll x M II (8) минимальна. Затем из оставшегося множества векторов к ним присоединяется по одному вектору ( x 2 , x M- 1 ), для которых величины

R 1,2 = X TI 2 2)/|| X 1|| || x 2 ||, (9)

R M -1, M = ( MM -1 Xm V|| XM -1|| ll x M II (10)

принимают максимальные значения. Пары векторов x1, x2 и xM-1, xM образуют два подпространства, описываемых матрицами X1,2 и XM-1,M соответственно. Далее определяются следующие два вектора x3, xM-2, бли- жайшие к этим двум подпространствам по критерию максимальной сопряжённости:

R 1,2,3 =

V TX T X 1 1 X T V

Х 3Л1,2 L Л1,2Л1,2 ] Л1,2 Х 3

T x T 3 x 3

RM - 2, M - 1, M

VT X    Гх T   X    T1 XT xm-2^m-1,M L m-1,m m-1,m ]    M-1,M

. (12)

x M - 2

кукуруза и соя, находятся на раннем этапе и покрывают меньше 5% изображения. Разработчиками тестового изображения предложен сокращённый вариант, включающий 200 спектральных полос изображения с разбиением изображения на 16 классов, притом не все из них являются взаимоисключающими. В частности, на снимке имеется неразмеченная область, которая не отнесена ни к одному из 16 классов. Данная область при проведении эксперимента не использовалась. Тестовое изображение, разбитое на классы, приведено на рис. 1, неразмеченная область показана белым цветом.

а)

Рис. 1. Тестовое изображение с разбиением на классы:

  • а)    исходное изображение;

  • б)    классификация по критерию спектрального угла;

  • в)    классификация по показателю сопряжённости

В эксперименте исследовалось достижимое качество классификации по показателю сопряжённости в сравнении с методом спектрального угла. В качестве критерия качества использовалось отношение числа правильно распознанных гиперпикселей к общему числу гиперпикселей тестового изображения. Поскольку доступным для экспериментов было только одно тестовое изображение без априорного разбиения на тестовую и обучающую части, для оценки качества алгоритмов распознавания применялась процедура скользящего контроля. Эта процедура позволяет разбить исходные данные N различными способами на две непересекающиеся подвыборки, одна из которых будет обучающей, а другая – тестовой. При этом тестовая выборка имеет долю 1/ N векторов, а обучающая – ( N –1)/ N .

Отметим, что полученное случайное разбиение обладает существенным недостатком – несбалансированностью количества представителей разных классов. В случае отсутствия (или недостаточного количества) представителей одного или нескольких классов в обучающей выборке качество классификации может быть существенно снижено. Для преодоления проблемы несбалансированности использовалась процедура стратифицированного скользящего контроля, разбивающего данные таким образом, что общая доля векторов каждого класса сохраняется как в тестовой, так и в обучающей выборке. При этом возможна оценка обобщающей способности алгоритма.

В табл. 1 и на рис. 1 а и б представлены сравнительные (по показателю сопряжённости и методу спектрального угла) результаты выполнения процедуры стратифицированного скользящего контроля с 5 блоками. На рисунках белыми точками на всех классах отмечены неверно классифицированные гиперпиксели.

Таблица 1. Результаты классификации

№ этапа

% верных классификаций

по показателю сопряжённости

по методу спектрального угла

1

62,7

50,9

2

64,1

48,7

3

61,0

48,7

4

61,6

49,4

5

65,2

50,1

Средний результат

62,9

49,6

В экспериментах исследовалась также описанная выше процедура разбиения класса на подклассы с использованием соотношений (8)–(12). В табл. 2 и на рис. 2 а приведены результаты классификации по показателю сопряжённости с предварительным разбиением каждого класса на 2 подкласса. На рис. 2 а , как и ранее, белыми точками на всех классах отмечены неверно классифицированные гиперпиксели.

Таблица 2. Результаты классификации с предварительным

Рис. 2. Результат классификации: а) с разбиением на два подкласса;

б) с вычитанием среднего и разбиением на подклассы

Был проведён также эксперимент по проверке степени влияния на качество классификации преобразования, заключающегося в вычитании из всех векторов среднего вектора, вычисленного по всем гиперпикселям тестового изображения. В табл. 3 и на рис. 2 б приведены результаты работы классификатора, основанного на показателе сопряжённости, с предварительным вычитанием среднего вектора и разбиением классов на подклассы.

Таблица 3. Результаты с вычитанием среднего и разбиением на подклассы

№ этапа

% верных классификаций

1

71,2

2

71,8

3

71,2

4

74,0

5

69,6

Средний результат

71,6

Заключение

Приведённые эксперименты показывают возможность достижения более высокого качества тематической классификации с использованием показателя сопряжённости по сравнению с методом спектрального угла. Подчеркнём, что векторы признаков в данном случае должны иметь одинаковые размерности, а их компоненты – характеризовать одноимённые спектральные диапазоны. Если в качестве обучающих гиперпикселей для классифицируемых областей используются данные из разных библиотек, содержащих данные в разных спектральных шкалах, необходимо решать задачу предварительного приведения данных к унифицированной спектральной шкале путём их интерполяции.

Работа выполнена при поддержке Министерства образования и РФФИ (проекты №13-07-12030 офи_м, № 12-07-00581-а).

Статья научная