Методы классификации гиперспектральных изображений при экологическом мониторинге

Автор: Раменская Екатерина Вячеславовна, Ермаков Василий Васильевич, Кузнецов Михаил Павлович

Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc

Рубрика: Общая биология

Статья в выпуске: 4-5 т.18, 2016 года.

Бесплатный доступ

В статье рассмотрены методы классификации гиперспектральных изображений с целью идентификации участков, загрязненных нефтью/нефтепродуктами. Выявлена необходимость создания узкоспециализированного алгоритма классификации изображений, который позволит учесть недостатки других методов. Разработан алгоритм, позволяющий получить классификацию высокого качества.

Гиперспектральное изображение, методы классификации, дешифрирование, экологический мониторинг

Короткий адрес: https://sciup.org/148204806

IDR: 148204806

Текст научной статьи Методы классификации гиперспектральных изображений при экологическом мониторинге

территории с нанесенными на ней дешифрированными распознанными объектами [1].

Дешифрирование может производиться визуальными и автоматизированными методами. Визуальные методы предполагают ручной анализ снимков, при этом основным инструментом проведения визуального дешифрирования являются знания и интуиция дешифровщика. Визуальные методы дешифрирования подразумевают наличие большого опыта у специалиста, проводящего дешифрирование.

Появление цифровых снимков стало основанием для развития методов автоматизированного дешифрирования. В настоящее время существует целый ряд программных средств, применяемых для обработки данных ДЗЗ. Выбор программы предопределяет конкретная решаемая задача, объем обрабатываемых данных и степень квалификации исполнителя. Среди многочисленных программных пакетов наибольшее распространение получили ENVI, ERDAS Imagine, PCI Geomatica. Перечисленные программные пакеты обеспечивают полный комплекс обработки, являются лицензионными и дорогостоящими. Между тем существуют бесплатные программы, такие как MultiSpec и ILWIS, с помощью которых можно выполнить основные операции, необходимые для картографирования и мониторинга природный изменений.

В основе большинства методов машинной классификации объектов лежат формализованные дешифровочные признаки. При обработке многозональных снимков используются признаки спектральной яркости, и решается задача определения количественных связей между спектральной яркостью и характеристикой объекта. Задача классификации заключается в разбиении некоторой группы объектов на классы на основе определенных требований [2]. К одному классу при этом относятся объекты, обладающие одинаковой спектральной яркостью. Для решения этой задачи используются различные алгоритмы теории распознавания образов, математической статистики, кластерный анализ.

Одной из актуальных задач стадии тематической обработки изображений, которая часто возникает на практике, становится выбор метода их классификации. Различают два вида классификации: с обучением (контролируемая классификация) и без обучения (неконтролируемая). Выбор того или иного вида классификации обусловлен поставленными задачами в исследовании. Наибольший интерес представляют методы контролируемой классификации, которые учитывают априорную информацию о типах объектов и вероятности их представления данными изображения, эталонных значениях спектральных характеристик этих объектов.

Алгоритмы контролируемой классификации основываются на методах, среди которых основными являются [3]:

  • -    метод параллелепипедов;

  • -    метод классификации по минимальному расстоянию;

  • -    метод дистанции Махаланобиса;

  • -    метод классификации по правилу максимального правдоподобия.

Метод параллелепипедов реализует наиболее простой алгоритм, основанный на статистическом подходе. В методе используются сведения о классах, полученные в процессе обучения в виде векторов средних значений яркости и векторов дисперсии. Этот метод применяется, когда значения спектральной яркости разных объектов практически не перекрываются, а классов объектов немного.

Метод минимального расстояния (называемый также методом спектрального расстояния) подсчитывает спектральное расстояние между вектором значений пикселя-кандидата и вектором средних значений каждой обучающей выборки. Метод используется, когда спектральные признаки разных классов похожи, и диапазоны значений их яркости перекрываются.

Метод расстояний Махаланобиса сходен с методом минимального расстояния и отличается лишь тем, что в процессе классификации измеряется не эвклидово, а расстояние Маха-ланобиса. Это позволяет учесть распределение (дисперсию) значений яркости пикселей в эталонных участках.

В методе максимального правдоподобия пиксель приписывается к тому классу, который максимизирует функцию правдоподобия классификации. Количество и параметры классов задаются пользователем путем указания обучающих выборок. Данный метод имеет высокую точность, учитывает дисперсию значений признаков классов (как в методе расстояния Махаланобиса) и не оставляет неклассифицированных пикселей (как в методе минимального расстояния).

Для решения задачи классификации гиперспектральных изображений с целью идентификации участков почвы, загрязненных нефтью/ нефтепродуктами, были применены все перечисленные методы. В работе объектом исследования выступил гиперспектральный снимок, полученный в ходе лётных испытаний самолета-лаборатории, с пространственным разрешением 2 м. На снимке отображена территория предприятия, на которой располагаются восемь нефтешламона-копителей, образованных в ходе эксплуатации установки комплексной подготовки нефти и при ликвидации аварийных разливов нефти. Группа накопителей включает накопители действующие и закрытые на рекультивацию.

В ходе обработки изображения было замечено, что в видимой части спектра электромагнитного излучения трудно отличить тёмные участки почвы, загрязненные нефтью и нефтепродуктами, от теней, отбрасываемых зданиями и растительностью, а также других слабоотражаю-щих объектов. В ближней инфракрасной области наблюдается разделение спектральных кривых отражения теней и нефти/нефтепродуктов, что позволяет применять алгоритмы классификаций для идентификации нефтезагрязненных участков земли по данным дистанционного зондирования.

Рассматриваемые методы позволили идентифицировать некоторые нефтешламонакопители, однако полученные результаты классификаций изображения нельзя считать удовлетворительными по причине низкого процента правильно идентифицированных объектов (менее 70% верно идентифицированных пикселей снимка) [4]. В этой связи возник вопрос создания узкоспециализированного алгоритма классификации.

Предлагаемая методология анализа гиперспектральных изображений включают в себя следующие шаги. Сначала определяется необходимый набор изображений поверхности Земли (гиперспектральных снимков). Затем экспертом производится маркировка изображений, при этом на каждом снимке выделяются земельные участки, которые загрязнены нефтью/нефте-продуктами с высокой степенью уверенности (например, в результате полевых исследований). Кроме того, выделяются участки, которые не загрязнены, но которые трудно отличить от нефтяного загрязнения. В такие области, как правило, входят тени инфраструктурных зданий, малых водоемов, тени облаков, и другие.

Для отмеченной сформированной выборки решается проблема двухклассной классификации спектров, при этом спектры, соответствующие нефтяному загрязнению, являются объектами класса интереса, а все остальные спектры, которые присутствуют в изображении, являются объектами других классов.

Алгоритм классификации включает в себя два этапа. На первом этапе выполняется процедура кластеризации размеченных областей интереса. Для этого выполняется процедура оценки смеси распределений, а также подсчитываются расстояния Махаланобиса между всеми центрами кластеров [5]. На втором этапе выполняется процедура классификации объектов, признаковым описанием которых является набор расстояний Махаланобиса до вычисленных центров кластеров. В качестве процедуры классификации в данной работе рассматривается алгоритм построения решающего дерева [6]. Выбор этого простого и универсального метода классификации основан на предположении, что объекты разных классов являются хорошо разделимыми в построенном признаковом пространстве расстояний.

Метод является интерпретируемым в контексте моделируемого явления: областями интереса считаются те точки изображения, форма спектров которых схожа с формой спектров центров кластеров. Кроме того, вычислительная сложность процедуры обучения является линейной по количеству объектов, что является необходимым требованием при обработке изображения большого размера, количество точек которого достигает 107.

Алгоритм позволил получить высокое качество классификации гиперспектрального изображения (92% верно идентифицированных пикселей). Такой процент идентификации может быть связан с неявным загрязнением почвы, которую можно считать условно чистой. На снимках, сделанных в разное время и при разных условиях (состав атмосферы, угол солнца), были определены нефтезагрязнения, различающиеся по своему химическому составу и агрегатному состоянию (водонефтяные эмульсии, застарелые нефтешламы, битумы) [7]. Алгоритм позволил отделить нефтезагрязненные участки почвы от других слабоотражающих объектов. Подтверждением работы алгоритма служит также идентифицируемый нефтезагрязненный участок, о существовании которого изначально не было никакой информации. При сопоставлении классифицированного снимка с картой было установлено, что это участок нефтеналивной станции, где вероятность загрязнения почвы достаточно высока.

Список литературы Методы классификации гиперспектральных изображений при экологическом мониторинге

  • Кашкин В.Б., Сухнин А.И. Дистанционное зондирование Земли из космоса. Цифровая обработка изображений: Учебное пособие. М.: Логос, 2001. 264 с.
  • Чандра А.М., Гош С.К. Дистанционное зондирование и географические информационные системы. М.: Техносфера, 2008. 312 с.
  • Шовенгердт Р.А. Дистанционное зондирование. Модели и методы обработки изображений. М.: Техносфера, 2010. 560 с.
  • Токарева О. С. Обработка и интерпретация данных дистанционного зондирования Земли: учебное пособие. Томск: Изд-во Томского политехнического университета, 2010. 148 с.
  • Mahalanobis P. On the generalized distance in statistics//Proceedings of the National Institute of Science 12 (1936): 49-55.
  • Ross Quinlan J. Induction of decision trees//Machine learning, 1(1):81-106, 1986.
  • Получение опорных спектральных сигнатур при гиперспектральной съемке/А.О.Гурьянова, Е.В. Раменская, А.Г. Мандра, В.В. Ермаков//Экология и промышленность России. 2014. №10. С.44-48
Статья научная