Метод классификации текстур с использованием структурных характеристик изображения
Автор: Асатрян Давид Гегамович, Куркчиян Вардан Вардгесович, Харатян Луиза Рафаэловна
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений: Восстановление изображений, выявление признаков, распознавание образов
Статья в выпуске: 3 т.38, 2014 года.
Бесплатный доступ
В статье предлагается новая методика для анализа и классификации текстур, основанная на использовании структурных свойств изображения. Известно, что визуальная система человека успешно воспринимает содержание изображения по визуализированной совокупности краёв и границ, имеющихся в изображении. В данной работе в качестве характеристики структуры изображения предлагается использовать совокупность магнитуд градиента изображения. Магнитуда градиента считается случайной величиной, имеющей двухпараметрическое распределение Вейбулла, а в качестве характеристики близости двух изображений используется специальная мера близости оценок параметров соответствующих распределений. Классификация выполнена методом сравнения с эталоном на примере базы данных университета Гейдельберга (Германия), которая содержит 10 классов текстур. В качестве эталонов использован набор средних значений оценок параметров распределения Вейбулла, рассчитанных по совокупности магнитуд градиента текстур обучающей выборки, а сравнение выполнено по предложенной мере близости. В результате анализа выявлены два практически неразличимых класса, а для остальных 8 классов показано, что ошибка классификации в среднем составляет около 18 %.
Классификация, текстура, магнитуда градиента, распределение вейбулла, мера сходства
Короткий адрес: https://sciup.org/14059277
IDR: 14059277
Текст научной статьи Метод классификации текстур с использованием структурных характеристик изображения
Классификация текстур является одной из важных областей обработки изображений, компьютерного зрения и их приложений, таких как анализ сцен, распознавание образов, дистанционное зондирование, поиск содержательной информации и т. д. Целью классификации является отнесение неизвестного образца изображения к одному из заранее заданных классов. Класс текстур обычно задаётся в виде некоторого множества изображений, выбранных по определённым содержательным или формальным признакам. Как известно, нет однозначного и чёткого определения понятия «текстура» (см., например, [1], в которой приведены наиболее часто встречаемые определения и даны соответствующие комментарии). Поэтому выбранные для классификации классы текстур, как правило, являются в определённой степени условными.
При решении задачи классификации текстур необходимо задать (или найти подходящее) описание (дескриптор) и меру близости изображений, соответствующую этому описанию. Как показывает даже беглый анализ научной литературы, предложено множество различных дескрипторов, применённых к одним и тем же типам, классам или базам текстур. При этом в каждый класс могут входить изображения одних и тех же реальных объектов, которые отличаются размерами, повёрнуты друг относительно друга, имеют различные цветовые характеристики, подвергнуты определённым геометрическим преобразованиям и искажениям. Поэтому наибольший интерес представляют методы классификации, инвариантные относительно указанных факторов [2]. Многие предложенные в литературе инвариантные процедуры основаны на использовании определённых элементов структуры в изображении, например, отрезков прямых линий или линий фиксированной конфигурации, повторяющихся групп пикселов (элементов текстуры – тексе- лов) и др., в соответствии с тем, как воспринимает структуру текстуры визуальная система человека (ВСЧ). В качестве наглядного примера укажем работу [3], в которой решена задача классификации типов кристаллических решёток по совокупности признаков структуры, обусловленных ориентировкой и распределением составных частей породы. Краткий обзор инвариантных методов классификации текстур можно найти в [4–8].
В настоящей работе мы ограничиваемся рассмотрением текстурных изображений, структура которых может быть охарактеризована совокупностью существующих в них краёв и границ. Большинство процедур, работающих со структурами подобного типа, применяют дескрипторы, использующие определённые свойства градиентного поля.
В одной из ранних работ предложен дескриптор, использующий магнитуду градиента и названный авторами «количество краёв в единице площади (Amount of edge per unit area)» [9]. Согласно этому дескриптору, каждому пикселу изображения ставится в соответствие магнитуда градиента, вычисленная по интенсивности пикселов из некоторой его окрестности. Далее определяется среднее значение магнитуды, приходящееся на единицу площади изображения, по которому и можно производить классификацию текстур. В дальнейшем этот метод был использован в других работах, однако в них непосредственно рассчитывались лишь некоторые числовые характеристики совокупности магнитуд. Между тем анализ работ с использованием градиентного поля изображения показывает необходимость изыскания достаточно общей математической модели, пригодной для анализа и классификации текстур без ограничения на наличие её конкретных свойств. Основой для такой модели может послужить предположение о случайном характере магнитуды градиента текстуры и типе распределения.
Важным является вопрос о распределении магнитуды градиента, которое существенным образом зависит от распределения интенсивностей пикселов самого изображения. Ввиду огромного разнообразия типов и содержания изображений отметаем стремление отыскать универсальную модель распределения интенсивностей пикселов произвольного изображения и ограничиваемся рассмотрением лишь определённых классов изображений, для которых применение конкретной модели имеет теоретическое или хотя бы экспериментальное обоснование . Анализ научной литературы показывает, что удобным и распространённым типом изображения является текстура, а подходящим распределением для магнитуды градиента текстуры является двухпараметрическое распределение Вейбулла. Так, данное положение теоретическими и экспериментальными исследованиями обосновано в [10]. Определённые теоретические обоснования приведены также в [11].
Следует отметить, что, применяя вейбуллиевскую модель, мы заменяем всё изображение текстуры (или её рассматриваемую часть) всего двумя параметрами, что в случае адекватности модели даёт огромное преимущество в задачах поиска информации и классификации в больших базах данных. Важность разработки быстрых методов поиска информации с применением текстурных признаков и других дескрипторов отмечается в литературе (см., например, [12]). Однако при применении вейбуллиевской модели для ускорения процедур поиска придётся сталкиваться с некоторой потерей точности, что, впрочем, в каждом аналогичном случае может оцениваться и приводить к определённому компромиссу.
Основываясь на приведённых выше рекомендациях, один из авторов настоящей работы в статье [13] предложил меру близости двух изображений, которая основана на двухпараметрической вейбуллиевской модели с использованием структурной характеристики, определяемой совокупностью значений магнитуды градиента изображения. Конкретный вид данной меры зависит от статистических оценок параметров распределения Вейбулла по выборкам магнитуд градиента сравниваемых изображений. В работе показано существенное достоинство данной меры – её инвариантность относительно различных манипуляций с изображением (повороты, масштабирование и др.). А это свойство весьма важно при классификации изображений, т.к. набор текстур, отобранных для классификации по какому-либо принципу, например, путём визуального анализа, может содержать образцы, полученные от исходного путём преобразований указанного типа.
Модели, основанные на распределении Вейбулла, с успехом применялись в различных прикладных задачах [11, 14]. Так, вейбуллиевская модель для магнитуды градиента легла в основу алгоритма обнаружения дефектов текстур, описанного в работе [14]. Процедура классификации, предложенная в этой модели, основана на использовании метода опорных векторов в пространстве параметров распределения Вейбулла. Однако в случае, если число классов больше двух, данная процедура классификации нуждается в соответствующем обобщении.
В настоящей работе предложена процедура классификации, основанная на методе сравнения с эталоном при использовании упомянутой меры близости изображений. На конкретном примере набора данных текстур показана эффективность предложенной процедуры.
Мера сходства изображений текстур
Рассмотрим полутоновое 8-битовое изображение I = { I ( m , n )} с размерами M × N , m = 0, 1,…, M – 1, n = 0, 1,…, N – 1, где I ( m , n ) – интенсивность пиксела с координатами ( m , n ).
Матрицы горизонтального и вертикального градиентов изображения обозначим через || G H ( m , n )|| и || G V ( m , n )|| соответственно, а матрицу магнитуды градиента – через || M ( m , n )||, где
M ( m, , n ) = GH 2 ( m , n ) + GV 2 ( m , n ) . (1)
В общем случае можно считать, что градиентное поле представляет собой двумерную случайную выборку вида
G ( m, n ) = [ GH ( m, n ) , GV ( m, n ) ] .
Магнитуда градиента (1) считается случайной величиной, имеющей распределение Вейбулла с плотностью распределения
η- 1
n I x I f ( x ; n , о ) =—I — I exp
о l о)
x
η
σ
, x ≥ 0,
где η>0 – параметр формы, а σ>0 – параметр масштаба.
В качестве меры структурной близости двух изображений, у которых распределения вероятностей магнитуды градиента описываются функциями f 1 ( x ; η 1 , σ 1 ) и f 2 ( x ; η 2 , σ 2 ) соответственно, в работе [13] предложена
2 min( η 1 , η 2 ) min( σ 1 , σ 2 ) 2
= ,< .
max( η 1 , η 2 ) max( σ 1 , σ 2 )
При выполнении численных расчётов производится статистическое оценивание параметров распределения (2) методом моментов применительно к матрице (1), элементы которой находятся при помощи оператора Собела.
Небольшая модификация процедуры оценивания близости и классификации, описанной в настоящей работе, позволяет применять её и в случае цветных изображений.
В работе [13] приведены примеры, показывающие инвариантность меры (3) относительно различных преобразований изображений, в том числе поворотов и масштабирования.
Приведём пример, иллюстрирующий инвариантность предложенной меры сходства изображений текстур.
Пример. На рис. 1 приведён фрагмент изображения некоторой текстуры (рис. 1а) и результаты двух транс- формаций этого фрагмента: поворота на 45° (рис. 1б) и увеличения размеров в 1,5 раза (рис. 1в).

Рис. 1. Примеры трансформированных текстур
В табл . 1 приведены соответствующие значения W 2, указывающие на значительное сходство этих изображений, несмотря на поворот и масштабирование исходного изображения. Расчёт PSNR возможен только для первых двух изображений и даёт результат сходства в 12,5 дБ , что никак нельзя считать удовлетворительным.
Таблица 1. Мера близости трансформированных текстур
Изображения |
(a) и (б) |
(a) и (в) |
(б) и (в) |
W 2 |
0,97 |
0,94 |
0,96 |
Методика классификации текстур
Предполагается, что заданы классы текстур, выбранные по некоторому принципу, отвечающему задачам определённого исследования, а также некоторое множество текстур, которые необходимо классифицировать. Предлагаемая процедура классификации основана на методе сравнения с эталонами и включает следующие шаги:
Шаг 1. Для каждого изображения текстуры из обучающей и тестируемой выборок оцениваются параметры распределения Вейбулла η и σ.
Шаг 2. Определяются средние значения ηi и σi оценок параметров ηˆi и σˆi для i = 1, 2,…, 10 по соответствующим образцам обучающей выборки. Эти значения запоминаются в качестве эталонных для последующего сравнения с ними тестовых образцов . Определяются также среднее значение W 2 и среднеквадратическое отклонение Si меры близости W2 по всем парам образцов каждого класса с номером i = 1, 2,…, 10.
Эти значения используются при оценивании степени сходства текстур внутри классов из обучающей выборки.
Шаг 3. Для каждого тестируемого образца текстуры по формуле (3) рассчитывается мера его близости с каждым эталоном. Принадлежность образца к какому-нибудь классу опр еделяется по максимальному значению меры близости.
Результаты экспериментов
Для проверки эффективности предлагаемого метода классификации нам представлялось целесообразным найти в сети Интернет готовые классы текстур , отказываясь от более простого и довольно распространённого метода искусственного создания обучающей выборки, получаемой в результате поворотов или иных преобразований одних и тех же образцов текстур. Типичным является подход, при котором из некоторого набора текстур (например, из известного набора Brodatz) выбираются отдельные образцы, каждый из них делится на определённое количество непе-ресекающихся частей. Затем часть полученных таким образом изображений используется как обучающая выборка, а остальная часть – как тестовая (укажем в качестве примера работу [15]). Основанием для отказа от подобного подхода служит ожидаемый низкий процент ошибок классификации ввиду того, что при подобных преобразованиях структура текстуры в принятом выше смысле практически не меняется (что иллюстрируется рассмотренным выше примером).
В данной работе проведены численные эксперименты по классификации текстур на примере базы данных университета Гейдельберга [16], в которой представлены 10 классов текстур с 7475 образцами. Изображения, включённые в каждый из классов, получены авторами [16] методом моделирования, визуально аналогичны изображениям реальных текстур. На рис. 2 для наглядности приведены образцы текстур из рассматриваемой базы данных.


Рис. 2. Образцы текстур из базы данных [16]


Следует отметить, что принцип, согласно которому авторы [16] создали именно эти классы, нам неизвестен. Поэтому вопрос о том, насколько заданные классы различимы по тому или иному дескриптору, можно решить лишь экспериментальным путём. Ка ждый класс нами был разбит на два подкласса с при мерно одинаковым количеством образцов, один из которых используется в качестве обучающего класса, а другой – в качестве тестового.
В табл. 2 приведены эталонные значения η i и σ i для обучающей выборки с 10 классами, а также средние W 2 и среднеквадратические отклонения S i значений меры близости внутри каждого класса.
Анализируя данные табл. 2, можно обнаружить достаточно высокие значения меры сходства текстур внутри каждого класса. Можно также заметить близость эталонных параметров классов с номерами 3 и 9 ( W 2 = 0,983), что может служить основанием для объединения этих классов или выполнения других действий по усмотрению персоны, проводящей исследование. В данном контексте важно лишь то, что предложенная методика позволяет обнаруживать плохо различимые классы текстур из числа заданных.
Табл. 2. Параметры обучающей выборки
Номер класса |
N |
η i |
σ i |
W 2 |
si |
1 |
288 |
132,56 |
1,849 |
0,858 |
0,091 |
2 |
288 |
293,01 |
1,515 |
0,908 |
0,060 |
3 |
288 |
79,92 |
1,992 |
0,950 |
0,034 |
4 |
288 |
55,08 |
1,062 |
0,951 |
0,029 |
5 |
288 |
119,68 |
1,979 |
0,953 |
0,031 |
6 |
288 |
286,58 |
1,657 |
0,931 |
0,051 |
7 |
575 |
49,53 |
1,169 |
0,858 |
0,074 |
8 |
575 |
69,18 |
1,973 |
0,960 |
0,026 |
9 |
575 |
78,63 |
1,990 |
0,946 |
0,036 |
10 |
288 |
93,12 |
1,255 |
0,950 |
0,030 |
По описанной выше методике проведена классификация тестовой выборки, состоящей из половинок классов. Результаты классификации приведены в табл. 3.
В строке с номером i расположены данные о количестве тестируемых текстур i -го класса, отнесённых процедурой классификации к каждому из 10 классов. Все числа каждой строки, кроме числа, размещённого в столбце с тем же номером i , представляют количество ошибочно классифицированных текстур, процентные отношения которых приведены в последнем столбце.
Как и следовало ожидать, максимальное число ошибок классификации приходится на классы с номерами 3 и 9 и составляет примерно 50 % от объёма подкласса. Для остальных классов процент ошибок находится в пределах от нуля до 23 % (в среднем около 18 %), что свидетельствует о достаточной различимости остальных восьми классов.
Таким образом, предложенная методика классификации позволяет различать классы текстур, используя предложенную меру сходства изображений, рассчитываемой по значениям оценок параметров распределения Вейбулла. Сравнительно высокий процент ошибок классификации в рассмотренном примере окупается инвариантностью предложенной процедуры к размерам, поворотам и другим характеристикам текстурных изображений.
В заключение отметим, что приведённые результаты в основном не противоречат выводам визуального анализа классов текстур.
Табл. 3. Распределение ошибок классификации по классам
Классы |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Процент ошибок |
1 |
222 |
0 |
7 |
0 |
54 |
0 |
0 |
1 |
3 |
0 |
22,6 |
2 |
0 |
227 |
0 |
0 |
0 |
60 |
0 |
0 |
0 |
0 |
20,9 |
3 |
0 |
0 |
144 |
0 |
0 |
0 |
0 |
13 |
130 |
0 |
49,8 |
4 |
0 |
0 |
0 |
277 |
0 |
0 |
10 |
0 |
0 |
0 |
3,5 |
5 |
4 |
0 |
0 |
0 |
283 |
0 |
0 |
0 |
0 |
0 |
1,4 |
6 |
0 |
10 |
0 |
0 |
0 |
277 |
0 |
0 |
0 |
0 |
3,5 |
7 |
0 |
0 |
0 |
96 |
0 |
0 |
479 |
0 |
0 |
0 |
16,7 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
571 |
4 |
0 |
0,7 |
9 |
0 |
0 |
227 |
0 |
0 |
0 |
0 |
61 |
287 |
0 |
50,1 |
10 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
288 |
0 |
Выводы
В статье предложена новая методика для анализа и классификации текстур, основанная на использовании структурных свойств изображения. В качестве характеристики структуры рассматривается совокупность магнитуд градиента изображения, для распределения которого принята двухпараметрическая вейбуллиевская модель. Для классификации текстур предложено использовать меру близости изображений, характеризующую близость значений статистической оценки параметров распределения Вейбулла, рассчитанной по соответствующим матрицам магнитуды градиента. Классификация выполнена мето- дом сравнения с эталонами на примере базы данных университета Гейдельберга (Германия), которая содержит 10 классов текстур. В качестве эталонов использованы средние значения оценок параметров распределения Вейбулла по текстурам обучающей выборки, а сравнение выполнено по предложенной мере близости. В результате анализа выявлено, что два класса практически неразличимы, а для остальных 8 классов ошибка классификации в среднем составляет около 18 %. Предложенная методика классификации может быть использована также при поиске изображения с определёнными структурными свойствами в больших базах данных.