Применение перцептивного хэширования для классификации изображений
Автор: Головачева М.И.
Журнал: Форум молодых ученых @forum-nauka
Статья в выпуске: 2 (6), 2017 года.
Бесплатный доступ
Статья посвящена задаче классификации изображений. Автором предлагается использование алгоритмов перцептивного хэширования в качестве метода классификации изображений. В статье приводится описание pHash алгоритма, основанного на дискретном косинусном преобразовании. Также приводится пример и результаты классификации с применением данного алгоритма.
Классификация изображений, перцептивное хэширование, хэш-фунции, дискретное косинусное преобразование
Короткий адрес: https://sciup.org/140277921
IDR: 140277921
Текст научной статьи Применение перцептивного хэширования для классификации изображений
Задача классификации – одна из классических задач машинного обучения. Данная задача имеет следующую формулировку: имеется множество объектов, разделённых некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется обучающей выборкой. Классовая принадлежность остальных объектов неизвестна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества [1].
Для классификации изображений можно применить алгоритм перцептивного хэширования.
Хэширование – это способ отображения множества данных произвольной длины в битовую строку фиксированной длины.
Перцептивные хэш-функции извлекают определенные признаки из изображения и на их основании вычисляют хэш – своеобразный отпечаток изображения. Далее, используя специальные функции, сравниваются значения хэшей изображений. Эти функции вычисляют коэффициент различия или сходства между двумя значениями перцептивных хэшей. Заключение о схожести изображений затем составляется на основании выбранного порогового значения [2].
В качестве примера, выполним классификацию 2539 изображений с различными вариантами начертаний буквы «а».
С помощью метода k-средних [3] выделим 8 центров кластеров, которые представлены на рисунке 1.

Рисунок 1 – Изображения центров кластеров
Выполним хэширование центров кластеров и изображений, классовая принадлежность которых неизвестна. Хэширование можно выполнить, например, с помощью метода pHash, основанного на дискретном косинусном преобразовании (DCT). В этом методе изображение рассматривается как совокупность пространственных волн. Дискретное косинусное преобразование позволяет переходить от пространственного представления изображения к его спектральному представлению и обратно.
Для построения перцептивного хеша с использованием дискретного косинусного преобразования необходимо:
-
1. Перевести изображение в оттенки серого;
-
2. Уменьшить изображение до квадрата 32×32 пикселя;
-
3. Выполнить дискретное косинусное преобразование для полученного изображения;
-
4. Выделить из полученной матрицы матрицу 8×8, начиная со второй строки и столбца;
-
5. Вычислить среднее значение элементов матрицы;
-
6. Построить хэш из полученной матрицы путем сравнения элементов со средним [2].
Для определения степени принадлежности изображения к тому или иному кластеру будем применять расстояние Хэмминга, которое вычисляет число позиций, в которых соответствующие символы двух слов одинаковой длины различны. Расстояние Хэмминга задается следующей функцией:
■/;;(X;,Xj) v' J.v':,j':|, где Х[, Xj - сравниваемые объекты, p - размерность объектов.
Если расстояние Хэмминга меньше 10, то между центром кластера и изображением есть сходство, поэтому последнее можно отнести к данному кластеру. Для проведения классификации необходимо сравнить каждое
Таблица 1 – Результаты классификации изображений
В таблице 1 приведены примеры полученных результатов классификации для каждого кластера.
Таким образом, была показана эффективность применения на практике алгоритма перцептивного хэширования для классификации изображений. Помимо метода pHash, основанного на дискретном косинусном преобразовании, существует множество других алгоритмов перцептивного хэширования, таких как хэш на основе гистограмм цветов, хэш по среднему и т.д. Описание данных алгоритмов дано в статье авторов И.В. Рудакова и И.М. Васютович [2].
Список литературы Применение перцептивного хэширования для классификации изображений
- Классификация. Машинное обучение [Электронный ресурс]. URL: http://www.machinelearning.ru/wiki/index.php?title=Классификация (дата обращения 03.02.2017).
- Рудаков И.В. Исследование перцептивных хеш-функций изображений / И.В. Рудаков, И.М. Васютович // Наука и образование: научное издание МГТУ им. Н.Э. Баумана. - М.: МГТУ им. Н.Э. Баумана, 2015. - №8. - 269-280 с.
- Методы кластерного анализа. Итеративные методы [Электронный ресурс]. URL: http://www.intuit.ru/studies/courses/6/6/lecture/184 (дата обращения 04.02.2017).