Исследование эффективности применения технологий вейвлет-анализа в задачах распознавания образов

Бесплатный доступ

Работа посвящена экспериментальному сравнению точности методов классификации на задаче распознавания образов на изображениях с использованием технологий вейвлет-анализа и без. В частности, исследуется взаимодействие кольце-проекционного вейвлет-фрактального метода для выявления признаков с классическими методами классификации, такими как «Наивный классификатор Байеса» и «Машины опорных векторов». Экспериментальные результаты тестирования приводятся в виде таблицы. В итоге устанавливается, что внедрение вейвлет-анализа в построение моделей классификации изображений оправдано, и приводит к относительно малому, но значимому повышению точности классификации.

Еще

Вейвлет анализ, распознавание образов, методы классификации, обработка данных, наивный классификатор Байеса, машины опорных векторов

Короткий адрес: https://sciup.org/14121888

IDR: 14121888   |   DOI: 10.47813/2782-2818-2021-1-1-23-28

Текст статьи Исследование эффективности применения технологий вейвлет-анализа в задачах распознавания образов

Распознавание образов является передовой областью, в настоящее время возникает множество новых технологий в ней, и, как известно, не существует абсолютного решения для задачи распознавания образов. Поэтому предлагается исследовать применение технологий вейвлет-анализа в задаче распознавания образов.

Технологии вейвлет-анализа достаточно перспективны и гибки в использовании и в связке с некоторыми алгоритмами машинного обучения могут повысить их точность и эффективность, в том числе, крайне существенно. Они могут быть применены на совершенно разных этапах процесса машинного распознавания образов: от выделения признаков и до выполнения классификации [1].

Один из главных этапов в классификации изображений это выделение набора значимых признаков на изображениях. Именно сюда будет легче всего внедрить вейвлет-анализ. Задача выделения признаков состоит в том, чтобы охарактеризовать образ и, кроме того, уменьшить размерность пространства изображения до пространства, подходящего для применения методов классификации [2].

В данной статье мы исследуем применение технологий вейвлет-анализа для построения моделей распознавания образов. А также, проведём экспериментальное сравнение эффективности применения особых методов вейвлет-анализа для выделения признаков и применения классических алгоритмов выделения признаков для последующей классификации. Таким образом, спроектируем математическую модель распознавания образов на основе технологий вейвлет-анализа.

2.    Методы

Для экспериментов же мы используем кольце-проекционный вейвлет-фрактальный метод (Ring-Projection-Wavelet-Fractal Method) [3]. Используемый метод можно отнести к классу методов выделения признаков ортогонального расширения.

Ранее, было выявлено, что в задаче анализа изображений двумерный вейвлет-анализ не особо эффективен, поэтому желательно свести задачу к одномерному вейвлет-анализу [4]. В этом и заключается основная идея кольце-проекционного вейвлет-фрактального метода: свести проблему двумерных объектов в одномерные, тогда мы можем использовать одномерное вейвлет-преобразование для решения проблемы распознавания. Блок схема алгоритма кольце-проекционного вейвлет-фрактального метода приведена на рисунке 1.

Рисунок 1. Блок схема алгоритма кольце-проекционного вейвлет-фрактального метода.

Используя кольце-проекционный вейвлет-фрактальный метод, мы получаем вектор признаков на выходе. Затем, можно использовать вектор признаков и базу данных всех признаков для классификации.

3.    Результаты

Проведём сравнение точности работы некоторых популярных методов классификации на задаче распознавания образов на изображениях с использованием кольце-проекционного вейвлет-фрактального метода для выявления признаков с классическим свёрточным методом выявления признаков. Для исследования возьмём следующие методы классификации: «Наивный классификатор Байеса» и «Машины опорных векторов». Алгоритмы были реализованы на языке Python, с использованием библиотек scikit-learn [5] и PyWavelets [6].

В качестве набора данных для задачи распознавания образов на изображениях выбрана классическая база данных изображений рукописных цифр MNIST [7]. Пример изображений из набора приведён на рисунке 2.

Рисунок 2. Пример изображений из набора данных MNIST.

В качестве альтернативы для сравнения степени изменения точности классификации при применении описанного кольце-проекционного вейвлет-фрактального метода выделения признаков были взяты стандартные свёрточные алгоритмы выделения признаков из изображения.

Так как набор данных не бинарный, то используется мульти классовый SVM: решающее правило основано на разбиении задачи на бинарные по схеме "один против остальных" (One-vs-Rest).

Для каждой комбинации метода классификации и метода выделения признаков проведено обучение, валидация и оценка точности на тестирующем множестве (20% от выборки). Для каждого метода классификации был проведён подбор наиболее эффективных гиперпараметров по сетке (Grid search). В итоге, для каждого метода высчитана точность при проведении повторной 10-и блоковой перекрёстной проверки (10-fold cross-validation). Данные о точности и скорости собраны в таблице 1.

Таблица 1. Результаты экспериментов.

Метод выделения

вектора признаков

Наивный байесовский

Метод опорных векторов (SVM)

Точно сть

классификатор

Время обучения (с.)

Время предсказан ия (с.)

Точно сть

Время обучения (с.)

Время предсказани я (с.)

Кольце-проекционный вейвлет-фрактальный

0.970

1.98

0.015

0.985

2.52

0.010

метод

Свёрточный алгоритм

0.942

1.15

0.009

0.973

1.88

0.006

4. Анализ

Первое что можно заметить – метод классификации SVM сработал во всех случаях лучше, чем наивный Байес. Однако нас интересует, способен ли исследуемый кольцепроекционный вейвлет-фрактальный метод выделения признаков превзойти стандартные свёрточные алгоритмы и дать выигрыш в точности классификации.

Как видно, нам удалость несколько повысить точность для обоих методов классификации. Статистическая значимость повышения точности подтверждается t-тестом Стьюдента при уровне значимости 0.05. При использовании наивного Байеса ошибка классификации была уменьшена на 93.3% (относительно), а при использовании SVM на 80.1%. Но в тоже время, использование вейвлет-анализа повышает как время обучения, так и время предсказания в обоих случаях. В среднем для обоих методов классификации, время обучения повышается на 53.1%, а время предсказания на 66.67%.

Таким образом, экспериментально установлено, что внедрение вейвлет-анализа в построение моделей классификации изображений полностью оправдано, как минимум в данной задаче распознавания образов рукописных цифр. Однако, нельзя утверждать, что представленный метод применения вейвлет-анализа будет также обеспечивать повышение точности при использовании других методов классификации, или же в иных задачах распознавания образов.

5.    Заключение

В работе выполнено экспериментальное сравнение точности методов классификации на задаче распознавания образов на изображениях с использованием технологий вейвлет-анализа и без.

Установлено, что внедрение вейвлет-анализа в построение моделей классификации изображений полностью оправдано, и приводит к относительно малому, но значимому повышению точности классификации. Таким образом, данный метод обладает широким потенциалом для внедрения в автоматизированные системы.

Однако, нельзя утверждать, что представленный метод применения вейвлет-анализа будет также обеспечивать повышение точности при использовании других методов классификации, или же в иных задачах распознавания образов. Таким образом, дальнейшие исследования в этой области целесообразно направить эксперименты по взаимодействию кольце-проекционного вейвлет-фрактального метода с другими типами классификаторов, например, «K ближайших соседей», бустинг, случайный лес, с другими материнскими вейвлетами (помимо «мексиканской шляпы») и, конечно, на других, более сложных (чем MNIST) задачах распознавания образов.

Кроме того, использование вейвлет-анализа в распознавании образов не заканчивается только на методе выделения признаков. Исследование применения других технологий могут быть проведены в последующих исследованиях.

Статья