Подход к распознаванию зрительных образов на основе эталонных образов и обучения

Автор: Батырканов Ж.И., Кудакеева Г.М., Субанкулова Ж.Ж.

Журнал: Огарёв-online @ogarev-online

Статья в выпуске: 15 т.5, 2017 года.

Бесплатный доступ

Рассматривается и решается задача распознавания зрительных образов. При этом под образом понимается конкретное проявление распознаваемого объекта. Предлагается подход к распознаванию зрительных образов на основе использования базы эталонных образов и процедуры обучения. Предлагаемый подход можно применять для распознавания рукописного текста, идентификации личности по биометрическим данным и решения других подобных задач.

Образ, объект распознавания, считывающее устройство, цифровой образ, эталонный образ

Короткий адрес: https://sciup.org/147249389

IDR: 147249389

Текст научной статьи Подход к распознаванию зрительных образов на основе эталонных образов и обучения

Существуют различные подходы и методы распознавания зрительных образов: распознавание на основе оценок определяющих признаков, распознавание на основе аналогий, распознавание на основе обучения и использования эталонных образов. Среди этих подходов наиболее универсальным и эффективным, на наш взгляд, является подход на основе использования эталонных образов и обучения. Ниже предлагается подход к решению задач распознавания рукописного текста и идентификации личности по биометрическим данным.

последовательном выполнении двух этапов:

  • 1)    зрительный образ предъявляется считывающему устройству;

  • 2)    считывающее устройство переводит зрительный образ в двоичный компьютерный образ.

В качестве считывающего устройства может служить сканирующее устройство, цифровой фотоаппарат, смартфон, рецепторная матрица и другие специальные устройства. Алгоритм распознавания заключается в последовательном сравнении поступившего двоичного образа со всеми двоичными образами из базы эталонных образов. При сравнении вычисляются количественные оценки близости, например, по эвклидовой разности сравниваемых двоичных образов. Тот эталонный двоичный образ, для которого вычисляемая величина эвклидовой разности минимальна, определит класс объекта, к которому принадлежит предъявленный для распознавания образ.

При распознавании рукописного текста алгоритм распознавания состоит в распознавании букв предъявленного слова, а затем в сборке распознанных букв в слово, которое затем ищется в словаре (существующей базе данных). Алгоритм распознавания личности по биометрическим данным осуществляется по аналогичной схеме.

Процедура обучения при применении данного подхода к распознаванию состоит в корректировке алгоритма распознавания на этапе разработки и обучения системы. Рассмотрим как это делается на примере распознавания зрительных образов.

Процедура подготовки и обучения системы. В самом начале последовательно на рецепторную матрицу считывающего устройства подается определенное количество образов первого объекта А. При предъявлении конкретного образа А1 активируются определенные ячейки рецепторной матрицы. Активацию ячеек матрицы можно представить в виде конкретной числовой матрицы, при этом размер числовой матрицы определяется размером рецепторной матрицы. Имеем числовую матрицу типа

A =

a11

a 21

, a M i

a12,...a1N a 22,... a 2N aM 2,... aMNJ

,

где a j  Ъ

Далее предъявляется образ А2 объекта А и так до последнего возможного образа AL объекта А. Совокупность образов A1 , A2 ,..., AL объекта А записывается в память компьютера как база данных эталонных образов объекта А. Эта процедура повторяется для всех объектов

(В… С). В итоге в компьютере создается база данных эталонных образов объектов

А, В,…, С:

А={А1, А2,…, АL}, В={В1, В2,…, ВР}, С={С1, С2,…, СМ}.

После этапа обучения система готова к распознаванию предъявленных образов.

Алгоритмы распознавания.

Предлагается два варианта алгоритма распознавания.

1-й вариант алгоритма распознавания.

Процедура классификации, т.е. отнесения предъявленного образа к тому или иному объекту происходит по следующей схеме. При предъявлении рецепторной матрице образа Х в компьютере образуется числовой образ в виде матрицы:

( X .1

X 12 ,.

v A

..  1 N

x =

X21

X 22 ,.

.X 2 N

ч X M 1

X M 2,

..X MN >

Чтобы отнести образ Х к тому или иному классу объектов А, В… С, осуществляется процедура последовательного вычисления нормы от разностей матрицы Х со всеми матрицами A1 ,A2 ,..., AL ,B1 ,..., C1 ,..., CM , которые хранятся в базе эталонных образов объектов А, В, … С. Норму вычислять удобно в виде эвклидовой нормы разностей матрицы (1), (2), (3) в виде

.                                   (4)

Среди этого множества (4) существует одна минимальная норма. Пусть, например, минимальная норма разностей будет для образа BS

.                                (5)

Тогда компьютер активирует выход В выходного слоя. Это говорит о том, что предъявленный образ Х относится к объекту В.

Описанный алгоритм классификации (распознавания) работает не только в случаях, когда матрица Х полностью совпадает с матрицами A1,..., CM , но и в тех случаях, когда Х не совпадает ни с одной из них. При этом используется «принцип близости», который в теории распознавания заключается в том, что образы для одного и того же объекта в пространстве признаков должны располагаться близко друг к другу.

2-й вариант алгоритма распознавания.

Далее осуществляется вычисление скалярных произведений вектора X со всеми векторами

A1

M ..,           .

Скалярное произведение вектора изображения X на векторы эталонов A1,...,CM характеризует их сходство, при этом изображение Х относят к тому классу эталонов, для которого одно скалярное произведение среди  (x, A1)...  (x, CM) дало максимальное значение.

Таким образом, нами предложен подход распознавания зрительных образов с процедурой обучения и использования базы эталонных образов. Для более точной и достоверной работы распознающего устройства необходимо увеличивать количество ячеек рецепторной матрицы, а также базу эталонных образов распознаваемых объектов.

Список литературы Подход к распознаванию зрительных образов на основе эталонных образов и обучения

  • Хант Э. Искусственный интеллект. - М.: Мир, 1978. - 558 с.
  • Хайкин С. Нейронные сети: полный курс Neural Networks: A Comprehensive Foundation. - 2-е изд. - М.: Вильямс, 2006. - 1104 с.
  • Журавлев Ю. И. Избранные научные труды. - М.: Магистр, 2002. - 420 с.
  • Батырканов Ж. И. Системы искусственного интеллекта. - Бишкек: ИЦ «Текник», 2013. - 138 с.
  • Батырканов Ж. И., Кудакеева Г. М. Подход к распознаванию зрительных образов на основе эталонов и обучения // Известия Кыргызск. гос. техн. ун-та им. И. Раззакова. - 2015. - №1 (34). - С. 11-13. EDN: WGYANT
Статья научная