Контурный анализ и современная оптика гауссовых пучков

Автор: Волостников Владимир Геннадьевич, Кишкин Сергей Александрович, Котова Светлана Павловна

Журнал: Компьютерная оптика @computer-optics

Рубрика: Дифракционная оптика, оптические технологии

Статья в выпуске: 3 т.38, 2014 года.

Бесплатный доступ

В работе представлено теоретическое исследование возможности использования математического аппарата спиральных пучков света в задачах распознавания контурных изображений. Даётся оценка предлагаемого подхода с точки зрения его преимуществ и недостатков, приводятся результаты численного моделирования, обсуждаются аспекты применения метода в рамках существующих практических задач.

Когерентная оптика, спиральные пучки света, контурные изображения

Короткий адрес: https://sciup.org/14059265

IDR: 14059265

Текст научной статьи Контурный анализ и современная оптика гауссовых пучков

Контурный анализ является одним из ключевых звеньев задачи распознавания изображений, суть которого заключается в исследовании изображения как набора контуров [1, 2]. В данной работе описывается новый способ распознавания контуров изображений, основанный на применении математического аппарата спиральных пучков – световых полей, сохраняющих свою структуру при фокусировке и распространении.

Сущность предлагаемого в работе подхода заключается в том, что все операции проводятся не с плоской кривой, задаваемой контуром, а с определяемым ею спиральным пучком. Это обусловлено тем, что выгоднее рассматривать обладающий рядом удобных свойств спиральный пучок (гарантированность его описания аналитическими равномерно-сходящимися функциями, большое количество способов его задания: амплитудой, корнями, коэффициентами разложения [3]).

Очевидно, что исход распознавания может (и должен) опираться на совокупность решений по многим выделенным на изображении контурам, и это легко достигается в том случае, когда существует механизм сравнения двух контуров. Именно нахождение качественных характеристик контура и извлечение из них информации о схожести является целью данной работы. Эта работа уточняет результаты, полученные в [4], а также обобщает подход распознавания на деформированные/зашумлённые контуры.

Отметим также, что область распознавания изображений разнообразна по применяемым методам и в последнее время ей уделяется значительное внимание как с теоретической, так и с практической точки зрения [5, 6].

1.    Описание контура

В задаче распознавания контурных изображений первой и обязательной процедурой является выделение границ (контуров) объекта. Но в данной работе подразумевается, что контуры уже были выделены одним из существующих способов. Следующим шагом является грамотное описание полученных контуров информацией, на основании которой будет непосредственно производиться процесс распознавания, а именно: её характеристики должны быть однозначны и инвариантны относительно различных факторов

(в частности, они не должны зависеть от выбора начальной точки). Забегая вперёд, отметим, что роль такой информации будут играть коэффициенты разложения спирального пучка. На рис. 1 приведено изображение корабля, на котором для простоты выделен единственный контур – его граница.

Рис. 1. Изображение (слева) и контур объекта (справа)

В данной работе математическим представлением контуров будем считать некоторые замкнутые плоские кривые, состоящие из упорядоченного набора точек:

Z ( t) = x ( t ) + iy(t ), t e [0, T ].

Очевидно, что любая замкнутая кривая представляет собой некоторую периодическую функцию с периодом T.

Конечно, каждый контур можно представить в виде бесконечного ряда по некоторой системе полных ортогональных функций. Задача разложения указанных функций детально освещена в [7], где приводятся классические базисы, применяемые в задачах распознавания изображений.

Проблема, однако, заключается в следующем. Конечный набор коэффициентов разложения по одномерному базису радикально зависит от того, с какой точки мы «начнём» кривую (задав её, таким образом, в интервале [0, T ] либо [ a , a + T ]). Конечно, с точки зрения кривой это не имеет никакого значения, но лишь при условии использования полного набора базисных функций, хотя на практике вычисления ведутся только с конечными суммами этих рядов. Следует отметить, что, если рассматривать кривую как двумерный объект, заданный на плоскости, эта проблема снимается. Однако платой за такой выбор является большое количество вычислений и асимптотический рост сложности таких алгоритмов. В данной работе рассматривается именно такой подход, в разделе 5 поясняется, как при этом бороться с указанными недостатками.

  • 2.    Контур как исходный объект для формирования спирального пучка

Исследование световых полей различного типа выявило новый тип световых пучков, названных спиральными [3]. Оказалось, что спиральный пучок представляет собой световое поле, сохраняющее свою структуру интенсивности с точностью до масштаба и вращения при распространении и фокусировке. Кроме того, структура такого светового поля может быть весьма разнообразной, в частности, оно может иметь форму произвольной плоской кривой, в том числе замкнутой.

Установлено, что комплексная амплитуда S ( z , z ) такого пучка для порождающей кривой ζ( t ) имеет вид:

S ( z , z | ζ ( t ), t [0, T ]) =

[- zz ] T     J Z ( t ) Z ( t ) 2 zZ ( t )

= exP KH exP 1-    2 +     )x        (2)

I P J 0     I P P J x exp |-1 j [?(<(т)-Z(<(Ti ] dr) | Z'( t) | dt,

IP 0                                 J где ρ – Гауссов параметр пучка, а черта означает комплексное сопряжение. Пример такой кривой и соответствующего ей спирального пучка приводится на рис. 2.

а)                     б)                   в)

Рис. 2. Порождающая кривая (а) и распределения интенсивности (б) и фазы (в) соответствующего спирального пучка

Важным является следующее свойство «квантования» спиральных пучков в виде замкнутых кривых. Если выполняется условие (квантования):

S curve = 12 πρ 2 N q , N q = 0, 1 , 2 ,                    (3)

где Scurve – площадь под кривой, то комплексная амплитуда пучка не зависит от начальной точки на кривой. Иными словами, спиральный пучок не определяется начальной точкой на контуре. Следовательно, любая конечная сумма ряда SN ( z , z | ζ ( t ), t [ a , a + T ]) также не будет зависеть от этой начальной точки с точностью до общего унимодулярного члена, зависящего только от параметра a . Таким образом, снимается проблема начальной точки в анализе и распознавании входного контура. Это означает, что мы с любой требуемой степенью точности можем поставить в соответствие спиральному пучку S ( z , z | ζ ( t ), t [ a , a + T ]) его конечную сумму ряда:

- zz Nc

S ( z , z | Z ( t ), t e [ a , a + T ]) = e P £ ^ z " .           (4)

n = 0

Приведённое ниже выражение показывает, что при этом снимается ещё и проблема поворота анализируемого контура, поскольку при его повороте на угол α конечная сумма ряда изменяется следующим образом:

S N ( zei α , z e - i α | ζ ( t ), t [ a , a + T ]) =

- zz N                    - zz N

= e P2 £(c„e")z" = e P2 £ c„z", n=0                       n=0

что лишний раз доказывает, что коэффициенты разложения способны характеризовать углы поворота.

Здесь следует отметить ещё один весьма важный аспект. Параметр квантования, как было показано в [8], определяет число нулей комплексной амплитуды внутри контура и, фактически, степень полинома, остающегося от исходной аналитической функции спирального пучка после взятия конечной суммы с требуемым количеством коэффициентов разложения. Очевидно, что если анализируемый контур сложен, то параметр квантования не может быть мал: нельзя сложное описать просто. Тем не менее, тот факт, что снимается проблема зависимости от выбора начальной точки и угла поворота, является весьма существенным и делает предлагаемый метод заслуживающим детального исследования.

  • 3.    Контурный анализ

Пусть имеются два контура, входной и контрольный, находящийся в базе данных, и необходимо определить, соответствуют они друг другу или нет.

Перед построением пучков сделаем следующее: выберем шаги комплексных сеток, на которых будут вычисляться спиральные пучки так, чтобы площади, ограниченные кривыми, были равными. Приведение к одной площади позволяет снять проблему неизвестного масштаба изображения (он будет находиться через отношение шага одной сетки к шагу другой), сохраняя независимость от выбора начальной точки и угла поворота.

Построим для обоих контуров соответствующие спиральные пучки, оставляя необходимое количество членов [4]. По приведённой ранее схеме поставим контурам в соответствие два спиральных пучка, суть два набора комплексных коэффициентов: { cn (1)} n N = c 0 и { cn (2) } n N = c 0 . В том случае, когда параметр квантования достаточен, чтобы различить два контура, указанные наборы коэффициентов совпадают с точностью до вращения:

| c (1) |                          c (1) c (2)

n                           n n - 1

n 1, Nc ,         = 1, ϕ n = ln .             (6)

| cn (2) |                  i cn (2) cn (1 - )1

Если ϕ n const для всех n , то ϕ n – угол взаимного поворота контуров α . Этот факт легко получить, записывая соотношение двух комплексных амплитуд из представления спирального пучка в виде сумм (4).

Если же условие (6) не выполняется, можно констатировать несоответствие контуров друг другу.

  • 4.    Алгоритм контурного анализа

  • 2. Построение 3. Разложение по базису

На основе вышесказанного можно кратко сформулировать пошаговую последовательность действий (блок-схема, рис. 3.) по определению схожести двух предложенных контуров. Во-первых, их необходимо задать в виде упорядоченного набора точек плоскости – кривой (шаг 1). По полученным кривым следует вычислить соответствующие им спиральные пучки (шаг 2) и разложить по ортогональной системе (шаг 3), взяв требуемое количество коэффициентов разложения, которое эмпирически определяется рамками задачи. И наконец, на основании сравнения двух наборов коэффициентов можно сделать вывод о том, являются ли два контура одинаковыми с точностью до масштаба и вращения (шаг 4).

1. Описание

J 4. Обработка

Рис. 3. Блок-схема алгоритма распознавания

Таким образом, реализуется алгоритм распознавания, обладающий следующими особенностями.

Во-первых, это независимость работы алгоритма от выбора начальной точки на контуре и масштаба контурного изображения. Во-вторых, контурный объект может быть произвольной формы; его сложность определяется только разрешением системы, а не количеством звеньев контура, характерным для других методов. В-третьих, все проводимые компьютерные вычисления на шагах 1 –3 непосредственно используются при принятии решения, на них нет переборных операций-подсчётов, которые отбрасываются. Так, последние две особенности выглядят достаточно привлекательными на фоне такого общепризнанного метода распознавания контуров, как анализ с использованием корреляционных функций (см. [2]).

Далее отметим, что при первоначальном рассмотрении метода шаги 2 и 3 выглядят очень ресурсоёмкими, поскольку оперируют двумерными объектами: комплексными амплитудами на плоскости и базисами. Однако авторами был найден и проверен способ уменьшить количество вычислений на 2–3 десятичных порядка, сведя реальные подсчёты к одномерным. Фактически шаги 2 и 3 объединяются в один по прямому вычислению коэффициентов разложения с использованием лишь одномерных интегралов. К сожалению, такие важные в прикладном значении подробности выходят за рамки данной статьи, предполагающей изложение общей концепции распознавания контуров при помощи спиральных пучков света.

К недостаткам данного подхода можно отнести следующее. Во-первых, при вычислениях используется операция экспоненцирования, которая является весьма «тяжёлой» для подсчёта, особенно на мобильных устройствах. Во-вторых, на текущий момент не известны эффективные оценки на параметр квантова- ния и количество членов остаточного ряда, достаточных (и необходимых) для устойчивости результатов распознавания. Этот вопрос ещё недостаточно проработан и требует дальнейшего исследования.

5.    Учёт шумов

Итак, основная канва метода сформулирована и описана в виде последовательности шагов, однако при переходе от рассмотренных ранее теоретических выкладок к практической реализации подхода необходимо сделать некоторые дополнительные замечания. Следует отметить, что в реальных системах неизбежно присутствуют факторы, которые в данной статье пока не были учтены: шумы и искажения. Причин их наличия много: ошибки дискретизации в ПЗС-матрицах, сбои при передаче информации с устройств регистрации изображения на вычислительную технику, реализующую процесс распознавания, и прочее.

Авторами было проведено исследование того, как предлагаемый подход реагирует на искажения подобного рода. Метод оказался весьма устойчивым к наличию шумов в распознаваемом контуре. Прежде всего, это связано с тем, что в выражение для комплексной амплитуды спирального пучка (2) входит Гауссова экспонента, которая оказывает «сглаживающий» эффект, проявляющийся в том, что небольшие деформации контура приводят лишь к соответствующим изменениям комплексной амплитуды.

Несмотря на то, что комплексная амплитуда и её нули устойчивы к деформации контура, коэффициенты разложения (см. формулы Виета, например, в [9]) могут варьироваться, притом весьма значительно. Это не мешает продолжать их использовать для распознавания, поскольку усечённые ряды (4) сходятся равномерно и весьма «быстро», основные информационно-значимые коэффициенты имеют номера меньше параметра квантования.

Кроме того, есть возможность воспользоваться дополнительной, слегка модифицированной глобальной характеристикой (в отличие от «локальных» коэффициентов), которая в оптике световых полей известна как «коэффициент перекрытия», а в функциональном анализе – как нормированное скалярное произведение в гильбертовом пространстве L2 (ℝ2) . Фактически K(θ) представляет собой корреляционную функцию по углу взаимного поворота θ спиральных пучков S(1) (z,z) и S(2) (z, z) , где мерой близости выступает скалярное произведение из числителя формулы (7). Максимум модуля этой функции достигается при истинном угле взаимного поворота α распознаваемых контуров.

K ( θ ) =                         ×

∫∫ S (1)( z , z ) S (1)( z , z ) d x d y

∫∫ S (1)( z , z ) S (2)( zei θ , ze - i θ ) d x d y

∫∫ S (2)( z , z ) S (2)( z , z ) d x d y

В отличие от метода распознавания посредством корреляционных функций, описанного, например, в [2], выражение (7) обладает следующими достоинствами: количество слагаемых в каждой сумме – это количество коэффициентов разложения (порядка десятков, одной – двух сотен штук), а не звеньев, задающих контур (более 500). Кроме этого возможно нахождение угла поворота с требуемой точностью: если шаг изменения угла θ для нахождения максимума функции корреляции мал – достигается большая точность, если велик – большая скорость.

При помощи формулы (4) и свойства ортогональности базиса Лагерра – Гаусса выражение (7) может быть с лёгкостью переписано в представлении с использованием только коэффициентов разложения:

N

Ус (1)с(2)е inа nn

K ( 9 ) = ,     n =0      г- .                         (8)

NN

  • (1)    (1)            (2) (2)

  • 6.    Низкая детализация как экспресс-тест для сравнения 7.    Численное моделирование

cn cn cn cn

V n=0            ч n=0

Таким образом, появляется новый инструмент, который может уточнить и подтвердить при необходимости результаты распознавания, рассчитанные исключительно при помощи коэффициентов.

Факт неустойчивости коэффициентов разложения побудил к поиску дополнительных решений, позволяющих нивелировать влияние шумов на рассматриваемый метод. Это привело к рассмотрению уже упомянутых корреляций, а также ситуации, названной нами «случаем сверхмалой детализации».

Идея заключается в следующем: если в случае большого количества коэффициентов разложения их точность может ухудшаться с наличием шумов, то следует строить спиральные пучки с очень маленьким параметром квантования (от 2 до 5). При этом интенсивность такого светового поля уже не будет внешне напоминать порождающую кривую, как это было на рис. 2, однако с точки зрения применения теоремы Виета и энергетических характеристик получающегося светового поля такой подход оправдан.

Как будет видно из раздела с численным моделированием, такое решение даёт неожиданно хорошие результаты, хотя неочевидно, что, если ограничиться лишь двумя-пятью коэффициентами разложения, не потеряется значительная доля информации о порождающей кривой. При этом скорость получения результата возрастает многократно. Это позволяет рассматривать случай сверхмалой детализации как своеобразный экспресс-тест на масштаб и потенциальный угол поворота, сохраняя все достоинства и нивелируя часть недостатков оригинального метода, кратко изложенного в 5-м разделе данной статьи. Повторимся, случай сверхмалой детализации не является основой для принятия решения о схожести объектов, он призван отфильтровать большое количество сильно различающихся контуров и выдать гипотетический угол поворота, который может быть проверен корреляционной функцией (7) высокодетализированных спиральных пучков (в этом случае нахождение максимума корреляции существенно упрощается – поиск взаимного угла поворота следует производить в окрестности гипотетического угла).

В качестве тестового образца было выбрано изображение самолёта, вручную выделен контур границы, и построен для него спиральный пучок. После этого в графическом редакторе контур был повёрнут на 123 градуса, уменьшен до 75 % от исходного, и построен соответствующий ему спиральный пучок.

Рис. 4. Слева направо: исходное изображение самолёта, выделенный контур границы, интенсивность порождённого спирального пучка

С целью наглядной визуализации при построении, параметр квантования N q был выбран равным 30, количество коэффициентов разложения N c – 120. Значение Гауссова параметра ρ = 1, площади под кривой S curve = 15π. Функция корреляции при этом достигает максимума своего абсолютного значения 0,8 при искомом угле 123 градуса и масштабном множителе 1,3. По определению K (θ), максимум её модуля не превосходит 1, иными словами, констатируется схожесть верхнего и нижнего контуров, но не абсолютная, что является следствием обработки (на рис. 4 заметны пропадания звеньев самолёта в районе «хвоста»).

Перейдём к случаю сверхмалой детализации (рис. 5). Для этого параметр квантования N q и количество коэффициентов N c были выбраны равными 3.

Рис. 5. Слева направо: исходное изображение самолёта, выделенный контур границы, интенсивность порождённого спирального пучка

Значение Гауссова параметра ρ = 1, площади под кривой Scurve = 1,5π. Функция корреляции при этом достигает максимума своего абсолютного значения 0,998 при угле 121 градус и масштабном множителе 1,3. Коэффициенты разложения, вычисленные для критерия (5), представлены в табл. 1.

Табл. 1. Коэффициенты разложения и применение критерия

n

(1) n

(2) n

| cn (1) | | cn (2) |

ϕ n

1

–0,088–0,335i

–0,286+0,175i

1,034

–98

2

–0,482+0,517i

–0,577 +0,155i

1,182

–139

3

1,175–2,049i

–0,365 +2,131i

1,093

–128

Среднее значение угла поворота

–122

Следует отметить, что сами по себе углы потенциального поворота φ n не вполне удовлетворяют критерию, однако обнаружена специфическая особенность: их среднее арифметическое значение даёт искомый угол поворота с небольшой погрешностью. Этот факт привлекает наше внимание, поскольку он подтверждён многочисленными численными экспериментами, но ещё не был детально проанализирован.

Таким образом, численные эксперименты показывают, что представленный на рис. 3 алгоритм может успешно применяться и в ситуации, когда распознаваемый контур зашумлён или деформирован. В этом могут помочь дополнительные инструменты: корреляция K (θ) и случай сверхмалой детализации.

Заключение

В данной работе предлагается к рассмотрению новый подход в рамках контурного анализа, основанный на тесном взаимодействии когерентной оптики, теории функций и численных методов. Показан и теоретически обоснован алгоритм сопоставления контуров, позволяющий определить, являются ли два контура одинаковыми с точностью до масштаба и/или вращения. Продемонстрирована динамика развития предлагаемого подхода в случае присутствия шумов или деформаций на исследуемом изображении. Отмечен факт уменьшения количества производимых вычислений на ЭВМ путём сведения задачи к подсчёту одномерных интегралов. Введены в рассмотрение дополнительные инструменты, которые позволяют уточнить результаты распознавания: корреляция и сверхмалая детализация.

Предполагается продолжение исследований в следующих направлениях: во-первых, проведение анализа производительности по сравнению с классическими методами контурного анализа; во-вторых, получение асимптотических оценок на алгоритмическую сложность предлагаемых вычислений; в-третьих, выработка критериев оценки получаемых значений корреляции.

Работа выполнена при поддержке Министерства образования и науки РФ.

Статья научная