Реконструкция 3D-сцен по разноракурсным изображениям при неизвестных внешних параметрах съёмки

Автор: Фурсов Владимир Алексеевич, Гошин Егор Вячеславович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений: Восстановление изображений, выявление признаков, распознавание образов

Статья в выпуске: 5 т.39, 2015 года.

Бесплатный доступ

В работе рассматривается информационная технология восстановления 3D-сцены по разноракурсным изображениям, полученным при неизвестных внешних параметрах съёмки. Идея работы состоит в том, чтобы определять параметры сдвига и поворота камер непосредственно по соответствующим точкам исходных изображений.

Разноракурсные изображения, определение положения камеры, внутренние параметры камеры, сопоставление изображений, 3d-реконструкция

Короткий адрес: https://sciup.org/14059422

IDR: 14059422   |   DOI: 10.18287/0134-2452-2015-39-5-770-776

Текст научной статьи Реконструкция 3D-сцен по разноракурсным изображениям при неизвестных внешних параметрах съёмки

Задача восстановления трёхмерных моделей сцен по разноракурсным изображениям является одной из наиболее востребованных в системах компьютерного зрения. При этом типичной является ситуация, когда внешние параметры камер в глобальной системе координат (сдвиг и поворот) не известны [1]. Известно, что эти параметры связаны с параметрами фундаментальной матрицы, которая может быть оценена по набору (не менее семи) соответствующих точек на видах сцены.

Такой путь решения задачи был предложен в работе [2]. Однако вследствие того, что процедуры восстановления трёхмерных моделей крайне чувствительны к неизбежным погрешностям определения параметров фундаментальной матрицы, технология в целом часто оказывается неработоспособной. В работах [3, 4] решается задача определения внешних параметров камер с использованием уравнений Круппа. Наибольшее число известных работ, посвящённых этой проблеме, направлено на исследование различных способов калибровки. Наиболее известные в области калибровки работы [5, 6] решают задачу определения как внешних, так и внутренних параметров камеры, в том числе параметры дисторсии. Однако калибровка камеры проводится с использованием плоского шаблона (например, шахматной доски), что, как правило, неосуществимо в реальных условиях съёмки.

Указанные выше попытки определить матрицу проективного преобразования при отсутствии информации о параметрах сдвига и поворота свидетельствуют об актуальности задачи. Вместе с тем полученные в этом направлении результаты пока достаточно скромны. В частности, используемые технологии и доступные открытые библиотеки пока не позволяют получить достаточно надёжное решение этой задачи для широкого диапазона характеристик разноракурсных изображений.

1. Постановка задачи

Для восстановления 3D-сцены по разноракурсным изображениям будем использовать модель камеры-обскуры [7]. Предполагается, что разноракурсные изображения получены путём перемещения в пространстве одной камеры с известными внутренними параметрами, заданными матрицей:

f 0 u 0

K =

0 f v 0 001

где f – фокусное расстояние камеры, а ( u 0 , v 0 ), – координаты главной точки камеры в системе координат, связанной с камерой.

Пусть M – некоторая точка в глобальной системе координат, которая должна быть восстановлена по паре разноракурсных изображений. Преобразование из глобальной системы координат в однородные координаты изображения имеет вид:

m =

f" 1 v

V 17

~

r11

K ( R I t ) M = K Г 21

V Г 31

r 12

r 22

r 32

r 13

r 23

r 33

t 1

t 2

1 3 7

Y

V 1 J

, (2)

где u , v – однородные координаты точек на изображении вида, X , Y , Z – глобальные координаты точки M , а ( R | t ) – объединённая матрица поворота-сдвига, называемая также матрицей внешних параметров .

С учётом связи пиксельных и однородных координат точек:

m ( x , y ) = K 1 m ( u, v )

соотношение (2) можно представить в виде

x

m ( x , y ) = y

V1J

~

f r 1

r 21

V r 31

r 12

r 22

r 32

, f X 1 r 3 t 1 Y r- t 2 Z Г 33 1 3 J ,

V 1 J

Далее под координатами точки m всюду подразумеваются координаты m ( x , y ), удовлетворяющие (4).

С использованием соотношения (4) строится процедура вычисления 3D-координат сцены. В частности, записав с использованием неизвестных множителей g и g' соотношения вида (4) для соответствующих точек m ( x , y ) и m ( x ' ,y ') [8] в виде равенств:

x

y

Л г

rx = rl m i = r11 xi + r12 У1 + ri = r2 m i = r21 xi + r22 yt + ri = r3 mi = r31 xi + r32 У1 + r1 =[r11, r12, r13]

а r 2 = [ / 2, . r 22 , Г 23 ] >  .

r 3 = [ r 31 , r 32 , r 33 ]

x

/ y

= Л R '

Y

g

V-

Z

t 2

.1 3 j;

Зададим критерий оптимальности проективного преобразования в виде суммы квадратов разностей координат соответствующих точек на изображениях видов. С учётом обозначений (8), (9), (10) этот критерий представляется в виде:

и приравняв фигурирующие в (5), (6) векторы координат [ X , Y , Z ] T , получаем:

g R

-1

x

y

g R

y

= c -

t 1 t 1 ' t 2 1 2 ' t 3 1 3 '

Соотношение (7) представляет собой систему из трёх уравнений относительно двух неизвестных – g и g '. Посредством подстановки найденных из этой системы указанных множителей в соотношение (5) и/или (6) формируется вектор координат трёхмерной точки [ X , Y , Z ] T .

Из соотношений (3)–(7) видно, что для реконструкции 3D-сцены необходимо знать параметры матрицы поворота-сдвига ( R | t ). Проблема состоит в том, что часто эти параметры оказываются неизвестными и вначале требуется определить их по заданным на двух видах координатам N пар соответствующих точек m ( x , y ) и m ( x ′, y′ ). Решению этой задачи и посвящена настоящая статья.

Идея работы состоит в том, чтобы определить параметры поворота и сдвига камер в глобальной системе координат непосредственно по заданным соответствующим точкам видов, исключив промежуточный этап оценивания параметров фундаментальной матрицы.

2. Формулировка задачи оптимизации

Задачу определения параметров сдвига и поворота сформулируем как задачу оптимизации параметров проективного преобразования, обеспечивающего близость (в смысле заданного критерия) соответствующих точек на двух видах. Для компактной записи общей оптимизационной задачи введём обозначения:

Q x = zr + t x Qi = zr? + t y Q i = zr + t z

,

где

N 2 2

Q(r,t,z) = Z (xQ — Qix) +(yQ—Qi) , (11) i=1 L j где r = [r1, r2, r3]T – 9×1-вектор параметров поворота камеры, составленный из векторов-строк (10) матрицы поворота R, а Z – вектор, компонентами которого являются глобальные координаты Zi, i = 1, N точек сцены. Заметим, что для векторов-строк матрицы поворота r1, r2, r3 должны выполняться требования ортонормальности.

Поскольку глобальные координаты Z i , i = 1, N , также являются неизвестными, в результате решения должны быть оценены N + 12 неизвестных параметров – компонент вектора Y = [ r T , t T , Z T ] T , являющегося прямой суммой векторов r , t , Z . С учётом сказанного задача формулируется следующим образом. Найти

Y * : Q ( Y * ) = mn Q ( r,t , Z )                  (12)

при условии

IIГ111=1Г211=1 кз1= 1,

(r1, r2 ) = (r1, r3 ) = (r2, r3 ) = 0, r1 X r2 = r3,  r2 x r3 = r1,  r3 X r1 = r2,

где Q - область допустимых значений параметров сдвига, поворота и координат Z i , i = 1, N .

Поставленную задачу можно переформулировать как задачу безусловной оптимизации, если вместо вектора параметров r = [ r 1, r 2, r 3] T оценивать вектор параметров, составленный из углов поворота вокруг осей X, Y, Z . При этом выполнение ограничений (5) обеспечивается тем, что матрица R формируется в виде

R = RyRvR7 , XYZ

где

R X

' 10    0 '

0 cos (a ) ± sin (a )

V 0 + sin ( a ) cos ( a ) ;

г cos ( в )

0

± sin ( в ) '

R Y =

0

1

0

V + sin ( в )

0

cos ( в ) ,

^ cos ( y )

±

sin ( y ) 0 )

R z =

+ sin ( y )

V 0

cos (Y )    0

0       1 X

Здесь знак перед синусом указывает направление поворота.

Выполнив в векторе r = [ r 1 , r 2 , r 3 ] T замены, соответствующие представлению (14):

r11 = Cos в Cos y, r12 = Cos в Sin y, rB = Sin в, r21 =- Cos a Sin y- Sin a Sin в Cos Y, r22 = Cos a Cos Y— Sin a Sin в Sin Y, r23 = Sin a Cos в, r31 =- Sin a Sin Y— Cos a Sin в Cos Y, r32 =- Sin a Cos Y— Cos a Sin в Sin y, r33 = Cos a Cos в , задачу (12) можно представить в следующем виде. Найти

  • Y * : Q ( Y * ) = min Q ( ф,t , Z ) ,                 (15)

  • 3.    Построение вычислительной процедуры

'     ' ф,t,ZеЦ где ф = [a, в, Y], а t и Z те же, что и выше. Подчеркнём, что в данном случае отсутствуют ограничения на искомые параметры.

Сформулированная задача является многомерной и в общем случае многоэкстремальной. Несмотря на устранение ограничений и снижение размерности, она остаётся достаточно громоздкой в вычислительном отношении. Поэтому для её решения воспользуемся идеей блочной многошаговой схемы оптимизации [9], [10], [11].

Представим вектор Y в виде

Y = [ ф T ,T T ] T ,                                 (16)

где T = [ t T , Z T ] T – ( N + 3)×1-вектор, являющийся прямой суммой векторов t и Z . Теперь задача определения минимума в правой части (15) может быть представлена в виде [11]:

min Q (ф,Т) = min min Q (ф,Т), ф,Тей^ ™, 1 феЦ Тейт^™, 1

где Цф , Ц т - подобласти допустимых значений, являющиеся проекциями исходной области Ц на подпространства, соответствующие макропеременным ф , T соответственно.

Применяя к макропеременным ф, T схему многошаговой оптимизации [10], можно записать алгоритм определения значений ф, T, доставляющих минимум критерию (15) на k-м шаге, в виде следующей после- довательности вложенных оптимизационных задач меньшей размерности:

ф : Q (Yk )= min Q (фk, т (фк)), фк еЦф '*

где т (фк): Q(фк, т (фк )) = min Q(фк,т).

На первом шаге вектор ф 0 должен быть каким-либо образом задан.

Процедура останавливается, если

|| Аф к|| <Еф , ||At к||<е t, ||AZ к|| <Е Z, где

А ф к = ф к - ф к - 1 , A t к = t к - t к - 1 , A Z к = Z к - Z к - 1

и

IIA Q (Yk )||<е Q,(20)

где

A Q ( Y k ) = Q ( Y k ) - Q ( Y k - 1 ) , а Е ф , E t , E Z, е q - заданные положительные числа (пороговые значения). Полученное на k -м шаге значение критерия считается оптимальным:

Список литературы Реконструкция 3D-сцен по разноракурсным изображениям при неизвестных внешних параметрах съёмки

  • Кудинов, И.А. Реализация алгоритма определения пространственных координат и угловой ориентации объекта по реперным точкам, использующего информацию от одной камеры/И.А. Кудинов, О.В. Павлов, И.С. Холопов//Компьютерная оптика. -2015. -Т. 39, № 3. -С. 413-419.
  • Hartley, R. Multiple view geometry in computer vision/R. Hartley, A. Zisserman. -Cambridge university press, 2003. -655 c.
  • Sun, Q. Self-calibration of multi-camera networks without feature correspondence between different cameras/Q. Sun, D. Xu//Optik-International Journal for Light and Electron Optics. -2014. -Vol. 125, Issue 13. -P. 3331-3336.
  • Фурсов, В.А. Решение задачи автокалибровки камеры с использованием метода согласованной идентификации/В.А. Фурсов, Е.В. Гошин//Компьютерная оптика. -2012. -Т. 36, № 4. -С. 605-610.
  • Tsai, R.Y. A versatile camera calibration technique for high-accuracy 3D machine vision metrology using off-the-shelf TV cameras and lenses/R.Y. Tsai//Robotics and Automation, IEEE Journal of. -1987. -Vol. 3, Issue 4. -P. 323-344.
  • Zhang, Z. A flexible new technique for camera calibration/Z. Zhang//Pattern Analysis and Machine Intelligence, IEEE Transactions on. -2000. -Vol. 22, Issue 11. -P. 1330-1334.
  • Форсайт, Д. Компьютерное зрение. Современный подход/Д. Форсайт, Ж. Понс. -М.: Издательский дом «Вильямс», 2004. -928 с.
  • Грузман, И.С. Цифровая обработка изображений в информационных системах: учеб. пособие/И.С. Грузман, В.С. Киричук, В.П. Косых -Новосибирск: Издательство НГТУ, 2002. -352 c.
  • Гергель, В.П. Многомерная многоэкстремальная оптимизация на основе адаптивной многошаговой редукции размерности/В.П. Гергель, В.А. Гришагин, А.В. Гергель//Вестник Нижегородского университета им. Н.И. Лобачевского. -2010. -№ 1. -С. 163-170.
  • Strongin, R.G. Global Optimization with Non-Convex Constraints/R.G. Strongin, Y.D. Sergeyev. -Springer US, 2000. -704 с.
  • Стронгин, Р.Г. Параллельные вычисления в задачах глобальной оптимизации/Р.Г. Стронгин, В.П. Гергель, В.А. Гришагин, К.А. Баркалов. -М.: Издательство Московского университета, 2013. -280 с.
Еще
Статья научная