Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

Автор: Сай Сергей Владимирович, Шоберг Анатолий Германович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений, распознавание образов

Статья в выпуске: 3 т.44, 2020 года.

Бесплатный доступ

В статье предлагается способ управления качеством передачи мелких структур изображений в стандарте JPEG2000 на основе автоматической регулировки параметров квантования коэффициентов дискретного вейвлет-преобразования. Описывается алгоритм настройки параметров шкалы квантования по субдиапазонам трансформации коэффициентов ДВП в зависимости от заданных (допустимых) искажений. Для объективной оценки качества изображений использованы числовые меры искажений мелких деталей в нормированной колометрической системе N-CIELAB, по которым выполняется анализ их структурных признаков. Приводятся результаты экспериментальных исследований анализа качества изображений и эффективности сжатия в зависимости от параметров квантования в разработанном адаптивном алгоритме сжатия. Также приводятся результаты оценки быстродействия алгоритма, которые могут быть использованы для практического применения в мультимедийных приложениях.

Еще

Анализ изображения, метрика искажений, дискретное вейвлет-преобразование, квантование

Короткий адрес: https://sciup.org/140250004

IDR: 140250004   |   DOI: 10.18287/2412-6179-CO-616

Текст научной статьи Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

В современных методах видеокомпрессии наибольшее применение имеют алгоритмы без адаптации к визуальному восприятию качества разных структур изображения. К таким методам относятся алгоритмы сжатия неподвижных изображений, реализованные в стандартах JPEG и JPEG2000. В системах цифрового телевидения H.264 (H.265), реализованных на основе стандартов MPEG, эти алгоритмы используются для компрессии опорных (I) кадров видеоряда.

Исследователи многих стран предлагают свои адаптивные алгоритмы [1–5] компрессии, основная цель которых заключается в повышении визуального качества изображений. Поиск компромиссных решений между качеством фото - и видеоизображений и степенью их компрессии до сих пор считается актуальной задачей.

В настоящее время существует множество методов анализа и метрик качества изображений. К традиционным метрикам относятся PSNR и MSE, к более сложным – метрики структурного подобия (SSIM) и мультимасштабная MSSIM [6]. Метод SSIM выполняет сравнение двух изображений и оценивает их изменения по яркости, контрасту и структуре [7]. Сравнение пикселей изображений выполняется с помощью окна, в котором оценивается качество изображения, выраженное величиной средней разности (DMOS). Этот метод более популярен, чем PSNR и MSE, т.к. он более информативен и ближе к зрительному восприятию различий между изображениями [7]. В [8] предлагается использовать метрику оценки искажений структур изображения в нормированной системе N-CIELAB, что, по мнению автора, позволяет приблизить объективные результаты анализа качества к субъективным зрительным оценкам.

В статье предлагается способ управления качеством передачи мелких структур изображений в стандарте JPEG2000 на основе автоматической регулировки параметров квантования коэффициентов дискретного вейвлет-преобразования (ДВП), позволяющий повысить эффективность сжатия с допустимыми (минимальными) визуальными искажениями по разработанным критериям в нормированной системе N-CIELAB.

1.    Особенности алгоритма JPEG2000

Рассмотрим особенности алгоритма сжатия изображений в стандарте JPEG2000. В кодере выполняются следующие основные процедуры: а) преобразование цифровых RGB- сигналов исходного файла изображения в сигналы YVU ; б) выполнение вейвлет-преоб-разования для каждой из YVU -компонент изображения; в) квантование коэффициентов ДВП и обнуление малозначащих коэффициентов; г) кодирование битовых плоскостей и арифметическое сжатие.

Преобразование сигналов основных цветов в цифровые сигналы яркости (Y) и цветности (U, V) для вещественного режима выполняется следующим способом [9]:

Y = 0,299 R + 0,587 G + 0,114 B ;

U = - 0,16875 R - 0,33125 G + 0,5 B ;             (1)

V = 0,5 R - 0,41869 G - 0,08131 B .

Дискретное вейвлет-преобразование одномерного сигнала S n длиной N можно выполнить по следующим формулам [9]:

N-1

sLk = ZSj-1,nhn-2k; SHk ZSj-1,ngn-2k,(2)

n=0

где n – номера отсчётов исходного дискретного сигнала; k – номера коэффициентов ДВП преобразованного сигнала в диапазоне от 0 до ( N – 1) / 2; j – номер итерации, изменяющийся от 1 до заданного значения J ; h n – низкочастотные коэффициенты и g n – высокочастотные коэффициенты импульсной характеристики симметричного биортогонального фильтра. В стандарте JPEG2000 рекомендовано [10] использование симметричного биортогонального фильтра Ко-эна–Добеши–Фово (CDF 9/7).

Из преобразования (2) следует, что коэффициенты ДВП SL представляют собой низкочастотные составляющие, а SH – высокочастотные составляющие исходного дискретного сигнала. При этом за счёт сдвига импульсной характеристики на 2 k в результате преобразования получаем две составляющие длиной N / 2. Таким образом, в результате первой итерации ( j = 1) имеем масштабированную (уменьшенную) в два раза копию ( SL ) исходного сигнала и его дополнение ( S H ) в виде высокочастотной составляющей. На следующей итерации ( j = 2) процесс повторяется, где исходным сигналом будет низкочастотная составляющая, полученная после первой итерации. После выполнения всех итераций получим масштабированную (уменьшенную) копию исходного сигнала в 2 J раза и J дополнительных высокочастотных составляющих.

Обратное преобразование и восстановление исходного сигнала выполняется итерационно по следующей формуле:

( N /2 j ) - 1                ( N /2 j ) - 1

S j - 1,n = Z S L,k h n + 2 k + Z S Hk g + 2 k ,          (3)

k = 0                     k = 0

где j изменяется от максимального значения ( J ) до единицы.

Для двумерного сигнала изображения вейвлет-преобразование выполняется следующим образом. На первой итерации преобразование (2) выполняется последовательно по строкам и столбцам, после чего формируются четыре матрицы (LL, LH, HL, HH) коэффициентов ДВП с размерами, в два раза меньшими ширины и высоты изображения. Принятые обозначения матриц следующие: LL – низкочастотная фильтрация по строкам и столбцам; LH – низкочастотная

фильтрация по строкам и высокочастотная по столбцам; HL – высокочастотная фильтрация по строкам и низкочастотная по столбцам; HH – высокочастотная фильтрация по строкам и столбцам. На второй итерации выполняется аналогичное преобразование для LL матрицы и т.д. Обычно достаточно 4–6 итераций. Такой процесс преобразований эквивалентен операции фильтрации сигналов изображения по частотным субдиапазонам для каждой итерации j .

После выполнения преобразования коэффициенты ДВП квантуются и преобразуются в целочисленные значения, где для каждого субдиапазона итерации j выбирается свой постоянный коэффициент Δ (шаг квантования), на который делятся все элементы матрицы.

Процесс квантования коэффициентов ДВП для каждой итерации ( j ) можно описать следующими формулами:

^^

S jHH

A *HH

.^^

S LH =

Sj LH

^^

;    S HIl =

A LH ’    j

S H j L

A HL J’

где S j – исходное значение коэффициента; Sj – квантованное значение. Операция L ... J означает округление вниз до ближайшего целого. Исключение состав-

ляет отрезок «мёртвой зоны» около нуля, в которой квантованные вещественные коэффициенты обнуля-

ются с помощью условия:

if | S / A|< 1; S = 0; else S = S .

Отметим, что для самого низкочастотного субдиапазона шаг квантования выбирается равным единице ( A JL = 1). Значения коэффициентов A ^ HH , A LLH и A ‘HL образуют шкалу квантования. Коэффициенты квантования рекомендованы стандартом и имеют более высокие значения для матриц HH, что обусловлено спадом пространственно-частотной характеристики зрения в области верхних частот.

В стандарте [10] рекомендовано оптимальное соотношение параметров квантования для разных субдиапазонов:

Ab- = , (5)

A o V Y b

где у b оценивается среднеквадратичной величиной искажения, которое вносится в изображение при единичном искажении коэффициента из субдиапазона b . Эта величина может быть определена на основании анализа вейвлет-преобразования «CDF 9/7». Из таблицы значений соотношения шагов квантования (5), представленной в работе [11], следует, что соотношение шагов квантования для соседних субдиапазонов приблизительно равно двум. В табл. 1 в качестве примера приведена шкала квантования для пяти итераций при заданном шаге для высокочастотного диапазона: A 1 HH = 32.

Табл. 1. Шкала квантования коэффициентов ДВП

j

A *HH

A LLH

A *HL

1

32

16

16

2

16

8

8

3

8

4

4

4

4

2

2

5

2

1

1

Процесс квантования и обнуления коэффициентов ДВП позволяет эффективно сжимать изображения с помощью алгоритма арифметического сжатия или на основе других алгоритмов. В то же время этот процесс вносит основные потери качества в декодированное изображение. Изменение коэффициентов квантования с помощью параметра качества Q позволяет регулировать качество изображения и, следовательно, скорость цифрового потока сжатых визуальных данных.

На последнем этапе выполняется арифметическое сжатие [9] квантованных коэффициентов ДВП. С этой целью матрица коэффициентов разбивается на одинаковые блоки (тайлы), по умолчанию размером 64 × 64. Далее каждый блок кодируется независимо от других. В процессе кодирования коэффициенты в блоке представляются в виде битовых плоскостей. Одну из таких плоскостей составляют знаки коэффициентов. Остальные плоскости соответствуют различным разрядам величин коэффициентов (положение бита в плоскости соответствует положению коэффициента в блоке). При этом сначала кодируется плоскость, соответствующая старшему разряду коэффициентов, затем следующая по убыванию, и т.д. Кодирование одной битовой плоскости одного блока осуществляется в три этапа: кодирование старших бит; уточняющий проход; очищающий проход. Для каждого прохода используется бинарное адаптивное арифметическое кодирование и контекстное моделирование.

При разработке адаптивного алгоритма квантования исследователи обычно предлагают свою шкалу коэффициентов квантования, которая, по их мнению, должна повысить качество изображения. В некоторых работах предлагается использовать разные материнские вейвлеты в зависимости от номера субдиапазона [1,4]. Анализ современного состояния исследований в данной области показывает, что авторы обычно оценивают качество изображения для разных параметров квантователя с помощью интегральных метрик, таких как PSNR, MSE, SSIM и др. [12]. К недостатку таких оценок относится то, что эти метрики не учитывают изменений зрительного восприятия цветовых различий и, следовательно, искажений отдельных участков изображения в зависимости от их цвета, контраста и детальности.

2.    Оценка искажений в системе N-CIELAB

Идея предлагаемого способа настройки параметров квантования заключается в использовании объек- тивных критериев оценки искажений мелких структур изображения, которые отличаются по признакам их детальности и по степени заметности искажений цветового контраста выделенных объектов. В качестве критериев предложено использовать числовые меры искажений мелких структур декодированного изображения в нормированной колометрической системе N-CIELAB [8], по которым выполняется анализ искажений (разрушений) их структурных признаков.

Описание системы N-CIELAB

Колометрическая система CIELAB относится к классу равноконтрастных систем [13] и широко используется для оценки цветовых различий и точности цветопередачи крупных деталей изображения. С уменьшением размеров деталей свойство равнокон-трастности CIELAB теряется, т.к. в системе не учитывается спад контрастной чувствительности зрения. Суть нормировки и переход в систему N-CIELAB заключается во введении в формулу оценки цветовых различий (контраста) между двумя деталями изображения (1 и 2) весовых коэффициентов по координатам светлоты L * и цветности a * , b * :

/ T* T* \ \ / 7 * 7 * V । L - L2 1 । a - a 2 1 1 b - b2 1 I T* I "I" I I I 7 * I V L5 J ( a 5 J ( bs J где ( L*1a*1b*1) – цветовые координаты первой детали и (C2a*2b2) - цветовые координаты второй детали; L*5, a*5 и b5 - весовые коэффициенты по светлоте и цветности, заданные количеством минимальных цветовых порогов MPCD в зависимости от размера (5) детали.

Цветовые координаты L*a*b* для каждого пикселя изображения получены с помощью преобразования основных цветов (RGB) в цветовое пространство (XYZ), а затем с помощью формул [13]:

L* = 116 f ( Y / Y o ) - 16;

a * = 500 [ f ( X / X o ) - f ( Y / Y o ) ] ; (7) b * = 200 [ f ( Y / Y o ) + f ( Z / Z o ) ] ;

где

[ t 1/3, if t >  0,008856, f ( t ) =                  ,          ,

[7,7871 + 0,13793, if t < 0,008856, и значения Xo, Yo и Zo являются координатами эталонного белого цвета.

Весовые коэффициенты получены экспериментальным путём раздельно для трёх цветовых координат L* , a* и b* в зависимости от размера одиночной детали в 1, 2, 3, 4 и более пикселей, расположенных на равномерном фоне. В частности, для самых мелких деталей эти значения равны: L 1 « 6 , a * « 40 и b 1 » 55 [14].

Использование весовых коэффициентов позволяет оценивать цветовой контраст деталей в системе

N-CIELAB в зависимости от их размера с учётом контрастной чувствительности зрения. Экспериментально доказано, что при пороговом значении цветового контраста K ≈ 1 мелкие детали начинают различаться глазом, и этот порог мало зависит от цвета детали и яркости окружающего фона.

Способ оценки искажений можно разделить на два этапа. На первом этапе выполняется алгоритм идентификации мелких структур оригинального изображения, который основан на результатах анализа структуры микроблоков с размером 3×3 пикселя. Для такого микроблока имеем шесть цветовых переходов по горизонтали и шесть цветовых переходов по вертикали, т.е. всего 12 переходов.

Мелкие структуры в микроблоке можно разделить на следующие типы: точечные объекты, фрагменты тонких линий, фрагменты контуров, фрагменты текстур. Максимальное количество цветовых переходов ( n ) между соседними пикселями внутри микроблока будет равно n = 12 (фрагмент текстуры). Минимальное количество цветовых переходов равно n =2.

Идентификация микроблока выполняется по следующему алгоритму. В каждом микроблоке m вычисляются двенадцать значений контраста между соседними пикселями:

K m , p

где значения A L * m , p , A a* m ,p и A b * p определяют контраст между соседними пикселями по светлоте и по цветности для цветового перехода с номером p . На каждом шаге вычислений (8) проверяем условие

K m , p 1 ,

при выполнении которого принимаем решение о том, что изменение контраста между соседними пикселями заметно глазом, и увеличиваем значение счетчика ( n ) обнаруженных цветовых переходов на единицу. После анализа всех цветовых переходов в микроблоке выполняем его идентификацию по следующему критерию.

Если количество переходов с цветовым контрастом (9) превышает значение n = 1, то в микроблоке присутствует мелкая структура, различимая глазом. Если данное условие не выполняется, то мелкая структура не различается глазом.

После анализа всего изображения получим выделенные участки изображения с различимыми мелкими структурами в виде микроблоков с размерами 3 × 3 пикселя. Количество таких микроблоков обозначим N m . Остальные участки классифицируем как микроблоки с равномерными изменениями цветовых координат и обозначаем их количество символом N F . По значению N m можно определить уровень детальности ( FDL ) изображения, который показывает процент участков изображения с мелкими структурами

FDL =--- N m ---100%.                   (10)

( N m + Nf )

На втором этапе оцениваются искажения компрессированного изображения. Для оценки искажений в выделенных участках с мелкими структурами предлагается следующая методика [8]. В каждом идентифицированном микроблоке m вычисляем 12 отклонений контраста между цветовыми переходами оригинального Km,p и искажённого Km,p изображений dEm,p = |Km,p - Km,p|                                (11)

и находим максимальное отклонение dEm = max(dEm,p).

Далее проверяем условие dEm > 0,5.                                      (12)

Если условие (12) выполняется [8], то принимается решение о том, что отклонения цветового контраста в микроблоке m заметны глазом и такой блок идентифицируется как искажённый in .

После анализа всех микроблоков получим объективную оценку искажений в виде отношения:

8 = N m 100%,                             (13)

m где значение N,m определяет количество искажённых микроблоков.

После вычислений значения 8 выполняем анализ качества компрессированного изображения по следующему критерию:

8< 1%.                                     (14)

В результате экспериментальных исследований (см. раздел 4) доказано, что при выполнении этого условия искажения мелких структур практически незаметны для глаза.

Дополнительно можно использовать среднюю оценку искажений по всем микроблокам с мелкими структурами:

Nm dEn =   Е dEm ,                         (15)

N m m = 1

которая соответствует метрике MFSD ( Metric of Fine Structures Distortion ) [8].

Таким образом, на основе метрики MFSD мы предлагаем новый критерий (14) оценки качества изображений.

3.    Алгоритм адаптивного квантования

В качестве основы шкалы квантования выбрано оптимальное соотношение параметров квантования для субдиапазонов в соответствии с критерием (5) и табл. 1.

Регулировка качества передачи изображения заключается в автоматической настройке параметра квантования A HH на допустимые искажения в соответствии с критерием (14). По умолчанию выбрано начальное значение A HH = 32. В процессе настройки этот параметр изменяется дискретно на заданный шаг регулировки ±о , пока не будет выполнено условие (14).

Таким образом, мы используем классическую систему автоматического регулирования по заданному критерию.

Основная задача исследований – это выбор оптимального значения шага о с целью минимизации вычислительных затрат при условии обеспечения заданного качества изображений.

Для решения этой задачи реализован программный модуль в среде С++, выполняющий следующие функции:

  • 1.    Открытие тестового изображения и линейное преобразование цифровых сигналов оригинального изображения из RGB- в YUV- формат.

  • 2.    Преобразование цифровых сигналов оригинального изображения из RGB- в L*a*b*- формат.

  • 3.    Идентификация микроблоков (3 × 3) оригинального изображения с мелкими структурами.

  • 4.    Выполнение прямого ДВП для составляющей яркости (Y) и для составляющих цветности (U и V) с заданным количеством итераций J = 5 .

  • 5.    Квантование коэффициентов ДВП, где на первом шаге использованы параметры квантования по умолчанию (табл. 1).

  • 6.    Выполнение обратного квантования и обратного ДВП с преобразованием цифровых сигналов изображения из YUV- в L*a*b*- формат.

  • 7.    Вычисление параметра искажений е .

  • 8.    Проверка качества декодированного изображения и настройка оптимального параметра A HH :

  • а)    При выполнении критерия (14) увеличиваем AHH на шаг о и выполняем п. 5-7 до тех пор, пока е не станет больше 1 %. Фиксируем оптимальное значение AHH = AHH - о;

  • б)    При невыполнении (14) уменьшаем AHH на шаг о и выполняем п. 5 - 7 до тех пор, пока е не станет меньше 1%. Фиксируем оптимальное значение AHH = AHH - о.

  • 9.    Сжатие квантованных коэффициентов ДВП на основе модифицированного алгоритма кодирования длин серий нулей [15] с переменной длиной кода. Таким образом, после выполнения алгоритма мы получим оптимальное значение A1HH для анализируемого изображения, при котором будет обеспечиваться его высокое качество. Это значение можно передать в заголовке файла или кадра видеоданных с целью обратного квантования и декодирования.

  • 4.    Результаты экспериментов

К особенностям реализации разработанного алгоритма относится следующее: в качестве материнского вейвлета выбран CDF 9/7; ширина «мёртвой» зоны квантования равна нулю; для каждого квантованного коэффициента ДВП (4) использовано 12 бит, включая один знаковый разряд.

Алгоритм сжатия в отличие от стандартного алгоритма [9] выполнен по упрощённой схеме. Размер тайла соответствует размеру изображения. В процессе сжатия последовательно по субдиапазонам каждый коэффициент ДВП проверяется на выполнение условия S j = 0 . Если это условие выполняется, вычисляется длина серии нулей. Если не выполняется, то кодируется ненулевой коэффициент. Серии нулей и ненулевые коэффициенты кодируются кодами переменной длины в соответствии с кодовой таблицей. В таблице [15] содержатся 4 префикса длин кода серий и 5 префиксов ненулевых коэффициентов. Каждый префикс соответствует заданной разрядности длины кодов и определяет их динамический диапазон. Отметим, что параметры таблицы выбраны на основе анализа статистики коэффициентов ДВП фотореалистичных изображений.

В результате экспериментов получено, что эффективность сжатия нашего алгоритма практически не уступает стандартному алгоритму сжатия JPEG2000, реализованному в приложении Adobe Photoshop CS6.

Для получения оптимального значения о был выполнен анализ качества оригинальных фотореалистичных изображений из базы данных [16] лаборатории LIVE, а также из других баз данных.

На рис. 1 показаны примеры тестовых изображений: «Женщина в шляпе» (Woman_hat), «Байкеры» (Bikes) и «Попугаи» (Parrots). В табл. 2 приведены результаты их анализа.

Рис. 1. Примеры тестовых изображений из базы данных лаборатории LIVE

Для каждого изображения приведён уровень детальности ( FDL ), который показывает процент участков изображения с мелкими структурами. Серым цветом выделен оптимальный параметр A HH , при котором выполняется критерий (14). Для сравнения приведена оценка искажений по метрике SSIM.

Табл. 2. Зависимости искажений тестовых изображений от параметров квантователя

Женщина в шляпе (FDL = 21 %)

Δ 1 HH

ε, %

d E N

k сж

SSIM

20

0,0

0,147

5,9

0,989

24

0,0

0,172

6,6

0,987

28

0,1

0,197

7,3

0,984

32

0,3

0,222

8,0

0,982

36

1,3

0,248

8,7

0,979

40

3,3

0,272

9,3

0,977

44

6,1

0,296

10,0

0,975

Байкеры (FDL = 56 %)

Δ 1 HH

ε, %

d E N

k сж

SSIM

20

0,0

0,173

4,2

0,995

24

0,0

0,201

4,6

0,994

28

0,2

0,231

5,0

0,993

32

1,2

0,261

5,3

0,992

36

3,8

0,290

5,7

0,990

40

7,9

0,319

6,0

0,989

44

13,8

0,348

6,3

0,988

Попугаи (FDL=9 %)

Δ 1 HH

ε, %

d E N

k сж

SSIM

20

0,0

0,153

8,2

0,987

24

0,0

0,180

9,4

0,985

28

0,0

0,203

10,7

0,983

32

0,3

0,225

12,0

0,981

36

1,2

0,250

13,3

0,979

40

3,2

0,274

14,7

0,977

44

6,8

0,299

16,1

0,976

В результате анализа более ста оригинальных изображений из разных баз данных получены следующие результаты.

  • 1.    Для большинства тестируемых изображений с уровнем детальности FDL<50% высокое качество обеспечивается при значении параметра Δ1HH32 . При этом средняя оценка искажений (15) не превышает значения 0,25.

  • 2.    Для настройки оптимального значения Δ1HH оптимальным шагом регулировки будет значение σ = ± 4. В этом случае достаточно выполнить одну итерацию изменения параметра Δ1HH .

  • 3.    Оценка искажений по метрике SSIM не дает однозначного решения. В частности, если для обеспечения высокого качества выбрать условие SSIM>0,98, то для изображений с высокой детальностью и контрастностью (пример «Байкеры») значение Δ1HH может превышать начальное значение Δ1HH почти в два раза.

  • 5.    Оценка быстродействия алгоритма

Отметим, что при настройке параметров квантования на оптимальные значения качество остальных участков изображения ( N F ) соответствует высокой оценке по критерию незаметности цветовых различий:

NF dEF=1 ∑dEk<2,3, (16) NF k=1

оценивает среднее отклонение цветовых координат оригинального и искажённого изображения в системе CIELAB внутри микроблока ( k ), в котором отсутствуют различимые глазом мелкие структуры; – номер пикселей в микроблоке (3 × 3). Выражение (16) даёт среднюю оценку по всем «фоновым» микроблокам N F .

При реализации адаптивного алгоритма сжатия в мультимедийных приложениях необходимо оценить его быстродействие. Время выполнения алгоритма можно оценить количеством вычислительных операций (КВО), которое требуется для выполнения п. 1–8. К таким операциям относятся математические операции сложения, вычитания, умножения, деления, возведения в степень, а также логические операции.

Наша задача – это оценка дополнительных вычислительных затрат, которые потребуются для адаптивной настройки квантователя. Поэтому ниже приводятся результаты поэтапных вычислений КВО.

Введём следующие обозначения операций: (+) сложение или вычитание, (×) умножение, (/) деление, (^) возведение в степень, (!=) проверка условия завершения цикла, (>) проверка логических условий.

На первом этапе оценим приблизительное значение КВО, необходимое для кодирования изображения (п. 1 и п. 4–5) без учёта алгоритмов адаптивной настройки квантователя и сжатия.

Пункт 1: преобразование RGB в YUV. Из форму -лы (1) следует, что для преобразования одного пикселя изображения потребуется 16 операций:

КВО 1 =[9(×) + 6(+) +1(!=)] =16.

Пункт 4: прямое ДВП. На первой итерации с учётом использования вейвлета CDF 9/7 получим, что для одного коэффициента ДВП для каждой составляющей по яркости и по цветности потребуется 68 операций:

2[9(×) +9(+) +1(!=) +7(×) +7(+) +1(!=)].

Здесь согласно формуле (2) учитывались 9 операций умножения и 9 сложения для НЧ составляющей и 14 операций для ВЧ составляющей при выполнении преобразования по строкам и то же количество при выполнении преобразования по столбцам. Также для каждого вычисления учтена операция проверки условия завершения цикла. Для всего изображения получим 68⋅Im операций, где Im – это размер изображения в пикселях. На второй итерации 68(Im /4), на третьей 68(Im /8) и т.д. В итоге, для пяти итераций для вычисления одного коэффициента ДВП по каждой состав- ляющей имеем КВО = 100. Для всех тех составляющих получим КВО4 = 300.

Пункт 5: квантование коэффициентов ДВП. Из формулы (4) следует, что для одного коэффициента ДВП потребуется всего 3 операции: 2(/) + 1(!=). В этом пункте мы учитываем, что операции деления и округления оцениваются числом 2. Суммарное количество операций будет равно КВО 5 =9.

В итоге получим, что для выполнения кодирования потребуется 325 операций (КВО 1,4,5 ) на один пиксель исходного изображения. Так как алгоритм симметричен, то на обратное декодирование и преобразование потребуется то же значение КВО.

При использовании адаптивного квантования для одного шага настройки необходимо выполнить пункты 2–3 и 5–8. Для этого потребуется следующее количество операций.

Пункт 2: преобразование цифровых сигналов оригинального изображения из RGB - в L*a*b*- формат. Для линейного преобразования RGB в XYZ потребуется аналогично (1) 16 операций. На выполнение преобразования (7) получим

5[(/) +(>) +(^)] +3[(+) +(×)] + 1(!=)

операций. В итоге имеем КВО 2 =38.

Пункт 3: идентификация микроблоков (3×3) оригинального изображения с мелкими структурами. Для расчётов использованы формулы (8) и (9), на основании которых получено, что вычисление контраста для каждого цветового перехода потребует 10 операций: 3(/) +2(+) +4(^) + 1(>). Для двенадцати переходов, с учётом проверки окончания цикла, получим 121 операцию, что в пересчёте на один пиксель даёт значение КВО 3 ≈ 13.

Пункт 6: выполнение обратного квантования и обратного ДВП с преобразованием цифровых сигналов изображения из YUV- в L*a*b*- формат. В результате получим КВО 6 ≈ КВО 5 + КВО 4 + КВО 2 =347.

Пункт 7: вычисление параметра искажений ε . Из формул (11) и (12) с учётом (8) следует, что для анализа каждого идентифицированного микроблока (3 × 3) потребуется 158 операций, что в пересчёте на один пиксель даёт значение 18. Так как количество микроблоков определяется уровнем FDL , то общее количество операций можно оценить, как КВО 7 ≈ 18( FDL /100).

Пункт 8: настройка квантователя. Для выполнения этого пункта потребуется следующее количество операций

КВО8= LΔ [КВО5+ КВО6+ КВО7], где LΔ – количество шагов настройки. Для численной оценки выберем параметр FDL =50, что даёт КВО8=365 LΔ.

В итоге, общее количество операций на один пиксель изображения, необходимое для выполнения адаптивного алгоритма, равно:

КВО 1 – 8 ≈ 325+407+365 L Δ , где первое слагаемое определяет количество операций без адаптивной настройки квантователя. Для одного шага настройки L Δ = 1 получим КВО 1 –8 ≈ 1097, что примерно в 3 раза превышает КВО неадаптивного алгоритма.

Отметим, что расчёты выполнены без учёта оптимизации алгоритма [17] и кода программы с целью минимизации вычислительных затрат.

Реальное время выполнения алгоритма зависит от многих факторов, в первую очередь, от архитектуры и производительности микропроцессорной системы.

В качестве примера выполним расчёт КВО, необходимое для кодирования изображения в ТВ -формате с количеством пикселей

Im =720×576=414720 и L Δ =1.

В результате получим: КВО 1–8 ≈ 455 ∙106. Используем процессор Intel Core 2 Quad Q6600 [18] с пиковой производительностью 38,4 Гигафлопс. Время выполнения адаптивного алгоритма будет равно t ≈ 12 мс.

Таким образом, использование адаптивной настройки увеличивает время выполнения алгоритма кодирования примерно в три раза. При этом быстродействие алгоритма декодирования не изменяется.

Заключение

В заключение отметим отличительные особенности предложенного способа управления качеством передачи мелких структур изображений.

Анализ качества изображений и настройка квантователя выполняются не по интегральным оценкам (SSIM, PSNR и др.), а по критерию (14), определяющему допустимые визуальные искажения выделенных участков с мелкими структурами в системе N-CIELAB. При этом искажения оцениваются относительным количеством микроблоков (3 × 3), в которых максимальное отклонение контраста превышает зрительный порог.

С помощью разработанной программной модели кодера JPEG2000 экспериментально определён начальный параметр квантования Δ 1 HH =32 и оптимальный шаг регулировки s = ± 4, при которых выполняется адаптивное квантование и настройка изображения на высокое качество передачи мелких структур с минимальными вычислительными затратами алгоритма кодирования.

К перспективным исследованиям относится внедрение и анализ эффективности разработанного алгоритма в мультимедийных системах передачи видеоданных на основе стандартов MPEG-2 и MPEG-4.

Список литературы Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

  • Liu, G. A novel direction adaptive wavelet based image compression / G. Liu, X. Zeng, F. Tian, K. Chaibou, Z. Zheng // AEU - International Journal of Electronics and Communications. - 2010. - Vol. 64, Issue 6. - P. 531-539.
  • Al-Azawi, S. Image compression algorithms using intensity based adaptive quantization coding / S. Al-Azawi, S. Boussakta, A. Yakovlev // American Journal of Engineering and Applied Sciences. - 2014. - Vol. 4, Issue 4. - P. 504-512.
  • Chen, P.-Y. An adaptive quantization scheme for 2-D DWT coefficients / P.-Y. Chen, J.-Y. Chang // International Journal of Applied Science and Engineering. - 2013. - Vol. 11, Issue 1. - P. 85-100.
  • Дворкович, В.П. Расчёт банков фильтров дискретного вейвлет-преобразования и анализ их характеристик / В.П. Дворкович, А.В. Дворкович // Цифровая обработка сигналов. - 2006. - № 2. - С. 2-10.
  • Умняшкин, С.В. Cжатие изображений на основе блочной декомпозиции в области пакетного вейвлет-преобразования / С.В. Умняшкин, Р.Р. Гизятулин // Цифровая обработка сигналов. - 2014. - № 1. - С. 46-51.
  • Lin, W. Perceptual visual quality metrics: A survey / W. Lin, C.-C.J. Kuo // Visual Communication and Image Representation. - 2011. - Vol. 22, Issue 4. - P. 297-312.
  • Bovik, A. No-reference image quality assessment in the spatial domain / A. Bovik, A. Mittal // IEEE Transactions on Image Processing. - 2012. - Vol. 21, Issue 12. - P. 4695-4708.
  • Сай, С.В. Метрика искажений мелких структур компрессированных изображений // Компьютерная оптика. - 2018. - Т. 42, № 5. - С. 829-837. -
  • DOI: 10.18287/2412-6179-2018-42-5-829-837
  • Стандарт JPEG2000: базовые алгоритмы, примеры реализации и перспективы применения / С.Н. Дроздов, А.А. Жиглатый, П.П. Кравченко, В.Н. Лутай, С.Н. Скороход, Н.Ш. Хусаинов. - Ростов-на-Дону: Изд-во ЮФУ, 2014. - 255 с.
  • Taubman, D. JPEG2000 image compression fundamentals, standard and practice / D. Taubman, M.B Marcellin // Kluver Academic Publishers, 2002. - 779 p.
  • Balster, E.J. Post-compression rate-distortion development for embedded block coding with optimal truncation in JPEG2000 imagery / E.J. Balster, B.T. Fortener, W.F. Turri // International Journal of Image and Graphics. - 2011. - Vol. 11, Issue 4. - P. 611-627.
  • Кольцов, П.П. О количественной оценке эффективности алгоритмов анализа изображений / П.П. Кольцов, А.С. Осипов, А.С. Куцаев, А.А. Кравченко, Н.В. Котович, А.В. Захаров // Компьютерная оптика. - 2015. - Т. 39, № 4. - С. 542-556. -
  • DOI: 10.18287/0134-2452-2015-39-4-542-556
  • Fairchild, M.D. Color appearance models / M.D. Fairchild. - John Wiley and Sons, 2005. - 409 p.
  • Sai, S.V. Segmentation of fine details in the CIELAB / S.V. Sai, N.Yu. Sorokin, A.G. Shoberg // 24th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision (WSCG 2016). Short Papers Proceedings. - 2016. - P. 155-162.
  • Сай, С.В. Выбор коэффициентов порогового отбора для вейвлет-трансформант цветного изображения / С.В. Сай, И.В. Савенков // Информатика и системы управления. - 2001. - № 2. - С. 112-117.
  • Image & video quality assessment at LIVE // [Electronical Resource]. - URL: http://live.ece.utexas.edu/research/quality/ (request date 01.08.2018).
  • Мясников, В.В. Эффективные алгоритмы вычисления локального дискретного вейвлет-преобразования // Компьютерная оптика. - 2007. - Т. 31, № 4. - С. 86-94.
  • Экспорт метрик соответствия требованиям микропроцессоров Intel® // [Электронный ресурс]. - URL: https://www.intel.ru/content/www/ru/ru/support/articles/000005755/processors.html (дата обращения 01.06.2019).
Еще
Статья научная