Сравнительный анализ методов нормализации контраста изображений

Бесплатный доступ

В статье рассмотрены методы глобальной нормализации контраста, включая алгоритм, основанный на накопительной функции распределения (CDF), и линейный алгоритм. Выполнен сравнительный анализ результатов применения указанных методов. В результате работы алгоритмов получены изображения с нормализованным уровнем контраста. Для оценки степени нормализации использовалась формула среднего квадратического отклонения, метод энтропийного контраста и показатель контраста по диапазону. Также выявлены ограничения каждого метода и предложены рекомендации по их использованию в различных условиях.

Контраст, нормализация, гистограмма, накопительная функция распределения, оценка контраста

Короткий адрес: https://sciup.org/148330359

IDR: 148330359   |   DOI: 10.18137/RNU.V9187.24.04.P.3

Текст научной статьи Сравнительный анализ методов нормализации контраста изображений

С появлением в мире технологий, способных обрабатывать визуальную информацию, появилась необходимость в улучшении качества изображений. Одна из важных характеристик изображения – его контрастность. Нормализация контраста помогает минимизировать влияние неоднородного освещения и улучшает результаты работы с изображениями. Например, многие алгоритмы компьютерного зрения, такие как распознавание объектов, детектирование границ и классификация, чувствительны к качеству изображения [1–3]. Для визуализации результатов работы алгоритмов используется язык программирования python версии 3.13 с использованием библиотек pywt, cv2 и numpy в среде разработки PyCharm 1 .

Алгоритмы нормализации глобального контраста

Контраст изображения может быть количественно оценен на основе гистограммы распределения яркости [4]. Для изображений с высокой степенью контрастности харак-

1 Python 3.13.1 documentation // Python. URL: (дата обращения: 09.11.2024).

Дубровская Елена Андреевна магистрант, Национальный исследовательский университет «МЭИ», Москва. Сфера научных интересов: разработка программного обеспечения, информационные системы. Автор шести опубликованных научных работ.

терно равномерное распределение интенсивности светлых и темных пикселей; при этом пиксели концентрируются преимущественно вблизи экстремумов диапазона яркости. Гистограмма изображения, прошедшего процедуру нормализации контраста, как правило, охватывает весь динамический диапазон яркости, демонстрируя его более полное использование.

В данной работе будут рассмотрены методы нормализации контраста после преобразования аналогового сигнала в цифровой формат, поскольку именно на этом этапе появляется возможность эффективно корректировать параметры изображения с учетом его особенностей [5].

В работе описан алгоритм на основе накопительной функции, а также представлен линейный метод нормализации глобального контраста изображения.

Алгоритм на основе накопительной функции. Алгоритм, основанный на накопительной функции распределения (CDF), используется для нормализации глобального контраста изображения. Начальным шагом является формирование массива из 256 элементов, который представляет собой накопленное распределение уровней интенсивности пикселей в гистограмме изображения. Заполнение этого массива осуществляется путем суммирования значений гистограммы для каждого уровня интенсивности по формуле

CDF(i) = ^ h(i) ,                                 (1)

i = 0

Сравнительный анализ методов нормализации контраста изображений где CDF(i) – значение накопительной функции i-го уровня яркости, поступающее в массив; h(i) – значение гистограммы изображения i-го уровня яркости; i – значения яркости от 0 до 255 включительно.

На графике (см. Рисунок 1) отображена накопительная функция для изображения размера изображения N на M . На горизонтальной оси расположены значения от 0 до 255, характеризующие значения яркости i -го уровня, на вертикальной – накопительные значения CDF(i) , полученные при суммировании количества пикселей яркости i -го уровня по гистограмме.

Рисунок 1. Накопительная функция Источник: составлено авторами

Наклон графика накопительной функции распределения характеризует скорость уве- личения суммарной интенсивности пикселей по мере продвижения по уровням яркости в исходной гистограмме. Чем более крутым является наклон графика на определенном интервале, тем большее количество пикселей с соответствующим уровнем яркости присутствует в изображении.

Следующим этапом является построение функции преобразования, которая на осно- ве накопительной функции переназначает исходные уровни яркости на новые значения, способствуя усилению общего контраста. Функция преобразования определяется по формуле

f(i)= CDF(i)(L-1) NM

где f(i) – новое значение яркости значение, поступающее в массив трансформации;

CDF(i) – значение накопительной функции в точке интенсивности i ;

L – количество возможных уровней интенсивности (256 для 8-битных изображений);

N , M – длина и ширина оригинального изображения в пикселях.

В функции преобразования входные значения интенсивности пикселей отображаются по горизонтальной оси графика, тогда как соответствующие им выходные значения – новые уровни яркости после трансформации – располагаются по вертикальной оси. Оба набора значений лежат в диапазоне от 0 до 255.

На заключительном этапе алгоритма происходит замена интенсивности каждого пикселя изображения на новое значение, определенное функцией преобразования. Этот процесс итеративно проходит по всем компонентам пикселей, поэтому общее количество итераций соответствует размеру массива, содержащего данные этих компонент. Исходное значение яркости пикселя используется как индекс для доступа к массиву преобразования, после чего новое значение интенсивности записывается в результирующий массив. В итоге из этого массива формируется нормализованное изображение с улучшенными характеристиками яркости и контраста.

Однако данный метод может иметь ограничения при применении к изображениям с бимодальной гистограммой, имеющей два выраженных пика (см. Рисунок 2). В таких случаях, особенно когда один пик значительно превышает другой, функция преобразования может демонстрировать резкий градиент между пиками. Это может привести к чрезмерному усилению определенных уровней интенсивности и подавлению других, что вызывает искажение цвета, потерю деталей в ключевых областях и появление артефактов или шума [6]. Данная ситуация представлена на Рисунке 3.

Рисунок 2. Бимодальная гистограмма

Источник : [7]

Рисунок 3. Оригинальные изображения: а – изображение без изменений; б – искаженное изображение с бимодальной гистограммой Источник:

Для предотвращения таких проблем может быть использован линейный алгоритм, который увеличивает контраст изображения, позволяя избежать появления артефактов.

Линейный алгоритм. Работа линейного алгоритма с постоянными коэффициентами имеет четыре этапа. На первом этапе по проценту от общего числа пикселей будут определяться пороговые значения x1,x2 . Для их нахождения устанавливаются пороги, соот-

Сравнительный анализ методов нормализации контраста изображений ветствующие определенному проценту ( a ) от общего числа пикселей [8]. Пороговое значение определяется по формуле threshold=NMa ,                                (3)

где threshold – число пикселей, при достижении которого устанавливаются пороговые значения с каждой стороны; a – выбранный процент (2,5 %); NM – ширина и высота изображения соответственно.

Пороговые значения x1,x2 определяются как уровни яркости, при которых накопленная сумма пикселей достигает threshold с начала и с конца гистограммы соответственно. Выбор метода установки порогов влияет на определение значимой части гистограммы, которая будет использована для построения массива трансформации. Метод установки порогов по проценту 5 от общего числа пикселей является наиболее распространённым из-за своей универсальности и снижения риска потери информации в важных областях гистограммы [9].

Второй этап – расчет коэффициентов угла наклона ( k ) и сдвига ( b ) после определения пороговых значений. Для определения этих коэффициентов используются линейные уравнения, необходимые для растяжения диапазона яркостей от a до полного диапазона [0,255]. Коэффициент k определяет угол между прямой и положительным направлением оси x , что влияет на контраст изображения. Система уравнений имеет вид

Г k2X 1 +b2=0 ,

[ k2X 2 +b2=255 ,

Г 255 k= , 2 X 2 -X 1

и - 255X 1 b= , _ 2 X 2 —X 1

где X1 – первое с начала значение яркости, которое больше среднего; X2 – первое с конца значение яркости, которое больше среднего; k2 и b2 – коэффициенты угла и сдвига соот- ветственно. Ограничение: X2 ^ X1.

Коэффициент b отвечает за сдвиг графика вдоль оси OY :

если b > 0, то график функции перемещается со сдвигом на b единиц вверх вдоль оси OY ;

если b < 0, то график функции перемещается со сдвигом на b единиц вниз вдоль оси OY .

От данного коэффициента будет зависеть степень яркости измененного изображения.

Третий этап – создание функции преобразования, которая заполняется значениями, полученными по линейной формуле с использованием коэффициентов:

f(i)=ki+b ,                                          (5)

где f(i) – новое значение интенсивности пикселя;

  • k – коэффициент, который определяет наклон функции преобразования и влияет на контраст изображения;

  • b – коэффициент, который отвечает за сдвиг по оси яркости, влияя на общую яркость результирующего изображения;

i – значение текущей яркости пикселя в диапазоне от 0 до 255.

На Рисунке 4 представлена функция преобразования, полученная с использованием линейного алгоритма.

Рисунок 4. Функция преобразования, полученная с использованием линейного алгоритма Источник: составлено авторами.

Последний этап – трансформация компонент пикселей исходного изображения. Каждое значение яркости пикселя заменяется на соответствующее новое значение из массива преобразования. Этот процесс применяется ко всем компонентам пикселей (например, к красному, зеленому и синему каналам в RGB-изображениях) и аналогичен для различных алгоритмов нормализации [10]. На Рисунке 5 представлены результаты нормализации контраста изображения с помощью линейного алгоритма.

Рисунок 5. Результаты нормализации контраста изображения с помощью линейного алгоритма

К достоинствам линейного алгоритма можно отнести то, что он позволяет избежать резких перепадов между соседними значениями в массиве преобразования, что способствует более плавной нормализации изображения без существенных искажений цвета.

Ниже представлена сравнительная Таблица, отображающая оценку яркости и контраста изображений по трем методам глобальной оценки контраста. Оценки даны для оригинального изображения (см. Рисунок 3, а ), нормализованного изображения с помощью алгоритма на основе накопительной функции (CDF) (см. Рисунок 3, б ) и с помощью линейного алгоритма (LIN) (см. Рисунок 5). Оценки контраста рассчитаны методами RMS-контраста, энтропийного контраста и контраста по диапазону [11].

Сравнительный анализ методов нормализации контраста изображений

Таблица

Сравнительная характеристика оценки контраста для оригинальных изображений

Метод оценки

Рисунок 3, а , ORIG

Рисунок 3, б , CDF

Рисунок 5, LIN

Яркость

131

128

161

RMS-контраст

31

72

77

Энтропийный контраст

9,73

13,25

11,84

Контраст по диапазону

0,853

0,977

0,997

Источник: составлено авторами.

По результатам, приведенным в Таблице, можно заметить, что при оценке контраста методом RMS и контрастом по диапазону наибольшее значение у изображения, нормализованного с помощью линейного алгоритма, которое не имеет артефактов. При оценке энтропийным контрастом наибольшее значение у изображения, нормализованного с помощью алгоритма на основе CDF. Однако высокая оценка по энтропийному контрасту не всегда коррелирует с лучшим визуальным качеством изображения, так как артефакты увеличивают разнообразие и равномерность распределения интенсивностей пикселей, что повышает энтропию изображения и, следовательно, энтропийный контраст [11–14].

Из двух описанных методов выбор сделан в пользу линейного алгоритма за счет его универсальности. Представленные методы нормализации контраста изображения наиболее эффективны с точки зрения вычислительных ресурсов и времени. Результаты таких алгоритмов более предсказуемыми, так как они основаны на фиксированных математических формулах и алгоритмах. Эти методы применяют заранее определенные операции к пикселям изображения, не изменяясь в зависимости от данных, что приводит к меньшей универсальности. Это означает, что выбранные методы будут давать лучший результат нормализации контраста в случае подбора каждого алгоритма для определенной задачи.

Список литературы Сравнительный анализ методов нормализации контраста изображений

  • Voronin V. Modified Local and Global Contrast Enhancement Algorithm for Color Satellite Image // IV International Conference “Modeling of Nonlinear Processes and Systems” (MNPS-2019). 2019. Vol. 224. Article no. 04010. DOI: 10.1051/epjconf/201922404010
  • Дубровская Е.А., Привалов К.Э., Баланев К.С. Сравнение подходов при построении сверточных нейронных сетей для классификации изображений // Цифровые системы и модели: теория и практика проектирования, разработки и применения: Материалы национальной (с международным участием) научно-практической конференции, Казань, 10–11 апреля 2024 г. Казань: Казанский государственный энергетический университет, 2024. С. 812–815. EDN LCAIO P.
  • Дубровская Е.А., Привалов К.Э., Михалевский И.Д. Методы построения и обучения сверточных нейронных сетей для классификации изображений // Радиоэлектроника, электротехника и энергетика: Тезисы докладов Тридцатой международной научно-технической конференции студентов и аспирантов, Москва, 29 февраля – 02 марта 2024 г. Москва: Радуга, 2024. С. 379. EDN WGYSM Q.
  • Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLA B / Пер. с англ. В.В. Чепыжова. М.: Техносфера, 2006. 616 с. ISBN 5-94836-092-Х.
  • Ковалевский В.А., Волхонский В.В. Методы повышения качества изображения для работы системы видеонаблюдения в условиях недостаточной освещенности // Известия высших учебных заведений. Приборостроение. 2021. Т 64. № 10. С. 811–820. EDN LIPGNL. DOI: 10.17586/0021-3454-2021-64-10-811-820
  • Тавбоев С.А. Каршибоев Н.А. Методы улучшения контраста изображений при нечеткой исходной информации // Экономика и социум. 2021. № 3 (82). C. 427–432. EDN JYDMOY.
  • Bhaskar A., Joshi B. Comparative Analysis of Image Enhancement Techniques: A Study on Combined and Individual Approaches // Sharma H., Shrivastava V., Tripathi A.K., Wang L. (Eds) Communication and Intelligent Systems. ICCIS 2023. Lecture Notes in Networks and Systems. Vol. 968. Springer, Singapore, 2024. DOI: https://doi.org/10.1007/978-981-97-2079-8_6
  • Горьян И.С., Фисенко В.Т. Автоматический выбор порогов квантования при сегментации изображений // Математические методы распознавания образов: Тезисы докладов Четвертой Всесоюзной конференции. Рига, 1989. C. 62–64.
  • Ярославский Л.П. Введение в цифровую обработку изображений. М.: Сов. радио, 1979. 312 c.
  • Александровская А.А. Маврин Е.М. Реализация алгоритма контрастно-ограниченной эквализации гистограммы изображения на ПЛИ C // Вестник науки и образования. 2019. № 10-1 (64). С. 38–41. EDN KLGPXT.
  • Буланова Ю.А., Садыков С.С., Самандаров И.Р., Душатов Н.Т., Миратоев З.М. Исследование методов фильтрации шума на маммографических снимках // Oriental Renaissance: Innovative, educational, natural and social sciences. Vol. 2. No. 10. Pp. 178–191. URL: https://www.oriens.uz/media/journalarticles/23_%D0%AE.%D0%90.%D0%91%D1%83%D0%BB%D0%B0%D0%BD%D0%BE%D0%B2%D0%B01_177-191.pdf (дата обращения: 31.10.2024).
  • Прэтт У. Цифровая обработка изображений / Пер. с англ. под ред. Д.С. Лебедева. М.: Мир, 1982. 790 c.
  • Голуб Ю.И., Старовойтов Ф.В. Исследование локальных оценок контраста цифровых изображений при отсутствии эталона // Системный анализ и прикладная информатика. 2019. № 2. С. 4–11. EDN NDHOWC.
  • Дубровская Е.А., Баланев К.С., Привалов К.Э., Раскатова М.В. Сравнительный анализ методов оценки контраста изображений // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. 2024. № 3. С. 124–133. EDN WUSM CI. DOI: 10.18137/ RN U.V9187.24.03.P.124
Еще
Статья научная