Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Метод визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений
Статья научная
В статье рассматривается разработка метода визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений. Целью исследований является создание метода, позволяющего с высокой точностью обнаруживать объекты на изображениях с низким цветовым контрастом выделяемых и фоновых областей. Для вычисления области значимости изображение предварительно сегментируется на регионы. На основе регионов строится граф. Каждый регион связан со смежными регионами, а также с областями, примыкающими к смежным регионам. Регионы являются вершинами графа. Вершины графа ранжируются по признакам соответствующих областей изображения. Область значимости выделяется на основе запросов фоновых областей. К фоновым областям относятся регионы, примыкающие к краям изображения. В существующем подходе визуального внимания на основе ранжирования вершин графа использовались только цветовые признаки изображения. В предлагаемом методе для повышения точности дополнительно используются текстурные признаки и признаки формы. Для вычисления текстурных признаков используется функция энергии Габора. При анализе формы рассчитывается расстояние между центрами регионов. Результаты экспериментов представлены на тестовых изображениях. Построены кривые точности-полноты, показывающие преимущество разработанного метода.
Бесплатно
Метод выделения области макулярного отёка с использованием данных оптической когерентной томографии
Статья научная
В работе предложен метод выделения области диабетического макулярного отёка на изображениях глазного дна на основе анализа данных оптической когерентной томографии. Актуальность работы обусловлена необходимостью создания систем поддержки проведения операций лазерокоагуляции для повышения её эффективности. В основе предложенного подхода лежит набор методов и алгоритмов сегментации изображений, поиска особых точек и составления их дескрипторов. Алгоритм Кэнни применяется для поиска границы между стекловидным телом и сетчаткой на изображениях оптической когерентной томографии. Метод сегментации, основанный на алгоритме Краскала построения минимального остовного дерева взвешенного связного неориентированного графа, используется для выделения области сетчатки до пигментного слоя на изображении. С использованием полученных результатов сегментации была построена карта толщины сетчатки глаза и её отклонений от нормы. В ходе проведенных исследований были подобраны оптимальные значения параметров в алгоритмах Кэнни и графовой сегментации, позволяющие достичь ошибки сегментации в размере 5 %. Были рассмотрены методы SIFT, SURF и AKAZE для наложения рассчитанных карт толщины сетчатки глаза и её отклонений от нормы на изображение глазного дна. В случаях, когда вместе с данными оптической когерентной томографии предоставлен снимок с фундус-камеры аппарата оптической когерентной томографии, с помощью метода SURF возможно точное совмещение с изображением глазного дна.
Бесплатно
Метод генерации обучающих данных для компьютерной системы обнаружения защитных масок на лицах людей
Статья научная
Мониторинг и оценка уровня безопасности отдельных граждан и общества в целом является одной из важнейших проблем современного мира, который вынужден меняться в связи с возникновением коронавируса COVID-19. Для повышения уровня безопасности общества необходимы новые информационные технологии, способные остановить распространение пандемии за счет минимизации угроз новых вспышек и мониторинга соблюдения людьми защитных мер. К таким технологиям относятся, в частности, компьютерные системы для автоматизированного отслеживания наличия защитных масок на лицах людей. Для таких систем предлагается метод генерации обучающих данных, который объединяет такие способы аугментации данных, как Mixup и Insert. Предложенный метод апробируется на двух корпусах - MAsked FAce и Real-World Masked Face Recognition Dataset, для которых достигаются значения невзвешенной средней полноты при обнаружении масок в 98,51 % и 98,50 %. Кроме того, эффективность предложенного метода апробируется на изображениях с имитацией защитных масок на лицах людей и предлагается автоматизированный способ для уменьшения ошибок I и II рода. С помощью предложенного автоматизированного способа удается сократить количество ошибок II рода с 174 до 32 для корпуса Real-World Masked Face Recognition Dataset и с 40 до 14 для изображений с нарисованными защитными масками на реальных лицах людей.
Бесплатно
Метод защиты авторских прав на глубокие нейронные сети с помощью цифровых водяных знаков
Статья научная
В статье предлагается новый метод защиты авторских прав на глубокие нейронные сети. Основная идея метода заключается во встраивании цифровых водяных знаков в защищаемую модель путем ее дообучения на уникальном наборе псевдоголографических изображений (псевдоголограмм). Псевдоголограмма - это двумерный синусоидальный сигнал, кодирующий двоичную последовательность произвольной длины. Изменяя фазу каждой синусоиды, можно формировать различные изображения-псевдоголограммы на основе одной битовой последовательности. Предлагаемая схема встраивания заключается в генерации обучающей выборки таким образом, чтобы псевдоголограммы, сформированные на основе одной последовательности, попадали в один и тот же класс. При этом каждому классу будут соответствовать различные битовые последовательности. Верификация цифровых водяных знаков осуществляется путем подачи на вход модели различных псевдоголограмм и проверки соответствия скрытой в них последовательности определенному классу. Экспериментальные исследования подтверждают работоспособность метода, а также соответствие всем критериям качества, выдвигаемым к методам встраивания цифровых водяных знаков в нейронные сети.
Бесплатно
Метод защиты векторных карт с использованием изображения ЦВЗ как вторичного контейнера
Статья научная
В статье исследован метод встраивания цифрового водяного знака в векторные картографические данные на основе циклического сдвига списка вершин полигональных объектов. Предложена модификация метода, позволяющая автоматизировать процедуру аутентификации, а также повысить его стойкость к изменению содержимого карты. Основная идея улучшенного метода заключается в использовании «шумоподобного» изображения в качестве вторичного контейнера для цифрового водяного знака, представленного в форме битовой последовательности. Описан алгоритм формирования изображения-контейнера из последовательности цифровых водяных знаков, а также алгоритм извлечения такой последовательности. Проведено экспериментальное исследование информационной ёмкости изображения-контейнера и его стойкости к искажениям, моделирующим встраивание в картографические данные: квантованию и добавлению интерполяционного шума. Работоспособность метода также продемонстрирована на реальных картографических данных. Сформулированы рекомендации по рациональному выбору параметров встраивания цифрового водяного знака в зависимости от числа полигонов векторной карты.
Бесплатно
Статья научная
Задача идентификации личности играет важную роль в обеспечении безопасности: информационной, общественной и др. В последнее время наиболее актуальными и перспективными являются биометрические методы идентификации личности. В статье представлено исследование метода идентификации личности по радужной оболочке глаза с использованием нейросетевого подхода на этапах сегментации и формирования признакового представления изображений. Представлено описание набора данных, используемого для реализации этапа сегментации с использованием сверточных нейронных сетей, а также предоставлен доступ к маскам сегментации всего набора данных. Предложен метод формирования признакового представления данных с использованием предварительно обученных сверточных нейронных сетей для решения задачи классификации радужной оболочки глаза. Проведен сравнительный анализ методов формирования признакового представления радужной оболочки глаза, включая классические подходы и нейросетевой подход. Проведен сравнительный анализ методов классификации, включая классические алгоритмы машинного обучения, а именно: метод опорных векторов, случайный лес, метод k-ближайших соседей. Результаты экспериментальных исследований показали высокое качество классификации при применении предложенного подхода.
Бесплатно
Метод измерения шумов цифровых камер автоматической сегментацией полосовой сцены
Статья научная
Широкое использование фото- и видеокамер для научных и производственных применений, а также в бытовых условиях привело к необходимости оперативного определения их характеристик для оценки применимости в конкретной задаче. В большинстве случаев информация о шумах фотосенсора представлена неполно или отсутствует даже в паспортах специализированных научных цифровых камер, что делает задачу нахождения шумов актуальной. В работе предложен метод измерения основных шумовых характеристик фотосенсоров цифровых камер: световых и темновых временных шумов, неоднородностей фоточувствительности пикселей и темнового сигнала. Метод включает съемку только 2 кадров одной сцены, состоящей из нескольких полос (квазиоднородных областей) различной яркости, по которым далее рассчитываются шумы исследуемой камеры после программной сегментации по уровням сигналов. Экспериментальная апробация проводилась при использовании цифровых камер различного назначения и с различным устройством сенсора. Предложенный метод позволяет определить все основные шумовые характеристики фотосенсоров и не уступает по скорости и точности другим оперативным методам оценки шумов (которые, как правило, не дают полной информации о шумах). Значения характеристик шума, полученные с его помощью, соответствуют в пределах погрешности измеренным с помощью времязатратного стандартного метода.
Бесплатно
Статья научная
Исследована задача распознавания изображений в условиях малых выборок наблюдений на основе метода ближайшего соседа, в котором сопоставляются векторы признаков высокой размерности, выделенные с помощью глубокой свёрточной нейронной сети. Предложен новый алгоритм распознавания на основе метода максимального правдоподобия (совместной плотности вероятности) рассогласований между входным и всеми эталонными изображениями. Для оценки правдоподобия используется известное асимптотически нормальное распределение рассогласования Йенсена-Шеннона между векторами значений признаков изображений, что согласовывается с известными экспериментальными оценками закона распределения мер близости между векторами высокой размерности. В рамках экспериментального исследования для базы данных фотографий лиц Labeled Faces in the Wild и набора видеоданных YouTube Faces показано, что предлагаемый алгоритм позволяет на 1-5 % повысить точность распознавания изображений и видеопоследовательностей по сравнению с традиционными методами классификации.
Бесплатно
Метод нахождения соответствий на изображениях с использованием структур дескрипторов
Статья научная
В работе рассматривается метод нахождения соответствий на изображениях с использованием структур дескрипторов. Дескрипторами в разработанном методе могут быть любые известные решения в области компьютерного зрения. Однако при нахождении соответствий на парах изображений могут появляться неточности. Для устранения «выбросов» предлагается сравнивать структуры дескрипторов. Структуры дескрипторов описываются при помощи графов. Для нахождения соответствий на основе структур дескрипторов используется метод Умеямы. Метод основан на разложении матриц на собственные значения и собственные векторы для задач сопоставления взвешенных графов. Таким образом, на начальном этапе находятся соответствия на основе дескриптора, а затем на основе полученных наборов сопоставленных особенностей строятся два графа для каждого изображения. Весами графа являются расстояния между всеми особенностями изображений, вычисленные с использованием функции Гаусса. Строятся весовые матрицы для каждого графа...
Бесплатно
Метод обнаружения контуров на основе весовой модели изображения
Статья научная
В работе рассматривается новый метод обнаружения контуров на полутоновых изображениях. Предлагаемый метод базируется на применении весовой модели изображения, которая позволяет оценить его пиксели с точки зрения их значимости для восприятия. При этом наиболее значимыми являются пиксели, в которых проявляются характерные особенности изображения, в том числе перепады яркости на границах областей. Для оценки значимости пикселей предлагается процедура анализа вклада соответствующих им вейвлет-коэффициентов на различных масштабных уровнях в общую энергию изображения. Описанный метод обнаружения контуров предусматривает построение весовой модели, определение направлений линейных сегментов вдоль границ на весовом изображении, анализ значимости пикселей и связывание значимых пикселей. Достоинством метода является высокая скорость работы (соответствующий детектор контуров работает в среднем в четыре раза быстрее детектора Кэнни). Кроме этого, в работе описан детектор значимых областей на изображении, основанный также на весовой модели. Предложенный подход может быть использован в различных системах обработки информации и управления на основе методов и средств компьютерного зрения, в том числе системах управления и навигации беспилотных транспортных средств, дистанционного зондирования Земли, системах обнаружения дефектов дорожного покрытия, биометрических системах и др.
Бесплатно
Метод оптимального линейного сверхразрешающего восстановления изображений
Статья научная
В статье предлагается метод сверхразрешения (измельчения сетки пикселов) цифровых изображений, основанный на применении линейной фильтрации к дискретному сигналу, дополненному нулями между отсчетами (пикселами). Для синтеза восстанавливающей системы вводится в рассмотрение непрерывно-дискретная модель наблюдения, характерная для реальных систем формирования изображений, в соответствии с которой изначально непрерывный сигнал сначала претерпевает линейные (динамические) искажения, а затем подвергается дискретизации и воздействию аддитивного шума. Для такой модели наблюдения строится процедура оптимального по критерию среднеквадратического отклонения процедура восстановления. Использование непрерывно-дискретной модели позволяет более адекватно описать искажения изображений, а также оценить остаточную погрешность такого восстановления, что полезно для решения ряда других задач (например, комплексирования изображений). В теоретической части статьи приводится общая схема линейного сверхразрешения сигнала, выводятся выражения для импульсной и частотной характеристики оптимальной восстанавливающей системы, а также для ошибки такого восстановления. Для краткости изложения материала всё описание ведется для одномерного сигнала, но полученные результаты предполагают естественное обобщение на случай двумерных изображений. Расчетный параграф статьи посвящен анализу ошибки сверхразрешающего восстановления в зависимости от параметров модели наблюдения. Продемонстрировано существенное превосходство предлагаемого метода по точности в сравнении с линейной интерполяцией, обычно применяемой при измельчении сетки пикселов изображения.
Бесплатно
Метод оценки уровня шума цифрового изображения
Статья научная
В работе представлен метод оценивания уровня дискретного белого шума в составе изображения, основанный на применении линейных разностных операторов с векторной маской. Предложены два варианта нового метода оценивания уровня шума, отличающиеся точностью получаемых оценок и вычислительной сложностью. Первый вариант метода можно отнести к классу блочных методов, второй - предназначен для экспресс-анализа изображения и основан на обработке небольшого числа строк или столбцов изображения.
Бесплатно
Метод разложения изображения по топологическим признакам
Статья научная
В статье предложен новый метод для разложения изображения на отдельные объекты интереса. В основе разработанного метода лежит использование персистентной гомологии. Показан процесс прямого и обратного преобразования изображения. Исходное изображение после прямого преобразования представляется как набор матриц, которые можно разделить на основные и детализирующие. Основные матрицы содержат информацию об основной структуре объектов на изображениях, а детализирующие включают данные о деталях этих объектов, а также о мелких объектах или шумовой составляющей. Показано, что существует определенная аналогия с Wavelet-преобразованием, но в основе предлагаемого метода заложена принципиально другая теоретическая база. Подробно описан численный пример, отражающий основную суть метода. Описаны свойства разложения, а также возможность использования стандартных алгебраических операций над матрицами разложения. Обратное преобразование позволяет учесть измененные свойства отдельных объектов и синтезировать новое изображение. Продемонстрированы перспективы применения разложения для решения практических задач. Разработаны алгоритмы для бинаризации изображений и удаления текста на неоднородном фоне. Анализ и обработка данных ведется с единых позиций в пространстве матриц разложения. Результаты бинаризации показали, что в сравнении с аналогами разработанный алгоритм покажет себя наилучшим образом в ситуациях, когда бинаризация применяется для выделения множества отдельных объектов. Полученные результаты алгоритма удаления текста на неоднородном фоне подтверждают, что информация полностью удаляется, не задевая остальные области на изображениях.
Бесплатно
Статья научная
В работе предлагается способ сегментации новообразований молочной железы и их периферического компонента на ультразвуковых изображениях. Отмечается, что определение пограничных структур поражения молочной железы служит важным шагом для дальнейшей классификации образования и напрямую влияет на окончательное определение характера образования. Основным отличием предлагаемого подхода является то, что при его реализации учитывались особенности перепада яркости пикселей исходного изображения, без использования фильтров спекл-шума. Работа методики протестирована на наборе ультразвуковых изображений морфологически верифицированных 42 доброкачественных и 49 злокачественных образований молочной железы, размеченных врачом-специалистом. Полученные результаты сегментации сравнивались с результатами ручной разметки врачом-специалистом в области ультразвуковой диагностики. Средние погрешности в выделении доброкачественного и злокачественного образования составили 5 пикселей для области самого образования и 7 пикселей для периферической области, что с учетом погрешности ручного выделения врачом-специалистом (3,95 и 4,7 пикселей соответственно) незначительно. А средние метрики «Пересечение над объединением» (IoU) составили 0,82 и 0,80 соответственно. Приведенные результаты эксперимента свидетельствуют о возможности использования разработанной технологии в комплексе с системой дифференцирования образования.
Бесплатно
Статья научная
Рассматривается метод и реализуемые на его основе алгоритмы создания цифровых водяных знаков, базирующиеся на применении обобщённых сжимающих преобразований при встраивании данных во фрагменты контейнеров - изображений. Принципиальной особенностью предлагаемого метода является использование гетероассоциативного сжимающего преобразования - взаимного отображения со сжатием двух соседних областей изображения произвольной формы. Проведены комплексные исследования для оценки показателей качества создаваемых цифровых водяных знаков, и показано, что предлагаемый метод и реализуемые на его основе алгоритмы позволяют достаточно гибко регулировать показатели уровня искажения контейнера и достоверности извлечения скрытых данных. Проводится анализ предлагаемых алгоритмов создания цифровых водяных знаков в условиях воздействий различных видов помех и преобразований, направленных на разрушение скрываемой информации, а также результаты сравнения с известными стегоалгоритмами.
Бесплатно
Метод цветовой консистентности для камер с неизвестной моделью
Статья научная
Современные методы вычислительной фотографии позволяют приблизить качество изображений, получаемых мобильными камерами, к качеству профессиональных фотокамер. Одна из важнейших задач в этой связи - задача обеспечения консистентности цветов различных камер. В настоящей работе предлагается простой и эффективный способ привести цвета одной камеры к другой, основанный на аппроксимации необходимого преобразования сплайном тоновой коррекции и матрицей цветового преобразования. Экспериментальное исследование проведено в достаточно сложном случае, в котором требуется привести в соответствие цвета изображений, полученных с двух принципиально разных сенсоров, а также с использованием дифракционной оптики. Результаты экспериментов показали, что предложенный метод позволяет получить более высокую точность приведения цветов между камерами, чем существующие аналоги.
Бесплатно
Статья научная
Дорожные дефекты являются одним из наиболее важных факторов при дорожно-транспортном происшествии, определяющим безопасность водителя, состояние автомобиля и скорость передвижения, поэтому они должны быть исправлены как можно скорее. К дефектам относятся трещины, колеи и выбоины на дорожном покрытии, и если их не исправлять в короткие сроки, то их размер будет расти каждый день. Есть различные методы, которые используются для обнаружения дорожных дефектов, одним из которых является метод компьютерного зрения. Типично цифровые камеры устанавливаются на автомобили, и затем выполняется обработка получаемого набора изображений от данного отрезка дороги. В данной статье предлагается методика получения изображения с помощью беспилотных летательных аппаратов, что позволяет собрать необходимые данные о состоянии дорожного полотна на больших по длине отрезках дороги. Предлагается методика выделения дефектов в виде трещин и оценки параметров, которые определены в нормативных документах. В результате проведенных исследований были получены и обработаны реальные изображения с помощью предложенной авторами методики, которая показала высокую скорость и точность, что указывает на возможность использования её на практике.
Бесплатно
Методика оценки объема гранулы полимерного геля в оптической микрометрии
Статья научная
В работе предложен алгоритм обработки фотографии полимерной гранулы с целью определения ее объема. Исследованы факторы, влияющие на результат автоматической обработки данных в методе оптической микрометрии. Показано, что по контуру гранулы эллиптического типа алгоритм определяет ее объем с относительной погрешностью 0,4 %, что соответствует ошибке определения диаметра гранулы в 1 пиксель.
Бесплатно
Статья научная
В работе рассматривается новая методика проверки гипотез о распределениях многомерных спектральных данных дистанционного зондирования. Предлагаемая методика основана на использовании непараметрических алгоритмов распознавания образов. Проверка гипотезы о тождественности двух законов распределений многомерных случайных величин заменяется на проверку гипотезы о равенстве ошибки распознавания образов значению 0,5. Применение данной методики позволяет исключить проблему декомпозиции области значений случайных величин на многомерные интервалы, которая свойственна для критерия Пирсона. Её эффективность подтверждается результатами проверки гипотез о распределении спектральных данных дистанционного зондирования лесных массивов. Проводится анализ законов распределения следующих состояний лесных массивов: темнохвойный лес, повреждённые и сухие древостои. Исходная информация получена по данным дистанционного зондирования территории юга Сибири с помощью аппарата Landsat по 6 спектральным каналам. Результаты исследований являются важными для формирования набора значимых спектральных признаков в задаче оценивания состояний лесных массивов.
Бесплатно
Статья научная
Рассматриваются алгоритмы проекции цифровых изображений в собственные подпространства в рамках линейных методов PCA, LDA, PLS и CCА. Приводится история развития этих методов за последние 100 лет на фоне появления новых областей их применения и меняющихся в связи с этим требований к ним. Показано, что развитие было инициировано четырьмя основными требованиями, вытекающими из современных задач и практики цифровой обработки изображений и, в первую очередь, изображений лиц. Первым является требование использования методов PCA, LDA, PLS и CCА в условиях как малой, так и чрезвычайно большой выборки изображений лиц в исходных наборах. Второе требование связано с критерием, определяющим собственный базис, который должен обеспечить, например, минимум ошибки аппроксимации изображений лиц, улучшение кластеризации в собственном подпространстве или максимум корреляции (ковариации) между наборами данных в подпространстве. Третье - связано с возможностью приложения рассматриваемых методов к задачам обработки двух и более наборов изображений с различных сенсорных источников или нескольких наборов любых числовых матриц...
Бесплатно