Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (287): Обработка изображений, распознавание образов
все рубрики
Сжатие гиперспектральных данных методом главных компонент

Сжатие гиперспектральных данных методом главных компонент

Минкин Александр Сергеевич, Николаева Ольга Васильевна, Руссков Александр Алексеевич

Статья научная

Цель работы - построение алгоритма сжатия гиперспектральных данных, позволяющего достигнуть высокой степени сжатия при малой мере близости исходного и восстановленного сигналов. Алгоритм опирается на метод главных компонент и метод исчерпывания. Методом исчерпывания последовательно находятся главные компоненты - сингулярные вектора матрицы исходного сигнала. Параллельно формируется матрица восстановленного сигнала. Процесс продолжается до достижения заданной меры близости исходного и восстановленного сигналов. Представлено пошаговое описание алгоритма, приведены списки входных и выходных параметров. Тестирование выполнено на данных эксперимента Aviris. Используются три снимка, отвечающие разной облачной ситуации (чистое небо, частичная облачность и сплошная облачность). Для каждого снимка тестирование выполнено отдельно для всего набора спектральных каналов и для набора, из которого исключены каналы, лежащие в полосах сильного поглощения излучения в водяном паре. Представлена зависимость мер близости исходного и восстановленного сигналов от степени сжатия. Рассматриваются четыре меры близости: среднее квадратичное отклонение, отношение шума к сигналу, мера структурного сходства и среднее относительное отклонение. Показано, что меры близости уменьшаются более чем на порядок при исключении из снимка спектральных каналов, лежащих в полосах сильного поглощения. Показано, что причиной этого являются погрешности измерения слабого в полосе поглощения сигнала, из-за чего снижается зависимость между спектрами в разных пространственных пикселях. Для оценки готовности снимка к сжатию представленным алгоритмом предложено использовать среднее по снимку косинусное расстояние между спектрами в разных пространственных пикселях.

Бесплатно

Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей

Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей

Шахуро Владислав Игоревич, Конушин Антон Сергеевич

Статья научная

В работе исследуется применимость порождающих конкурирующих нейронных сетей для синтеза обучающих выборок на примере задачи классификации дорожных знаков. Рассматриваются порождающие нейронные сети, обучаемые с помощью метрики Васерштейна. В качестве базового метода для сравнения используется метод генерации синтетических изображений дорожных знаков по иконке. Проводится экспериментальное сравнение нейросетевых классификаторов, обученных на реальных данных, двух видах синтетических данных, а также смеси реальных и синтетических данных. Эксперименты показывают, что современные порождающие нейронные сети позволяют создавать реалистичные обучающие выборки для классификации автодорожных знаков, которые превосходят по качеству методы генерации знаков по иконкам, но немного уступают по качеству реальным данным.

Бесплатно

Синтез ядра вращательного смаза в цифровом изображении с использованием измерений трехосного гироскопа

Синтез ядра вращательного смаза в цифровом изображении с использованием измерений трехосного гироскопа

Василюк Николай Николаевич

Статья научная

Предложен метод вычисления ядра смаза, возникающего при вращении цифровой камеры. Вращение измеряется трёхосным гироскопом, скреплённым с камерой. Получены дифференциальные уравнения траектории вращательного смаза, исходящей из выбранного пикселя цифрового изображения. Уравнения записаны в фокальной плоскости объектива без вычисления промежуточных элементов внешнего ориентирования камеры. Приведено выражение для интеграла от энергетической освещённости вдоль траектории смаза, создаваемой точечным источником излучения. В интеграле учитываются функция рассеяния объектива и апертурные функции отдельных фоточувствительных ячеек матричного фотоприёмника. Расчёт значений интеграла для всех фоточувствительных ячеек, освещённых точечным источником, даёт дискретное ядро вращательного смаза, начинающееся в выбранным пикселе цифрового изображения. Описаны алгоритмы численного интегрирования полученных уравнений. Выполнен анализ уравнения смаза, выделены характерные особенности ядер, и показана их неоднородность - ядра вращательного смаза для различных пикселей при произвольном вращении камеры не совпадают между собой. Приведён пример синтеза ядер смаза для заданных параметров вращения цифровой камеры.

Бесплатно

Система нейросетевой классификации пигментных новообразований кожи с предварительным удалением волос на фотографиях

Система нейросетевой классификации пигментных новообразований кожи с предварительным удалением волос на фотографиях

Ляхов Павел Алексеевич, Ляхова Ульяна Алексеевна

Статья научная

В статье предложена система нейросетевой классификации пигментных новообразований кожи с этапом предварительной обработки для удаления волосяных структур с изображений. Основным отличием предложенной системы является применение этапа предварительной обработки изображений для идентификации местоположения волос и их дальнейшего удаления. Данный этап позволяет подготовить дерматоскопические изображения для дальнейшего анализа с целью проведения автоматизированной классификации и диагностики пигментных кожных новообразований. Моделирование проводилось с использованием пакета прикладных программ MatLAB R2020b на клинических дерматоскопических изображениях из международного открытого архива ISIC Melanoma Project. Предложенная система позволила повысить точность распознавания изображений пигментных поражений кожи по 10 диагностически важным категориям до 80,81%. Использование предложенной системы распознавания и классификации дерматоскопических изображений пигментных поражений специалистами даст возможность увеличить эффективность диагностики по сравнению с методами визуальной постановки диагноза, а также позволит начать лечение на более ранней стадии заболевания, что напрямую влияет на процентную выживаемость и выздоровление пациентов.

Бесплатно

Система признаков для расширенного суперпиксельного представления изображений

Система признаков для расширенного суперпиксельного представления изображений

Егорова Анна Александровна, Сергеев Владислав Викторович

Статья научная

Как правило, при решении прикладных задач анализа и обработки изображений на основе суперпиксельного представления используется малый набор признаков суперпикселей. Расширение описания суперпикселей может повысить качество обрабатывающих алгоритмов. В статье предлагается набор из 25 базовых признаков суперпикселей, характеризующих их форму, яркость, геометрические параметры и положение на плоскости. Предлагаемые признаки отвечают требованиям низкой сложности вычисления в процессе сегментации изображения и достаточности для решения широкого класса прикладных задач. На их основе представлена модификация известного подхода к формированию суперпикселей, которая заключается в быстрой первичной суперпиксельной сегментации изображения со строгим предикатом однородности, обеспечивающим получение суперпикселей, с высокой точностью сохраняющих информацию исходного растрового изображения, и последующем укрупнении суперпикселей при более мягких предикатах однородности. Экспериментально показано, что такой подход позволяет существенно сократить число элементов изображения, что способствует снижению сложности обрабатывающих алгоритмов, а расширенные суперпиксели более точно соответствуют содержательным областям изображения.

Бесплатно

Совместная реконструкция и сегментация изображений: сравнение двух алгоритмов малоракурсной томографии

Совместная реконструкция и сегментация изображений: сравнение двух алгоритмов малоракурсной томографии

Власов Виталий Викторович, Коновалов Александр Борисович, Кольчугин Сергей Валентинович

Статья научная

В статье сравниваются два алгоритма малоракурсной томографии: итерационный алгоритм минимизации функционала Поттса и алгебраический алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией. Оба алгоритма ориентированы на восстановление кусочно-постоянных структур, используют теорию опознавания со сжатием и совмещают процедуры реконструкции и сегментации изображений. На уровне численного эксперимента показано, что каждый из алгоритмов способен точно восстанавливать фантом Шеппа-Логана всего по 7 ракурсам. Когда же речь идет о восстановлении объекта, имеющего сложную высокочастотную структуру (QR-кода), минимальное число ракурсов, необходимое для точной реконструкции, возрастает до 17-21 в случае алгоритма реконструкции с TV-регуляризацией и адаптивной сегментацией и до 32-34 в случае итерационного алгоритма минимизации функционала Поттса. Показано, что разработанный авторами статьи алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией имеет некоторое преимущество над итерационным алгоритмом минимизации функционала Поттса по таким критериям, как точность и скорость реконструкции, а также устойчивость к шуму проекционных данных. Отмечено, что алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией имеет хороший потенциал для дальнейшего совершенствования.

Бесплатно

Совместный анализ рентгенологических протоколов и компьютерных томограмм для автоматического уточнения патологических состояний головного мозга

Совместный анализ рентгенологических протоколов и компьютерных томограмм для автоматического уточнения патологических состояний головного мозга

Агафонова Юлия Дмитриевна, Гайдель Андрей Викторович, Зельтер Павел Михайлович, Капишников Александр Викторович, Кузнецов Андрей Владимирович, Суровцев Евгений Николаевич, Никоноров Артем Владимирович

Статья научная

Рассматривается задача валидации радиологических медицинских протоколов и изображений компьютерной томографии для автоматизированного анализа состояния головного мозга. Предлагается два метода решения задачи: метод на основе мультимодальной модели ruCLIP и метод, основанный на совместном использовании двух отдельных классификаторов - для текстового отчета и для изображения КТ головного мозга. Обсуждаются способы оценки полученных результатов. Предложенные подходы позволяют верно классифицировать на 15 возможных диагнозов 99,6 % радиологических отчётов из контрольной выборки.

Бесплатно

Современные технологии автоматического распознавания средств общения на основе визуальных данных

Современные технологии автоматического распознавания средств общения на основе визуальных данных

Ячная Валерия Олеговна, Луцив Вадим Ростиславович, Малашин Роман Олегович

Статья научная

Общение представляет собой широкий спектр различных действий, связанных с приёмом и передачей информации. Процесс общения складывается из вербальных, паравербальных и невербальных компонентов, содержащих информационную часть передаваемого сообщения и его эмоциональную окраску соответственно. Комплексный анализ всех компонентов общения позволяет оценить не только содержательную составляющую, но и ситуативный контекст сказанного, а также выявлять дополнительные факторы, относящиеся к психическому и соматическому состоянию говорящего. Существует несколько методов передачи вербального сообщения, среди которых устная и жестовая речь. Речевые и околоречевые компоненты общения могут содержаться в различных каналах данных, таких как аудио- или видеоканалы. В данном обзоре рассматриваются системы анализа видеоданных ввиду того, что аудиоканал не способен передать ряд околоречевых компонентов общения, вносящих в передаваемое сообщение дополнительную информацию. Проводится анализ существующих баз данных статических и динамических образов и систем, разрабатываемых для распознавания вербальной составляющей в устной и жестовой речи, а также систем, оценивающих паравербальные и невербальные компоненты общения. Обозначены сложности, с которыми сталкиваются разработчики подобных баз данных и систем. Также сформулированы перспективные направления разработок, связанные в том числе с комплексным анализом всех компонентов общения с целью наиболее полной оценки передаваемого сообщения.

Бесплатно

Спектральное и пространственное сверхразрешение при комплексировании данных ДЗЗ различных источников

Спектральное и пространственное сверхразрешение при комплексировании данных ДЗЗ различных источников

Белов Александр Михайлович, Денисова Анна Юрьевна

Статья научная

В статье предлагается алгоритм получения пространственного и спектрального сверхразрешения для совокупности изображений дистанционного зондирования Земли, полученных при помощи различной съёмочной аппаратуры. Результат работы алгоритма рассматривается как модель идеального источника данных, обладающего большей точностью представления наблюдаемой территории, чем каждое из входных изображений, имеющих более низкое пространственное и спектральное разрешение. Предложенный алгоритм основан на методе градиентного спуска и использует уточнённую модель наблюдения изображений, включающую спектральную дискретизацию и интерполяцию, возникающую при переходе от наблюдаемых входных изображений к модельному представлению. В статье описывается экспериментальное исследование предложенного алгоритма на модельных изображениях низкого разрешения, полученных из гиперспектрального снимка дистанционного зондирования Земли. Практическое применение предлагаемого алгоритма заключается в совместной обработке данных ДЗЗ различного уровня, позволяющей стереть границы, возникающие из-за конструктивных различий изображающих систем.

Бесплатно

Способ оценки четкости фотореалистичных изображений с высоким разрешением

Способ оценки четкости фотореалистичных изображений с высоким разрешением

Сай Сергей Владимирович

Статья научная

В статье предлагается способ оценки четкости фотореалистичных изображений, основанный на сравнении коэффициента детальности оригинального и искаженного изображений. В алгоритме идентификации мелких структур оригинального изображения используются операции сегментации активных пикселей, к которым относятся точечные объекты, тонкие линии и фрагменты текстуры. Количество активных пикселей оценивается значением коэффициента детальности, которое определяется отношением активных пикселей к общему количеству пикселей изображения. Этот же алгоритм используется для вычисления значения коэффициента детальности искаженного изображения, и далее оценивается снижение четкости с помощью сравнения полученных значений. К особенностям способа относится то, что идентификация мелких структур и сегментация активных пикселей выполняется в нормированной системе N-CIELAB.Также в алгоритме учитывается влияние ложных микроструктур на результаты оценки реставрированного изображения. Рассматриваются особенности построения нейронных сетей SRCNN в задачах качественного повышения разрешения изображения с восстановлением мелких структур. Приводятся результаты анализа качества увеличенных изображений по традиционным метрикам PSNR и SSIM, а также по предлагаемому способу.

Бесплатно

Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

Сай Сергей Владимирович, Шоберг Анатолий Германович

Статья научная

В статье предлагается способ управления качеством передачи мелких структур изображений в стандарте JPEG2000 на основе автоматической регулировки параметров квантования коэффициентов дискретного вейвлет-преобразования. Описывается алгоритм настройки параметров шкалы квантования по субдиапазонам трансформации коэффициентов ДВП в зависимости от заданных (допустимых) искажений. Для объективной оценки качества изображений использованы числовые меры искажений мелких деталей в нормированной колометрической системе N-CIELAB, по которым выполняется анализ их структурных признаков. Приводятся результаты экспериментальных исследований анализа качества изображений и эффективности сжатия в зависимости от параметров квантования в разработанном адаптивном алгоритме сжатия. Также приводятся результаты оценки быстродействия алгоритма, которые могут быть использованы для практического применения в мультимедийных приложениях.

Бесплатно

Сравнение алгоритмов выделения области интереса на компьютерных томограммах легких

Сравнение алгоритмов выделения области интереса на компьютерных томограммах легких

Пашина Татьяна Андреевна, Гайдель Андрей Викторович, Зельтер Павел Михайлович, Капишников Александр Викторович, Никоноров Артем Владимирович

Статья научная

Рассматривается автоматическое создание масок для выделения лёгких на компьютерных томограммах с помощью трёх подходов: метода Оцу, простой свёрточной нейронной сети, состоящей из 10 одинаковых слоёв, и свёрточной нейронной сети U-Net. Произведено исследование и сравнение используемых методов автоматического выделения области интереса на реальных изображениях компьютерной томографии лёгких, полученных в Клиниках СамГ-МУ. Решение данной задачи актуально, так как она является первым этапом при автоматизированном поиске патологических изменений на изображениях компьютерной томографии. Предложен алгоритм постобработки изображений, основанный на поиске контуров, который позволяет повысить качество сегментации. Сделан вывод о том, что U-Net выделяет область интереса, относящуюся к легкому, несколько лучше, чем два других подхода. При этом простая свёрточная нейронная сеть обеспечивает достоверность сегментации 97,5 %, что лучше достоверности сегментации 96,7 %, достигнутой с помощью метода Оцу, и лучше достоверности сегментации 96,4 %, достигнутой с помощью нейронной сети U-Net.

Бесплатно

Сравнение алгоритмов описания комплекснозначного поля градиента цифровых изображений с использованием линейных методов снижения размерности

Сравнение алгоритмов описания комплекснозначного поля градиента цифровых изображений с использованием линейных методов снижения размерности

Дмитриев Егор Андреевич, Мясников Владислав Валерьевич

Статья научная

В работе представлен анализ различных подходов к построению описаний полей градиентов цифровых изображений. Анализируемые подходы основаны на известных методах снижения размерности данных, таких как методы главных и независимых компонент, метод дискриминантного анализа. Мы применяем указанные методы не к исходному изображению, представленному в виде двумерного поля яркости (полутоновому изображению), а к его вторичному представлению в виде двумерного поля градиента - комплекснозначному изображению. При этом рассматриваются случаи использования как поля градиента целиком, так и только его фазовой части. Дополнительно рассматриваются два независимых способа формирования окончательного описания искомого объекта: в виде коэффициентов разложения поля градиента по сформированному базису и с использованием оригинальной авторской конструкции модельно-ориентированных дескрипторов. Последние позволяют в два раза снизить число вещественных коэффициентов, используемых при описании искомого объекта. В качестве конкретной прикладной задачи, на которой проводятся исследования, выступает проблема распознавания лиц. Эффективность анализируемых подходов демонстрируется путём сравнения результатов их применения к изображениям из базы данных “Extended Yale Face Database B”. Алгоритмом классификации выступает метод ближайшего соседа.

Бесплатно

Сравнение архитектур нейронных сетей для подавления мультипликативного шума на изображениях

Сравнение архитектур нейронных сетей для подавления мультипликативного шума на изображениях

Павлов В.А., Белов А.А., Нгуен В.Т., Йовановски Н., Овсянникова А.С.

Статья научная

В статье сравниваются различные методы фильтрации шумов на изображении с помощью нейронных сетей, при этом обрабатываемые изображения могут содержать как однородные области, так и малоразмерные объекты, и резкие границы. Используются сверточные и полносвязные нейронные сети. Показано, что различные архитектуры НС требуют существенно разного количества обучающего материала для достижения одинакового качества фильтрации. Приведены примеры сетей с пониженными требованиями к количеству обучающего материала.

Бесплатно

Сравнение бинарных дескрипторов особых точек изображений в условиях искажений

Сравнение бинарных дескрипторов особых точек изображений в условиях искажений

Краснобаев Евгений Алексеевич, Чистобаев Дмитрий Викторович, Малышев Алексей Леонидович

Статья научная

Статья посвящена обзору и анализу бинарных дескрипторов особых точек объектов на цифровых изображениях в условиях искажений. Приводится обзор методов BRIEF, ORB, BRISK, FREAK, AKAZE, LATCH. Выполнена оценка свойств дескрипторов на типовых наборах изображений. В работе затрагиваются проблемы использования данных методов для обработки изображений в режиме реального времени.

Бесплатно

Сравнение дискретного косинус и вейвлет-преобразований в системах сжатия raw-изображений

Сравнение дискретного косинус и вейвлет-преобразований в системах сжатия raw-изображений

Сай Сергей Владимирович, Зинкевич Алексей Владимирович, Фомина Екатерина Сергеевна

Статья научная

В статье приводится описание особенностей цифровой обработки сигналов изображения в процессе кодирования на основе дискретного косинус- и вейвлет-преобразований, используемых в стандартах сжатия JPEG и JPEG2000. Для сравнения дискретного косинус-преобразования и дискретного вейвлет-преобразования разработана цифровая модель системы, в которой реализованы одинаковые этапы обработки сигналов, кроме этапов самих дискретных преобразований. Предложена методика анализа эффективности преобразований по объективным оценкам качества изображений в зависимости от коэффициента сжатия. К особенностям относится то, что, в отличие от популярных метрик PSNR и SSIM, для оценки качества предложено использовать коэффициент четкости изображения, вычисление которого связано с контрастной чувствительностью зрения. В результате исследований получены количественные оценки эффективности сжатия при заданных параметрах качества в зависимости от типа преобразования и детальности RAW-изображений. Предложены рекомендации по использованию результатов исследований в системах кодирования и передачи изображений с высокой четкостью.

Бесплатно

Сравнение изображений на основе их диффеоморфного преобразования

Сравнение изображений на основе их диффеоморфного преобразования

Лейхтер Сергей Владимирович, Чуканов Сергей Николаевич

Статья научная

Рассмотрена задача сравнения двух диффеоморфных изображений - начального изображения диффеоморфизма и конечного изображения диффеоморфизма, которые задаются множеством точек. Задача решается на основе метода построения минимизируемого функционала, характеризующего эволюцию диффеоморфного преобразования изображения от начального до конечного, и штрафа за отклонение траектории изображения от требуемой траектории. Разработан итерационный алгоритм решения уравнения диффеоморфного преобразования на основе итеративного метода решения уравнений. Рассмотрена задача сравнения двух изображений с использованием построения функционала при оптимальном метаморфозисе изображений.

Бесплатно

Статистическое кодирование при компрессии изображений на основе иерархической сеточной интерполяции

Статистическое кодирование при компрессии изображений на основе иерархической сеточной интерполяции

Гашников Михаил Валерьевич

Статья научная

Исследуются алгоритмы статистического кодирования при компрессии изображений. Предлагается подход к повышению эффективности кодов переменной длины при компрессии изображений с потерями. Разрабатывается алгоритм статистического кодирования, предназначенный для использования в составе методов компрессии изображений, осуществляющих кодирование декоррелированного сигнала с неравномерным распределением вероятностей. Производится экспериментальное сравнение предложенного алгоритма с алгоритмами ZIP и ARJ при кодировании специфических данных иерархического метода компрессии. Кроме того, проводится экспериментальное сравнение иерархического метода компрессии изображений, включающего разработанный алгоритм кодирования, с методом JPEG и методом на основе вейвлет-преобразования.

Бесплатно

Стратегии формирования панорамного видеоизображения без учёта информации о сюжетных соответствиях в мультиспектральных системах с распределённой апертурой

Стратегии формирования панорамного видеоизображения без учёта информации о сюжетных соответствиях в мультиспектральных системах с распределённой апертурой

Кудинов Игорь Алексеевич, Никифоров Михаил Борисович, Холопов Иван Сергеевич

Статья научная

Приведены аналитические выражения для расчета количества элементарных вычислительных операций, требуемых для формирования по двум альтернативным стратегиям нескольких персональных областей интереса пользователей панорамной обзорной системы технического зрения с распределённой апертурой: стратегия 1 - формирование полного панорамного кадра с последующим выделением персональных областей интереса, стратегия 2 - непосредственное формирование области интереса для каждого пользователя. Параметрами аналитических выражений являются количество камер распределённой системы, количество пользователей, разрешение кадров панорамы и пользователя. Полученные формулы для заданных параметров позволяют определить оптимальную по критерию минимума количества элементарных операций стратегию для формирования нескольких персональных областей интереса. Формирование области интереса основано только на априорной информации о внутренних и внешних параметрах камер, полученной в результате их фотограмметрической калибровки по универсальному тест-объекту, и не учитывает информации о сюжетных соответствиях на пересечениях их полей зрения.

Бесплатно

Структурно-топологический алгоритм идентификации звёзд и обнаружения объектов околоземного космического пространства

Структурно-топологический алгоритм идентификации звёзд и обнаружения объектов околоземного космического пространства

Журкин Игорь Георгиевич, Чабан Людмила Николаевна, Орлов Павел Юрьевич

Статья научная

При решении ряда задач космической навигации возникает вопрос об определении параметров движения космического аппарата и элементов ориентирования целевой аппаратуры, установленной на борту, по получаемым координатам зарегистрированных изображений звёзд. При этом в поле зрения съёмочной системы могут попадать посторонние объекты, снижающие вероятность правильного распознавания: активные спутники, естественный и искусственный космический мусор. Отсюда возникает необходимость фильтрации изображений звёздного неба от подобных помех. Если же объектами распознавания являются находящиеся в околоземном пространстве тела, то в данном случае сами изображения звёзд выступают в роли помех. Кроме того, поскольку обнаружение и каталогизация этих объектов с Земли затрудняется их малыми размерами, влиянием атмосферы, а также другими техническими трудностями, целесообразно использовать уже имеющуюся аппаратуру на борту космических аппаратов для решения подобной задачи. В работе представлены существующие алгоритмы распознавания групп звёзд, а также их классификация. Предложен структурно-топологический подход идентификации групп небесных светил, основанный на свойствах огибающих многоугольников, используемых при построении топологических конфигураций звёзд. Описаны особенности при построении топологических конфигураций на анализируемом множестве точек, а также принципы обнаружения динамического космического объекта в их пределах. Показаны результаты численных экспериментов, выполненные с применением разработанного алгоритма на картах звёздного неба и модельных сценах.

Бесплатно

Журнал