Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (280): Обработка изображений, распознавание образов
все рубрики
Совместная реконструкция и сегментация изображений: сравнение двух алгоритмов малоракурсной томографии

Совместная реконструкция и сегментация изображений: сравнение двух алгоритмов малоракурсной томографии

Власов Виталий Викторович, Коновалов Александр Борисович, Кольчугин Сергей Валентинович

Статья научная

В статье сравниваются два алгоритма малоракурсной томографии: итерационный алгоритм минимизации функционала Поттса и алгебраический алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией. Оба алгоритма ориентированы на восстановление кусочно-постоянных структур, используют теорию опознавания со сжатием и совмещают процедуры реконструкции и сегментации изображений. На уровне численного эксперимента показано, что каждый из алгоритмов способен точно восстанавливать фантом Шеппа-Логана всего по 7 ракурсам. Когда же речь идет о восстановлении объекта, имеющего сложную высокочастотную структуру (QR-кода), минимальное число ракурсов, необходимое для точной реконструкции, возрастает до 17-21 в случае алгоритма реконструкции с TV-регуляризацией и адаптивной сегментацией и до 32-34 в случае итерационного алгоритма минимизации функционала Поттса. Показано, что разработанный авторами статьи алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией имеет некоторое преимущество над итерационным алгоритмом минимизации функционала Поттса по таким критериям, как точность и скорость реконструкции, а также устойчивость к шуму проекционных данных. Отмечено, что алгоритм реконструкции с TV-регуляризацией и адаптивной сегментацией имеет хороший потенциал для дальнейшего совершенствования.

Бесплатно

Совместный анализ рентгенологических протоколов и компьютерных томограмм для автоматического уточнения патологических состояний головного мозга

Совместный анализ рентгенологических протоколов и компьютерных томограмм для автоматического уточнения патологических состояний головного мозга

Агафонова Юлия Дмитриевна, Гайдель Андрей Викторович, Зельтер Павел Михайлович, Капишников Александр Викторович, Кузнецов Андрей Владимирович, Суровцев Евгений Николаевич, Никоноров Артем Владимирович

Статья научная

Рассматривается задача валидации радиологических медицинских протоколов и изображений компьютерной томографии для автоматизированного анализа состояния головного мозга. Предлагается два метода решения задачи: метод на основе мультимодальной модели ruCLIP и метод, основанный на совместном использовании двух отдельных классификаторов - для текстового отчета и для изображения КТ головного мозга. Обсуждаются способы оценки полученных результатов. Предложенные подходы позволяют верно классифицировать на 15 возможных диагнозов 99,6 % радиологических отчётов из контрольной выборки.

Бесплатно

Современные технологии автоматического распознавания средств общения на основе визуальных данных

Современные технологии автоматического распознавания средств общения на основе визуальных данных

Ячная Валерия Олеговна, Луцив Вадим Ростиславович, Малашин Роман Олегович

Статья научная

Общение представляет собой широкий спектр различных действий, связанных с приёмом и передачей информации. Процесс общения складывается из вербальных, паравербальных и невербальных компонентов, содержащих информационную часть передаваемого сообщения и его эмоциональную окраску соответственно. Комплексный анализ всех компонентов общения позволяет оценить не только содержательную составляющую, но и ситуативный контекст сказанного, а также выявлять дополнительные факторы, относящиеся к психическому и соматическому состоянию говорящего. Существует несколько методов передачи вербального сообщения, среди которых устная и жестовая речь. Речевые и околоречевые компоненты общения могут содержаться в различных каналах данных, таких как аудио- или видеоканалы. В данном обзоре рассматриваются системы анализа видеоданных ввиду того, что аудиоканал не способен передать ряд околоречевых компонентов общения, вносящих в передаваемое сообщение дополнительную информацию. Проводится анализ существующих баз данных статических и динамических образов и систем, разрабатываемых для распознавания вербальной составляющей в устной и жестовой речи, а также систем, оценивающих паравербальные и невербальные компоненты общения. Обозначены сложности, с которыми сталкиваются разработчики подобных баз данных и систем. Также сформулированы перспективные направления разработок, связанные в том числе с комплексным анализом всех компонентов общения с целью наиболее полной оценки передаваемого сообщения.

Бесплатно

Спектральное и пространственное сверхразрешение при комплексировании данных ДЗЗ различных источников

Спектральное и пространственное сверхразрешение при комплексировании данных ДЗЗ различных источников

Белов Александр Михайлович, Денисова Анна Юрьевна

Статья научная

В статье предлагается алгоритм получения пространственного и спектрального сверхразрешения для совокупности изображений дистанционного зондирования Земли, полученных при помощи различной съёмочной аппаратуры. Результат работы алгоритма рассматривается как модель идеального источника данных, обладающего большей точностью представления наблюдаемой территории, чем каждое из входных изображений, имеющих более низкое пространственное и спектральное разрешение. Предложенный алгоритм основан на методе градиентного спуска и использует уточнённую модель наблюдения изображений, включающую спектральную дискретизацию и интерполяцию, возникающую при переходе от наблюдаемых входных изображений к модельному представлению. В статье описывается экспериментальное исследование предложенного алгоритма на модельных изображениях низкого разрешения, полученных из гиперспектрального снимка дистанционного зондирования Земли. Практическое применение предлагаемого алгоритма заключается в совместной обработке данных ДЗЗ различного уровня, позволяющей стереть границы, возникающие из-за конструктивных различий изображающих систем.

Бесплатно

Способ оценки четкости фотореалистичных изображений с высоким разрешением

Способ оценки четкости фотореалистичных изображений с высоким разрешением

Сай Сергей Владимирович

Статья научная

В статье предлагается способ оценки четкости фотореалистичных изображений, основанный на сравнении коэффициента детальности оригинального и искаженного изображений. В алгоритме идентификации мелких структур оригинального изображения используются операции сегментации активных пикселей, к которым относятся точечные объекты, тонкие линии и фрагменты текстуры. Количество активных пикселей оценивается значением коэффициента детальности, которое определяется отношением активных пикселей к общему количеству пикселей изображения. Этот же алгоритм используется для вычисления значения коэффициента детальности искаженного изображения, и далее оценивается снижение четкости с помощью сравнения полученных значений. К особенностям способа относится то, что идентификация мелких структур и сегментация активных пикселей выполняется в нормированной системе N-CIELAB.Также в алгоритме учитывается влияние ложных микроструктур на результаты оценки реставрированного изображения. Рассматриваются особенности построения нейронных сетей SRCNN в задачах качественного повышения разрешения изображения с восстановлением мелких структур. Приводятся результаты анализа качества увеличенных изображений по традиционным метрикам PSNR и SSIM, а также по предлагаемому способу.

Бесплатно

Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

Способ управления качеством передачи мелких структур изображений в стандарте JPEG2000

Сай Сергей Владимирович, Шоберг Анатолий Германович

Статья научная

В статье предлагается способ управления качеством передачи мелких структур изображений в стандарте JPEG2000 на основе автоматической регулировки параметров квантования коэффициентов дискретного вейвлет-преобразования. Описывается алгоритм настройки параметров шкалы квантования по субдиапазонам трансформации коэффициентов ДВП в зависимости от заданных (допустимых) искажений. Для объективной оценки качества изображений использованы числовые меры искажений мелких деталей в нормированной колометрической системе N-CIELAB, по которым выполняется анализ их структурных признаков. Приводятся результаты экспериментальных исследований анализа качества изображений и эффективности сжатия в зависимости от параметров квантования в разработанном адаптивном алгоритме сжатия. Также приводятся результаты оценки быстродействия алгоритма, которые могут быть использованы для практического применения в мультимедийных приложениях.

Бесплатно

Сравнение алгоритмов выделения области интереса на компьютерных томограммах легких

Сравнение алгоритмов выделения области интереса на компьютерных томограммах легких

Пашина Татьяна Андреевна, Гайдель Андрей Викторович, Зельтер Павел Михайлович, Капишников Александр Викторович, Никоноров Артем Владимирович

Статья научная

Рассматривается автоматическое создание масок для выделения лёгких на компьютерных томограммах с помощью трёх подходов: метода Оцу, простой свёрточной нейронной сети, состоящей из 10 одинаковых слоёв, и свёрточной нейронной сети U-Net. Произведено исследование и сравнение используемых методов автоматического выделения области интереса на реальных изображениях компьютерной томографии лёгких, полученных в Клиниках СамГ-МУ. Решение данной задачи актуально, так как она является первым этапом при автоматизированном поиске патологических изменений на изображениях компьютерной томографии. Предложен алгоритм постобработки изображений, основанный на поиске контуров, который позволяет повысить качество сегментации. Сделан вывод о том, что U-Net выделяет область интереса, относящуюся к легкому, несколько лучше, чем два других подхода. При этом простая свёрточная нейронная сеть обеспечивает достоверность сегментации 97,5 %, что лучше достоверности сегментации 96,7 %, достигнутой с помощью метода Оцу, и лучше достоверности сегментации 96,4 %, достигнутой с помощью нейронной сети U-Net.

Бесплатно

Сравнение алгоритмов описания комплекснозначного поля градиента цифровых изображений с использованием линейных методов снижения размерности

Сравнение алгоритмов описания комплекснозначного поля градиента цифровых изображений с использованием линейных методов снижения размерности

Дмитриев Егор Андреевич, Мясников Владислав Валерьевич

Статья научная

В работе представлен анализ различных подходов к построению описаний полей градиентов цифровых изображений. Анализируемые подходы основаны на известных методах снижения размерности данных, таких как методы главных и независимых компонент, метод дискриминантного анализа. Мы применяем указанные методы не к исходному изображению, представленному в виде двумерного поля яркости (полутоновому изображению), а к его вторичному представлению в виде двумерного поля градиента - комплекснозначному изображению. При этом рассматриваются случаи использования как поля градиента целиком, так и только его фазовой части. Дополнительно рассматриваются два независимых способа формирования окончательного описания искомого объекта: в виде коэффициентов разложения поля градиента по сформированному базису и с использованием оригинальной авторской конструкции модельно-ориентированных дескрипторов. Последние позволяют в два раза снизить число вещественных коэффициентов, используемых при описании искомого объекта. В качестве конкретной прикладной задачи, на которой проводятся исследования, выступает проблема распознавания лиц. Эффективность анализируемых подходов демонстрируется путём сравнения результатов их применения к изображениям из базы данных “Extended Yale Face Database B”. Алгоритмом классификации выступает метод ближайшего соседа.

Бесплатно

Сравнение бинарных дескрипторов особых точек изображений в условиях искажений

Сравнение бинарных дескрипторов особых точек изображений в условиях искажений

Краснобаев Евгений Алексеевич, Чистобаев Дмитрий Викторович, Малышев Алексей Леонидович

Статья научная

Статья посвящена обзору и анализу бинарных дескрипторов особых точек объектов на цифровых изображениях в условиях искажений. Приводится обзор методов BRIEF, ORB, BRISK, FREAK, AKAZE, LATCH. Выполнена оценка свойств дескрипторов на типовых наборах изображений. В работе затрагиваются проблемы использования данных методов для обработки изображений в режиме реального времени.

Бесплатно

Сравнение дискретного косинус и вейвлет-преобразований в системах сжатия raw-изображений

Сравнение дискретного косинус и вейвлет-преобразований в системах сжатия raw-изображений

Сай Сергей Владимирович, Зинкевич Алексей Владимирович, Фомина Екатерина Сергеевна

Статья научная

В статье приводится описание особенностей цифровой обработки сигналов изображения в процессе кодирования на основе дискретного косинус- и вейвлет-преобразований, используемых в стандартах сжатия JPEG и JPEG2000. Для сравнения дискретного косинус-преобразования и дискретного вейвлет-преобразования разработана цифровая модель системы, в которой реализованы одинаковые этапы обработки сигналов, кроме этапов самих дискретных преобразований. Предложена методика анализа эффективности преобразований по объективным оценкам качества изображений в зависимости от коэффициента сжатия. К особенностям относится то, что, в отличие от популярных метрик PSNR и SSIM, для оценки качества предложено использовать коэффициент четкости изображения, вычисление которого связано с контрастной чувствительностью зрения. В результате исследований получены количественные оценки эффективности сжатия при заданных параметрах качества в зависимости от типа преобразования и детальности RAW-изображений. Предложены рекомендации по использованию результатов исследований в системах кодирования и передачи изображений с высокой четкостью.

Бесплатно

Сравнение изображений на основе их диффеоморфного преобразования

Сравнение изображений на основе их диффеоморфного преобразования

Лейхтер Сергей Владимирович, Чуканов Сергей Николаевич

Статья научная

Рассмотрена задача сравнения двух диффеоморфных изображений - начального изображения диффеоморфизма и конечного изображения диффеоморфизма, которые задаются множеством точек. Задача решается на основе метода построения минимизируемого функционала, характеризующего эволюцию диффеоморфного преобразования изображения от начального до конечного, и штрафа за отклонение траектории изображения от требуемой траектории. Разработан итерационный алгоритм решения уравнения диффеоморфного преобразования на основе итеративного метода решения уравнений. Рассмотрена задача сравнения двух изображений с использованием построения функционала при оптимальном метаморфозисе изображений.

Бесплатно

Статистическое кодирование при компрессии изображений на основе иерархической сеточной интерполяции

Статистическое кодирование при компрессии изображений на основе иерархической сеточной интерполяции

Гашников Михаил Валерьевич

Статья научная

Исследуются алгоритмы статистического кодирования при компрессии изображений. Предлагается подход к повышению эффективности кодов переменной длины при компрессии изображений с потерями. Разрабатывается алгоритм статистического кодирования, предназначенный для использования в составе методов компрессии изображений, осуществляющих кодирование декоррелированного сигнала с неравномерным распределением вероятностей. Производится экспериментальное сравнение предложенного алгоритма с алгоритмами ZIP и ARJ при кодировании специфических данных иерархического метода компрессии. Кроме того, проводится экспериментальное сравнение иерархического метода компрессии изображений, включающего разработанный алгоритм кодирования, с методом JPEG и методом на основе вейвлет-преобразования.

Бесплатно

Стратегии формирования панорамного видеоизображения без учёта информации о сюжетных соответствиях в мультиспектральных системах с распределённой апертурой

Стратегии формирования панорамного видеоизображения без учёта информации о сюжетных соответствиях в мультиспектральных системах с распределённой апертурой

Кудинов Игорь Алексеевич, Никифоров Михаил Борисович, Холопов Иван Сергеевич

Статья научная

Приведены аналитические выражения для расчета количества элементарных вычислительных операций, требуемых для формирования по двум альтернативным стратегиям нескольких персональных областей интереса пользователей панорамной обзорной системы технического зрения с распределённой апертурой: стратегия 1 - формирование полного панорамного кадра с последующим выделением персональных областей интереса, стратегия 2 - непосредственное формирование области интереса для каждого пользователя. Параметрами аналитических выражений являются количество камер распределённой системы, количество пользователей, разрешение кадров панорамы и пользователя. Полученные формулы для заданных параметров позволяют определить оптимальную по критерию минимума количества элементарных операций стратегию для формирования нескольких персональных областей интереса. Формирование области интереса основано только на априорной информации о внутренних и внешних параметрах камер, полученной в результате их фотограмметрической калибровки по универсальному тест-объекту, и не учитывает информации о сюжетных соответствиях на пересечениях их полей зрения.

Бесплатно

Структурно-топологический алгоритм идентификации звёзд и обнаружения объектов околоземного космического пространства

Структурно-топологический алгоритм идентификации звёзд и обнаружения объектов околоземного космического пространства

Журкин Игорь Георгиевич, Чабан Людмила Николаевна, Орлов Павел Юрьевич

Статья научная

При решении ряда задач космической навигации возникает вопрос об определении параметров движения космического аппарата и элементов ориентирования целевой аппаратуры, установленной на борту, по получаемым координатам зарегистрированных изображений звёзд. При этом в поле зрения съёмочной системы могут попадать посторонние объекты, снижающие вероятность правильного распознавания: активные спутники, естественный и искусственный космический мусор. Отсюда возникает необходимость фильтрации изображений звёздного неба от подобных помех. Если же объектами распознавания являются находящиеся в околоземном пространстве тела, то в данном случае сами изображения звёзд выступают в роли помех. Кроме того, поскольку обнаружение и каталогизация этих объектов с Земли затрудняется их малыми размерами, влиянием атмосферы, а также другими техническими трудностями, целесообразно использовать уже имеющуюся аппаратуру на борту космических аппаратов для решения подобной задачи. В работе представлены существующие алгоритмы распознавания групп звёзд, а также их классификация. Предложен структурно-топологический подход идентификации групп небесных светил, основанный на свойствах огибающих многоугольников, используемых при построении топологических конфигураций звёзд. Описаны особенности при построении топологических конфигураций на анализируемом множестве точек, а также принципы обнаружения динамического космического объекта в их пределах. Показаны результаты численных экспериментов, выполненные с применением разработанного алгоритма на картах звёздного неба и модельных сценах.

Бесплатно

Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка

Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка

Федотов Николай Гаврилович, Смов Алексей Александрович, Моисеев Александр Владимирович

Статья научная

В статье последовательно описывается теоретическая основа нового геометрического метода анализа и распознавания трёхмерных (3D) изображений. Даётся описание техники сканирования для формирования гипертрейс-преобразования и его математическая модель. Данный метод в отличие от существующих позволяет анализировать 3D-изображения без предварительного их упрощения или построения проекций на плоскости, анализируя непосредственно их трёхмерную форму. Обоснован выбор сканирующего инструмента и построение опорной сетки на сфере, необходимой для решения проблемы инвариантности распознавания 3D-изображения к повороту. Разработан математический аппарат стохастической реализации техники сканирования на основе стохастической геометрии и функционального анализа. Введён новый математический инструмент для анализа 3D-изображений - гипертрейс-матрица, позволяющий распознавать пространственные объекты сложной формы и структуры благодаря построению единой математической модели 3D-изображения. Представлено описание нового типа признаков 3D-изображений, имеющих аналитическую структуру, - гипертриплетные признаки, благодаря аналитической структуре которых возможна автоматическая генерация большого количества признаков с заранее заданными свойствами. Рассматриваются результаты экспериментальной проверки, демонстрирующие точность вычисления признаков для распознавания 3D-изображения и доказывающие адекватность разработанного математического аппарата.

Бесплатно

Технология повышения детализации изображений с нелинейной коррекцией высокоградиентных фрагментов

Технология повышения детализации изображений с нелинейной коррекцией высокоградиентных фрагментов

Фурсов Владимир Алексеевич, Гошин Егор Вячеславович, Медведева Ксения Сергеевна

Статья научная

Статья посвящена проблеме улучшения качества изображений, регистрируемых с помощью оптических приборов низкого разрешения, в том числе дифракционных регистрирующих приборов. Предлагается двухэтапная технология коррекции изображений. На первом этапе осуществляется коррекция с использованием линейного КИХ-фильтра с центрально-симметричным частотным откликом в виде отрезков квадратичной и экспоненциальной функций. Полученное изображение затем подвергается обработке нелинейным фильтром, который осуществляет компьютерное ретуширование участков изображений, характеризующихся заметным перепадом яркости. Преобразованию подвергаются лишь отсчёты, в которых модуль среднего значения градиентов в различных направлениях достаточно высокий, то есть находятся на границах областей с различным уровнем яркости. Это позволяет избежать усиления шумов в области фона, что характерно для традиционных фильтров. Приводятся примеры реализации, показывающие возможность достижения высокой резкости и иллюстрирующие простоту настройки фильтра по визуальному восприятию.

Бесплатно

Устройство на основе ПЛИС для распознавания рукописных цифр на изображениях

Устройство на основе ПЛИС для распознавания рукописных цифр на изображениях

Зоев Иван Владимирович, Береснев Алексей Павлович, Марков Николай Григорьевич, Мальчуков Андрей Николаевич

Статья научная

Рассмотрена задача создания мобильного и энергоэффективного устройства, позволяющего распознавать рукописные цифры на изображениях с помощью свёрточных нейронных сетей. Устройство реализовано на основе программируемой логической интегральной схемы, входящей в систему на кристалле Cyclone V SX. При этом разработаны функциональные схемы вычислительных блоков, реализующих процедуры свёртки и подвыборки, а также функциональная схема самой свёрточной нейронной сети предложенной архитектуры. Приведены результаты исследования эффективности созданного устройства на программируемой логической интегральной схеме в части точности распознавания рукописных цифр, производительности устройства и его энергопотребления. Показаны результаты сравнения эффективности аппаратной реализации свёрточной нейронной сети с её программной реализацией.

Бесплатно

Формирование информативного индекса для различения заданных объектов гиперспектральных данных

Формирование информативного индекса для различения заданных объектов гиперспектральных данных

Парингер Рустам Александрович, Мухин Артем Владимирович, Куприянов Александр Викторович

Статья научная

Работа посвящена разработке подхода, позволяющему по малому числу наблюдений создавать правила различения заданных объектов гиперспектральных данных. Разработка подобного подхода способствовала бы развитию методов и алгоритмов для оперативного анализа гиперспектральных данных, применимых как для предварительной обработки, так и для выполнения разметки гиперспектральных данных. Для реализации подхода предлагается применять технологию, заключающуюся в совместном использовании общих правил вычисления индексов и критериев информативности. В рамках данной работы при реализации предлагаемой технологии индекс задается нормализованной разностной формулой, а информативность оценивается на основе значения критерия разделимости дискриминантного анализа. В результате проведённых исследований, было показано, что с использованием алгоритма, реализующего технологию, была решена задача различения областей гиперспектральных данных с разной растительностью. Сформированный алгоритмом индекс оказался близким по значениям к NDVI. Применяемая технология является генерализацией подхода к формированию правил анализа гиперспектральных данных по малому числу признаков и может быть использована для формирования индексов, информативных в различных задачах.

Бесплатно

Экспериментальное определение влажности почвы по гиперспектральным изображениям

Экспериментальное определение влажности почвы по гиперспектральным изображениям

Подлипнов Владимир Владимирович, Щедрин Вячеслав Николаевич, Бабичев Александр Николаевич, Васильев Сергей Михайлович, Бланк Вероника Александровна

Статья научная

Анализируется возможность определения влажности на основе использования спектральных распределений в диапазоне длин волн до 1 мкм. Рассматривается использование изображающих гиперспектрометров для точного земледелия. Описывается полевой эксперимент по определению индекса влажности почвы, покрытой растительностью. Описывается процедура точной калибровки гиперспектрометра на основе использования перестраиваемого лазера. Показана возможность практического определения влажности на основе использования спектров в диапазоне длин волн до 1 мкм.

Бесплатно

Эффективность алгоритмов машинного обучения и свёрточной нейронной сети для обнаружения патологических изменений на магнитно-резонансных томограммах головного мозга

Эффективность алгоритмов машинного обучения и свёрточной нейронной сети для обнаружения патологических изменений на магнитно-резонансных томограммах головного мозга

Агафонова Юлия Дмитриевна, Гайдель Андрей Викторович, Зельтер Павел Михайлович, Капишников Александр Викторович

Статья научная

В работе сравниваются подходы для автоматического обнаружения различимых невооружённым глазом областей патологических изменений на изображениях МРТ головного мозга. В статье проанализированы многоэтапные подходы для диагностики видимых патологических изменений головного мозга на магнитно-резонансных томограммах, основанные на глубоком обучении и на пороговой обработке. Была сформирована свёрточная нейронная сеть, построен классификатор, основанный на применении ансамбля решающих деревьев, был создан алгоритм для многоэтапной обработки изображений. В результате экспериментальных исследований было установлено, что наиболее эффективным методом распознавания изображений магнитно-резонансной томографии является подход, основанный на ансамбле решающих деревьев. С его помощью 95 % изображений из контрольной выборки были классифицированы правильно. При этом с помощью свёрточной нейронной сети удалось классифицировать правильно все изображения, содержащие область патологических изменений. Полученные данные могут найти применение на практике для диагностики заболеваний головного мозга, для автоматизации процесса обработки большого количества исследований магнитно-резонансной томографии.

Бесплатно

Журнал