Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (287): Обработка изображений, распознавание образов
все рубрики
Обзор алгоритмов детектирования текстовых областей на изображениях и видеозаписях

Обзор алгоритмов детектирования текстовых областей на изображениях и видеозаписях

Болотова Юлия Александровна, Спицын Владимир Григорьевич, Осина Полина Максимовна

Статья научная

Статья посвящена обзору методов детектирования и сегментации текстовых областей на изображениях и видеозаписях. Определяется обобщенный алгоритм работы систем распознавания текстов. Проводится обзор методов детектирования, определения структуры и сегментации текстовых документов в рамках решения задачи распознавания текстовых областей на изображениях и видеозаписях. Методы, предложенные в течение 30 лет исследований, анализируются с точки зрения точности, скорости и универсальности. В работе затрагиваются современные проблемы, касающиеся детектирования и распознавания текстовых областей на изображениях.

Бесплатно

Обнаружение атак на биометрическое предъявление на системы аутентификации лиц при помощи специальных устройств съёмки

Обнаружение атак на биометрическое предъявление на системы аутентификации лиц при помощи специальных устройств съёмки

Денисова Анна Юрьевна, Федосеев Виктор Андреевич

Статья научная

В статье предлагается система признаков, предназначенная для обнаружения атак на биометрическое предъявление на системы аутентификации, использующие лицевую биометрию. При таком типе атаки злоумышленник маскируется под авторизованного пользователя, используя его изображение. Предложенная система признаков предполагает возможность использования одного или нескольких изображающих сенсоров в дополнение к базовой RGB-камере (тепловизоры, дальномеры, инфракрасные камеры). Использование предложенной системы признаков в сочетании с одной из классических моделей бинарной классификации составляет предлагаемый в работе метод обнаружения атак на биометрическое предъявление. Данный метод продемонстрировал низкий уровень ошибок на наборе данных WMCA, при этом эксперименты показали его способность оставаться эффективным в условиях нехватки обучающих данных. Проведённые сравнительные эксперименты показали, что предложенный метод превзошёл алгоритм RDWT-Haralick-SVM и приблизился к результатам алгоритма MC-CNN, основанного на глубоком обучении и требующего значительно больший объём обучающих данных.

Бесплатно

Обнаружение встраиваний на изображениях путем анализа артефактов, обусловленных параметрами сенсора регистрирующего устройства

Обнаружение встраиваний на изображениях путем анализа артефактов, обусловленных параметрами сенсора регистрирующего устройства

Варламова Анна Александровна, Кузнецов Андрей Владимирович

Статья научная

Встраивание в изображение областей, скопированных из другого изображения, является одним из часто осуществляемых видов подделки изображений. Данная статья посвящена исследованию одного из методов их обнаружения, работа которого основана на анализе артефактов, обусловленных параметрами сенсора регистрирующего устройства, при помощи которого было получено изображение. Для проверки подлинности изображение разбивается на блоки, для каждого из которых вычисляется критерий, определяющий вероятность наличия/отсутствия на нем артефактов и, как следствие, вероятность того, является ли блок встроенным. В экспериментальной части работы проводится анализ точности обнаружения встроенных областей, а также исследование устойчивости метода к различным видам искажений: аддитивному гауссовскому шуму, сжатию JPEG и линейному контрастированию. Результаты экспериментов показали, что метод позволяет обнаруживать встроенные области различной природы, формы и размера, а также обладает устойчивостью к аддитивному гауссовскому шуму и линейному контрастированию для заданного диапазона параметров, но не устойчив к сжатию JPEG. Отличительной особенностью метода является возможность выявления встроенных областей с минимальным размером 2×2.

Бесплатно

Обнаружение искусственных фрагментов, встроенных в изображения дистанционного зондирования состязательными нейросетями

Обнаружение искусственных фрагментов, встроенных в изображения дистанционного зондирования состязательными нейросетями

Гашников Михаил Валерьевич, Кузнецов Андрей Владимирович

Статья научная

Исследуются алгоритмы обнаружения искусственных фрагментов изображений дистанционного зондирования Земли, сгенерированных состязательными нейронными сетями. Рассматривается детектор искусственных изображений, основанный на обнаружении характерного для генеративно-состязательных нейросетей спектрального артефакта, причиной возникновения которого является слой сети, повышающий разрешение. Рассматриваемый детектор применяется для обнаружения искусственных фрагментов, встроенных в настоящие изображения дистанционного зондирования Земли с помощью состязательной нейросети, включающей генератор протяженных элементов. При этом используются изображения дистанционного зондирования различного типа и разрешения, а подменяемые области, некоторые из которых не являются односвязными, имеют различные размеры и формы. Экспериментально показано, что исследуемый спектральный нейросетевой детектор имеет высокую эффективность при обнаружении искусственных фрагментов изображений дистанционного зондирования Земли.

Бесплатно

Обнаружение коронавирусной инфекции COVID-19 на основе анализа рентгеновских снимков грудной клетки методами глубокого обучения

Обнаружение коронавирусной инфекции COVID-19 на основе анализа рентгеновских снимков грудной клетки методами глубокого обучения

Щетинин Евгений Юрьевич

Статья научная

Раннее выявление пациентов с коронавирусной инфекцией COVID-19 имеет важное значение для обеспечения их адекватного лечения и снижения нагрузки на систему здравоохранения. Эффективным методом обнаружения COVID-19 является компьютерный анализ рентгеновских снимков грудной клетки методами глубокого обучения. В работе предложена методология, состоящая из этапов стандартизации размеров рентгеновских снимков к (224, 224), их классификации с использованием глубоких сверточных нейронных сетей Xception, InceptionResNetV2, MobileNetV2, DenseNet121, ResNet50 и VGG16, предварительно обученных на наборе данных ImageNet, а затем настроенных на наборе рентгеновских снимков грудной клетки. Результаты компьютерных экспериментов показали, что модель VGG16 с тонкой настройкой параметров продемонстрировала максимальную эффективность в классификации COVID-19 с показателями точности (accuracy) 99,09 %, полнота (recall) 99,483 %, прецизионность (precision) 99,08 %.

Бесплатно

Обнаружение объектов на изображении: от критериев Байеса и Неймана-Пирсона к детекторам на базе нейронных сетей

Обнаружение объектов на изображении: от критериев Байеса и Неймана-Пирсона к детекторам на базе нейронных сетей

Андриянов Никита Андреевич, Дементьев Виталий Евгеньевич, Ташлинский Александр Григорьевич

Статья научная

Актуальность задач обнаружения и распознавания объектов на изображениях и их последовательностях с годами только возрастает. За последние несколько десятилетий предложено огромное количество подходов и методов обнаружения как аномалий, то есть областей изображения, характеристики которых отличаются от прогнозных, так и объектов интереса, о свойствах которых есть априорная информация, вплоть до библиотеки эталонов. В работе предпринята попытка системного анализа тенденций развития подходов и методов обнаружения, причин этого развития, а также метрик, предназначенных для оценки качества и достоверности обнаружения объектов. Рассмотрено обнаружение на основе математических моделей изображений. При этом особое внимание уделено подходам на основе моделей случайных полей и отношения правдоподобия. Проанализировано развитие сверточных нейронный сетей, направленных на задачи распознавания и обнаружения, включая ряд предобученных архитектур, обеспечивающих высокую эффективность при решении данной задачи. В них для обучения используются уже не математические модели, а библиотеки реальных снимков. Среди характеристик оценки качества обнаружения рассмотрены вероятности ошибок первого и второго рода, точность и полнота обнаружения, пересечение по объединению, интерполированная средняя точность. Также представлены типовые тесты, которые применяются для сравнения различных нейросетевых алгоритмов.

Бесплатно

Обнаружение поверхностных дефектов сварных соединений при визуальном контроле методами машинного зрения

Обнаружение поверхностных дефектов сварных соединений при визуальном контроле методами машинного зрения

Емельянова Мария Геннадьевна, Смаилова Сауле Сансызбаевна, Бакланова Ольга Евгеньевна

Статья научная

В статье рассматривается задача автоматического обнаружения поверхностных дефектов сварных соединений труб из нержавеющей стали в процессе производства. Показаны возможные дефекты, возникающие при дуговой сварке металла неплавящимся электродом в среде инертного газа. Приведено обоснование выбора метода решения задачи на основе моделирования и вычитания фона. Предлагается алгоритм обнаружения поверхностных дефектов сварных соединений на кадрах видеопоследовательностей, учитывающий специфику конкретной области. Модели фона строились методами усреднения кадров и Гауссовой смеси. Проведены экспериментальные исследования работы алгоритма на примерах обработки кадров видеопоследовательностей, полученных со статичной камеры. Полученные результаты подтверждают, что для автоматического обнаружения дефектов сварки подходящим является метод построения модели фона, основанный на усреднении кадров, поскольку дефекты различны и имеют характерные особенности. Предлагаемый алгоритм позволяет обнаруживать и выделять дефектную область в сварном соединении на кадрах видеопоследовательностей. Результаты экспериментов показывают, что алгоритм удовлетворяет требованиям непрерывного оперативного обнаружения поверхностных дефектов.

Бесплатно

Обнаружение световозвращающих объектов на основе поиска пространственных аномалий

Обнаружение световозвращающих объектов на основе поиска пространственных аномалий

Борзов Сергей Михайлович, Потатуркин Олег Иосифович, Узилов Сергей Борисович

Статья научная

Данная работа посвящена исследованию методов обнаружения световозвращающих объектов, в т.ч. оптических и оптико-электронных приборов наблюдения, на основе поиска пространственных аномалий в изображениях, сформированных в системах лазерной импульсной локации. Разработаны алгоритмы и программно-аппаратные средства обнаружения световозвращающих объектов. При этом особое внимание уделено различным способам формирования разностных кадров при периодической подсветке, в т.ч. с предварительным замещением каждого пикселя фоновых изображений на максимальное значение по соответствующей окрестности. Продемонстрирована эффективность предложенных методов для обнаружения световозвращающих объектов в условиях интенсивного солнечного освещения, несмотря на наличие в поле зрения зеркальных и диффузных отражающих поверхностей.

Бесплатно

Обоснование выбора источников излучения для системы технического зрения в задаче автоматической посадки беспилотных летательных аппаратов

Обоснование выбора источников излучения для системы технического зрения в задаче автоматической посадки беспилотных летательных аппаратов

Агеев Андрей Михайлович, Бондарев Валерий Георгиевич, Проценко Виталий Владимирович

Статья научная

Обоснован целесообразный спектральный диапазон источников излучения для применения в автоматической системе посадки беспилотных летательных аппаратов. Предложен способ синхронизации фотоэкспозиции системы технического зрения и излучения ориентиров для однозначного определения их взаимного расположения. Приведены результаты экспериментальных исследований.

Бесплатно

Обработка данных оптических триангуляционных сканеров для измерения профилей рельсов

Обработка данных оптических триангуляционных сканеров для измерения профилей рельсов

Васин Николай Николаевич, Диязитдинов Ринат Радмирович

Статья научная

В статье представлены алгоритмы совмещения профиля измеряемого рельса с профилем неизношенного рельса. Работа алгоритмов основана на вычислении параметров преобразования, связывающего между собой два профиля, один из которых задан совокупностью точек, а второй - уравнениями линий. Алгоритмы предназначены для измерения износов рельса по данным триангуляционных сканеров на вагоне-путеизмерителе.

Бесплатно

Обработка и анализ изображений на основе использования информации о фазе

Обработка и анализ изображений на основе использования информации о фазе

Павельева Елена Александровна

Статья научная

В работе представлены основные подходы к использованию фазовой информации в задачах анализа, обработки и восстановления изображений. Приведены описания фазовых алгоритмов и примеры результатов их работы. Предложена методика применения фазовой информации на основе проекционного метода Эрмита.

Бесплатно

Одноэтапный детектор лиц и особых точек на цифровых изображениях

Одноэтапный детектор лиц и особых точек на цифровых изображениях

Визильтер Юрий Валентинович, Горбацевич Владимир Сергеевич, Моисеенко Анастасия Сергеевна

Статья научная

Поиск особых точек лица является важной подзадачей в решении ряда задач лицевой биометрии. В системах распознавания лиц построение биометрического шаблона происходит по предварительно выровненному (нормализованному) изображению лица, этап нормализации включает в себя задачу поиска основных точек лица. Актуальной в подобной задаче является проблема баланса между качеством работы детектора особых точек и скоростью. В данной статье предложен одноэтапный детектор лиц и особых точек на базе глубоких конволюционных нейронных сетей, работающий в режиме реального времени и достигающий высокого качества на ряде известных тестовых выборок (AFLW2000, COFW, Menpo2D). Предлагаемый детектор лиц и особых точек основан на идее одноэтапного детектора объектов SSD, зарекомендовавшего себя как алгоритм, обеспечивающий высокую скорость работы и высокое качество обнаружения объектов. В качестве базовой архитектуры глубоких конволюционных нейронных сетей используется сеть ShuffleNet V2. Важной особенностью предлагаемого алгоритма является то, что обнаружение лица на изображении и поиск ключевых точек делается за один проход глубоких конволюционных нейронных сетей, что позволяет значительно экономить время на этапе внедрения. Также подобная многозадачность позволяет снизить процент ошибок в задаче поиска особых точек, что позитивно сказывается на качестве работы итогового алгоритма распознавания лиц.

Бесплатно

Описание изображений с использованием конфигурационного отношения эквивалентности

Описание изображений с использованием конфигурационного отношения эквивалентности

Мясников Владислав Валерьевич

Статья научная

В работе предлагается подход к построению описания данных и изображений, основанный на поиске оптимальной конфигурации (перестановки) их составляющих (отсчётов, областей, векторов признаков и др.). Критерий качества конфигурации, который может быть выбран в соответствии с прикладной задачей, определяет понятие оптимальности конфигурации. Конкретные конфигурации разбивают все множество анализируемых данных/изображений на эквивалентные подклассы, описания которых совпадают. Рассматриваются задачи инвариантности описаний, устойчивости предлагаемого представления, связи предлагаемого подхода с известными решениями: LBP и знаковым представлением изображения. Дана иллюстрация решения прикладной задачи с использованием предлагаемого подхода.

Бесплатно

Описание изображений с использованием модельно-ориентированных дескрипторов

Описание изображений с использованием модельно-ориентированных дескрипторов

Мясников Владислав Валерьевич

Статья научная

В работе предлагается подход к построению описания изображений, основанный на их представлении с использованием набора модельно-ориентированных дескрипторов. Каждый дескриптор характеризует «схожесть» анализируемого изображения, представленного в виде комплекснозначного поля градиента, с некоторой предварительно выбранной моделью этого дескриптора. Для синтеза моделей дескрипторов в работе предлагается использовать метод главных компонент, применяемых для множества реализаций комплекснозначных градиентных полей. Предлагаемый подход позволяет получить описание комплекснозначного поля градиента анализируемого изображения в виде набора вещественных величин - признаков дескрипторов - из интервала [0, 1], которые одновременно характеризуют и фазовую, и абсолютную составляющую градиента изображения. Эффективность предлагаемого подхода демонстрируется на примере решения задачи распознавания лиц путем сопоставления с решением-прототипом (методом «собственных лиц»), использующим непосредственно полутоновые изображения. Сравнение выполняется с использованием классификатора по ближайшему соседу.

Бесплатно

Определение объёмного содержания волокон в слоистых композитах оптическими методами

Определение объёмного содержания волокон в слоистых композитах оптическими методами

Комаров Валерий Андреевич, Павлов Александр Александрович

Статья научная

Рассматривается задача определения объёмного содержания армирующего волокна в нитях слоистых композитов с тканевыми заполнителями. В качестве источника информации о структуре материала используются цифровые микроизображения шлифованной поверхности поперечных сечений композитов. Обсуждаются методы и особенности анализа растровых микроскопических снимков гетерогенного материала, связанные с переменной яркостью пикселей и размытостью границ «волокно-связующее». В целях сокращения трудоёмкости и повышения объективности обработки изображений предлагается и строится специальный автоэнкодер. Изложение сопровождается сквозным демонстрационным примером исследования структуры типового конструкционного углепластика. Показано существенное ускорение процесса обработки изображений с использованием свёрточного автоэнкодера и хорошее согласование результатов с тщательным ручным анализом.

Бесплатно

Оптимизация интерполятора многомерного сигнала в пространстве уменьшенной размерности

Оптимизация интерполятора многомерного сигнала в пространстве уменьшенной размерности

Гашников Михаил Валерьевич

Статья научная

Разрабатываются адаптивные интерполяторы многомерного сигнала, учитывающие наличие и направление границ гладких областей сигнала в каждой локальной окрестности за счёт автоматического выбора интерполирующей функции для каждого отсчёта сигнала. Выбор интерполирующей функции производится посредством параметризованного правила, оптимизация которого производится в параметрическом пространстве уменьшенной размерности. Уменьшение размерности выполняется с использованием ранговой фильтрации локальных разностей в окрестности каждого отсчёта сигнала. Интерполирующие функции адаптивных интерполяторов записываются для многомерного, трёхмерного и двумерного случаев. Также рассматривается применение адаптивных интерполяторов в задаче компрессии многомерных сигналов. Приводятся результаты экспериментального исследования адаптивных интерполяторов на реальных многомерных сигналах различных типов.

Бесплатно

Оценка ошибок синтеза изображений с суперразрешением на основе использования нескольких кадров

Оценка ошибок синтеза изображений с суперразрешением на основе использования нескольких кадров

Кокошкин Александр Владимирович, Коротков Вадим Андреевич, Коротков Кирилл Вадимович, Новичихин Евгений Павлович

Статья научная

Предлагаемая работа показывает возможность оценки ошибок синтеза изображений с суперразрешением, полученных на основе использования нескольких кадров. Показана возможность выявления областей с большими ошибками интерполяции, основываясь только на применяемом методе интерполяции и интерполируемых данных. Продемонстрирована возможность определения необходимого количества использованных для формирования изображения кадров по величине оценки ошибок интерполяции. В данной работе приводятся как результаты интерполяции сформированных тестовых кадров, способ корреляционного субпиксельного определения сдвигов кадров относительно 1 кадра, так и оценка возникающих при этом ошибок интерполяции. Показано, что до проведения измерений нельзя предсказать количество кадров, необходимое для достижения необходимого уровня ошибок интерполяции. Предлагаемый метод позволяет контролировать величину ошибок в процессе измерений. Показано, что оценка ошибок метода суперразрешения, основанная на тестовых изображениях, малоперспективна, поскольку величина ошибок зависит как от самого изображения, так и от набора субпиксельных смещений кадров низкого разрешения. Приведён весь путь получения результатов работы, начиная от формирования тестового изображения и заканчивая выводами.

Бесплатно

Оценка эффективности алгоритма поддержки принятия решения врачом при дистрофии сетчатки с использованием методов машинного обучения

Оценка эффективности алгоритма поддержки принятия решения врачом при дистрофии сетчатки с использованием методов машинного обучения

Жданов Алексей Евгеньевич, Долганов Антон Юрьевич, Занка Дарио, Борисов Василий Ильич, Лучиан Евдочим, Доросинский Леонид Григорьевич

Статья научная

Электроретинография является перспективным методом электрофизиологического тестирования, позволяющего диагностировать заболевания, связанные с нарушениями сосудистых структур сетчатки зрительного анализатора. Классический анализ электроретинограммы строится на оценке 4 параметров в амплитудно-временном представлении и часто нуждается в конкретизации с использованием альтернативных методов диагностики. В настоящем исследовании предлагается использование оригинального алгоритма поддержки принятия решения врачом для диагностирования дистрофии сетчатки. Алгоритм построен на базе методов машинного обучения и использует параметры, извлеченные из вейвлет-скалограммы педиатрических и взрослых сигналов электроретинограмм. Также в исследовании используется размеченная база данных педиатрических и взрослых сигналов электроретинограмм, записанная с помощью компьютеризированной электрофизиологической рабочей станции EP-1000 (Tomey GmbH) в Екатеринбургском центре МНТК «Микрохирургия глаза». Научная новизна настоящего исследования заключается в разработке специального алгоритмического обеспечения для анализа процедуры извлечения параметров из вейвлет-скалограммы сигнала электроретинограммы с использованием функции cwt библиотеки PyWT, где в качестве базисной функции был выбран вейвлет Гаусса 8-го порядка. Также научная новизна заключается в разработке алгоритма анализа сигналов электроретинограмм, который в сравнении с классическим анализом реализует классификацию взрослых сигналов электроретинограммы на 19 % точнее, а педиатрических сигналов на 20 % точнее, чем классический анализ.

Бесплатно

Параметризованная интерполяция при комплексировании многомерных сигналов различного разрешения

Параметризованная интерполяция при комплексировании многомерных сигналов различного разрешения

Гашников Михаил Валерьевич

Статья научная

Производится адаптация параметризованных алгоритмов интерполяции к задаче комплексирования многомерных сигналов различного разрешения. Конкретизируются интерполирующие функции, правила переключения между ними и локальные признаки, на основе которых осуществляется выбор интерполирующей функции в каждой точке сигнала. Производится оптимизация параметризованных алгоритмов интерполяции, исходя из минимизации погрешности интерполяции. Рекуррентная схема оптимизации интерполятора рассматривается для ситуации недоступности интерполируемых отсчётов на этапе настройки интерполяционной процедуры. Производятся вычислительные эксперименты по исследованию предложенных интерполяторов при комплексировании реальных многомерных сигналов различных типов. Экспериментально подтверждается, что использование параметризованных интерполяторов позволяет повысить точность комплексирования.

Бесплатно

Повышение эффективности анализа изображений МРТ головного мозга с использованием отбора признаков

Повышение эффективности анализа изображений МРТ головного мозга с использованием отбора признаков

Коневский Владислав Валерьевич, Благов Александр Владимирович, Гайдель Андрей Викторович, Капишников Александр Викторович, Куприянов Александр Викторович, Суровцев Евгений Николаевич, Асатрян Давид Гегамович

Статья научная

В данной статье рассматривается возможность повышения качества анализа изображений МРТ головного мозга в различных режимах сканирования путем использования алгоритмов жадного отбора признаков. Всего было рассмотрено пять последовательностей МРТ. Формирование текстурных признаков производилось с использованием програм-много комплекса MaZda. С использованием алгоритма рекурсивного отбора признаков удалось повысить точность определения типа опухоли с 69 % до 100 %. С помощью комбинированного алгоритма отбора признаков удалось повысить точность определения необходимости лечения пациента с 60 % до 78 % и с 81 % до 88 % в случае использования дополнительного класса, содержащего в себе данные пациентов, у которых точный результат лечения не известен. Использование текстурных признаков в совокупности с признаком, отвечающим за тип менингиомы, позволило однозначно определить необходимость лечения пациента.

Бесплатно

Журнал