Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (280): Обработка изображений, распознавание образов
все рубрики
Поиск объектов на изображениях с использованием структурного дескриптора на основе графов

Поиск объектов на изображениях с использованием структурного дескриптора на основе графов

Захаров Алексей Александрович, Баринов Алексей Евгеньевич, Жизняков Аркадий Львович, Титов Виталий Семнович

Статья научная

В работе рассматривается разработка структурного дескриптора для поиска объектов на изображениях. Дескриптор построен на основе графа, вершинами которого являются центры масс сегментов особенностей. Для вложения графа в векторное пространство используется преобразование Юнга - Хаусхолдера. Предложенный способ вложения графа в векторное пространство базируется на методах дифференциальной геометрии. Для описания связи между точками используются составные кривые. Граф изображения описывается матрицей параметров кривизны. С помощью метрики Хаусдорфа вычисляется матрица расстояний для графов объекта-кандидата и объекта-эталона. Для представления результатов используется метод многомерного шкалирования. Для исследования разработанного подхода были использованы изображения тестовых объектов и изображения лиц людей. При обнаружении головы человека на изображениях сравнение разработанного дескриптора осуществлялось с методом Виолы - Джонса. Достоинством разработанного подхода является инвариантность к повороту изображения на плоскости при поиске объектов. Также дескриптор позволяет обнаруживать объекты с углом поворота в пространстве до 50 градусов. Использование центров масс сегментов особенностей в качестве вершин графа значительно повышает устойчивость подхода при изменении ракурса съёмки по сравнению с подходом, в котором вершинами графа являются особые точки изображения.

Бесплатно

Поиск редких данных в задаче распознавания лиц на изображениях

Поиск редких данных в задаче распознавания лиц на изображениях

Соколова Анастасия Дмитриевна, Савченко Андрей Владимирович, Николенко Сергей Игоревич

Статья научная

Одной из основных проблем современных нейросетевых дескрипторов в задаче идентификации лиц является малое число обучающих примеров определенного типа: изображения плохого качества, разный масштаб или освещение, лица детей, пожилых людей, редкие расы. В результате точность распознавания оказывается низкой для входных изображений, не похожих на большинство изображений в наборе данных, используемом для настройки метода извлечения признаков. В работе предлагается способ преодоления такой проблемы за счет автоматического обнаружения нетипичных входных изображений на основе введения предварительного этапа их автоматической отбраковки. Для этого используется специальная свёрточная сеть, обученная на наборе редких данных, которые обрабатывались с помощью известных алгоритмов преобразования изображений. Для повышения вычислительной эффективности решение о наличии редкого изображения принимается на основе того же дескриптора лица, который используется в классификаторе. Экспериментальное исследование подтвердило преимущества в точности предложенного подхода для нескольких наборов данных лиц и современных нейросетевых дескрипторов.

Бесплатно

Полухрупкие водяные знаки для аутентификации изображений с возможностью восстановления, адаптированные к HGI-компрессии

Полухрупкие водяные знаки для аутентификации изображений с возможностью восстановления, адаптированные к HGI-компрессии

Баврина Алина Юрьевна, Федосеев Виктор Андреевич

Статья научная

В статье предлагается новая полухрупкая система встраивания цифровых водяных знаков для защиты изображений, обладающая возможностью локализации несанкционированных искажений и восстановления искаженных фрагментов изображения. Система адаптирована к методу компрессии HGI и, подобно ему, использует иерархическую структуру изображения при встраивании информации. Отличие заключается в замене этапа квантования постинтерполяционных остатков, присутствующего в HGI, специальным квантователем, основанным на методе Quantization Index Modulation. В результате встроенный водяной знак становится устойчивым к компрессии HGI вплоть до заданного пользователем уровня искажений, вносимых при сжатии. Проведенные эксперименты демонстрируют необходимость выбора баланса между качеством защищенного изображения и точностью локализации возможных изменений. Помимо отыскания маски искажённых областей, предлагаемая система позволяет восстанавливать искажённые фрагменты с приемлемым качеством за счёт встраивания данных исходного изображения в качестве водяного знака на других иерархических уровнях. Разработанная система может использоваться для защиты изображений дистанционного зондирования и медицинских изображений от злонамеренных искажений.

Бесплатно

Построение квадратично-экспоненциальных КИХ-фильтров с расширенной средней областью частотного отклика

Построение квадратично-экспоненциальных КИХ-фильтров с расширенной средней областью частотного отклика

Фурсов Владимир Алексеевич

Статья научная

Статья посвящена проблеме синтеза фильтров с конечной импульсной характеристикой (КИХ-фильтров) для коррекции радиально-симметричных искажений типа дефокусировки. Предлагается новая модель радиально-симметричного частотного отклика, являющаяся обобщением модели частотного отклика, который описывается аналитически в виде композиции отрезков квадратичной и экспоненциальной функций. Обобщение состоит в том, что вводится дополнительный участок постоянного частотного отклика, который расширяет область средних частот. В работе исследуется зависимость качества восстановления от параметра, характеризующего диапазон средних частот, в котором спектральная характеристика фильтра постоянна. Приводятся примеры реализации и результаты сравнения с оптимальным фильтром Винера.

Бесплатно

Применение вейвлет-преобразования для слияния многоспектральных изображений

Применение вейвлет-преобразования для слияния многоспектральных изображений

Борисова Ирина Валентиновна

Статья научная

Рассматривается метод слияния изображений одной и той же сцены, полученных в разных спектральных диапазонах, с формированием интегрированного монохромного изображения. Метод слияния основан на вейвлет-преобразовании исходных изображений. Предлагается стратегия объединения высокочастотных коэффициентов путём сравнения отношений их значений для всех исходных изображений. Процедура слияния не требует введения каких-либо пороговых значений и может выполняться для любого количества входных изображений. Предложенный алгоритм может быть использован в многоканальных оптико-электронных системах автоматической обработки изображений.

Бесплатно

Применение искусственной иммунной системы для распознавания зрительных образов

Применение искусственной иммунной системы для распознавания зрительных образов

Михерский Ростислав Михайлович

Статья научная

Рассмотрена возможность применения искусственных иммунных систем для распознавания зрительных образов. Разработан и программно реализован новый алгоритм искусственной иммунной системы, позволяющей с помощью Web-камеры в режиме реального времени распознавать такие образы. Экспериментально показано, что данная система может быть успешно применена для распознавания как лиц людей, так и любых других объектов. Обсужден вопрос о применении искусственной иммунной системы в высокопроизводительных системах параллельных вычислений. К преимуществам разработанной искусственной иммунной системы можно отнести высокую скорость обучения системы новым образам, а также возможность обучения системы новому образу в любой момент её работы. Эти преимущества открывают возможность создания систем искусственного интеллекта, обучающихся в режиме реального времени.

Бесплатно

Применение легковесной сиамской нейросети для формирования вектора признаков в системе васкулярной аутентификации

Применение легковесной сиамской нейросети для формирования вектора признаков в системе васкулярной аутентификации

Прозоров Дмитрий Евгеньевич, Земцов Антон Валерьевич

Статья научная

В статье анализируется возможность использования сиамской сверточной нейросети для решения задачи васкулярной аутентификации на встраиваемой аппаратной платформе с ограниченными вычислительными ресурсами (Orange Pi One). Выполнен краткий обзор современных методов вычисления векторов признаков изображений, применяемых в задачах классификации, сравнения или поиска изображений по контенту: на основе вариационных рядов (гистограмм), локальных дескрипторов, дескрипторов особых точек, дескрипторов на основе хэш-функций, нейросетевых дескрипторов. Предложена архитектура биометрической системы аутентификации по изображениям ладоней в видимом и ближнем ИК-спектрах на основе сиамской сверточной нейросети. Разработанное программное решение позволяет использовать сиамскую нейросеть в режимах «полная сеть» (используются оба симметричных канала нейросети) и «половина нейросети» (используется только один канал) для сокращения времени сравнения векторов биометрических данных зарегистрированных пользователей биометрической системы аутентификации. Показаны преимущества нейросетевых признаков, заключающиеся в универсальности, масштабируемости и конкурентоспособности, в том числе на встраиваемых аппаратно-программных решениях с ограниченными вычислительными ресурсами при отсутствии графических ускорителей. Исследования показали возможность повышения качества классификации изображений ладоней с 0,929 до 0,968 по метрике «overall accuracy» при использовании сиамской нейросети вместо метода перцептивного хэширования при сопоставимом времени определения зарегистрированной в биометрической системе аутентификации персоны. В экспериментах осуществлялся поиск по базе данных из 2000 изображений для 400 персон.

Бесплатно

Применение методов глубокого обучения для оценки степени коммерческой ценности визуальных объектов

Применение методов глубокого обучения для оценки степени коммерческой ценности визуальных объектов

Ефремцев Вадим Григорьевич, Ефремцев Николай Григорьевич, Тетерин Евгений Петрович, Тетерин Петр Евгеньевич, Гансовский Владислав Викторович

Статья научная

Рассмотрена возможность применения сверточной нейронной сети для оценки коммерческой ценности цифровых изображений. Исследовалось влияние на обучение нейронной сети различных условий подготовки образцов, алгоритмов оптимизаторов, количества пикселей в образцах, размеров обучающей выборки, цветовых схем, качества сжатия и других фотометрических параметров. Показано, что благодаря предложенной предварительной подготовке данных, оптимальному выбору архитектуры и гиперпараметров нейросети удалось добиться точности классификации не менее 98 %.

Бесплатно

Применение нейронных сетей для семантической сегментации изображений глазного дна

Применение нейронных сетей для семантической сегментации изображений глазного дна

Парингер Рустам Александрович, Мухин Артем Владимирович, Ильясова Наталья Юрьевна, Демин Никита Сергеевич

Статья научная

Развитие нейросетевых алгоритмов произвело революцию во многих областях, а особенно в тех, что связаны с интеллектуальным анализом изображений. Особую сложность представляют собой задачи обработки биомедицинских данных, которым свойственны проблемы несбалансированности, малого объема и некачественной разметки. В данной работе производится исследование возможности использования нейронных сетей для решения задачи семантической сегментации изображений глазного дна. Для оценки применимости нейронных сетей для решения данной задачи было произведено сравнение их результатов с результатами сегментации изображений с помощью текстурных признаков. В результате оказалось, что нейронные сети превосходят в точности текстурные признаки по метрикам precision (~25 %) и recall (~50 %). Нейронные сети могут быть применены для решения задач биомедицинской сегментации изображений с предварительным применением алгоритмов балансировки и аугментации данных.

Бесплатно

Применение обученных на оптических изображениях свёрточных нейронных сетей для обнаружения объектов на радиолокационных изображениях

Применение обученных на оптических изображениях свёрточных нейронных сетей для обнаружения объектов на радиолокационных изображениях

Павлов Виталий Александрович, Белов Андрей Александрович, Волвенко Сергей Валентинович, Рашич Андрей Валерьевич

Статья научная

В связи с малым количеством размеченных наборов данных радиолокационных изображений перспективным представляется использование оптических изображений для обучения нейронных сетей, предназначенных для обнаружения объектов на радиолокационных изображениях. Однако оптические изображения имеют ряд существенных отличий от радиолокационных изображений, что приводит к необходимости более глубокого экспериментального исследования вопроса. В работе была исследована применимость такого подхода и показано, что в случае задачи обнаружения кораблей достижимы высокие результаты. Кроме того, показано, что предварительная фильтрация спекл-шума позволяет дополнительно улучшить ситуацию.

Бесплатно

Применение ориентации градиента яркости для систем автосопровождения объектов

Применение ориентации градиента яркости для систем автосопровождения объектов

Борисова Ирина Валентиновна, Легкий Владимир Николаевич, Кравец Сергей Александрович

Статья научная

Рассматривается задача автосопровождения объекта, находящегося на сложном естественном фоне. Обнаружение объекта производится в каждом кадре видеопоследовательности путем поточечного сопоставления с эталоном. Предлагаемый метод основан на представлении каждой точки изображения ориентацией градиента яркости в локальной окрестности. В зависимости от своей ориентации окрестности разделяются на классы. Помимо классов анизотропных окрестностей, вводится класс окрестностей с изотропной структурой. Классы нумеруются, и номер класса окрестности принимается в качестве признака рассматриваемой точки. После кодировки изображение сканируется эталоном, используемая мера близости - поэлементное сравнение (компарация). В результате формируется компарационная матрица, каждый элемент которой есть число совпадений элементов эталона и текущего фрагмента изображения. Локация объекта производится по максимальному значению компарационной матрицы. Для достижения устойчивого сопровождения применяется особое правило перезаписи эталона - динамическая мера близости. Результаты тестирования показали более устойчивое сопровождение объекта по сравнению с использованием нормированной корреляционной меры.

Бесплатно

Применение плотных траекторий движения к задаче обнаружения нехарактерного поведения на видеоизображении

Применение плотных траекторий движения к задаче обнаружения нехарактерного поведения на видеоизображении

Шаталин Роман Андреевич, Фидельман Владимир Романович, Овчинников Павел Евгеньевич

Статья научная

В работе предложены алгоритмы обнаружения нехарактерного поведения на основе главных компонент по характеристикам плотных траекторий движения. Проведено сравнение показателей точности и быстродействия с алгоритмом обнаружения по длинам векторов оптического потока. Результаты свидетельствуют о повышении быстродействия при использовании плотных траекторий и сохранении точности при обучении модели «мешка признаков» на сбалансированной выборке признаков поведения.

Бесплатно

Применение реперных отметок для координатной привязки к поверхности в сканирующей зондовой микроскопии

Применение реперных отметок для координатной привязки к поверхности в сканирующей зондовой микроскопии

Гуляев Павел Валентинович

Статья научная

Статья посвящена координатной привязке сканирующего зондового микроскопа к исследуемой поверхности. Координатная привязка имеет большое значение при исследованиях одних и тех же объектов различными зондами и в различных средах. В качестве объекта такой привязки предложено использовать реперные отметки, нанесённые на поверхность наноиндентором вдоль прямой линии через равные промежутки. Описан порядок смещения поля зрения микроскопа в процессе обнаружения реперных отметок. Представлен алгоритм их распознавания. Алгоритм основан на корреляционном анализе изображения с помощью эталонного изображения отметки с последующим выделением особых точек изображения по локальным максимумам коэффициента корреляции. При этом использовались дескриптор взаимных расстояний между парами особых точек и коэффициент Пирсона в качестве количественного критерия распознавания. Рассмотрено три варианта эталонов: окружность, круг с градиентной заливкой и круг со сплошной заливкой. Установлено, что количество особых точек может существенно превышать количество реперных отметок. Описан метод пороговой фильтрации особых точек по значениям коэффициента корреляции. Данная фильтрация подразумевает исключение особых точек, в окрестностях которых разность максимального и минимального значения коэффициента корреляции не превышает заданного порога. Представлены результаты, подтверждающие работоспособность предложенных алгоритмов. Выработаны рекомендации по выбору настроек алгоритмов распознавания и фильтрации.

Бесплатно

Разработка алгоритма семантической сегментации аэрофотоснимков реального времени

Разработка алгоритма семантической сегментации аэрофотоснимков реального времени

Блохинов Юрий Борисович, Горбачев Вадим Александрович, Ракутин Юрий Олегович, Никитин Андрей Дмитриевич

Статья научная

Статья посвящена разработке эффективного алгоритма семантической сегментации изображений для работы в реальном времени, обладающего наилучшей точностью в своем классе. На основе сравнительного анализа методов предварительной сегментации, методов вычисления признаков по сегментам изображения, а также различных алгоритмов машинного обучения выявлены наиболее эффективные из них как по точности, так и по быстродействию. По результатам исследования построен модульный алгоритм семантической сегментации со временем выполнения, близким к реальному. Обучение и тестирование проводились на коллекции ISPRS «Vaihingen» аэрофотоснимков видимого и инфракрасного диапазонов, к которым прилагается пиксельная карта высот изображенной местности. Предложен оригинальный способ получения нормализованной матрицы высот по исходной цифровой модели рельефа.

Бесплатно

Разработка алгоритмов цифровой обработки изображений на основе метода Винограда в общем виде и анализ их вычислительной сложности

Разработка алгоритмов цифровой обработки изображений на основе метода Винограда в общем виде и анализ их вычислительной сложности

Ляхов Павел Алексеевич, Нагорнов Николай Николаевич, Семнова Наталия Фдоровна, Абдулсалямова Альбина Шихаевна

Статья научная

Стремительный рост количественных и качественных характеристик цифровых визуальных данных приводит к необходимости улучшения эксплуатационных показателей современных устройств обработки изображений. В данной работе предложены новые алгоритмы цифровой обработки двумерных изображений на основе метода Винограда в общем виде. Анализ полученных результатов показал, что использование метода Винограда сокращает вычислительную сложность обработки изображений до 84 % по сравнению с традиционным прямым методом цифровой фильтрации в зависимости от параметров фильтра и фрагментов изображения, не влияя при этом на качество обработки изображения. Составленные матрицы преобразования метода Винограда и разработанные алгоритмы могут быть использованы в системах обработки изображений для улучшения эксплуатационных характеристик современных микроэлектронных устройств, осуществляющих очистку от шума и сжатие изображений, а также распознавание образов. Перспективным направлением дальнейших исследований является аппаратная реализация разработанных алгоритмов на современных устройствах вычислительной техники, таких как программируемые пользователем вентильные матрицы и интегральные схемы специального назначения, разработка алгоритмов цифровой обработки изображений, используемой в сверточных нейронных сетях, на основе метода Винограда в общем виде для одномерных вейвлет-фильтров с децимацией и для свертки с шагом.

Бесплатно

Разработка векторного алгоритма по технологии CUDA для трехмерного моделирования процесса лазерной коагуляции сетчатки

Разработка векторного алгоритма по технологии CUDA для трехмерного моделирования процесса лазерной коагуляции сетчатки

Широканев Александр Сергеевич, Андриянов Никита Андреевич, Ильясова Наталья Юрьевна

Статья научная

Для лечения диабетической ретинопатии в современной практике применяется лазерная коагуляция. В процессе лазерной операции параметры лазерного воздействия подбираются вручную врачом, что требует от врача достаточного опыта и знаний, чтобы достичь терапевтического эффекта. На основе математического моделирования процесса лазерной коагуляции можно оценить основные параметры без проведения операции. Однако сетчатка имеет достаточно сложную структуру, и при применении даже низкозатратных численных методов для моделирования требуется значительное время для получения результата. В связи с этим разработка эффективных по времени алгоритмов трехмерного моделирования является актуальной задачей, поскольку применение таких алгоритмов позволит обеспечить проведение комплексного исследования в рамках ограниченного времени. В настоящей работе проводится исследование времени выполнения алгоритмов, реализующих различные вариации применения метода расщепления и метода конечных разностей, адаптированных под поставленную задачу теплопроводности, выявляется наиболее эффективный алгоритм, который далее подвергается векторизации и реализации с использованием технологии CUDA. Исследование проводилось с использованием Intel Core i7-10875H и Nvidia RTX 2080 MAX Q и показало, что аналог векторного алгоритма, ориентированного на решение многомерной задачи теплопроводности, обеспечивает ускорение не более, чем в 1,5 раза, по сравнению с последовательным вариантом. Разработанный векторный алгоритм, ориентированный на применение метода прогонки по всем направлениям трехмерной задачи, существенно снижает временные издержки, затрачиваемые на копирование в память видеокарты, и обеспечивает 40-кратное ускорение по сравнению с последовательным алгоритмом трехмерного моделирования. На основе такого же подхода разработан параллельный алгоритм математического моделирования, который обеспечил 20-кратное ускорение при полной загрузке процессора.

Бесплатно

Разработка и исследование алгоритмов определения предпочитаемых пользователем остановок общественного транспорта в геоинформационной системе на основе методов машинного обучения

Разработка и исследование алгоритмов определения предпочитаемых пользователем остановок общественного транспорта в геоинформационной системе на основе методов машинного обучения

Бородинов Александр Александрович

Статья научная

В работе рассматривается задача определения предпочитаемых пользователем остановок в рекомендательной транспортной системе. Проведено сравнение эффективности использования различных методов машинного обучения для решения указанной задачи в системе персонализированных рекомендаций: метода опорных векторов, дерева решений, случайного леса, AdaBoost, алгоритма k-ближайших соседей, многослойного персептрона. Сравнение указанных традиционных методов машинного обучения производилось также с предложенным методом, разработанным на основе алгоритма вычисления оценок. Экспериментальные исследования использовали реальные данные мобильного приложения «Прибывалка-63», являющегося частью сервиса tosamara.ru. Подтверждена как работоспособность, так и эффективность предложенного метода.

Бесплатно

Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

Лобанова Виктория Александровна, Иванова Юлия Александровна

Статья научная

Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88.

Бесплатно

Распознавание выражений лиц на основе адаптации классификатора видеоданных пользователя

Распознавание выражений лиц на основе адаптации классификатора видеоданных пользователя

Чураев Е.Н., Савченко А.В.

Статья научная

В настоящей работе предложен метод распознавания выражений лиц по видео, позволяющий значительно увеличить точность при помощи адаптации модели к эмоциям конкретного пользователя, например, владельца мобильного устройства. На первом этапе нейросетевая модель, предварительно обученная распознавать выражения лиц на статических фото, применяется для извлечения визуальных признаков лиц на каждом видеокадре. Далее они агрегируются в единый дескриптор для короткого фрагмента видео, после чего обучается нейросетевой классификатор. На втором этапе предлагается выполнить адаптацию этого классификатора с использованием небольшого набора видеоданных с выражениями лиц конкретного пользователя. После принятия решения пользователь может корректировать предсказанные эмоции для дальнейшего повышения точности персональной модели. В рамках экспериментального исследования для набора данных RAVDESS показано, что подход с адаптацией модели под конкретного пользователя позволяет значительно (на 20 - 50 %) повысить точность распознавания выражений лиц по видео.

Бесплатно

Распознавание гомотопического типа объекта с помощью дифференциально-топологических инвариантов аппроксимирующего отображения

Распознавание гомотопического типа объекта с помощью дифференциально-топологических инвариантов аппроксимирующего отображения

Курочкин Сергей Владимирович

Статья научная

Предложен новый метод топологического анализа данных, позволяющий получить информацию о гомотопическом типе анализируемого объекта. В отличие от наиболее хорошо разработанных и широко применяемых методов, использующих понятие персистентных гомологий, данный метод основан на анализе дифференциальных инвариантов аппроксимирующего отображения. Таким образом, в противоположность комбинаторно-топологическому подходу, используются методы дифференциальной топологии и прямая аналогия с основным результатом теории Морса. При этом аппроксимирующее графический объект гладкое отображение может быть построено с использованием общедоступного инструментария, например, нейронной сети. Доказано, в частности, что метод позволяет полностью распознать гомотопический тип объекта на плоскости: топологическая степень некоторого вспомогательного отображения и количество окружностей в гомотопически эквивалентном представлении объекта в виде букета связаны соотношением. Работа алгоритма продемонстрирована на примере символов из базы данных MNIST и их трансформаций. Рассмотрены обобщения и открытые вопросы, возникающие в случае более высоких размерностей.

Бесплатно

Журнал