Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (334): Обработка изображений, распознавание образов
все рубрики
Интерполяция на основе контекстного моделирования при иерархической компрессии многомерных сигналов

Интерполяция на основе контекстного моделирования при иерархической компрессии многомерных сигналов

Гашников Михаил Валерьевич

Статья научная

Исследуются контекстные алгоритмы интерполяции многомерных сигналов в задаче компрессии. Рассматривается метод иерархической компрессии для сигналов произвольной размерности. Для этого метода предлагается алгоритм интерполяции, основанный на контекстном моделировании. Алгоритм основан на оптимизации параметров интерполирующей функции в локальной окрестности интерполируемого отсчёта. При этом локально оптимальные параметры, найденные для более прореженных масштабных уровней сигнала, используются для интерполяции отсчётов менее прореженных масштабных уровней сигнала. Контекстный алгоритм интерполяции реализован программно в составе иерархического метода компрессии. Вычислительные эксперименты показали, что использование контекстного интерполятора вместо усредняющего позволяет заметно повысить эффективность иерархической компрессии.

Бесплатно

Интерпретация действий животного по его изображению во времени, близком к реальному

Интерпретация действий животного по его изображению во времени, близком к реальному

Егоров Алексей Дмитриевич, Резник Максим Семнович

Статья научная

Определение действий объекта - сложная и актуальная задача компьютерного зрения. Такую задачу можно решать с помощью информации о положении ключевых точек объекта. Обучение моделей, определяющих положение ключевых точек, требует большой объём данных, включающих в себя информацию о положении этих ключевых точек. В связи с недостатком данных для обучения представлен метод для получения дополнительных данных, а также алгоритм, позволяющий получать высокую точность распознавания действий животных на основании малого числа данных. Достигнутая точность определения положений ключевых точек на тестовой выборке составила 92,3 %. По положению ключевых точек определяется действие объекта. Сравниваются различные подходы к классификации действий по ключевым точкам. Точность определения действий объекта на изображении достигает 73,5 %.

Бесплатно

Информационная технология обработки данных ДЗЗ для оценки ареалов растений

Информационная технология обработки данных ДЗЗ для оценки ареалов растений

Варламова Анна Александровна, Денисова Анна Юрьевна, Сергеев Владислав Викторович

Статья научная

В статье предлагается информационная технология обработки данных дистанционного зондирования Земли для оценки ареалов растений, основанная на вычислении локальных признаков, полученных по суперпиксельному представлению изображений, и кластеризации K-Means. Технология представляет собой автоматизированный способ оценки состава растительного ареала по заданной пользователем обучающей выборке. Достоинствами предлагаемой технологии являются использование меньшего объема данных для обучения, чем для поэлементной классификации, и более высокое качество классификации по сравнению с поэлементной классификацией.

Бесплатно

Использование блоков сжатия и возбуждения для повышения точности автоматической классификации остеоартрита коленного сустава при помощи сверточных нейронных сетей

Использование блоков сжатия и возбуждения для повышения точности автоматической классификации остеоартрита коленного сустава при помощи сверточных нейронных сетей

Михайличенко Алексей Андреевич, Демяненко Яна Михайловна

Статья научная

В данной работе исследуется влияние блоков сжатия и возбуждения на улучшение качества классификации остеоартрита при помощи сверточных нейронных сетей с архитектурами ResNet и DenseNet. Показано, что использование подобных блоков позволяет повысить качество классификации остеоартрита по шкале Келлгрена-Лоуренса на 1 - 3 % без существенной модификации традиционных схем. Также показано, что объединение 0-го и 1-го классов шкалы Келлгрена-Лоуренса в один класс позволяет на 12,74 % повысить точность автоматической классификации стадии остеоартрита, не теряя при этом значимой информации о заболевании. Наилучшая точность классификации составила 84,66 % при использовании ансамбля трех сверточных сетей с архитектурой DenseNet-121, с включенными в них блоками сжатия и возбуждения, что существенно превосходит результаты предыдущих исследований. Полученные результаты могут быть использованы как для автоматической постановки предварительного диагноза, так и в качестве вспомогательного инструмента.

Бесплатно

Использование спектрального вторичного контейнера в методе защиты видео с помощью фазовых ЦВЗ

Использование спектрального вторичного контейнера в методе защиты видео с помощью фазовых ЦВЗ

Шапиро Д.А., Сергеев В.В.

Статья научная

В работе предложен новый метод защиты видео с помощью фазовых цифровых водяных знаков, отличающийся от ранее описанного метода использованием вторичного контейнера (дискретного спектра Фурье), обеспечивающего дополнительную защищенность видеоконтента. Защитная информация (бинарный QR-код) встраивается в дискретный спектр цифровых водяных знаков, который затем переводится в пространство в виде полутонового изображения, визуально напоминающего шум, которое затем встраивается в фазы синусоид, развивающихся во времени. В данной работе приведены эксперименты, анализирующие зависимость точности процедуры извлечения цифровых водяных знаков от объема встраиваемой информации, от качества. Также рассматривается возможность расположения QR-кода в разных областях дискретного спектра. Приведено экспериментальное доказательство работоспособности метода, а также его стойкости к сжатию с помощью кодека H.264. В заключение сравнивается эффективность использования предложенного метода в сравнении с исходным методом фазовых цифровых водяных знаков.

Бесплатно

Исследование зависимости точности одновременной реконструкции сцены и позиционирования камеры от погрешностей, вносимых датчиками мобильного устройства

Исследование зависимости точности одновременной реконструкции сцены и позиционирования камеры от погрешностей, вносимых датчиками мобильного устройства

Мясников Владислав Валерьевич, Дмитриев Егор Андреевич

Статья научная

Задача одновременной реконструкции сцены и позиционирования камеры (Simultaneous Localization and Mapping - SLAM) с использованием монокулярной системы наблюдения - одна из наиболее известных и сложных, затрагивающая целый ряд научных направлений: робототехнику, компьютерное зрение и виртуальную реальность. Настоящая работа направлена на решение проблемы SLAM в рамках мобильного устройства, оснащённого, наряду с монокулярным оптическим сенсором (камерой), также инерционными датчиками (гироскоп и акселерометр) и цифровым компасом. Последние позволяют получать дополнительную оценку положения и ориентации мобильного устройства. Цель работы - оценить потенциальную пригодность и эффективность использования дополнительной информации, предоставляемой указанными датчиками мобильного устройства типа смартфона, с точки зрения точности получаемого решения и/или снижения временных затрат на его получение. Экспериментальная часть исследования, включающая как модельные, так и натурные эксперименты, позволила определить требования к допустимым погрешностям, вносимым датчиками мобильного устройства. Для конкретной модели мобильного устройства показано, что электронный компас удовлетворяет этим требованиям, в то время как погрешности инерционных датчиков, используемых для определения перемещений, оказываются неприемлемо большими.

Бесплатно

Исследование нейросетевых алгоритмов распознавания объектов железнодорожной инфраструктуры на видеоизображениях

Исследование нейросетевых алгоритмов распознавания объектов железнодорожной инфраструктуры на видеоизображениях

Медведева Е.В., Перевощикова А.А.

Статья научная

В статье разработаны два нейросетевых алгоритма распознавания объектов железнодорожной инфраструктуры на видеоизображениях. Оба алгоритма направлены на повышение безопасности движения железнодорожного транспорта. Первый алгоритм – это детектирование объектов, создающих препятствия, и объектов железнодорожной инфраструктуры. Второй алгоритм – семантическая сегментация главных и вспомогательных железнодорожных путей, а также поездов в пределах видимости следования локомотива. Алгоритмы реализованы на основе сверточных нейронных сетей YOLO и U-Net. Для обучения и тестирования СНС использована база изображений НИИ информатизации, автоматизации и связи на железнодорожном транспорте. Проведены экспериментальные исследования, направленные на повышение эффективности алгоритмов обнаружения и сегментации объектов за счет методов аугментации данных, дополнительной предобработки, выбора архитектуры и наилучших гиперпараметров сети. Алгоритм обнаружения работает в режиме реального времени, достигаемая средняя точность для 11 классов объектов по метрике mAP – 64 %. Скорость работы алгоритма семантической сегментации составляет 5 кадр/с, средняя точность для трех классов объектов по метрики IoU – 92 %.

Бесплатно

Исследование подхода «обнаружение объектов» в задаче фрагментации горных пород на открытых карьерах

Исследование подхода «обнаружение объектов» в задаче фрагментации горных пород на открытых карьерах

Решетников Кирилл Игоревич, Ронкин Михаил Владимирович, Поршнев Сергей Владимирович

Статья научная

В горнодобывающих работах на открытых карьерах активно используются взрывные технологии. При этом появляется задача оценки качества взрывных работ, которая определяется размерами фрагментов горной породы, полученных в результате взрывов. В связи с этим возникает задача оценки числа фрагментов горной породы и их размеров (задача фрагментации). В настоящее время популярны подходы к решению таких задач на основе систем компьютерного зрения с использованием нейронных сетей семантической или экземплярной сегментации. При этом оказывается, что для их работы требуется существенное привлечение компьютерных ресурсов. В связи с этим использование альтернатив - алгоритмов быстрого обнаружения объектов на цифровых изображениях взорванной породы является актуальным. В статье изучены особенности использования нейронных сетей глубокого обучения с архитектурой YOLO, которая, как ожидалось, будет иметь более высокую скорость обработки видеоинформации. На основе проведённого исследования обоснован выбор в качестве базовой архитектуры использовать YOLOv7x. Для обучения нейронных сетей выбранной архитектуры был использован размеченный авторами набор данных, составленный из цифровых фотографий фрагментов горной породы, образовавшихся в результате взрыва в открытом карьере. Полученные результаты позволили обосновать выбор в качестве метрики оценки качества взрывных работ геометрические размеры описанного прямоугольника вокруг выделенного на изображении фрагмента породы.

Бесплатно

Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей

Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей

Фигура Константин Николаевич

Статья научная

Проведенные в работе исследования показывают, что применение технологии дескрипторов особых точек в чистом виде к задаче сравнения и поиска чертежей является неэффективным. Выявлено, что основной причиной этому служит наличие в чертежах большого количества идентичных элементов (рамки, основная надпись, выносные линии, элементы шрифтов и др.). Для решения данной проблемы предложено использование метода tf-idf (term frequency-inverse document frequency), широко известного в технологии обработки естественного языка. В исследовании вместо векторов слов, применяемых в оригинальной методике tf-idf, использовались дескрипторы особых точек изображений, вычисленных по алгоритмам ORB и BRISK. В результате исследования получены следующие выводы: 1) показана высокая эффективность предлагаемого подхода для поиска копии изображения-запроса в базе данных. Так, для всех изображений, предложенных для поиска и имеющих свои полные аналоги в базе данных, было выявлено наличие копий. 2) Количество выявленных изображений, являющихся модификациями изображения-запроса, разнится и зависит от алгоритма нахождения особых точек и дескрипторов. Так, при использовании ORB максимальное количество выявленных модифицированных аналогов составило 60 %, при использовании BRISK - 80 % от всех аналогов изображения, находящихся в базе данных. 3) Предлагаемый подход показывает ограниченную эффективность для нахождения изображений, которые можно отнести к тому же классу, что и изображение-запрос (например, чертеж экскаватора, бульдозера, автомобильного крана). Здесь максимальное количество ложных определений достигло 60 %.

Бесплатно

Исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники

Исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники

Гаврилов Дмитрий Александрович

Статья научная

В работе проведено исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники. Метод нейросетевой сегментации изображений основан на реализации Сarvana c архитектурой типа U-Net, для распознавания ориентации использована нейросеть, построенная в открытой нейросетевой библиотеке Keras на основе предобученной нейронной сети VGG16. Рассмотренный подход позволяет осуществлять сегментацию изображений. Результаты проведенных экспериментов показали возможность достаточно точного (0,94 - 0,96) выделения объекта интереса. Полученные бинарные маски позволяют визуально судить о классе самолета, имеющегося на изображении.

Бесплатно

Исследование эффективности активно-импульсного метода обнаружения световозвращающих объектов

Исследование эффективности активно-импульсного метода обнаружения световозвращающих объектов

Алантьев Д.В., Борзов С.М. , Потатуркин О.И., Узилов С.Б.

Статья научная

Данная статья посвящена экспериментальному исследованию эффективности аппаратно-программных средств лазерной импульсной локации без применения электрооптического преобразователя в качестве внешнего затвора. Система предназначена для обнаружения световозвращающих объектов, в т.ч. оптических и оптико-электронных приборов наблюдения. Приведены результаты измерений на многоплановой сцене в зависимости от положения активной зоны видимости лазерной импульсной локации. Показана возможность определения расстояний до объектов за счет обработки последовательностей изображений, полученных при сканировании сцены по дальности и квадратичной аппроксимации полученных значений сигналов с расчетом координат их максимумов. Предложены и продемонстрированы алгоритмы обработки регистрируемых изображений с целью обнаружения слабоконтрастных объектов (с низким показателем световозвращения) на сложном фоне.

Бесплатно

Исследование эффективности восстановления кам-символов неполной длительности в OFDM-сигнале

Исследование эффективности восстановления кам-символов неполной длительности в OFDM-сигнале

Юзькив Руслан Романович, Федосеев Виктор Андреевич, Мясников Владислав Валерьевич, Сергеев Владислав Викторович

Статья научная

Рассматривается задача восстановления данных, передаваемых при помощи технологии OFDM, по не полностью принятому сигналу. Теоретически данный подход способен повысить стойкость декодера к потере части переданного сигнала. В статье дана математическая постановка задачи восстановления КАМ-символов неполной длительности в OFDM-сигнале, а также рассматриваются несколько методов её решения: метод регуляризации, итерационный метод на базе быстрого преобразования Фурье, градиентный метод на основе обучения по примерам, расчёт обратного оператора. Исследуется их эффективность, а также эффективность использования одновременно нескольких методов для повышения точности восстановления данных. Представленные в работе результаты численных экспериментов подтверждают практический потенциал предложенного подхода.

Бесплатно

Исследование эффективности классификации трудноразличимых типов растительности по гиперспектральным изображениям

Исследование эффективности классификации трудноразличимых типов растительности по гиперспектральным изображениям

Борзов Сергей Михайлович, Гурьянов Марк Александрович, Потатуркин Олег Иосифович

Статья научная

Работа посвящена исследованию эффективности методов контролируемой спектральной и спектрально-пространственной классификации гиперспектральных данных. В частности, на примере различения типов растительности рассмотрены методы минимального расстояния, опорных векторов, Махаланобиса, максимального правдоподобия. Значительное внимание уделено изучению зависимости точности классификации данных при применении перечисленных методов от количества и способа выбора спектральных признаков. Продемонстрирована перспективность совместной обработки спектральных и пространственных признаков, учитывающей коррелированность близкорасположенных пикселей. Приведены экспериментальные результаты, полученные при различных способах формирования обучающих выборок.

Бесплатно

Итерационный алгоритм совмещения контуров с неравномерным шагом дискретизации

Итерационный алгоритм совмещения контуров с неравномерным шагом дискретизации

Диязитдинов Ринат Радмирович

Статья научная

В статье представлен итерационный алгоритм для совмещения контуров. В рассматриваемой задаче совмещаемые контуры имеют одинаковую форму, но шаг дискретизации является неравномерным и между точками контуров нет соответствия. По этой причине применение методов, связывающих между собой определенные точки контуров через уравнения, невозможно. В работе представлен алгоритм, который проводит раздельную оценку параметров: смещений вдоль осей координат и угла поворота для таких контуров. Идея алгоритма заключается в итерационном уточнении параметров. Оценка параметров смещения используется для расчета угла поворота, и оценка угла поворота используется для расчета смещения. Алгоритм характеризуется более высокой скоростью обработки, чем алгоритм полного перебора, и меньшей погрешностью совмещения по сравнению с алгоритмами, основанными на вычислении макропараметров контура.

Бесплатно

Классификация и сравнительное исследование систем аутентификации jpeg-изображений, основанных на встраивании полухрупких водяных знаков

Классификация и сравнительное исследование систем аутентификации jpeg-изображений, основанных на встраивании полухрупких водяных знаков

Егорова Анна Александровна, Федосеев Виктор Андреевич

Статья научная

В статье рассматриваются системы полухрупких цифровых водяных знаков, предназначенные для защиты от несанкционированных изменений изображений, представленных в формате JPEG. Эти системы позволяют обнаруживать и определять местоположение изменений, а некоторые также приближённо восстанавливать исходное содержимое. Приводятся формальные схемы, описывающие процедуры встраивания цифровых водяных знаков и аутентификации. Рассматривается более десятка систем данного типа, предложенных с 2000 года, и предлагается их классификация по различным критериям. Представлены результаты экспериментальных исследований различных систем по оценке уровня искажений, возникающих при встраивании информации, а также погрешности при извлечении. Кроме того, исследована работоспособность систем в смысле обеспечения частичной стойкости к JPEG-сжатию.

Бесплатно

Классификация изображений ДЗЗ с использованием алгоритма комплексирования данных различных сенсоров

Классификация изображений ДЗЗ с использованием алгоритма комплексирования данных различных сенсоров

Белов Александр Михайлович, Денисова Анна Юрьевна

Статья научная

Комплексирование данных дистанционного зондирования Земли предназначено для получения изображений более высокого качества, чем исходные изображения. Однако вопрос о влиянии комплексирования данных на дальнейшую тематическую обработку часто остаётся за рамками исследований, и методы комплексирования используются в большинстве своём для улучшения визуального представления данных. В настоящей статье рассматривается вопрос о влиянии комплексирования с повышением пространственного и спектрального разрешения данных на тематическую классификацию изображений с использованием различных классификаторов и методов извлечения признаков, популярных в задачах обработки данных дистанционного зондирования Земли. В качестве алгоритма комплексирования в работе используется авторский алгоритм, позволяющий выполнять комплексирование данных по множеству кадров из различных источников оптических систем дистанционного зондирования Земли, обладающих различным пространственным и спектральным разрешением. В качестве алгоритмов классификации рассматриваются метод опорных векторов и Random Forest, в качестве признаков - спектральные каналы, а также расширенные атрибутивные профили и локальные признаки атрибутивных профилей. Экспериментальное исследование было произведено с использованием модельных изображений четырёх изображающих систем. Результирующее изображение имело пространственное разрешение в 2, 3, 4 и 5 раз выше, чем для исходных изображений соответственно. В результате исследований было выявлено, что для метода опорных векторов не имеет смысла выполнять комплексирование, так как излишняя пространственная детализация на классификацию данным алгоритмом влияет отрицательно. Для алгоритма Random Forest, напротив, результаты классификации в 90 % случаев имели большую точность, чем для исходных изображений низкого разрешения. Например, для изображений с наименьшим отличием в пространственном разрешении (в 2 раза) от результата комплексирования точность классификации комплексированного изображения была в среднем на 4 % выше. Кроме того, результаты, полученные для алгоритма Random Forest с комплексированием, оказались лучше результатов для метода опорных векторов без комплексирования. Дополнительно было показано, что точность классификации комплексированного изображения методом Random Forest может быть повышена в среднем на 9 % за счёт использования расширенных атрибутивных профилей в качестве признаков. Таким образом, при использовании комплексирования данных лучше применять классификатор Random Forest, а использование комплексирования с методом опорных векторов нецелесообразно.

Бесплатно

Классификация изображений оперения для определения видовой принадлежности птиц

Классификация изображений оперения для определения видовой принадлежности птиц

Белько Алина Вадимовна, Добратулин Константин Сергеевич, Кузнецов Андрей Владимирович

Статья научная

В работе исследуется возможность применения нейронных сетей для классификации изображений оперения с целью определения видовой принадлежности птиц. Таксономическая идентификация птиц по перу широко применяется в авиационной орнитологии для анализа столкновений с летательными аппаратами и разработки методов их предотвращения. В данной статье производится обучение на основе набора данных с фотографиями оперения птиц. Проводится сравнение классификаторов, обученных на четырех выборках из исходного набора данных. Предлагается метод идентификации птиц по изображениям с реальными данными на основе нейронных сетей YoloV4 и моделей группы DenseNet. Проведенная экспериментальная оценка показала, что предложенный метод позволяет определить видовую принадлежность птицы по фотографии отдельного пера с точностью до 81,03 % для точной классификации и с точностью 97,09 % для первых пяти предсказаний классификатора.

Бесплатно

Классификация интенсивности цветения водорослей на основе методов машинного обучения и гиперспектральных данных БПЛА

Классификация интенсивности цветения водорослей на основе методов машинного обучения и гиперспектральных данных БПЛА

Новиков И.А., Макаров А.Р., Подлипнов В.В., Платонов В.И., Рыськова Д.Д., Калашникова О.В., Хабибуллин Р.М., Скиданов Р.В., Илларионова С.В., Выборнова Ю.В., Никоноров А.В., Шадрин Д.Г., Подладчикова Т.В.

Статья научная

В работе представлен подход к анализу гиперспектральных изображений высокого пространственного разрешения в прикладной задаче анализа состояния речных вод. Данный метод позволяет обнаружить цветение или загрязнение воды посторонними веществами. Гиперспектральные изображения высокого разрешения были получены с помощью гиперспектрометра, установленного на малом беспилотном летательном аппарате. Продемонстрирована разница между спектрами участков реки с разной интенсивностью цветения водорослей. Были взяты пробы речной воды, проведен химический анализ, который подтвердил различное содержание магния и кальция во всех пробах, соответствующее интенсивности цветения водорослей в воде. Для классификации акваторий с различной интенсивностью цветения водорослей было рассмотрено несколько алгоритмов классификации на основе машинного обучения и вегетационных индексов. Показана эффективность использования алгоритмов машинного обучения по сравнению с вегетационными индексами. Рассмотрено и проведено сравнение нескольких подходов понижения размерности гиперспектральных данных на основании селекции спектральных каналов для повышения производительности наиболее эффективных алгоритмов классификации.

Бесплатно

Классификация космоснимков Sentinel-2 Байкальской природной территории

Классификация космоснимков Sentinel-2 Байкальской природной территории

Бычков Игорь Вячеславович, Ружников Геннадий Михайлович, Федоров Роман Константинович, Попова Анастасия Константиновна, Авраменко Юрий Владимирович

Статья научная

В работе рассматривается задача классификации мультиспектральных космоснимков Sentinel-2 при организации экологического мониторинга Байкальской природной территории. Специфика территории потребовала создания нового набора из 12 классов, который учитывает актуальные проблемы и сформирован таким образом, что площади, соответствующие этим классам, полностью покрывают исследуемую территорию. Обучающая выборка сформирована с помощью Web-интерфейса на основе космоснимков Sentinel-2 и полевых исследований. Классификация космоснимков проводилась с использованием алгоритмов RandomForest и нейронной сети ResNet50. Точность расчетов показала, что результаты классификации могут применяться для решения актуальных задач Байкальской природной территории, в частности, для анализа изменений лесного фонда, оценки влияния изменений климата на ландшафт, анализа динамики застройки, инвентаризации сельхозугодий и т.д.

Бесплатно

Классификация редких дорожных знаков

Классификация редких дорожных знаков

Фаизов Борис Владимирович, Шахуро Владислав Игоревич, Санжаров Вадим Владимирович, Конушин Антон Сергеевич

Статья научная

В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.

Бесплатно

Журнал