Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Информационная технология обработки данных ДЗЗ для оценки ареалов растений
Статья научная
В статье предлагается информационная технология обработки данных дистанционного зондирования Земли для оценки ареалов растений, основанная на вычислении локальных признаков, полученных по суперпиксельному представлению изображений, и кластеризации K-Means. Технология представляет собой автоматизированный способ оценки состава растительного ареала по заданной пользователем обучающей выборке. Достоинствами предлагаемой технологии являются использование меньшего объема данных для обучения, чем для поэлементной классификации, и более высокое качество классификации по сравнению с поэлементной классификацией.
Бесплатно

Статья научная
В данной работе исследуется влияние блоков сжатия и возбуждения на улучшение качества классификации остеоартрита при помощи сверточных нейронных сетей с архитектурами ResNet и DenseNet. Показано, что использование подобных блоков позволяет повысить качество классификации остеоартрита по шкале Келлгрена-Лоуренса на 1 - 3 % без существенной модификации традиционных схем. Также показано, что объединение 0-го и 1-го классов шкалы Келлгрена-Лоуренса в один класс позволяет на 12,74 % повысить точность автоматической классификации стадии остеоартрита, не теряя при этом значимой информации о заболевании. Наилучшая точность классификации составила 84,66 % при использовании ансамбля трех сверточных сетей с архитектурой DenseNet-121, с включенными в них блоками сжатия и возбуждения, что существенно превосходит результаты предыдущих исследований. Полученные результаты могут быть использованы как для автоматической постановки предварительного диагноза, так и в качестве вспомогательного инструмента.
Бесплатно

Использование спектрального вторичного контейнера в методе защиты видео с помощью фазовых ЦВЗ
Статья научная
В работе предложен новый метод защиты видео с помощью фазовых цифровых водяных знаков, отличающийся от ранее описанного метода использованием вторичного контейнера (дискретного спектра Фурье), обеспечивающего дополнительную защищенность видеоконтента. Защитная информация (бинарный QR-код) встраивается в дискретный спектр цифровых водяных знаков, который затем переводится в пространство в виде полутонового изображения, визуально напоминающего шум, которое затем встраивается в фазы синусоид, развивающихся во времени. В данной работе приведены эксперименты, анализирующие зависимость точности процедуры извлечения цифровых водяных знаков от объема встраиваемой информации, от качества. Также рассматривается возможность расположения QR-кода в разных областях дискретного спектра. Приведено экспериментальное доказательство работоспособности метода, а также его стойкости к сжатию с помощью кодека H.264. В заключение сравнивается эффективность использования предложенного метода в сравнении с исходным методом фазовых цифровых водяных знаков.
Бесплатно

Статья научная
Задача одновременной реконструкции сцены и позиционирования камеры (Simultaneous Localization and Mapping - SLAM) с использованием монокулярной системы наблюдения - одна из наиболее известных и сложных, затрагивающая целый ряд научных направлений: робототехнику, компьютерное зрение и виртуальную реальность. Настоящая работа направлена на решение проблемы SLAM в рамках мобильного устройства, оснащённого, наряду с монокулярным оптическим сенсором (камерой), также инерционными датчиками (гироскоп и акселерометр) и цифровым компасом. Последние позволяют получать дополнительную оценку положения и ориентации мобильного устройства. Цель работы - оценить потенциальную пригодность и эффективность использования дополнительной информации, предоставляемой указанными датчиками мобильного устройства типа смартфона, с точки зрения точности получаемого решения и/или снижения временных затрат на его получение. Экспериментальная часть исследования, включающая как модельные, так и натурные эксперименты, позволила определить требования к допустимым погрешностям, вносимым датчиками мобильного устройства. Для конкретной модели мобильного устройства показано, что электронный компас удовлетворяет этим требованиям, в то время как погрешности инерционных датчиков, используемых для определения перемещений, оказываются неприемлемо большими.
Бесплатно

Статья научная
В статье разработаны два нейросетевых алгоритма распознавания объектов железнодорожной инфраструктуры на видеоизображениях. Оба алгоритма направлены на повышение безопасности движения железнодорожного транспорта. Первый алгоритм – это детектирование объектов, создающих препятствия, и объектов железнодорожной инфраструктуры. Второй алгоритм – семантическая сегментация главных и вспомогательных железнодорожных путей, а также поездов в пределах видимости следования локомотива. Алгоритмы реализованы на основе сверточных нейронных сетей YOLO и U-Net. Для обучения и тестирования СНС использована база изображений НИИ информатизации, автоматизации и связи на железнодорожном транспорте. Проведены экспериментальные исследования, направленные на повышение эффективности алгоритмов обнаружения и сегментации объектов за счет методов аугментации данных, дополнительной предобработки, выбора архитектуры и наилучших гиперпараметров сети. Алгоритм обнаружения работает в режиме реального времени, достигаемая средняя точность для 11 классов объектов по метрике mAP – 64 %. Скорость работы алгоритма семантической сегментации составляет 5 кадр/с, средняя точность для трех классов объектов по метрики IoU – 92 %.
Бесплатно

Исследование подхода «обнаружение объектов» в задаче фрагментации горных пород на открытых карьерах
Статья научная
В горнодобывающих работах на открытых карьерах активно используются взрывные технологии. При этом появляется задача оценки качества взрывных работ, которая определяется размерами фрагментов горной породы, полученных в результате взрывов. В связи с этим возникает задача оценки числа фрагментов горной породы и их размеров (задача фрагментации). В настоящее время популярны подходы к решению таких задач на основе систем компьютерного зрения с использованием нейронных сетей семантической или экземплярной сегментации. При этом оказывается, что для их работы требуется существенное привлечение компьютерных ресурсов. В связи с этим использование альтернатив - алгоритмов быстрого обнаружения объектов на цифровых изображениях взорванной породы является актуальным. В статье изучены особенности использования нейронных сетей глубокого обучения с архитектурой YOLO, которая, как ожидалось, будет иметь более высокую скорость обработки видеоинформации. На основе проведённого исследования обоснован выбор в качестве базовой архитектуры использовать YOLOv7x. Для обучения нейронных сетей выбранной архитектуры был использован размеченный авторами набор данных, составленный из цифровых фотографий фрагментов горной породы, образовавшихся в результате взрыва в открытом карьере. Полученные результаты позволили обосновать выбор в качестве метрики оценки качества взрывных работ геометрические размеры описанного прямоугольника вокруг выделенного на изображении фрагмента породы.
Бесплатно

Статья научная
Проведенные в работе исследования показывают, что применение технологии дескрипторов особых точек в чистом виде к задаче сравнения и поиска чертежей является неэффективным. Выявлено, что основной причиной этому служит наличие в чертежах большого количества идентичных элементов (рамки, основная надпись, выносные линии, элементы шрифтов и др.). Для решения данной проблемы предложено использование метода tf-idf (term frequency-inverse document frequency), широко известного в технологии обработки естественного языка. В исследовании вместо векторов слов, применяемых в оригинальной методике tf-idf, использовались дескрипторы особых точек изображений, вычисленных по алгоритмам ORB и BRISK. В результате исследования получены следующие выводы: 1) показана высокая эффективность предлагаемого подхода для поиска копии изображения-запроса в базе данных. Так, для всех изображений, предложенных для поиска и имеющих свои полные аналоги в базе данных, было выявлено наличие копий. 2) Количество выявленных изображений, являющихся модификациями изображения-запроса, разнится и зависит от алгоритма нахождения особых точек и дескрипторов. Так, при использовании ORB максимальное количество выявленных модифицированных аналогов составило 60 %, при использовании BRISK - 80 % от всех аналогов изображения, находящихся в базе данных. 3) Предлагаемый подход показывает ограниченную эффективность для нахождения изображений, которые можно отнести к тому же классу, что и изображение-запрос (например, чертеж экскаватора, бульдозера, автомобильного крана). Здесь максимальное количество ложных определений достигло 60 %.
Бесплатно

Статья научная
В работе проведено исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники. Метод нейросетевой сегментации изображений основан на реализации Сarvana c архитектурой типа U-Net, для распознавания ориентации использована нейросеть, построенная в открытой нейросетевой библиотеке Keras на основе предобученной нейронной сети VGG16. Рассмотренный подход позволяет осуществлять сегментацию изображений. Результаты проведенных экспериментов показали возможность достаточно точного (0,94 - 0,96) выделения объекта интереса. Полученные бинарные маски позволяют визуально судить о классе самолета, имеющегося на изображении.
Бесплатно

Исследование эффективности активно-импульсного метода обнаружения световозвращающих объектов
Статья научная
Данная статья посвящена экспериментальному исследованию эффективности аппаратно-программных средств лазерной импульсной локации без применения электрооптического преобразователя в качестве внешнего затвора. Система предназначена для обнаружения световозвращающих объектов, в т.ч. оптических и оптико-электронных приборов наблюдения. Приведены результаты измерений на многоплановой сцене в зависимости от положения активной зоны видимости лазерной импульсной локации. Показана возможность определения расстояний до объектов за счет обработки последовательностей изображений, полученных при сканировании сцены по дальности и квадратичной аппроксимации полученных значений сигналов с расчетом координат их максимумов. Предложены и продемонстрированы алгоритмы обработки регистрируемых изображений с целью обнаружения слабоконтрастных объектов (с низким показателем световозвращения) на сложном фоне.
Бесплатно

Исследование эффективности восстановления кам-символов неполной длительности в OFDM-сигнале
Статья научная
Рассматривается задача восстановления данных, передаваемых при помощи технологии OFDM, по не полностью принятому сигналу. Теоретически данный подход способен повысить стойкость декодера к потере части переданного сигнала. В статье дана математическая постановка задачи восстановления КАМ-символов неполной длительности в OFDM-сигнале, а также рассматриваются несколько методов её решения: метод регуляризации, итерационный метод на базе быстрого преобразования Фурье, градиентный метод на основе обучения по примерам, расчёт обратного оператора. Исследуется их эффективность, а также эффективность использования одновременно нескольких методов для повышения точности восстановления данных. Представленные в работе результаты численных экспериментов подтверждают практический потенциал предложенного подхода.
Бесплатно

Статья научная
Работа посвящена исследованию эффективности методов контролируемой спектральной и спектрально-пространственной классификации гиперспектральных данных. В частности, на примере различения типов растительности рассмотрены методы минимального расстояния, опорных векторов, Махаланобиса, максимального правдоподобия. Значительное внимание уделено изучению зависимости точности классификации данных при применении перечисленных методов от количества и способа выбора спектральных признаков. Продемонстрирована перспективность совместной обработки спектральных и пространственных признаков, учитывающей коррелированность близкорасположенных пикселей. Приведены экспериментальные результаты, полученные при различных способах формирования обучающих выборок.
Бесплатно

Итерационный алгоритм совмещения контуров с неравномерным шагом дискретизации
Статья научная
В статье представлен итерационный алгоритм для совмещения контуров. В рассматриваемой задаче совмещаемые контуры имеют одинаковую форму, но шаг дискретизации является неравномерным и между точками контуров нет соответствия. По этой причине применение методов, связывающих между собой определенные точки контуров через уравнения, невозможно. В работе представлен алгоритм, который проводит раздельную оценку параметров: смещений вдоль осей координат и угла поворота для таких контуров. Идея алгоритма заключается в итерационном уточнении параметров. Оценка параметров смещения используется для расчета угла поворота, и оценка угла поворота используется для расчета смещения. Алгоритм характеризуется более высокой скоростью обработки, чем алгоритм полного перебора, и меньшей погрешностью совмещения по сравнению с алгоритмами, основанными на вычислении макропараметров контура.
Бесплатно

Статья научная
В статье рассматриваются системы полухрупких цифровых водяных знаков, предназначенные для защиты от несанкционированных изменений изображений, представленных в формате JPEG. Эти системы позволяют обнаруживать и определять местоположение изменений, а некоторые также приближённо восстанавливать исходное содержимое. Приводятся формальные схемы, описывающие процедуры встраивания цифровых водяных знаков и аутентификации. Рассматривается более десятка систем данного типа, предложенных с 2000 года, и предлагается их классификация по различным критериям. Представлены результаты экспериментальных исследований различных систем по оценке уровня искажений, возникающих при встраивании информации, а также погрешности при извлечении. Кроме того, исследована работоспособность систем в смысле обеспечения частичной стойкости к JPEG-сжатию.
Бесплатно

Классификация изображений ДЗЗ с использованием алгоритма комплексирования данных различных сенсоров
Статья научная
Комплексирование данных дистанционного зондирования Земли предназначено для получения изображений более высокого качества, чем исходные изображения. Однако вопрос о влиянии комплексирования данных на дальнейшую тематическую обработку часто остаётся за рамками исследований, и методы комплексирования используются в большинстве своём для улучшения визуального представления данных. В настоящей статье рассматривается вопрос о влиянии комплексирования с повышением пространственного и спектрального разрешения данных на тематическую классификацию изображений с использованием различных классификаторов и методов извлечения признаков, популярных в задачах обработки данных дистанционного зондирования Земли. В качестве алгоритма комплексирования в работе используется авторский алгоритм, позволяющий выполнять комплексирование данных по множеству кадров из различных источников оптических систем дистанционного зондирования Земли, обладающих различным пространственным и спектральным разрешением. В качестве алгоритмов классификации рассматриваются метод опорных векторов и Random Forest, в качестве признаков - спектральные каналы, а также расширенные атрибутивные профили и локальные признаки атрибутивных профилей. Экспериментальное исследование было произведено с использованием модельных изображений четырёх изображающих систем. Результирующее изображение имело пространственное разрешение в 2, 3, 4 и 5 раз выше, чем для исходных изображений соответственно. В результате исследований было выявлено, что для метода опорных векторов не имеет смысла выполнять комплексирование, так как излишняя пространственная детализация на классификацию данным алгоритмом влияет отрицательно. Для алгоритма Random Forest, напротив, результаты классификации в 90 % случаев имели большую точность, чем для исходных изображений низкого разрешения. Например, для изображений с наименьшим отличием в пространственном разрешении (в 2 раза) от результата комплексирования точность классификации комплексированного изображения была в среднем на 4 % выше. Кроме того, результаты, полученные для алгоритма Random Forest с комплексированием, оказались лучше результатов для метода опорных векторов без комплексирования. Дополнительно было показано, что точность классификации комплексированного изображения методом Random Forest может быть повышена в среднем на 9 % за счёт использования расширенных атрибутивных профилей в качестве признаков. Таким образом, при использовании комплексирования данных лучше применять классификатор Random Forest, а использование комплексирования с методом опорных векторов нецелесообразно.
Бесплатно

Классификация изображений оперения для определения видовой принадлежности птиц
Статья научная
В работе исследуется возможность применения нейронных сетей для классификации изображений оперения с целью определения видовой принадлежности птиц. Таксономическая идентификация птиц по перу широко применяется в авиационной орнитологии для анализа столкновений с летательными аппаратами и разработки методов их предотвращения. В данной статье производится обучение на основе набора данных с фотографиями оперения птиц. Проводится сравнение классификаторов, обученных на четырех выборках из исходного набора данных. Предлагается метод идентификации птиц по изображениям с реальными данными на основе нейронных сетей YoloV4 и моделей группы DenseNet. Проведенная экспериментальная оценка показала, что предложенный метод позволяет определить видовую принадлежность птицы по фотографии отдельного пера с точностью до 81,03 % для точной классификации и с точностью 97,09 % для первых пяти предсказаний классификатора.
Бесплатно

Классификация космоснимков Sentinel-2 Байкальской природной территории
Статья научная
В работе рассматривается задача классификации мультиспектральных космоснимков Sentinel-2 при организации экологического мониторинга Байкальской природной территории. Специфика территории потребовала создания нового набора из 12 классов, который учитывает актуальные проблемы и сформирован таким образом, что площади, соответствующие этим классам, полностью покрывают исследуемую территорию. Обучающая выборка сформирована с помощью Web-интерфейса на основе космоснимков Sentinel-2 и полевых исследований. Классификация космоснимков проводилась с использованием алгоритмов RandomForest и нейронной сети ResNet50. Точность расчетов показала, что результаты классификации могут применяться для решения актуальных задач Байкальской природной территории, в частности, для анализа изменений лесного фонда, оценки влияния изменений климата на ландшафт, анализа динамики застройки, инвентаризации сельхозугодий и т.д.
Бесплатно

Классификация редких дорожных знаков
Статья научная
В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.
Бесплатно

Компаративная фильтрация изображений с использованием монотонных морфологических операторов
Статья научная
В работе представлен новый класс компаративных фильтров, основанных на операциях математической морфологии Серра. Как известно, операции открытия (закрытия) Серра, в отличие от рассматривавшихся ранее проекторов Пытьева, линейных диффузных и нелинейных медианных фильтров, являются монотонно неувеличивающими (неуменьшающими) фильтрами, что определяет их иные математические и прикладные свойства. Приведены результаты экспериментального исследования предложенных компаративных фильтров с различными параметрами в задаче выделения отличий на изображениях в сравнении другими морфологическими процедурами выделения отличий.
Бесплатно

Комплексный анализ и мониторинг состояния окружающей среды на основе данных ДЗЗ
Статья научная
Исследуется проблема комплексного анализа и мониторинга окружающей среды на основе прежде всего данных гиперспектральных изображений и вариант ее решения с созданием необходимого алгоритмического обеспечения для обработки и хранения гиперспектральных изображений. Гиперспектральное изображение рассматривается как двумерное поле сигнатур пикселей. Предложены методы оценки сходства сигнатуры пикселя гиперспектрального изображения с эталоном, включающие в себя простые преобразования совмещения пикселя с эталоном: тождественное; масштабирование по амплитуде; смещение по y ; сочетание последних двух. Предложен метод кластеризации/распознавания с самообучением, определяющий значения параметров преобразования, обеспечивающего совмещение сигнатуры текущего пикселя с эталоном. Сходство с эталоном устанавливается по величине среднеквадратического отклонения. На этой основе предложен метод сжатия гиперспектральных изображений с контролируемыми потерями путем формирования базиса накоплением эталонов сигнатур и представления остальных сигнатур параметрами совмещения их с распознанным эталоном класса...
Бесплатно

Статья научная
Алгоритм коррекции вращательного смаза рассматривается как этап предварительной обработки изображений в задаче измерения ориентации при помощи звёздного датчика. Для реализации предлагаемого алгоритма звёздный датчик должен быть оснащён измерителем вектора угловой скорости (трёхосным гироскопом). Алгоритм не гарантирует обнаружения изображения звезды на фоне дневного неба в одном кадре, но облегчает условия для последующего накопления последовательности кадров. Целью коррекции является локализация энергетических максимумов смазанных изображений звёзд в пикселях с заранее определёнными характеристиками. После коррекции эти пиксели получают некоторое превышение над фоном, в них улучшается отношение сигнал/шум, но теряется художественное качество цифрового изображения в целом. Определяющей характеристикой пикселя, в котором локализуется максимум, является попадание в него геометрического изображения звезды в момент начала экспозиции корректируемого кадра. Коррекция выполняется в форме обработки кадра цифровым фильтром, имеющим конечную импульсную характеристику. Импульсная характеристика фильтра неоднородна и представляет собой ядро вращательного смаза, синтезированное в каждом пикселе корректируемого кадра. Описаны алгоритмы расчёта уровней сигнала, фона и шума в изображении звезды, наблюдаемой на фоне дневного неба вращающейся камерой. Выполнен анализ зависимостей отношений сигнал/шум в различных пикселях смазанного изображения от времени экспозиции и от угловой скорости вращения камеры. Рассчитаны отношения сигнал/шум в изображении звезды до и после коррекции смаза. Приведены результаты моделирования на примере изображения яркой звезды, наглядно показывающие особенности работы предлагаемого алгоритма коррекции вращательного смаза.
Бесплатно