Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Статья научная
В работе рассматривается задача извлечения предпочтений пользователя по его фотоальбому. Предложен новый подход на основе автоматического порождения текстовых описаний фотографий и последующей классификации таких описаний. Проведен анализ известных методов создания аннотаций по изображению на основе свёрточных и рекуррентных (Long short-term memory) нейронных сетей. С использованием набора данных Google’s Conceptual Captions обучены новые модели, в которых объединяются характерные признаки фотографии и выходы блока рекуррентной нейронной сети. Исследовано применение алгоритмов обработки текстов для преобразования полученных аннотаций в пользовательские предпочтения. Проведены экспериментальные исследования с помощью наборов данных Microsoft COCO Captions, Flickr8k и специально собранного набора данных, отражающего интересы пользователя. Показано, что наилучшее качество определения предпочтений достигается с помощью методов поиска ключевых слов и суммаризации текстов из Watson API, которые оказываются на 8 % точнее по сравнению с традиционным латентным размещением Дирихле. При этом описания, порожденные с помощью обученных моделей, классифицируются на 1 - 7 % точнее известных аналогов.
Бесплатно
Статья научная
Представлены результаты выявления многолетних изменений в растительном покрове оставленных аграрных угодий лесостепной зоны Центрального Черноземья на основе рядов вегетационного индекса NDVI. Значения спектрального показателя вычислены на основе изображений MOD13Q1. Исследованы особенности динамики вегетационного индекса в зависимости от величины проективного покрытия крон древесных сообществ, формирующихся на залежах. Установлено, что значения индекса периода середины августа наиболее информативны для анализа доли лесных насаждений, присутствующих на оставленных аграрных угодьях. Для залежей с хвойными породами характерны более высокие корреляции с NDVI, чем для залежей с лиственными сообществами. В период 2000 - 2018 гг. для всех типов залежей лесостепи Центрального Черноземья установлено наличие положительной статистически значимой тенденции вегетационного индекса. С использованием коэффициента наклона трендовой линии NDVI выполнен пространственно-временной анализ скорости формирования древесных сообществ на залежах лесостепи в первые десятилетия XXI века. Изучены особенности этого процесса.
Бесплатно
Статья научная
В статье рассмотрен подход к интеграции геоинформационных технологий и методов цифровой обработки изображений с целью повышения эффективности использования компьютерных технологий в управлении сложными распределенными системами в аварийных ситуациях на примере анализа деятельности предприятий трубопроводного транспорта нефти, включая линейную часть, нефтеперекачивающие станции, административные, ремонтные и спасательные подразделения. Новизна предложенного варианта интеграции геоинформационных технологий и цифровой обработки изображений состоит в применении теоретико-множественного подхода к единообразному формализованному описанию разнотипных пространственных данных, цифровых изображений и их взаимосвязях, необходимых для построения трехмерных моделей производственных объектов сложно распределенных систем. В дальнейшем она позволила определить критерии, состав и структуру этих трехмерных моделей с применением различных уровней детальности моделей объектов для уменьшения вычислительной нагрузки и ускорения трехмерной визуализации объектов сложно распределенных систем, необходимых для поддержки принятия решений при парировании некоторых видов угроз (аварий). Преимущество предложенного подхода заключается в повышении эффективности поддержки принятия решений при парировании некоторых угроз, которое достигается в том числе за счет применения трехмерной визуализации технологической и оперативной (поступающей в случае аварийной ситуации) информации о производственных объектах сложно распределенных систем, а качество, наполняемость и оптимизация трехмерной модели напрямую влияют на принимаемые решения при реализации действий реагирования на аварийные ситуации. Разработанные методы и алгоритмы доведены до практической реализации и применены для построения трехмерных геоинформационных моделей производственных объектов предприятий трубопроводного транспорта нефти.
Бесплатно
Интеллектуальные методы анализа природных данных: приложение к космической погоде
Статья научная
В работе описаны методы обнаружения аномалий в данных геофизического мониторинга. Рассмотрен актуальный класс задач этой области, направленный на создание методов прогноза космической погоды. Негативное воздействие аномалий космической погоды на здоровье людей и практически на все объекты современной инфраструктуры требует развития методов и создания эффективных средств обнаружения аномалий. Широко применяемые для задач анализа данных и обнаружения аномалий методы пороговой вейвлет-фильтрации позволяют с использованием стратегии «жадности» получить достаточно точные оценки даже при неполных данных относительно шума. Сигнал в этом случае оценивается путем изоляции когерентных структур. Но эти методы имеют большую вычислительную сложность и в случае, когда энергия сигнала мала относительно энергии шума, не обеспечивают получение точных оценок. Для таких сигналов в работе предлагается использовать адаптивные вероятностные пороги. Вводятся параметры пороговой функции, позволяющие оценить изменчивость процесса, подавить шум и детектировать нестационарные особенности разной частотно-временной структуры. Также в работе рассматриваются способы совмещения пороговой вейвлет-фильтрации с нейронными сетями архитектур NARX и Автокодировщик. Предложены схемы реализации таких подходов в задачах обнаружения аномалий космической погоды. На примере задачи обнаружения ионосферных аномалий показана эффективность совмещения пороговой вейвлет-фильтрации с сетью NARX. Эффективность совместного применения сети Автокодировщик с адаптивной пороговой вейвлет-фильтрацией показана в задаче обнаружения аномалий в данных интенсивности потока космических лучей.
Бесплатно
Интерполяция на основе контекстного моделирования при иерархической компрессии многомерных сигналов
Статья научная
Исследуются контекстные алгоритмы интерполяции многомерных сигналов в задаче компрессии. Рассматривается метод иерархической компрессии для сигналов произвольной размерности. Для этого метода предлагается алгоритм интерполяции, основанный на контекстном моделировании. Алгоритм основан на оптимизации параметров интерполирующей функции в локальной окрестности интерполируемого отсчёта. При этом локально оптимальные параметры, найденные для более прореженных масштабных уровней сигнала, используются для интерполяции отсчётов менее прореженных масштабных уровней сигнала. Контекстный алгоритм интерполяции реализован программно в составе иерархического метода компрессии. Вычислительные эксперименты показали, что использование контекстного интерполятора вместо усредняющего позволяет заметно повысить эффективность иерархической компрессии.
Бесплатно
Интерпретация действий животного по его изображению во времени, близком к реальному
Статья научная
Определение действий объекта - сложная и актуальная задача компьютерного зрения. Такую задачу можно решать с помощью информации о положении ключевых точек объекта. Обучение моделей, определяющих положение ключевых точек, требует большой объём данных, включающих в себя информацию о положении этих ключевых точек. В связи с недостатком данных для обучения представлен метод для получения дополнительных данных, а также алгоритм, позволяющий получать высокую точность распознавания действий животных на основании малого числа данных. Достигнутая точность определения положений ключевых точек на тестовой выборке составила 92,3 %. По положению ключевых точек определяется действие объекта. Сравниваются различные подходы к классификации действий по ключевым точкам. Точность определения действий объекта на изображении достигает 73,5 %.
Бесплатно
Информационная технология обработки данных ДЗЗ для оценки ареалов растений
Статья научная
В статье предлагается информационная технология обработки данных дистанционного зондирования Земли для оценки ареалов растений, основанная на вычислении локальных признаков, полученных по суперпиксельному представлению изображений, и кластеризации K-Means. Технология представляет собой автоматизированный способ оценки состава растительного ареала по заданной пользователем обучающей выборке. Достоинствами предлагаемой технологии являются использование меньшего объема данных для обучения, чем для поэлементной классификации, и более высокое качество классификации по сравнению с поэлементной классификацией.
Бесплатно
Статья научная
В данной работе исследуется влияние блоков сжатия и возбуждения на улучшение качества классификации остеоартрита при помощи сверточных нейронных сетей с архитектурами ResNet и DenseNet. Показано, что использование подобных блоков позволяет повысить качество классификации остеоартрита по шкале Келлгрена-Лоуренса на 1 - 3 % без существенной модификации традиционных схем. Также показано, что объединение 0-го и 1-го классов шкалы Келлгрена-Лоуренса в один класс позволяет на 12,74 % повысить точность автоматической классификации стадии остеоартрита, не теряя при этом значимой информации о заболевании. Наилучшая точность классификации составила 84,66 % при использовании ансамбля трех сверточных сетей с архитектурой DenseNet-121, с включенными в них блоками сжатия и возбуждения, что существенно превосходит результаты предыдущих исследований. Полученные результаты могут быть использованы как для автоматической постановки предварительного диагноза, так и в качестве вспомогательного инструмента.
Бесплатно
Использование спектрального вторичного контейнера в методе защиты видео с помощью фазовых ЦВЗ
Статья научная
В работе предложен новый метод защиты видео с помощью фазовых цифровых водяных знаков, отличающийся от ранее описанного метода использованием вторичного контейнера (дискретного спектра Фурье), обеспечивающего дополнительную защищенность видеоконтента. Защитная информация (бинарный QR-код) встраивается в дискретный спектр цифровых водяных знаков, который затем переводится в пространство в виде полутонового изображения, визуально напоминающего шум, которое затем встраивается в фазы синусоид, развивающихся во времени. В данной работе приведены эксперименты, анализирующие зависимость точности процедуры извлечения цифровых водяных знаков от объема встраиваемой информации, от качества. Также рассматривается возможность расположения QR-кода в разных областях дискретного спектра. Приведено экспериментальное доказательство работоспособности метода, а также его стойкости к сжатию с помощью кодека H.264. В заключение сравнивается эффективность использования предложенного метода в сравнении с исходным методом фазовых цифровых водяных знаков.
Бесплатно
Статья научная
Задача одновременной реконструкции сцены и позиционирования камеры (Simultaneous Localization and Mapping - SLAM) с использованием монокулярной системы наблюдения - одна из наиболее известных и сложных, затрагивающая целый ряд научных направлений: робототехнику, компьютерное зрение и виртуальную реальность. Настоящая работа направлена на решение проблемы SLAM в рамках мобильного устройства, оснащённого, наряду с монокулярным оптическим сенсором (камерой), также инерционными датчиками (гироскоп и акселерометр) и цифровым компасом. Последние позволяют получать дополнительную оценку положения и ориентации мобильного устройства. Цель работы - оценить потенциальную пригодность и эффективность использования дополнительной информации, предоставляемой указанными датчиками мобильного устройства типа смартфона, с точки зрения точности получаемого решения и/или снижения временных затрат на его получение. Экспериментальная часть исследования, включающая как модельные, так и натурные эксперименты, позволила определить требования к допустимым погрешностям, вносимым датчиками мобильного устройства. Для конкретной модели мобильного устройства показано, что электронный компас удовлетворяет этим требованиям, в то время как погрешности инерционных датчиков, используемых для определения перемещений, оказываются неприемлемо большими.
Бесплатно
Статья научная
В статье разработаны два нейросетевых алгоритма распознавания объектов железнодорожной инфраструктуры на видеоизображениях. Оба алгоритма направлены на повышение безопасности движения железнодорожного транспорта. Первый алгоритм – это детектирование объектов, создающих препятствия, и объектов железнодорожной инфраструктуры. Второй алгоритм – семантическая сегментация главных и вспомогательных железнодорожных путей, а также поездов в пределах видимости следования локомотива. Алгоритмы реализованы на основе сверточных нейронных сетей YOLO и U-Net. Для обучения и тестирования СНС использована база изображений НИИ информатизации, автоматизации и связи на железнодорожном транспорте. Проведены экспериментальные исследования, направленные на повышение эффективности алгоритмов обнаружения и сегментации объектов за счет методов аугментации данных, дополнительной предобработки, выбора архитектуры и наилучших гиперпараметров сети. Алгоритм обнаружения работает в режиме реального времени, достигаемая средняя точность для 11 классов объектов по метрике mAP – 64 %. Скорость работы алгоритма семантической сегментации составляет 5 кадр/с, средняя точность для трех классов объектов по метрики IoU – 92 %.
Бесплатно
Исследование подхода «обнаружение объектов» в задаче фрагментации горных пород на открытых карьерах
Статья научная
В горнодобывающих работах на открытых карьерах активно используются взрывные технологии. При этом появляется задача оценки качества взрывных работ, которая определяется размерами фрагментов горной породы, полученных в результате взрывов. В связи с этим возникает задача оценки числа фрагментов горной породы и их размеров (задача фрагментации). В настоящее время популярны подходы к решению таких задач на основе систем компьютерного зрения с использованием нейронных сетей семантической или экземплярной сегментации. При этом оказывается, что для их работы требуется существенное привлечение компьютерных ресурсов. В связи с этим использование альтернатив - алгоритмов быстрого обнаружения объектов на цифровых изображениях взорванной породы является актуальным. В статье изучены особенности использования нейронных сетей глубокого обучения с архитектурой YOLO, которая, как ожидалось, будет иметь более высокую скорость обработки видеоинформации. На основе проведённого исследования обоснован выбор в качестве базовой архитектуры использовать YOLOv7x. Для обучения нейронных сетей выбранной архитектуры был использован размеченный авторами набор данных, составленный из цифровых фотографий фрагментов горной породы, образовавшихся в результате взрыва в открытом карьере. Полученные результаты позволили обосновать выбор в качестве метрики оценки качества взрывных работ геометрические размеры описанного прямоугольника вокруг выделенного на изображении фрагмента породы.
Бесплатно
Статья научная
Проведенные в работе исследования показывают, что применение технологии дескрипторов особых точек в чистом виде к задаче сравнения и поиска чертежей является неэффективным. Выявлено, что основной причиной этому служит наличие в чертежах большого количества идентичных элементов (рамки, основная надпись, выносные линии, элементы шрифтов и др.). Для решения данной проблемы предложено использование метода tf-idf (term frequency-inverse document frequency), широко известного в технологии обработки естественного языка. В исследовании вместо векторов слов, применяемых в оригинальной методике tf-idf, использовались дескрипторы особых точек изображений, вычисленных по алгоритмам ORB и BRISK. В результате исследования получены следующие выводы: 1) показана высокая эффективность предлагаемого подхода для поиска копии изображения-запроса в базе данных. Так, для всех изображений, предложенных для поиска и имеющих свои полные аналоги в базе данных, было выявлено наличие копий. 2) Количество выявленных изображений, являющихся модификациями изображения-запроса, разнится и зависит от алгоритма нахождения особых точек и дескрипторов. Так, при использовании ORB максимальное количество выявленных модифицированных аналогов составило 60 %, при использовании BRISK - 80 % от всех аналогов изображения, находящихся в базе данных. 3) Предлагаемый подход показывает ограниченную эффективность для нахождения изображений, которые можно отнести к тому же классу, что и изображение-запрос (например, чертеж экскаватора, бульдозера, автомобильного крана). Здесь максимальное количество ложных определений достигло 60 %.
Бесплатно
Статья научная
В работе проведено исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники. Метод нейросетевой сегментации изображений основан на реализации Сarvana c архитектурой типа U-Net, для распознавания ориентации использована нейросеть, построенная в открытой нейросетевой библиотеке Keras на основе предобученной нейронной сети VGG16. Рассмотренный подход позволяет осуществлять сегментацию изображений. Результаты проведенных экспериментов показали возможность достаточно точного (0,94 - 0,96) выделения объекта интереса. Полученные бинарные маски позволяют визуально судить о классе самолета, имеющегося на изображении.
Бесплатно
Исследование эффективности активно-импульсного метода обнаружения световозвращающих объектов
Статья научная
Данная статья посвящена экспериментальному исследованию эффективности аппаратно-программных средств лазерной импульсной локации без применения электрооптического преобразователя в качестве внешнего затвора. Система предназначена для обнаружения световозвращающих объектов, в т.ч. оптических и оптико-электронных приборов наблюдения. Приведены результаты измерений на многоплановой сцене в зависимости от положения активной зоны видимости лазерной импульсной локации. Показана возможность определения расстояний до объектов за счет обработки последовательностей изображений, полученных при сканировании сцены по дальности и квадратичной аппроксимации полученных значений сигналов с расчетом координат их максимумов. Предложены и продемонстрированы алгоритмы обработки регистрируемых изображений с целью обнаружения слабоконтрастных объектов (с низким показателем световозвращения) на сложном фоне.
Бесплатно
Исследование эффективности восстановления кам-символов неполной длительности в OFDM-сигнале
Статья научная
Рассматривается задача восстановления данных, передаваемых при помощи технологии OFDM, по не полностью принятому сигналу. Теоретически данный подход способен повысить стойкость декодера к потере части переданного сигнала. В статье дана математическая постановка задачи восстановления КАМ-символов неполной длительности в OFDM-сигнале, а также рассматриваются несколько методов её решения: метод регуляризации, итерационный метод на базе быстрого преобразования Фурье, градиентный метод на основе обучения по примерам, расчёт обратного оператора. Исследуется их эффективность, а также эффективность использования одновременно нескольких методов для повышения точности восстановления данных. Представленные в работе результаты численных экспериментов подтверждают практический потенциал предложенного подхода.
Бесплатно
Статья научная
Работа посвящена исследованию эффективности методов контролируемой спектральной и спектрально-пространственной классификации гиперспектральных данных. В частности, на примере различения типов растительности рассмотрены методы минимального расстояния, опорных векторов, Махаланобиса, максимального правдоподобия. Значительное внимание уделено изучению зависимости точности классификации данных при применении перечисленных методов от количества и способа выбора спектральных признаков. Продемонстрирована перспективность совместной обработки спектральных и пространственных признаков, учитывающей коррелированность близкорасположенных пикселей. Приведены экспериментальные результаты, полученные при различных способах формирования обучающих выборок.
Бесплатно
Итерационный алгоритм совмещения контуров с неравномерным шагом дискретизации
Статья научная
В статье представлен итерационный алгоритм для совмещения контуров. В рассматриваемой задаче совмещаемые контуры имеют одинаковую форму, но шаг дискретизации является неравномерным и между точками контуров нет соответствия. По этой причине применение методов, связывающих между собой определенные точки контуров через уравнения, невозможно. В работе представлен алгоритм, который проводит раздельную оценку параметров: смещений вдоль осей координат и угла поворота для таких контуров. Идея алгоритма заключается в итерационном уточнении параметров. Оценка параметров смещения используется для расчета угла поворота, и оценка угла поворота используется для расчета смещения. Алгоритм характеризуется более высокой скоростью обработки, чем алгоритм полного перебора, и меньшей погрешностью совмещения по сравнению с алгоритмами, основанными на вычислении макропараметров контура.
Бесплатно
Статья научная
В статье рассматриваются системы полухрупких цифровых водяных знаков, предназначенные для защиты от несанкционированных изменений изображений, представленных в формате JPEG. Эти системы позволяют обнаруживать и определять местоположение изменений, а некоторые также приближённо восстанавливать исходное содержимое. Приводятся формальные схемы, описывающие процедуры встраивания цифровых водяных знаков и аутентификации. Рассматривается более десятка систем данного типа, предложенных с 2000 года, и предлагается их классификация по различным критериям. Представлены результаты экспериментальных исследований различных систем по оценке уровня искажений, возникающих при встраивании информации, а также погрешности при извлечении. Кроме того, исследована работоспособность систем в смысле обеспечения частичной стойкости к JPEG-сжатию.
Бесплатно
Классификация изображений ДЗЗ с использованием алгоритма комплексирования данных различных сенсоров
Статья научная
Комплексирование данных дистанционного зондирования Земли предназначено для получения изображений более высокого качества, чем исходные изображения. Однако вопрос о влиянии комплексирования данных на дальнейшую тематическую обработку часто остаётся за рамками исследований, и методы комплексирования используются в большинстве своём для улучшения визуального представления данных. В настоящей статье рассматривается вопрос о влиянии комплексирования с повышением пространственного и спектрального разрешения данных на тематическую классификацию изображений с использованием различных классификаторов и методов извлечения признаков, популярных в задачах обработки данных дистанционного зондирования Земли. В качестве алгоритма комплексирования в работе используется авторский алгоритм, позволяющий выполнять комплексирование данных по множеству кадров из различных источников оптических систем дистанционного зондирования Земли, обладающих различным пространственным и спектральным разрешением. В качестве алгоритмов классификации рассматриваются метод опорных векторов и Random Forest, в качестве признаков - спектральные каналы, а также расширенные атрибутивные профили и локальные признаки атрибутивных профилей. Экспериментальное исследование было произведено с использованием модельных изображений четырёх изображающих систем. Результирующее изображение имело пространственное разрешение в 2, 3, 4 и 5 раз выше, чем для исходных изображений соответственно. В результате исследований было выявлено, что для метода опорных векторов не имеет смысла выполнять комплексирование, так как излишняя пространственная детализация на классификацию данным алгоритмом влияет отрицательно. Для алгоритма Random Forest, напротив, результаты классификации в 90 % случаев имели большую точность, чем для исходных изображений низкого разрешения. Например, для изображений с наименьшим отличием в пространственном разрешении (в 2 раза) от результата комплексирования точность классификации комплексированного изображения была в среднем на 4 % выше. Кроме того, результаты, полученные для алгоритма Random Forest с комплексированием, оказались лучше результатов для метода опорных векторов без комплексирования. Дополнительно было показано, что точность классификации комплексированного изображения методом Random Forest может быть повышена в среднем на 9 % за счёт использования расширенных атрибутивных профилей в качестве признаков. Таким образом, при использовании комплексирования данных лучше применять классификатор Random Forest, а использование комплексирования с методом опорных векторов нецелесообразно.
Бесплатно