Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Статья научная
В работе проведено исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники. Метод нейросетевой сегментации изображений основан на реализации Сarvana c архитектурой типа U-Net, для распознавания ориентации использована нейросеть, построенная в открытой нейросетевой библиотеке Keras на основе предобученной нейронной сети VGG16. Рассмотренный подход позволяет осуществлять сегментацию изображений. Результаты проведенных экспериментов показали возможность достаточно точного (0,94 - 0,96) выделения объекта интереса. Полученные бинарные маски позволяют визуально судить о классе самолета, имеющегося на изображении.
Бесплатно
Исследование эффективности восстановления кам-символов неполной длительности в OFDM-сигнале
Статья научная
Рассматривается задача восстановления данных, передаваемых при помощи технологии OFDM, по не полностью принятому сигналу. Теоретически данный подход способен повысить стойкость декодера к потере части переданного сигнала. В статье дана математическая постановка задачи восстановления КАМ-символов неполной длительности в OFDM-сигнале, а также рассматриваются несколько методов её решения: метод регуляризации, итерационный метод на базе быстрого преобразования Фурье, градиентный метод на основе обучения по примерам, расчёт обратного оператора. Исследуется их эффективность, а также эффективность использования одновременно нескольких методов для повышения точности восстановления данных. Представленные в работе результаты численных экспериментов подтверждают практический потенциал предложенного подхода.
Бесплатно
Статья научная
Работа посвящена исследованию эффективности методов контролируемой спектральной и спектрально-пространственной классификации гиперспектральных данных. В частности, на примере различения типов растительности рассмотрены методы минимального расстояния, опорных векторов, Махаланобиса, максимального правдоподобия. Значительное внимание уделено изучению зависимости точности классификации данных при применении перечисленных методов от количества и способа выбора спектральных признаков. Продемонстрирована перспективность совместной обработки спектральных и пространственных признаков, учитывающей коррелированность близкорасположенных пикселей. Приведены экспериментальные результаты, полученные при различных способах формирования обучающих выборок.
Бесплатно
Итерационный алгоритм совмещения контуров с неравномерным шагом дискретизации
Статья научная
В статье представлен итерационный алгоритм для совмещения контуров. В рассматриваемой задаче совмещаемые контуры имеют одинаковую форму, но шаг дискретизации является неравномерным и между точками контуров нет соответствия. По этой причине применение методов, связывающих между собой определенные точки контуров через уравнения, невозможно. В работе представлен алгоритм, который проводит раздельную оценку параметров: смещений вдоль осей координат и угла поворота для таких контуров. Идея алгоритма заключается в итерационном уточнении параметров. Оценка параметров смещения используется для расчета угла поворота, и оценка угла поворота используется для расчета смещения. Алгоритм характеризуется более высокой скоростью обработки, чем алгоритм полного перебора, и меньшей погрешностью совмещения по сравнению с алгоритмами, основанными на вычислении макропараметров контура.
Бесплатно
Статья научная
В статье рассматриваются системы полухрупких цифровых водяных знаков, предназначенные для защиты от несанкционированных изменений изображений, представленных в формате JPEG. Эти системы позволяют обнаруживать и определять местоположение изменений, а некоторые также приближённо восстанавливать исходное содержимое. Приводятся формальные схемы, описывающие процедуры встраивания цифровых водяных знаков и аутентификации. Рассматривается более десятка систем данного типа, предложенных с 2000 года, и предлагается их классификация по различным критериям. Представлены результаты экспериментальных исследований различных систем по оценке уровня искажений, возникающих при встраивании информации, а также погрешности при извлечении. Кроме того, исследована работоспособность систем в смысле обеспечения частичной стойкости к JPEG-сжатию.
Бесплатно
Классификация изображений ДЗЗ с использованием алгоритма комплексирования данных различных сенсоров
Статья научная
Комплексирование данных дистанционного зондирования Земли предназначено для получения изображений более высокого качества, чем исходные изображения. Однако вопрос о влиянии комплексирования данных на дальнейшую тематическую обработку часто остаётся за рамками исследований, и методы комплексирования используются в большинстве своём для улучшения визуального представления данных. В настоящей статье рассматривается вопрос о влиянии комплексирования с повышением пространственного и спектрального разрешения данных на тематическую классификацию изображений с использованием различных классификаторов и методов извлечения признаков, популярных в задачах обработки данных дистанционного зондирования Земли. В качестве алгоритма комплексирования в работе используется авторский алгоритм, позволяющий выполнять комплексирование данных по множеству кадров из различных источников оптических систем дистанционного зондирования Земли, обладающих различным пространственным и спектральным разрешением. В качестве алгоритмов классификации рассматриваются метод опорных векторов и Random Forest, в качестве признаков - спектральные каналы, а также расширенные атрибутивные профили и локальные признаки атрибутивных профилей. Экспериментальное исследование было произведено с использованием модельных изображений четырёх изображающих систем. Результирующее изображение имело пространственное разрешение в 2, 3, 4 и 5 раз выше, чем для исходных изображений соответственно. В результате исследований было выявлено, что для метода опорных векторов не имеет смысла выполнять комплексирование, так как излишняя пространственная детализация на классификацию данным алгоритмом влияет отрицательно. Для алгоритма Random Forest, напротив, результаты классификации в 90 % случаев имели большую точность, чем для исходных изображений низкого разрешения. Например, для изображений с наименьшим отличием в пространственном разрешении (в 2 раза) от результата комплексирования точность классификации комплексированного изображения была в среднем на 4 % выше. Кроме того, результаты, полученные для алгоритма Random Forest с комплексированием, оказались лучше результатов для метода опорных векторов без комплексирования. Дополнительно было показано, что точность классификации комплексированного изображения методом Random Forest может быть повышена в среднем на 9 % за счёт использования расширенных атрибутивных профилей в качестве признаков. Таким образом, при использовании комплексирования данных лучше применять классификатор Random Forest, а использование комплексирования с методом опорных векторов нецелесообразно.
Бесплатно
Классификация изображений оперения для определения видовой принадлежности птиц
Статья научная
В работе исследуется возможность применения нейронных сетей для классификации изображений оперения с целью определения видовой принадлежности птиц. Таксономическая идентификация птиц по перу широко применяется в авиационной орнитологии для анализа столкновений с летательными аппаратами и разработки методов их предотвращения. В данной статье производится обучение на основе набора данных с фотографиями оперения птиц. Проводится сравнение классификаторов, обученных на четырех выборках из исходного набора данных. Предлагается метод идентификации птиц по изображениям с реальными данными на основе нейронных сетей YoloV4 и моделей группы DenseNet. Проведенная экспериментальная оценка показала, что предложенный метод позволяет определить видовую принадлежность птицы по фотографии отдельного пера с точностью до 81,03 % для точной классификации и с точностью 97,09 % для первых пяти предсказаний классификатора.
Бесплатно
Классификация космоснимков Sentinel-2 Байкальской природной территории
Статья научная
В работе рассматривается задача классификации мультиспектральных космоснимков Sentinel-2 при организации экологического мониторинга Байкальской природной территории. Специфика территории потребовала создания нового набора из 12 классов, который учитывает актуальные проблемы и сформирован таким образом, что площади, соответствующие этим классам, полностью покрывают исследуемую территорию. Обучающая выборка сформирована с помощью Web-интерфейса на основе космоснимков Sentinel-2 и полевых исследований. Классификация космоснимков проводилась с использованием алгоритмов RandomForest и нейронной сети ResNet50. Точность расчетов показала, что результаты классификации могут применяться для решения актуальных задач Байкальской природной территории, в частности, для анализа изменений лесного фонда, оценки влияния изменений климата на ландшафт, анализа динамики застройки, инвентаризации сельхозугодий и т.д.
Бесплатно
Классификация редких дорожных знаков
Статья научная
В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.
Бесплатно
Компаративная фильтрация изображений с использованием монотонных морфологических операторов
Статья научная
В работе представлен новый класс компаративных фильтров, основанных на операциях математической морфологии Серра. Как известно, операции открытия (закрытия) Серра, в отличие от рассматривавшихся ранее проекторов Пытьева, линейных диффузных и нелинейных медианных фильтров, являются монотонно неувеличивающими (неуменьшающими) фильтрами, что определяет их иные математические и прикладные свойства. Приведены результаты экспериментального исследования предложенных компаративных фильтров с различными параметрами в задаче выделения отличий на изображениях в сравнении другими морфологическими процедурами выделения отличий.
Бесплатно
Комплексный анализ и мониторинг состояния окружающей среды на основе данных ДЗЗ
Статья научная
Исследуется проблема комплексного анализа и мониторинга окружающей среды на основе прежде всего данных гиперспектральных изображений и вариант ее решения с созданием необходимого алгоритмического обеспечения для обработки и хранения гиперспектральных изображений. Гиперспектральное изображение рассматривается как двумерное поле сигнатур пикселей. Предложены методы оценки сходства сигнатуры пикселя гиперспектрального изображения с эталоном, включающие в себя простые преобразования совмещения пикселя с эталоном: тождественное; масштабирование по амплитуде; смещение по y ; сочетание последних двух. Предложен метод кластеризации/распознавания с самообучением, определяющий значения параметров преобразования, обеспечивающего совмещение сигнатуры текущего пикселя с эталоном. Сходство с эталоном устанавливается по величине среднеквадратического отклонения. На этой основе предложен метод сжатия гиперспектральных изображений с контролируемыми потерями путем формирования базиса накоплением эталонов сигнатур и представления остальных сигнатур параметрами совмещения их с распознанным эталоном класса...
Бесплатно
Статья научная
Алгоритм коррекции вращательного смаза рассматривается как этап предварительной обработки изображений в задаче измерения ориентации при помощи звёздного датчика. Для реализации предлагаемого алгоритма звёздный датчик должен быть оснащён измерителем вектора угловой скорости (трёхосным гироскопом). Алгоритм не гарантирует обнаружения изображения звезды на фоне дневного неба в одном кадре, но облегчает условия для последующего накопления последовательности кадров. Целью коррекции является локализация энергетических максимумов смазанных изображений звёзд в пикселях с заранее определёнными характеристиками. После коррекции эти пиксели получают некоторое превышение над фоном, в них улучшается отношение сигнал/шум, но теряется художественное качество цифрового изображения в целом. Определяющей характеристикой пикселя, в котором локализуется максимум, является попадание в него геометрического изображения звезды в момент начала экспозиции корректируемого кадра. Коррекция выполняется в форме обработки кадра цифровым фильтром, имеющим конечную импульсную характеристику. Импульсная характеристика фильтра неоднородна и представляет собой ядро вращательного смаза, синтезированное в каждом пикселе корректируемого кадра. Описаны алгоритмы расчёта уровней сигнала, фона и шума в изображении звезды, наблюдаемой на фоне дневного неба вращающейся камерой. Выполнен анализ зависимостей отношений сигнал/шум в различных пикселях смазанного изображения от времени экспозиции и от угловой скорости вращения камеры. Рассчитаны отношения сигнал/шум в изображении звезды до и после коррекции смаза. Приведены результаты моделирования на примере изображения яркой звезды, наглядно показывающие особенности работы предлагаемого алгоритма коррекции вращательного смаза.
Бесплатно
Линейные операторы с векторными масками в задачах цифровой обработки изображений
Статья научная
В работе обосновывается целесообразность применения векторных масок для решения определенного круга задач цифровой обработки изображений. Основное преимущество векторных масок по сравнению с матричными масками заключается в сокращении вычислительной сложности алгоритмов при сохранении, а в некоторых задачах и в улучшении качественных показателей. В статье демонстрируются примеры применения векторных масок в задаче оценивания уровня дискретного белого шума в составе изображения и конструирования на этой основе корректно работающего сигма-фильтра, в задаче детектирования границ для получения сглаженных оценок частных производных, в задаче обнаружения прямых в составе контурного изображения. В работе используются результаты, полученные авторами в их более ранних публикациях.
Бесплатно
Статья научная
В данной работе рассматривается проблема оконтуривания сельскохозяйственных полей на спутниковых снимках. Для решения этой задачи применяется подход, основанный на анализе исторических данных. В работе показано, что на таких данных можно добиться высокого качества с помощью простого малопараметрического метода. Метод состоит из детектора полей и детектора границ. Детекция полей основана на определении порога Оцу, а для определения границ используется детектор краев Кэнни. В связи с нехваткой доступных наборов данных нами был подготовлен и опубликован собственный набор данных, состоящий из 18859 экспертно аннотированных полей на снимках Sentinel-2. Для сравнения оконтуривания на мгновенных и исторических данных был реализован один из наиболее современных методов, основанный на глубоком обучении. Эксперимент показал, что использование исторических данных позволяет получить более высокое качество с более низкими затратами. Предлагаемый малопараметрический метод требует значительно меньше обучающих данных по сравнению с методом на мгновенных данных. Подготовленный набор данных и реализация алгоритма на языке Python были выложены в открытый доступ.
Бесплатно
Статья научная
Исследуются вопросы распознавания изображений множеств объектов, чьи размеры соизмеримы с элементом разрешения регистрирующей аппаратуры - групп точечных объектов. Образы в виде группы точечных объектов встречаются в локационных изображениях, к ним могут быть сведены изображения крупноразмерных объектов, представленных характерными точками, кластеры данных в признаковом пространстве, события в системах массового обслуживания и автоматизированных системах управления. Осложняет распознавание групп точечных объектов несвязность их элементов, узость автокорреляционной функции их изображений по параметрам геометрических преобразований, пространственные флуктуации элементов, ложные отметки и пропуски сигнальных. Наиболее перспективные подходы к распознаванию изображений данного типа основаны на преобразовании групп точечных объектов в связный объект - ассоциированный сплошной образ - и анализе его вторичных признаков. Однако для групп точечных объектов с нестационарной конфигурацией и/или частично маскированных вопросы распознавания еще слабо исследованы...
Бесплатно
Статья научная
В современной полиграфии большое число задач связано со взаимной трансформацией цветовых пространств. В частности, наиболее часто встречается пара аппаратно-зависимых цветовых пространств RGB и CMYK, взаимное преобразование цвета в которых неоднозначно, что создает существенные проблемы при цветовоспроизведении. Для решения этой проблемы мы предлагаем использовать инварианты цветовых пространств - градационные траектории и градационные поверхности, которые представляют собой аналоги градационных кривых для исходных колорантов и их бинарных наложений, построенные в абсолютном цветовом пространстве CIE Lab. Инварианты вводятся на основе математического аппарата дифференциальной геометрии пространственных кривых и поверхностей. Практическое применение инвариантов цветовых пространств сопряжено с определенными трудностями, связанными с их сложным аналитическим описанием, кроме того, для большинства практических задач высокая точность модели является избыточной. Для практического применения инвариантов мы предлагаем более простой подход, использующий естественную дискретизацию цвета в цифровых печатных системах. В качестве примера приводится процедура определения баланса по серому для электрофотографической печатной машины.
Бесплатно
Статья научная
Статья посвящена разработке и исследованию математических моделей, описывающих получение изображений с двухзеркальных катадиоптрических систем, которые позволяют создавать стереоизображения с использованием одной камеры и двух плоских зеркал. Главное отличие предложенных моделей от существующих решений в данной области - учёт дисторсии на изображениях с реальных камер. Приведён обзор основных методов создания 3D-моделей с применением оптических технологий, а также обзор типов катадиоптрических систем в зависимости от количества используемых зеркал и их формы (криволинейные или плоские). Методика проведения исследования заключается в математическом моделировании двухзеркальной катадиоптрической системы, а также в компьютерном эксперименте с использованием реальных изображений, которые были получены с помощью стереонасадки из двух плоских зеркал, и синтетических изображений, сгенерированных на основе алгоритма трассировки лучей. Приведены результаты экспериментов по калибровке камеры со стереонасадкой, а также результаты ректификации изображений с использованием калибровочных данных и разработанных математических моделей. Результаты экспериментов позволяют судить об адекватности разработанных моделей. Предложенные модели расширяют теорию компьютерного зрения и могут быть использованы в создании и исследовании систем компьютерного зрения для робототехнических комплексов.
Бесплатно
Метод анализа динамических изображений нефросцинтиграфии
Статья научная
Предложен метод автоматической обработки динамических нефросцинтиграмм, основанный на приближении кривой ренограммы экспоненциальной функцией. Метод позволяет получить объективные параметры состояния почек. Работа метода изучена на наборе радионуклидных изображений ренотрансплантата. Представлены результаты клинических исследований, подтверждающие диагностическую эффективность разработанного подхода. Анализ кинетики нефротропного индикатора обеспечивает точную оценку функционального состояния пересаженной почки. Выявлено два числовых параметра, показывающих более высокую диагностическую эффективность при их вычислении по построенной модели, чем при их вычислении по исходной ренограмме.
Бесплатно
Статья научная
Распознавание рукописной подписи является важной проблемой в области исследований аутентификации личности и биометрической идентификации. Известны два метода распознавания рукописной подписи: если возможно оцифровать скорость движения пера, то говорят о динамическом распознавании; в противном случае, когда доступно только изображение подписи, говорят о статическом распознавании. Доказано, что при использовании динамического распознавания достигается большая точность, чем при использовании статического распознавания. В настоящей работе в качестве характеристик подписи используются амплитуды, частоты и фазы гармоник, извлечённых из сигналов подписи координат X и Y движения пера с помощью дискретного преобразования Фурье. Предварительно все сигналы подвергаются предобработке, включающей в себя устранение разрывов, устранение угла наклона, нормализацию позиции и масштабирование. В качества инструмента распознавания подписи по полученным признакам предлагается использовать нечёткий классификатор...
Бесплатно
Статья научная
В работе предложен метод визуального анализа и чтения речи по губам водителя при управлении транспортным средством. Автоматическое распознавание речи в акустически неблагоприятных динамических условиях является одной из актуальных задач искусственного интеллекта. Проблема эффективного автоматического чтения по губам во время дорожного движения на данный момент не решена из-за наличия различного рода помех (частые повороты головы, вибрация, динамическое освещение и т.п.). Кроме того, проблема усложняется отсутствием представительных баз данных визуальной речи. Для поиска и извлечения области интереса используется программная библиотека MediaPipe Face Mesh. Для анализа визуальной речи разработана интегральная нейросетевая архитектура (End-to-End). Визуальные признаки извлекаются из отдельного изображения с помощью свёрточной нейронной сети в связке с полносвязным слоем. Извлеченные нейросетевые признаки изображений являются входными данными для нейросети с длинной кратковременной памятью. В связи с небольшим объемом обучающих данных было предложено применять метод переноса обучения. Результаты по анализу и распознаванию визуальной речи водителя в процессе управления автомобилем представляют большие возможности для решения актуальной задачи автоматического чтения по губам. Экспериментальные исследования выполнены на собственном аудиовизуальном корпусе русской речи RUSAVIC, собранном в реальных условиях дорожного движения. Максимальная точность визуального распознавания 62 голосовых управляющих команд водителей составила 64,09 %. Полученные результаты могут быть использованы в системах аудиовизуального распознавания речи, применяемых в акустически сложной обстановке дорожного движения (высокая скорость движения, открытые окна или люк в автомобиле, одновременное проигрывание музыки, слабая шумоизоляция и т.п.).
Бесплатно