Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Методы коррекции цвета и яркости при создании панорамных изображений
Статья научная
При создании бесшовных панорам из набора перекрывающихся изображений, полученных с различных камер, области перекрытия могут сильно различаться по освещённости и цветовым оттенкам на соседних изображениях. В данной работе рассматриваются различные подходы к смешению цветов при сшивке и алгоритмы предварительной цветокоррекции исходных изображений. Предложен способ параллельной оценки корректирующих коэффициентов по всем границам стыковки изображений. Получены сравнительные оценки цветового, структурного подобия внутри областей перекрытия, а также показана плавность перехода яркости в панораме.
Бесплатно
Метрика искажений мелких структур компрессированных изображений
Статья научная
В статье предлагается новая метрика искажений мелких структур компрессированных изображений - MFSD ( Metric of Fine Structures Distortion ). К особенностям метрики относится то, что она основана на алгоритме идентификации мелких структур изображения с использованием нормированной системы N-CIELAB, что позволяет оценивать искажения с учетом свойств контрастной чувствительности зрения. Приводятся экспериментальные результаты оценки искажений тестовых изображений в зависимости от степени компрессии и параметра качества в кодеках JPEG и JPEG2000 по метрике MFSD и по традиционным метрикам PSNR и SSIM. На основе результатов сравнительного анализа MFSD с субъективными оценками качества компрессированных изображений JPEG и JPEG2000 получен новый объективный критерий высокого качества воспроизведения мелких структур компрессированных изображений. Приводится теоретическое и экспериментальное обоснование объективности нового критерия по результатам обработки и анализа искажений компрессированных тестовых фотореалистичных изображений.
Бесплатно
Моделирование рассуждений при поиске и описании объектов на космоснимках
Статья научная
В статье представлен подход к проблеме контекстного поиска и описания объектов на растровых космоснимках, заключающийся в моделировании рассуждений на основе структурированных прецедентов. В результате обработки изображения строится граф смежности цветовых областей. Объект характеризуется цветом, атрибутами формы отрезков границы и формы объекта в целом. Структурированный прецедент представляется в виде лучевого графа, дуги которого упорядочены в соответствии с положительным обходом границ областей. С помощью алгоритма сопоставления графов в анализируемом изображении выявляются вхождения прецедентов из базы данных системы. При обнаружении вхождения применяется правило прецедентного вывода. Степень принадлежности объекта некоторому классу зависит не только от свойств самого объекта, но и от достоверности окружающих его объектов. Стратегия контекстного поиска содержит этапы рекурсии и итерации. В отличие от нейросетевых технологий, предложенный подход позволяет не только классифицировать изображенные объекты, но и получать их структурированные описания. Кроме того, выдаваемое системой классификационное решение имеет аргументированное обоснование. Результаты эксперимента показывают, что рассуждения на основе структурированных прецедентов позволяют уточнять результаты классификации и повышать достоверность распознавания объектов на космоснимках.
Бесплатно
Статья научная
Основная проблема использования стандартных методов оптимизации заключается в необходимости изменять все параметры шагами одинакового размера, независимо от поведения градиента. Более эффективный способ оптимизации нейронной сети состоит в том, чтобы установить адаптивные размеры шага для каждого параметра. Стандартные методы основаны на квадратных корнях экспоненциальных оценок моментов квадратов прошлых градиентов и не используют локальное изменение градиентов. В работе представлены методы адаптивной невыпуклой и доверительной оптимизации с положительно-отрицательной оценкой моментов с соответствующими теоретическими гарантиями сходимости. Данные подходы позволяют более точно сходиться функции потери в области глобального минимума за меньшее количество итераций. Использование преобразований положительно-отрицательной оценки момента и дополнительного параметра, регулирующего размер шага, позволяют обходить локальные экстремумы для достижения более высокой производительности по сравнению с аналогичными методами. Внедрение разработанных алгоритмов в процесс обучения различных архитектур мультимодальных нейросетевых систем анализа гетерогенных данных позволило повысить точность распознавания пигментных новообразований кожи на 2,33 - 5,69 процентных пункта по сравнению с известными методами оптимизации. Мультимодальные нейросетевые системы анализа разнородных дерматологических данных, обученные с применением предложенных алгоритмов оптимизации, могут использоваться в качестве инструмента вспомогательной медицинской диагностики, который позволит сократить потребление финансовых и трудовых ресурсов, задействованных в медицинской отрасли, а также повысить шанс раннего выявления пигментных онкопатологий.
Бесплатно
Статья научная
В настоящей работе предложен новый подход к классификации гиперспектральных изображений высокого разрешения в прикладной задаче определения типов сельскохозяйственной растительности. В качестве классификатора используется спектрально-пространственная сверточная нейронная сеть с компенсацией вариаций освещения. Для автоматизированного формирования обучающей выборки предложен алгоритм на основе адаптивного вегетационного индекса. Показана эффективность предложенного подхода в задаче классификации типов растительности по результатам съемок сельскохозяйственных угодий, выполненных сканирующей гиперспектральной камерой.
Бесплатно
Статья научная
Данная работа посвящена задаче распознавания людей по лицу в видеопоследовательности. В работе предложена нейросетевая модель, которая для входного набора изображений лица человека строит компактное признаковое представление фиксированной размерности. Предложенная модель состоит из двух частей: модуль распознавания по изображению лица и модуль оценки качества изображения лица. Признаковые представления кадров из входного набора, полученные в результате работы модуля распознавания, агрегируются с учетом их полезности, которая оценивается модулем оценки качества. Визуальный анализ выявил, что предложенная нейронная сеть учится использовать больше полезной информации с изображений высокого качества и меньше - с размытых или перекрытых изображений. Экспериментальная оценка на базах YouTube Faces и IJB-A показала, что предложенный метод объединения признаков на основе оценок полезности изображений позволяет повысить качество распознавания по сравнению с базовыми методами агрегации.
Бесплатно
Нейросетевая реконструкция видеопотока в дифракционных оптических системах массового производства
Статья
Возможность существенно снизить массу и стоимость систем технического зрения привела к появлению большого числа работ, посвященных разработке новых оптических схем на основе дифракционной оптики и новых подходов к реконструкции получаемых изображений. Получаемые системы демонстрируют достаточное для прикладных систем технического зрения качество изображений. Однако при создании таких прикладных систем возможны источники дополнительных потерь качества получаемого видеопотока. В настоящей работе исследовано влияние на итоговое качество реконструируемого видеопотока таких факторов, как ограничения технологии массового производства дифракционной оптики, артефактов сжатия видеопотока с потерями, а также особенностей нейросетевого подхода к реконструкции. Предложена сквозная нейросетевая технология реконструкции изображений, позволяющая компенсировать дополнительные факторы потери качества и получить итоговый видеопоток с качеством, достаточным для решения прикладных задач технического зрения.
Бесплатно
Статья научная
Контроль качества и обнаружение артефактов в данных функциональной магнитно-резонансной томографии актуален для исследований головного мозга и клинических применений. Движение головы испытуемых остается основным источником артефактов - даже микросмещение головы способно исказить структурные и функциональные МРТ-данные. В настоящей работе предложена сквозная нейросетевая технология обнаружения ступенчатых аномалий с обучением на частично синтезированных данных с адаптацией к конкретному малому набору реальных данных. Разработана процедура формирования синтетического набора данных для обучения и автоматизированной разметки реальных данных. Предложена рекуррентная нейросетевая модель обнаружения ступенчатых аномалий. Разработан метод адаптации модели по малому набору реальных данных на основе одношагового метаобучения. Экспериментальная проверка точности проведена в задаче детектирования ступенчатых аномалий скользящим окном в 10, 15 и 24 отсчёта. Эксперименты показали, что предложенная технология обеспечивает обнаружение ступенчатых аномалий с точностью до 0,9546.
Бесплатно
Нейросетевой классификатор гиперспектральных снимков кожных патологий
Статья научная
В работе представлены результаты применения нейросетевого классификатора для анализа снимков злокачественных и доброкачественных кожных образований, полученных с помощью гиперспектральной камеры. С помощью трёхблочной нейросети архитектуры VGG произведена классификация набора двумерных изображений меланомы, папилломы и базальноклеточной карциномы, полученных в диапазонах 530 - 570 и 600 - 606 нм, характеризуемых наибольшим поглощением меланина и гемоглобина. Проанализирована достаточность включения в обучающий набор двумерных изображений ограниченного спектрального диапазона. Полученные результаты позволяют судить о значительных перспективах применения нейросетевых алгоритмов обработки гиперспектральных данных для классификации кожных патологий. При относительно малом наборе обучающих данных точность классификации для трех типов новообразований составила 96 %.
Бесплатно
Нелинейная фильтрация контуров изображений, заданных в комплекснозначном коде
Статья научная
Рассмотрены особенности организации нелинейной фильтрации контуров изображений, заданных в виде последовательности комплексных чисел. Исследовано влияние линейных преобразований масштабирования и поворота контура на результат фильтрации. Исследовано изменение спектра контура при прохождении через нелинейные фильтры.
Бесплатно
Статья научная
Предлагается непараметрический алгоритм автоматической классификации статистических данных большого объёма. Основу алгоритма составляет процедура оптимальной дискретизации области значений случайной величины. Под классом понимается компактная группа наблюдений случайной величины, соответствующих одномодальному фрагменту плотности вероятности. Рассматриваемый алгоритм автоматической классификации основан на «сжатии» исходной информации на основе декомпозиции многомерного пространства признаков. В результате статистическая выборка большого объёма преобразуется в массив данных, составленный из центров многомерных интервалов дискретизации и соответствующих им частот принадлежности случайных величин. Для обоснования процедуры оптимальной дискретизации используются результаты исследования асимптотических свойств регрессионной оценки плотности вероятности ядерного типа. Из условия минимума среднеквадратического отклонения регрессионной оценки плотности вероятности определяются оптимальные количества интервалов дискретизации области значений одномерной и двухмерной случайных величин. Полученные результаты обобщаются на дискретизацию области значений многомерной случайной величины. Формула оптимальной дискретизации содержит составляющую, которая характеризуется нелинейным функционалом от плотности вероятности. Устанавливается аналитическая зависимость обнаруженной составляющей от коэффициента контрэксцесса одномерной случайной величины. Для независимых компонент многомерной случайной величины определяется методика расчёта оценок оптимального количества интервалов дискретизации случайных величин и их длин. На этой основе разрабатывается непараметрический алгоритм автоматической классификации, который основан на последовательной процедуре проверки близости центров многомерных интервалов дискретизации и соотношений между частотами принадлежности случайных величин из исходной выборки этим интервалам. Для дополнительного повышения вычислительной эффективности предлагаемого алгоритма автоматической классификации используется многопоточный метод его программной реализации. Практическая значимость разработанных алгоритмов подтверждается результатами их применения при обработке данных дистанционного зондирования.
Бесплатно
Статья научная
При синтезе алгоритмов автоматической пороговой сегментации изображений по яркостному признаку важной информацией является количество яркостных классов и, как следствие, проблема определения числа порогов. Решение задачи оценивания количества классов на изображении может базироваться на представлении его распределения в виде смеси распределений яркостных классов с неизвестными априорными вероятностями либо оценке количества мод гистограмм. При этом известно, что задача расщепления смеси имеет решение лишь для некоторых видов распределений, а моды гистограммы не всегда различимы. В общем случае, когда распределения яркостных классов неизвестны, возникают трудности применения указанных методов. В статье предлагается непараметрический подход к определению количества классов, отличающихся средней яркостью, основанный на ранговых гистограммах и использующий свойство локальной пространственной группировки элементов каждого яркостного класса на изображении.
Бесплатно
Новый метод встраивания цифровых водяных знаков в векторные картографические данные
Статья научная
Предложен метод встраивания цифровых водяных знаков в векторные данные (карты) геоинформационных систем. Метод основан на комбинации двух оригинальных приемов. Во-первых, защитная информация вносится в полигональные объекты карты путем управляемого циклического сдвига списка вершин каждого полигона. Во-вторых, в качестве цифрового водяного знака рассматривается не битовый вектор, а растровое изображение, геометрически совмещенное с картой. В отличие от известных, предложенный метод не искажает координатную информацию карты. На простом примере продемонстрирована работоспособность метода, а также стойкость вносимого изображения - цифрового водяного знака к геометрическим преобразованиям, обычно осуществляемым при работе с картографическими данными: сдвигу, масштабированию, повороту и кадрированию.
Бесплатно
Новый метод обнаружения и устранения случайнозначного импульсного шума на изображениях
Статья научная
В работе предложен метод детектирования и последующего устранения импульсного шума на изображениях, в котором вводится понятие сходства между пикселями как функции расстояния и разницы в значениях яркости в локальном окне детектора. Рассматривается модель импульсного шума, в которой искаженные пиксели принимают случайные значения, а также случайным образом возникают на изображении. Пиксели, которые были отмечены как искаженные импульсным шумом, восстанавливаются адаптивным медианным фильтром. Импульсные искажения детектируются в окне детектора, размер которого рассчитан по евклидовой метрике и увеличивается с ростом интенсивности шума на изображении. В экспериментальной части представлено сравнение между известными и предлагаемым методами на трёх изображениях для трех различных интенсивностей импульсного шума. В приближении на фрагментах изображений видно, что предлагаемый метод наилучшим образом справляется с задачей, что было также подтверждено численными оценками качества фильтрации импульсного шума на изображении на основе пикового отношения сигнала к шуму и индекса структурного сходства. Предлагаемый метод может найти применение в задачах очистки изображений в условиях искажающего импульсного воздействия и для устранения искажений от неблагоприятных погодных эффектов, таких как капли дождя и снег.
Бесплатно
О количественной оценке малых цветовых различий на цифровых изображениях
Статья научная
Рассматриваются особенности использования и возможности, предоставляемые трёхцветными колориметрами или цифровыми камерами, в задачах выявления малых цветовых различий методами компьютерного зрения. Экспериментально выявлена спектральная зависимость полных цветовых различий между парами монохроматических стимулов, цвет которых не различается визуально. Создана экспериментальная установка на основе монохроматора УМ-2, с помощью которой экспериментально построен цифровой атлас монохроматических стимулов с шагом 1 нм. Атлас служит для тестирования цветового охвата и цветоразличения камер. Экспериментально показано, что в видимом спектральном диапазоне величину цветового различия в 3 единицы обнаруживают пары стимулов, расположенные по спектру неравномерно и отличающиеся по длинам волн от 1 до 6 нм. Возможности компьютерного зрения тестируются на примерах выявления дописок при технико-криминалистической экспертизе документов. Разработан новый алгоритм для обнаружения и количественной характеризации цветового различия в дописках по цифровому фотоизображению сделанной надписи. Объективный анализ изображения предлагается разделить на блоки цветовой сегментации и оценки цветового тона и цветового различия. В такой постановке блок цветовой сегментации выполняет функции предобработки, задавая карту границ разноокрашенных классов для последующих вычислений. Метод Оцу оптимального глобального порогового преобразования впервые применён к задаче сегментации изображения по насыщенности цвета. Апробация алгоритма подтвердила его эффективность в решении экспертных задач цветоразличения.
Бесплатно
Обзор алгоритмов детектирования текстовых областей на изображениях и видеозаписях
Статья научная
Статья посвящена обзору методов детектирования и сегментации текстовых областей на изображениях и видеозаписях. Определяется обобщенный алгоритм работы систем распознавания текстов. Проводится обзор методов детектирования, определения структуры и сегментации текстовых документов в рамках решения задачи распознавания текстовых областей на изображениях и видеозаписях. Методы, предложенные в течение 30 лет исследований, анализируются с точки зрения точности, скорости и универсальности. В работе затрагиваются современные проблемы, касающиеся детектирования и распознавания текстовых областей на изображениях.
Бесплатно
Статья научная
В статье предлагается система признаков, предназначенная для обнаружения атак на биометрическое предъявление на системы аутентификации, использующие лицевую биометрию. При таком типе атаки злоумышленник маскируется под авторизованного пользователя, используя его изображение. Предложенная система признаков предполагает возможность использования одного или нескольких изображающих сенсоров в дополнение к базовой RGB-камере (тепловизоры, дальномеры, инфракрасные камеры). Использование предложенной системы признаков в сочетании с одной из классических моделей бинарной классификации составляет предлагаемый в работе метод обнаружения атак на биометрическое предъявление. Данный метод продемонстрировал низкий уровень ошибок на наборе данных WMCA, при этом эксперименты показали его способность оставаться эффективным в условиях нехватки обучающих данных. Проведённые сравнительные эксперименты показали, что предложенный метод превзошёл алгоритм RDWT-Haralick-SVM и приблизился к результатам алгоритма MC-CNN, основанного на глубоком обучении и требующего значительно больший объём обучающих данных.
Бесплатно
Статья научная
Встраивание в изображение областей, скопированных из другого изображения, является одним из часто осуществляемых видов подделки изображений. Данная статья посвящена исследованию одного из методов их обнаружения, работа которого основана на анализе артефактов, обусловленных параметрами сенсора регистрирующего устройства, при помощи которого было получено изображение. Для проверки подлинности изображение разбивается на блоки, для каждого из которых вычисляется критерий, определяющий вероятность наличия/отсутствия на нем артефактов и, как следствие, вероятность того, является ли блок встроенным. В экспериментальной части работы проводится анализ точности обнаружения встроенных областей, а также исследование устойчивости метода к различным видам искажений: аддитивному гауссовскому шуму, сжатию JPEG и линейному контрастированию. Результаты экспериментов показали, что метод позволяет обнаруживать встроенные области различной природы, формы и размера, а также обладает устойчивостью к аддитивному гауссовскому шуму и линейному контрастированию для заданного диапазона параметров, но не устойчив к сжатию JPEG. Отличительной особенностью метода является возможность выявления встроенных областей с минимальным размером 2×2.
Бесплатно
Статья научная
Исследуются алгоритмы обнаружения искусственных фрагментов изображений дистанционного зондирования Земли, сгенерированных состязательными нейронными сетями. Рассматривается детектор искусственных изображений, основанный на обнаружении характерного для генеративно-состязательных нейросетей спектрального артефакта, причиной возникновения которого является слой сети, повышающий разрешение. Рассматриваемый детектор применяется для обнаружения искусственных фрагментов, встроенных в настоящие изображения дистанционного зондирования Земли с помощью состязательной нейросети, включающей генератор протяженных элементов. При этом используются изображения дистанционного зондирования различного типа и разрешения, а подменяемые области, некоторые из которых не являются односвязными, имеют различные размеры и формы. Экспериментально показано, что исследуемый спектральный нейросетевой детектор имеет высокую эффективность при обнаружении искусственных фрагментов изображений дистанционного зондирования Земли.
Бесплатно
Статья научная
Раннее выявление пациентов с коронавирусной инфекцией COVID-19 имеет важное значение для обеспечения их адекватного лечения и снижения нагрузки на систему здравоохранения. Эффективным методом обнаружения COVID-19 является компьютерный анализ рентгеновских снимков грудной клетки методами глубокого обучения. В работе предложена методология, состоящая из этапов стандартизации размеров рентгеновских снимков к (224, 224), их классификации с использованием глубоких сверточных нейронных сетей Xception, InceptionResNetV2, MobileNetV2, DenseNet121, ResNet50 и VGG16, предварительно обученных на наборе данных ImageNet, а затем настроенных на наборе рентгеновских снимков грудной клетки. Результаты компьютерных экспериментов показали, что модель VGG16 с тонкой настройкой параметров продемонстрировала максимальную эффективность в классификации COVID-19 с показателями точности (accuracy) 99,09 %, полнота (recall) 99,483 %, прецизионность (precision) 99,08 %.
Бесплатно