Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Статья научная
Современные архитектуры свёрточных нейронных сетей являются весьма ресурсозатратными, что ограничивает возможности их широкого практического применения. В статье предложена архитектура свёрточной нейронной сети, разделённой на аппаратную и программную части для увеличения производительности вычислений. Для реализации свёрточного слоя нейронной сети в аппаратной части использована модулярная арифметика с целью сокращения ресурсозатрат. Предложен численный метод квантования коэффициентов фильтров свёрточного слоя сети для минимизации влияния шума квантования на результат вычислений в системе остаточных классов и определения разрядности коэффициентов. Данный метод основан на масштабировании коэффициентов на фиксированное количество бит и округлении к большему и к меньшему. Используемые операции позволяют уменьшить ресурсы при аппаратной реализации за счёт простоты их выполнения. Все вычисления в свёрточном слое сети выполняются над числами в формате с фиксированной точкой...
Бесплатно
Аутентификация пользователя по динамике подписи на основе нечёткого классификатора
Статья научная
Анализ динамики подписи является одним из наиболее быстрых, интуитивно понятных и экономичных инструментов аутентификации пользователей. Динамическое распознавание подписи основано на анализе нескольких характеристик почерка индивидуума, таких как параметры движения, давление, азимут и угол наклона пера в определенные моменты времени, а также скорости и ускорения вышеперечисленных величин. В нашей работе в качестве признаков были использованы постоянная составляющая и первые семь гармоник разложения данных сигналов в ряд Фурье. Создание систем подтверждения подлинности подписи включает следующие этапы: предобработка, отбор информативных признаков, классификация. Для отбора признаков использованы бинарные метаэвристические и детерминированные алгоритмы. Классификация выполнялась с помощью нечеткого классификатора. Параметры нечетких классификаторов настраивались непрерывными метаэвристическими алгоритмами. Работоспособность системы аутентификации проверена на авторской базе данных. База данных содержит 280 оригинальных вариантов подписи одного автора и 1281 вариант фальсификаций (поддельных подписей) семи авторов. Для оценки статистической значимости различий в точности и ошибках нечетких классификаторов, сформированных метаэвристическими алгоритмами, использованы критерий Манна-Уитни (Уилкоксона) и тест Крускала-Уоллиса.
Бесплатно
Бесконтактная регистрация функции дыхания на основе анализа ИК-ТГц-изображений лица человека
Статья научная
В работе предложен новый подход к бесконтактной регистрации функции дыхания на основе анализа инфракрасно-терагерцовых изображений лица человека, последовательность которых позволяет визуализировать процессы, происходящие во время дыхания. Для получения количественных оценок функции дыхания предложено два способа. Первый - с использованием зонда, реализующего функцию пространственного дифференцирования, обеспечивает высокую чувствительность, но требует повышенной точности совмещения зонда с носовым отверстием и масштабирования в соответствии с ракурсом съемки. Второй - гистограммный способ получения количественных оценок функции внешнего дыхания - инвариантен к масштабу, не требует точного позиционирования, но при этом обладает меньшей чувствительностью. Предложенные способы позволили дистанционно оценить частоту дыхания, которая коррелирует с данными, полученными контактным методом регистрации функции дыхания.
Бесплатно
Быстрое восстановление смазанного изображения, полученного горизонтально вращающейся камерой
Статья научная
В предлагаемой статье решается задача восстановления смазанного изображения, полученного горизонтально вращающейся камерой. Математической моделью данной задачи является уравнение со сверткой на циклической группе. В прежних работах авторов рассмотрен случай невырожденного уравнения. В данной статье рассматривается общий случай, допускающий вырожденность уравнения свертки. Разработан алгоритм, на основе которого написана быстрая программа восстановления смазанных таким образом изображений. Сложность представленного в данной статье алгоритма для вырожденного уравнения свертки такая же, как для невырожденного случая. Приводится анализ погрешностей вычислений, влияющих на качество изображения. Влияние погрешностей начальных данных алгоритма для вырожденного уравнения не хуже, чем для невырожденного.
Бесплатно
Статья научная
В статье рассматривается задача навигации автономного необитаемого подводного аппарата. Изображения, получаемые бортовой стереокамерой, используются для построения облаков точек, привязанных к конкретным положениям аппарата. Квантованные дескрипторы точек хранятся в метрическом дереве для организации процедуры быстрого поиска с использованием алгоритма best bin first. Связи для нового облака точек ищутся в небольшой группе облаков, которые имеют наибольшее число похожих дескрипторов, сохранённых в дереве. Таким образом, новое облако может быть позиционировано относительно других облаков без какой-либо априорной информации о положении АНПА и точности, с которой это положение известно. Это приводит к повышению надежности системы навигации, делает систему нечувствительной к пропускам данных, однотонным участкам дна и длинным проходам без пересечений собственной траектории. В статье рассматриваются алгоритмы построения облаков точек, сопоставления этих облаков, построения групп потенциально связанных облаков для ускорения процедуры глобального поиска связей. Также предлагается основной алгоритм навигации, состоящий из трёх выполняемых параллельно подпрограмм: добавление изображений в систему, обновление дерева поиска, оптимизация. Предложенный алгоритм навигации тестируется как на реальных, так и на синтетических данных. Тесты на реальных данных показывают, что траектория может быть построена даже для последовательностей с 60 % пропущенных изображений и малым или нулевым перекрытием последовательных снимков. Тесты на синтетических данных демонстрируют, что построенная траектория близка к истинной даже для длительных миссий. Средняя скорость работы навигационной системы составляет 3 кадра в секунду на процессоре среднего ценового диапазона.
Бесплатно
Выделение контуров костей коленного сустава на медицинских рентгенограммах
Статья научная
Важным шагом в автоматическом анализе медицинских рентгенограмм является детектирование интересующих объектов. Однако медицинские рентгенограммы зачастую имеют низкую контрастность и варьирующуюся в широких пределах цветовую гамму, что затрудняет их анализ традиционными методами, которые в своей работе опираются на конкретные критерии однородности регионов. В данной работе мы предлагаем подход к выделению контуров объектов, не требующий критерия однородности. Метод основан на выделении фрагментов границ и устранении разрывов между фрагментами границы одного объекта. Нами был предложен численный критерий для определения точности соответствия полученного контура описываемому объекту. Полученные результаты могут применяться для диагностики отклонений, болезней, а также использоваться как промежуточный результат для более интеллектуальных методов анализа изображений.
Бесплатно
Выделение отличий на изображениях с помощью референтных EMD-фильтров
Статья научная
Ранее для задачи выделения отличий в случае существенного изменения как яркости, так и геометрии наблюдаемой сцены была предложена морфологическая схема анализа изображения, основанная на диффузных и референтных мозаичных фильтрах, определяемых тепловыми ядрами сходства областей разбиения кадра. В данной работе для реализации этой схемы предлагаются оригинальные референтные EMD-фильтры, основанные на определении оптимальных матриц взаимного сходства мозаичных форм методом линейного программирования. Рассмотрены теоретические аспекты проективных EMD-морфологий мозаичных изображений, приводится алгоритм морфологического выделения отличий на мозаичных изображениях на основе референтных EMD-фильтров и результаты его работы.
Бесплатно
Выделение сезонно-однородных областей на основе анализа временных серий спутниковых изображений
Статья научная
В работе рассматривается метод сегментации временных серий спутниковых изображений, позволяющий использовать разновременную информацию при формировании границ сегментов. Метод выделяет однородные объекты со схожей временной динамикой дистанционных характеристик, небольшими порциями анализируя значительные по объёму массивы разновременных входных данных, позволяя получать целостный результат сегментации на протяженные территории. Логика формирования сегментов максимально упрощена для обеспечения минимального времени работы, при этом точность проведения границ достаточна для решения задач мониторинга и распознавания быстроменяющихся типов растительного покрова, таких как сельскохозяйственная растительность. Описанный метод сегментации в настоящее время используется в автоматических алгоритмах оперативного анализа спутниковых данных, разработанных в ИКИ РАН для распознавания и оценки состояния растительности на больших территориях, в частности, озимых, яровых культур, используемых пахотных земель. Возможность установления границ сегментов в условиях наличия пропущенных значений во временных сериях данных позволяет рассчитывать и восстанавливать недостающие измерения на основе спектрально-временных связей между пикселями сегмента. Устойчивость метода к шуму в исходных данных дистанционных наблюдений может быть использована для его подавления, что показано на примере радиолокационных изображений.
Бесплатно
Статья научная
В статье рассматривается вопрос формирования требований к мультиспектральным данным дистанционного зондирования Земли при экспертизе зарастания пахотных земель древесно-кустарниковой растительностью с применением авторской технологии анализа состава растительных сообществ, основанной на суперпиксельной сегментации. Исследование производится по двум наземным контрольно-измерительным площадкам с использованием доступных данных дистанционного зондирования Земли высокого разрешения. В статье рассматривается влияние пространственного разрешения, комбинаций спектральных каналов, а также сезонов съёмки на качество оценки элементарных классов растительности, составляющих основу растительного сообщества - залежь, по мультиспектральным данным дистанционного зондирования Земли. В ходе исследований было показано, что для определения древесно-кустарниковой растительности эффективнее использовать данные дистанционного зондирования Земли, полученные в осенний период, а именно во второй половине сентября...
Бесплатно
Статья научная
В работе рассматривается проблема высоконадежной биометрической аутентификации на основе преобразователей тайных биометрических образов в длинный ключ или пароль, а также их тестирования на сравнительно малых выборках (тысячи образов). Статические образы являются открытыми, поэтому при удаленной аутентификации доверие к ним ограничено. Описан процесс вычисления биометрических параметров голосового и рукописного паролей, предложен метод автоматического формирования гибкой гибридной сети, состоящей из нейронов различного типа, и абсолютно устойчивый алгоритм ее обучения на малых выборках «Свой» (7-15 примеров). Предложен метод обученного гибридного преобразователя «биометрия-код» от извлечения знаний. Достигнуты низкие показатели FAR.
Бесплатно
Статья научная
Непрерывное совершенствование методов регистрации, обработки и хранения визуальной информации приводит к необходимости улучшения технических характеристик систем цифровой обработки изображений. В данной работе предлагаются новые высокопроизводительные архитектуры цифровых фильтров для обработки изображений по методу Винограда с вычислениями в системе остаточных классов с модулями специального вида. Для оценки производительности и аппаратных затрат предложенных архитектур проведено аппаратное моделирование с использованием программируемых логических интегральных схем в среде автоматизированного проектирования Xilinx Vivado 2018.3 для целевой платы Artix-7 xc7a200tffg1156-3. Результаты аппаратного моделирования показали, что предлагаемые архитектуры цифровых фильтров повышают производительность до 5,42 раза по сравнению с известными методами за счет увеличения аппаратных затрат. Результаты данного исследования могут быть использованы при проектировании сложных систем обработки и анализа изображений, с целью увеличения их производительности.
Бесплатно
Статья научная
В данной статье рассматривается идея совместного анализа изображений компьютерной томографии лёгких и текстовых радиологических данных для повышения качества автоматизированной диагностики эмфиземы. Сравнивается качество классификации изображений без учёта локализации патологии, упомянутой в радиологических отчётах, и с её учётом. Исследование произведено на наборах реальных изображений компьютерной томографии лёгких, полученных при клинических исследованиях в Самарском государственном медицинском университете. Установлено, что использование информации о локализации патологии, содержащейся в радиологических отчётах, приводит к повышению F-меры обнаружения эмфиземы с 0,55 до 0,73.
Бесплатно
Статья научная
Основываясь на данных наблюдения магнитных обсерваторий и вариационных станций, публикуемых на портале SuperMAG, предлагается и верифицируется подход к построению специализированной веб-ГИС на базе микросервисной архитектуры, обеспечивающей аналитический контроль возмущенной составляющей вариаций геомагнитного поля. Реализованный в рамках данной системы метод пространственной интерполяции геомагнитных данных в совокупности с предложенной схемой их ранжировки и интерпретации, а также способом визуализации в виде изолиний позволяет отслеживать структуру, наблюдать динамику, выявлять вероятные регионы, длительность и временные интервалы возникновения экстремальных геомагнитных возмущений.
Бесплатно
Статья научная
Предложена гибридная архитектура нейронной сети SegTwice для решения задачи семантической сегментации, которая сочетает в себе преимущества трансформеров и свёрточных нейронных сетей в рамках общей структуры кодер-декодер. Представлена оригинальная архитектура кодирующей сети TWICE-DA с иерархической структурой из четырех уровней. Вводятся и обосновываются новые архитектурные решения в блоках трансформера, имеющие отличие от известных аналогов. К ним относятся: модуль многомасштабного восприятия, модуль канального внимания, модуль деформируемого внимания и модуль свёрточной сети прямого распространения. Для задачи классификации изображений проведены эксперименты с целью оценки эффективности извлечения признаков TWICE-DA на разных по сложности наборах данных. Показано, что TWICE-DA демонстрирует высокое качество, превосходя большинство современных моделей по точности и вычислительной сложности. Осуществлена интеграция TWICE-DA в структуру сети семантической сегментации путём добавления легковесного MLP-декодера, что в итоге позволило реализовать заявленную архитектуру SegTwice. Эксперименты, проведённые на типовых аэрокосмических наборах данных LoveDA и Potsdam, показали, что предложенная сеть SegTwice демонстрирует конкурентоспособные показатели и не уступает в точности традиционным моделям и современным трансформерам, а в некоторых случаях превосходит их. Важно отметить, что SegTwice обучалась «с нуля», без предварительного обучения на больших наборах данных, что свидетельствует о её устойчивости к переобучению в условиях ограниченного объёма данных.
Бесплатно
Статья научная
Рассмотрены наиболее используемые на практике методы автоматизированной идентификации изменений ландшафтного покрова по данным дистанционного зондирования Земли. На их основе предложены подходы к формированию гибридных методов. Приведены результаты экспериментальных исследований методов в условиях шумов различного типа и интенсивности. По результатам экспериментов определены гибридные методы, позволяющие получать результаты лучшего качества по сравнению с известными методами при автоматизированном решении задачи идентификации изменений.
Бесплатно
Гиперспектральный in vivo анализ хромофоров нормальной кожи и визуализация онкологических патологий
Статья научная
В работе представлены результаты тестирования методов бесконтактной диагностики новообразований кожи, основанные на регистрации снимков, полученных с помощью гиперспектральной камеры с акустооптическим перестраиваемым фильтром. Для идентификации онкологических патологий предложен интегральный спектральный индекс по множеству концентрических областей вокруг источника роста новообразования исследуемой биоткани. Введенный индекс позволяет, наряду с изменением спектральных свойств ткани, косвенно учесть классические дерматоскопические параметры ABCD: асимметрию, неровность границ, цветовое разнообразие, диаметр новообразования. Приведены результаты разделимости обучающей выборки, и показана возможность применения предложенных подходов в клинической практике.
Бесплатно
Два метода адаптивной медианной фильтрации импульсного шума на изображениях
Статья научная
В статье предложены два новых метода адаптивной медианной фильтрации импульсного шума в изображениях. Первый метод основан на совместном применении итеративной обработки и преобразования результата медианной фильтрации на основе распределения Лоренца. Второй метод использует альтернативные маски медианного фильтра, рассчитанные с использованием метрики Евклида. Такой подход позволил уменьшить размер обрабатываемой области без потери качества обработки для шумов с низкой интенсивностью. В экспериментальной части статьи приведены результаты сравнения качества работы предложенных методов с известными. Для моделирования были использованы 3 различных изображения, искаженные импульсным шумом с вероятностями искажения пикселей от 1 % до 99 % включительно. Численная оценка качества очистки изображений от шума на основе пикового отношения сигнала к шуму (PSNR) и индекса структурного сходства (SSIM) показала, что предложенные методы показывают лучший результат обработки во всех рассмотренных случаях по сравнению с известными подходами. Полученные в статье результаты могут найти широкое практическое применение в обработке спутниковых и медицинских изображений, геофизических данных и других приложениях цифровой обработки изображений.
Бесплатно
Статья научная
Исследованы свойства двухканального акустооптического фильтра пространственных частот, отклоняющего оптические лучи в два симметричных порядка. Выявлено, что неоднородное распределение поля в каждом порядке дает возможность выполнять обработку изображений по двум каналам с использованием различных передаточных функций. Формирование двумерного контура в двух дифракционных порядках подтверждено экспериментально на длине волны 0,63 мкм. В качестве двухканального фильтра пространственных частот использована АО-ячейка из ТеО2, работающая на частоте звука 26 МГц.
Бесплатно
Статья научная
Работа посвящена поиску единого решения для практической задачи повышения разрешения разнородных цифровых изображений дистанционного зондирования Земли: панхроматических изображений, цветных изображений, мультиспектральных и гиперспектральных изображений, а также изображений, полученных радаром с синтезированной апертурой (РСА). Для получения такого решения из существующих наборов данных был собран агрегированный, включающий как пары изображений высокого и низкого разрешений, так и отдельные изображения, выступающие как изображения высокого разрешения. Для собранной базы данных и типовой модели искажений было проведено экспериментальное сравнение различных современных нейросетевых моделей повышения разрешения (включая преднастроенные и переобученные варианты), которые в обзорах фигурируют как state-of-the-art: сверточные, генеративно-состязательные и трансформенные (основанные на механизме внимания). Учитывая возможные ограничения моделей на число слоев космических снимков, рассматривались два варианта предварительной обработки изображений. Итоговый результат работы – единая нейросетевая модель повышения разрешения цифровых космических снимков, дополненная адаптерами для различных их типов, которая при обучении превосходит или не уступает современным специализированным state-of-the art решениям.
Бесплатно
Защита авторских прав на глубокие модели классификации изображений
Статья научная
С ростом числа задач, решаемых с помощью методов глубокого обучения, растёт потребность в защите от несанкционированного распространения такого вида интеллектуальной собственности, как предобученные модели глубоких нейронных сетей. На сегодняшний день одним из наиболее распространенных способов защиты авторских прав в цифровом пространстве является встраивание цифровых водяных знаков. При решении задачи встраивания цифровых водяных знаков важным критерием является сохранение точности прогнозов модели после процедуры внедрения защитной информации. В данной работе предлагается метод встраивания цифровых водяных знаков в модели классификации изображений, основанный на добавлении в обучающую выборку изображений, полученных путем наложения псевдоголограмм на изображения оригинального дат+асета. Псевдоголограмма - это изображение, синтезируемое на основе заданной бинарной последовательности путем расстановки импульсов, кодирующих каждый бит, в спектральной области. Согласно результатам проведенного экспериментального исследования предложенный метод позволяет сохранить качество классификации и, кроме того, сохраняет свою работоспособность независимо от архитектуры защищаемой нейронной сети. Проведённые серии атак на защищенные модели показывают, что попытки злоумышленника полностью удалить цифровые водяные знаки маловероятны без значительной потери качества прогнозов. Результаты экспериментов также включают рекомендации по выбору параметров метода, таких как размер триггерной и обучающей выборок, а также длина последовательностей, кодируемых псевдоголограммами.
Бесплатно