Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (339): Обработка изображений, распознавание образов
все рубрики
Классификация изображений оперения для определения видовой принадлежности птиц

Классификация изображений оперения для определения видовой принадлежности птиц

Белько Алина Вадимовна, Добратулин Константин Сергеевич, Кузнецов Андрей Владимирович

Статья научная

В работе исследуется возможность применения нейронных сетей для классификации изображений оперения с целью определения видовой принадлежности птиц. Таксономическая идентификация птиц по перу широко применяется в авиационной орнитологии для анализа столкновений с летательными аппаратами и разработки методов их предотвращения. В данной статье производится обучение на основе набора данных с фотографиями оперения птиц. Проводится сравнение классификаторов, обученных на четырех выборках из исходного набора данных. Предлагается метод идентификации птиц по изображениям с реальными данными на основе нейронных сетей YoloV4 и моделей группы DenseNet. Проведенная экспериментальная оценка показала, что предложенный метод позволяет определить видовую принадлежность птицы по фотографии отдельного пера с точностью до 81,03 % для точной классификации и с точностью 97,09 % для первых пяти предсказаний классификатора.

Бесплатно

Классификация интенсивности цветения водорослей на основе методов машинного обучения и гиперспектральных данных БПЛА

Классификация интенсивности цветения водорослей на основе методов машинного обучения и гиперспектральных данных БПЛА

Новиков И.А., Макаров А.Р., Подлипнов В.В., Платонов В.И., Рыськова Д.Д., Калашникова О.В., Хабибуллин Р.М., Скиданов Р.В., Илларионова С.В., Выборнова Ю.В., Никоноров А.В., Шадрин Д.Г., Подладчикова Т.В.

Статья научная

В работе представлен подход к анализу гиперспектральных изображений высокого пространственного разрешения в прикладной задаче анализа состояния речных вод. Данный метод позволяет обнаружить цветение или загрязнение воды посторонними веществами. Гиперспектральные изображения высокого разрешения были получены с помощью гиперспектрометра, установленного на малом беспилотном летательном аппарате. Продемонстрирована разница между спектрами участков реки с разной интенсивностью цветения водорослей. Были взяты пробы речной воды, проведен химический анализ, который подтвердил различное содержание магния и кальция во всех пробах, соответствующее интенсивности цветения водорослей в воде. Для классификации акваторий с различной интенсивностью цветения водорослей было рассмотрено несколько алгоритмов классификации на основе машинного обучения и вегетационных индексов. Показана эффективность использования алгоритмов машинного обучения по сравнению с вегетационными индексами. Рассмотрено и проведено сравнение нескольких подходов понижения размерности гиперспектральных данных на основании селекции спектральных каналов для повышения производительности наиболее эффективных алгоритмов классификации.

Бесплатно

Классификация космоснимков Sentinel-2 Байкальской природной территории

Классификация космоснимков Sentinel-2 Байкальской природной территории

Бычков Игорь Вячеславович, Ружников Геннадий Михайлович, Федоров Роман Константинович, Попова Анастасия Константиновна, Авраменко Юрий Владимирович

Статья научная

В работе рассматривается задача классификации мультиспектральных космоснимков Sentinel-2 при организации экологического мониторинга Байкальской природной территории. Специфика территории потребовала создания нового набора из 12 классов, который учитывает актуальные проблемы и сформирован таким образом, что площади, соответствующие этим классам, полностью покрывают исследуемую территорию. Обучающая выборка сформирована с помощью Web-интерфейса на основе космоснимков Sentinel-2 и полевых исследований. Классификация космоснимков проводилась с использованием алгоритмов RandomForest и нейронной сети ResNet50. Точность расчетов показала, что результаты классификации могут применяться для решения актуальных задач Байкальской природной территории, в частности, для анализа изменений лесного фонда, оценки влияния изменений климата на ландшафт, анализа динамики застройки, инвентаризации сельхозугодий и т.д.

Бесплатно

Классификация редких дорожных знаков

Классификация редких дорожных знаков

Фаизов Борис Владимирович, Шахуро Владислав Игоревич, Санжаров Вадим Владимирович, Конушин Антон Сергеевич

Статья научная

В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.

Бесплатно

Компаративная фильтрация изображений с использованием монотонных морфологических операторов

Компаративная фильтрация изображений с использованием монотонных морфологических операторов

Рубис Алексей Юрьевич, Лебедев Максим Алексеевич, Визильтер Юрий Валентинович, Выголов Олег Вячеславович, Желтов Сергей Юрьевич

Статья научная

В работе представлен новый класс компаративных фильтров, основанных на операциях математической морфологии Серра. Как известно, операции открытия (закрытия) Серра, в отличие от рассматривавшихся ранее проекторов Пытьева, линейных диффузных и нелинейных медианных фильтров, являются монотонно неувеличивающими (неуменьшающими) фильтрами, что определяет их иные математические и прикладные свойства. Приведены результаты экспериментального исследования предложенных компаративных фильтров с различными параметрами в задаче выделения отличий на изображениях в сравнении другими морфологическими процедурами выделения отличий.

Бесплатно

Комплексный анализ и мониторинг состояния окружающей среды на основе данных ДЗЗ

Комплексный анализ и мониторинг состояния окружающей среды на основе данных ДЗЗ

Лебедев Леонид Иванович, Ясаков Юрий Васильевич, Утешева Тамара Шатовна, Громов Владимир Петрович, Борусяк Александр Владимирович, Турлапов Вадим Евгеньевич

Статья научная

Исследуется проблема комплексного анализа и мониторинга окружающей среды на основе прежде всего данных гиперспектральных изображений и вариант ее решения с созданием необходимого алгоритмического обеспечения для обработки и хранения гиперспектральных изображений. Гиперспектральное изображение рассматривается как двумерное поле сигнатур пикселей. Предложены методы оценки сходства сигнатуры пикселя гиперспектрального изображения с эталоном, включающие в себя простые преобразования совмещения пикселя с эталоном: тождественное; масштабирование по амплитуде; смещение по y ; сочетание последних двух. Предложен метод кластеризации/распознавания с самообучением, определяющий значения параметров преобразования, обеспечивающего совмещение сигнатуры текущего пикселя с эталоном. Сходство с эталоном устанавливается по величине среднеквадратического отклонения. На этой основе предложен метод сжатия гиперспектральных изображений с контролируемыми потерями путем формирования базиса накоплением эталонов сигнатур и представления остальных сигнатур параметрами совмещения их с распознанным эталоном класса...

Бесплатно

Коррекция вращательного смаза в изображениях звёзд, наблюдаемых астроинерциальным датчиком ориентации на фоне дневного неба

Коррекция вращательного смаза в изображениях звёзд, наблюдаемых астроинерциальным датчиком ориентации на фоне дневного неба

Василюк Николай Николаевич

Статья научная

Алгоритм коррекции вращательного смаза рассматривается как этап предварительной обработки изображений в задаче измерения ориентации при помощи звёздного датчика. Для реализации предлагаемого алгоритма звёздный датчик должен быть оснащён измерителем вектора угловой скорости (трёхосным гироскопом). Алгоритм не гарантирует обнаружения изображения звезды на фоне дневного неба в одном кадре, но облегчает условия для последующего накопления последовательности кадров. Целью коррекции является локализация энергетических максимумов смазанных изображений звёзд в пикселях с заранее определёнными характеристиками. После коррекции эти пиксели получают некоторое превышение над фоном, в них улучшается отношение сигнал/шум, но теряется художественное качество цифрового изображения в целом. Определяющей характеристикой пикселя, в котором локализуется максимум, является попадание в него геометрического изображения звезды в момент начала экспозиции корректируемого кадра. Коррекция выполняется в форме обработки кадра цифровым фильтром, имеющим конечную импульсную характеристику. Импульсная характеристика фильтра неоднородна и представляет собой ядро вращательного смаза, синтезированное в каждом пикселе корректируемого кадра. Описаны алгоритмы расчёта уровней сигнала, фона и шума в изображении звезды, наблюдаемой на фоне дневного неба вращающейся камерой. Выполнен анализ зависимостей отношений сигнал/шум в различных пикселях смазанного изображения от времени экспозиции и от угловой скорости вращения камеры. Рассчитаны отношения сигнал/шум в изображении звезды до и после коррекции смаза. Приведены результаты моделирования на примере изображения яркой звезды, наглядно показывающие особенности работы предлагаемого алгоритма коррекции вращательного смаза.

Бесплатно

Линейные операторы с векторными масками в задачах цифровой обработки изображений

Линейные операторы с векторными масками в задачах цифровой обработки изображений

Новиков А.И., Пронькин А.В.

Статья научная

В работе обосновывается целесообразность применения векторных масок для решения определенного круга задач цифровой обработки изображений. Основное преимущество векторных масок по сравнению с матричными масками заключается в сокращении вычислительной сложности алгоритмов при сохранении, а в некоторых задачах и в улучшении качественных показателей. В статье демонстрируются примеры применения векторных масок в задаче оценивания уровня дискретного белого шума в составе изображения и конструирования на этой основе корректно работающего сигма-фильтра, в задаче детектирования границ для получения сглаженных оценок частных производных, в задаче обнаружения прямых в составе контурного изображения. В работе используются результаты, полученные авторами в их более ранних публикациях.

Бесплатно

Малопараметрический метод оконтуривания сельскохозяйственных полей на спутниковых снимках с помощью исторических данных MSAVI2

Малопараметрический метод оконтуривания сельскохозяйственных полей на спутниковых снимках с помощью исторических данных MSAVI2

Павлова Мария Александровна, Тимофеев Валерий Андреевич, Бочаров Дмитрий Александрович, Сидорчук Дмитрий Сергеевич, Нурмухаметов Альмир Линарович, Никоноров Артем Владимирович, Ярыкина Мария Сергеевна, Кунина Ирина Андреевна, Смагина Анна Александровна, Загарев Михаил Александрович

Статья научная

В данной работе рассматривается проблема оконтуривания сельскохозяйственных полей на спутниковых снимках. Для решения этой задачи применяется подход, основанный на анализе исторических данных. В работе показано, что на таких данных можно добиться высокого качества с помощью простого малопараметрического метода. Метод состоит из детектора полей и детектора границ. Детекция полей основана на определении порога Оцу, а для определения границ используется детектор краев Кэнни. В связи с нехваткой доступных наборов данных нами был подготовлен и опубликован собственный набор данных, состоящий из 18859 экспертно аннотированных полей на снимках Sentinel-2. Для сравнения оконтуривания на мгновенных и исторических данных был реализован один из наиболее современных методов, основанный на глубоком обучении. Эксперимент показал, что использование исторических данных позволяет получить более высокое качество с более низкими затратами. Предлагаемый малопараметрический метод требует значительно меньше обучающих данных по сравнению с методом на мгновенных данных. Подготовленный набор данных и реализация алгоритма на языке Python были выложены в открытый доступ.

Бесплатно

Маркировка элементов частично маскированных групповых объектов по локальным описаниям ассоциированного сплошного образа

Маркировка элементов частично маскированных групповых объектов по локальным описаниям ассоциированного сплошного образа

Кревецкий Александр Владимирович, Чесноков Сергей Евгеньевич

Статья научная

Исследуются вопросы распознавания изображений множеств объектов, чьи размеры соизмеримы с элементом разрешения регистрирующей аппаратуры - групп точечных объектов. Образы в виде группы точечных объектов встречаются в локационных изображениях, к ним могут быть сведены изображения крупноразмерных объектов, представленных характерными точками, кластеры данных в признаковом пространстве, события в системах массового обслуживания и автоматизированных системах управления. Осложняет распознавание групп точечных объектов несвязность их элементов, узость автокорреляционной функции их изображений по параметрам геометрических преобразований, пространственные флуктуации элементов, ложные отметки и пропуски сигнальных. Наиболее перспективные подходы к распознаванию изображений данного типа основаны на преобразовании групп точечных объектов в связный объект - ассоциированный сплошной образ - и анализе его вторичных признаков. Однако для групп точечных объектов с нестационарной конфигурацией и/или частично маскированных вопросы распознавания еще слабо исследованы...

Бесплатно

Математика и практика инвариантов цветовых пространств на примере определения баланса по серому для цифровой печатной системы

Математика и практика инвариантов цветовых пространств на примере определения баланса по серому для цифровой печатной системы

Тарасов Дмитрий Александрович, Мильдер Олег Борисович

Статья научная

В современной полиграфии большое число задач связано со взаимной трансформацией цветовых пространств. В частности, наиболее часто встречается пара аппаратно-зависимых цветовых пространств RGB и CMYK, взаимное преобразование цвета в которых неоднозначно, что создает существенные проблемы при цветовоспроизведении. Для решения этой проблемы мы предлагаем использовать инварианты цветовых пространств - градационные траектории и градационные поверхности, которые представляют собой аналоги градационных кривых для исходных колорантов и их бинарных наложений, построенные в абсолютном цветовом пространстве CIE Lab. Инварианты вводятся на основе математического аппарата дифференциальной геометрии пространственных кривых и поверхностей. Практическое применение инвариантов цветовых пространств сопряжено с определенными трудностями, связанными с их сложным аналитическим описанием, кроме того, для большинства практических задач высокая точность модели является избыточной. Для практического применения инвариантов мы предлагаем более простой подход, использующий естественную дискретизацию цвета в цифровых печатных системах. В качестве примера приводится процедура определения баланса по серому для электрофотографической печатной машины.

Бесплатно

Математические модели получения стереоизображений с двухзеркальных катадиоптрических систем с учетом дисторсии объективов

Математические модели получения стереоизображений с двухзеркальных катадиоптрических систем с учетом дисторсии объективов

Степанов Дмитрий Николаевич

Статья научная

Статья посвящена разработке и исследованию математических моделей, описывающих получение изображений с двухзеркальных катадиоптрических систем, которые позволяют создавать стереоизображения с использованием одной камеры и двух плоских зеркал. Главное отличие предложенных моделей от существующих решений в данной области - учёт дисторсии на изображениях с реальных камер. Приведён обзор основных методов создания 3D-моделей с применением оптических технологий, а также обзор типов катадиоптрических систем в зависимости от количества используемых зеркал и их формы (криволинейные или плоские). Методика проведения исследования заключается в математическом моделировании двухзеркальной катадиоптрической системы, а также в компьютерном эксперименте с использованием реальных изображений, которые были получены с помощью стереонасадки из двух плоских зеркал, и синтетических изображений, сгенерированных на основе алгоритма трассировки лучей. Приведены результаты экспериментов по калибровке камеры со стереонасадкой, а также результаты ректификации изображений с использованием калибровочных данных и разработанных математических моделей. Результаты экспериментов позволяют судить об адекватности разработанных моделей. Предложенные модели расширяют теорию компьютерного зрения и могут быть использованы в создании и исследовании систем компьютерного зрения для робототехнических комплексов.

Бесплатно

Метод автоматического совмещения разнородных цифровых изображений дистанционного зондирования Земли

Метод автоматического совмещения разнородных цифровых изображений дистанционного зондирования Земли

Борисов А.Н., Мясников В.В., Сергеев В.В.

Статья научная

В работе предлагается метод автоматического совмещения разнородных цифровых изображений дистанционного зондирования Земли с использованием данных о съемке. Метод предназначен для совмещения цветных, полутоновых, мультиспектральных и радарных изображений и их комбинаций с возможным отличием в пространственном разрешении до четырех (опционально – шестнадцати) раз. Основными этапами предлагаемого метода являются: опциональный этап повышения разрешения (до четырех раз); опциональный этап снижения числа каналов цифровых снимков до предустановленных трех или одного; этап поиска особых точек и этап их описания и совмещения. Для получения универсального и устойчивого решения на последних этапах в работе сопоставлялись лучшие известные алгоритмы: SIFT, SAR-SIFT, RIFT и обучаемый RoMa. Экспериментальные исследования с использованием указанных типов космических изображений показали однозначное преимущество обучаемой нейросетевой модели RoMa, которая и была настроена/обучена на множестве разнородных снимков. Для дополнительного повышения точности совмещения мы использовали априорные данные о снимках в виде данных их геопривязки.

Бесплатно

Метод анализа динамических изображений нефросцинтиграфии

Метод анализа динамических изображений нефросцинтиграфии

Гайдель Андрей Викторович, Капишников Александр Викторович, Пышкина Юлия Сергеевна, Колсанов Александр Владимирович, Храмов Александр Григорьевич

Статья научная

Предложен метод автоматической обработки динамических нефросцинтиграмм, основанный на приближении кривой ренограммы экспоненциальной функцией. Метод позволяет получить объективные параметры состояния почек. Работа метода изучена на наборе радионуклидных изображений ренотрансплантата. Представлены результаты клинических исследований, подтверждающие диагностическую эффективность разработанного подхода. Анализ кинетики нефротропного индикатора обеспечивает точную оценку функционального состояния пересаженной почки. Выявлено два числовых параметра, показывающих более высокую диагностическую эффективность при их вычислении по построенной модели, чем при их вычислении по исходной ренограмме.

Бесплатно

Метод баггинга и отбор признаков в построении нечётких классификаторов для распознавания рукописной подписи

Метод баггинга и отбор признаков в построении нечётких классификаторов для распознавания рукописной подписи

Сарин Константин Сергеевич, Ходашинский Илья Александрович

Статья научная

Распознавание рукописной подписи является важной проблемой в области исследований аутентификации личности и биометрической идентификации. Известны два метода распознавания рукописной подписи: если возможно оцифровать скорость движения пера, то говорят о динамическом распознавании; в противном случае, когда доступно только изображение подписи, говорят о статическом распознавании. Доказано, что при использовании динамического распознавания достигается большая точность, чем при использовании статического распознавания. В настоящей работе в качестве характеристик подписи используются амплитуды, частоты и фазы гармоник, извлечённых из сигналов подписи координат X и Y движения пера с помощью дискретного преобразования Фурье. Предварительно все сигналы подвергаются предобработке, включающей в себя устранение разрывов, устранение угла наклона, нормализацию позиции и масштабирование. В качества инструмента распознавания подписи по полученным признакам предлагается использовать нечёткий классификатор...

Бесплатно

Метод визуального анализа лица водителя для автоматического чтения речи по губам при управлении транспортным средством

Метод визуального анализа лица водителя для автоматического чтения речи по губам при управлении транспортным средством

Акснов Александр Александрович, Рюмин Дмитрий Александрович, Кашевник Алексей Михайлович, Иванько Денис Викторович, Карпов Алексей Анатольевич

Статья научная

В работе предложен метод визуального анализа и чтения речи по губам водителя при управлении транспортным средством. Автоматическое распознавание речи в акустически неблагоприятных динамических условиях является одной из актуальных задач искусственного интеллекта. Проблема эффективного автоматического чтения по губам во время дорожного движения на данный момент не решена из-за наличия различного рода помех (частые повороты головы, вибрация, динамическое освещение и т.п.). Кроме того, проблема усложняется отсутствием представительных баз данных визуальной речи. Для поиска и извлечения области интереса используется программная библиотека MediaPipe Face Mesh. Для анализа визуальной речи разработана интегральная нейросетевая архитектура (End-to-End). Визуальные признаки извлекаются из отдельного изображения с помощью свёрточной нейронной сети в связке с полносвязным слоем. Извлеченные нейросетевые признаки изображений являются входными данными для нейросети с длинной кратковременной памятью. В связи с небольшим объемом обучающих данных было предложено применять метод переноса обучения. Результаты по анализу и распознаванию визуальной речи водителя в процессе управления автомобилем представляют большие возможности для решения актуальной задачи автоматического чтения по губам. Экспериментальные исследования выполнены на собственном аудиовизуальном корпусе русской речи RUSAVIC, собранном в реальных условиях дорожного движения. Максимальная точность визуального распознавания 62 голосовых управляющих команд водителей составила 64,09 %. Полученные результаты могут быть использованы в системах аудиовизуального распознавания речи, применяемых в акустически сложной обстановке дорожного движения (высокая скорость движения, открытые окна или люк в автомобиле, одновременное проигрывание музыки, слабая шумоизоляция и т.п.).

Бесплатно

Метод визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений

Метод визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений

Захаров Алексей Александрович, Титов Дмитрий Витальевич, Жизняков Аркадий Львович, Титов Виталий Семнович

Статья научная

В статье рассматривается разработка метода визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений. Целью исследований является создание метода, позволяющего с высокой точностью обнаруживать объекты на изображениях с низким цветовым контрастом выделяемых и фоновых областей. Для вычисления области значимости изображение предварительно сегментируется на регионы. На основе регионов строится граф. Каждый регион связан со смежными регионами, а также с областями, примыкающими к смежным регионам. Регионы являются вершинами графа. Вершины графа ранжируются по признакам соответствующих областей изображения. Область значимости выделяется на основе запросов фоновых областей. К фоновым областям относятся регионы, примыкающие к краям изображения. В существующем подходе визуального внимания на основе ранжирования вершин графа использовались только цветовые признаки изображения. В предлагаемом методе для повышения точности дополнительно используются текстурные признаки и признаки формы. Для вычисления текстурных признаков используется функция энергии Габора. При анализе формы рассчитывается расстояние между центрами регионов. Результаты экспериментов представлены на тестовых изображениях. Построены кривые точности-полноты, показывающие преимущество разработанного метода.

Бесплатно

Метод выделения области макулярного отёка с использованием данных оптической когерентной томографии

Метод выделения области макулярного отёка с использованием данных оптической когерентной томографии

Ильясова Наталья Юрьевна, Демин Никита Сергеевич, Широканев Александр Сергеевич, Куприянов Александр Викторович, Замыцкий Евгений Андреевич

Статья научная

В работе предложен метод выделения области диабетического макулярного отёка на изображениях глазного дна на основе анализа данных оптической когерентной томографии. Актуальность работы обусловлена необходимостью создания систем поддержки проведения операций лазерокоагуляции для повышения её эффективности. В основе предложенного подхода лежит набор методов и алгоритмов сегментации изображений, поиска особых точек и составления их дескрипторов. Алгоритм Кэнни применяется для поиска границы между стекловидным телом и сетчаткой на изображениях оптической когерентной томографии. Метод сегментации, основанный на алгоритме Краскала построения минимального остовного дерева взвешенного связного неориентированного графа, используется для выделения области сетчатки до пигментного слоя на изображении. С использованием полученных результатов сегментации была построена карта толщины сетчатки глаза и её отклонений от нормы. В ходе проведенных исследований были подобраны оптимальные значения параметров в алгоритмах Кэнни и графовой сегментации, позволяющие достичь ошибки сегментации в размере 5 %. Были рассмотрены методы SIFT, SURF и AKAZE для наложения рассчитанных карт толщины сетчатки глаза и её отклонений от нормы на изображение глазного дна. В случаях, когда вместе с данными оптической когерентной томографии предоставлен снимок с фундус-камеры аппарата оптической когерентной томографии, с помощью метода SURF возможно точное совмещение с изображением глазного дна.

Бесплатно

Метод генерации обучающих данных для компьютерной системы обнаружения защитных масок на лицах людей

Метод генерации обучающих данных для компьютерной системы обнаружения защитных масок на лицах людей

Рюмина Елена Витальевна, Рюмин Дмитрий Александрович, Маркитантов Максим Викторович, Карпов Алексей Анатольевич

Статья научная

Мониторинг и оценка уровня безопасности отдельных граждан и общества в целом является одной из важнейших проблем современного мира, который вынужден меняться в связи с возникновением коронавируса COVID-19. Для повышения уровня безопасности общества необходимы новые информационные технологии, способные остановить распространение пандемии за счет минимизации угроз новых вспышек и мониторинга соблюдения людьми защитных мер. К таким технологиям относятся, в частности, компьютерные системы для автоматизированного отслеживания наличия защитных масок на лицах людей. Для таких систем предлагается метод генерации обучающих данных, который объединяет такие способы аугментации данных, как Mixup и Insert. Предложенный метод апробируется на двух корпусах - MAsked FAce и Real-World Masked Face Recognition Dataset, для которых достигаются значения невзвешенной средней полноты при обнаружении масок в 98,51 % и 98,50 %. Кроме того, эффективность предложенного метода апробируется на изображениях с имитацией защитных масок на лицах людей и предлагается автоматизированный способ для уменьшения ошибок I и II рода. С помощью предложенного автоматизированного способа удается сократить количество ошибок II рода с 174 до 32 для корпуса Real-World Masked Face Recognition Dataset и с 40 до 14 для изображений с нарисованными защитными масками на реальных лицах людей.

Бесплатно

Метод защиты авторских прав на глубокие нейронные сети с помощью цифровых водяных знаков

Метод защиты авторских прав на глубокие нейронные сети с помощью цифровых водяных знаков

Выборнова Юлия Дмитриевна

Статья научная

В статье предлагается новый метод защиты авторских прав на глубокие нейронные сети. Основная идея метода заключается во встраивании цифровых водяных знаков в защищаемую модель путем ее дообучения на уникальном наборе псевдоголографических изображений (псевдоголограмм). Псевдоголограмма - это двумерный синусоидальный сигнал, кодирующий двоичную последовательность произвольной длины. Изменяя фазу каждой синусоиды, можно формировать различные изображения-псевдоголограммы на основе одной битовой последовательности. Предлагаемая схема встраивания заключается в генерации обучающей выборки таким образом, чтобы псевдоголограммы, сформированные на основе одной последовательности, попадали в один и тот же класс. При этом каждому классу будут соответствовать различные битовые последовательности. Верификация цифровых водяных знаков осуществляется путем подачи на вход модели различных псевдоголограмм и проверки соответствия скрытой в них последовательности определенному классу. Экспериментальные исследования подтверждают работоспособность метода, а также соответствие всем критериям качества, выдвигаемым к методам встраивания цифровых водяных знаков в нейронные сети.

Бесплатно

Журнал