Статьи журнала - Компьютерная оптика
Все статьи: 2346
Статья научная
В статье описан метод автоматического адаптивного управления процессом формирования изображений в системах распознавания текстовых меток реального времени. Предложены критерии оценки качества видеоизображений с образами текстовых меток объектов контроля и алгоритмы управления параметрами средств формирования изображений в составе таких систем. Даны рекомендации по выбору средств формирования изображений и описаны критерии эффективности модуля управления их параметрами.
Бесплатно
Метод анализа данных сложной структуры с элементами машинного обучения
Статья научная
Предложен метод анализа данных сложной структуры, основанный на совмещении вейвлет-преобразования и нейронных сетей «Автокодировщик». Метод позволяет изучить структуру данных, выделить аномальные изменения разной формы и длительности и подавить шум. На примере данных сети станций нейтронных мониторов показана эффективность метода. Данные нейтронных мониторов определяют интенсивность вторичных космических лучей и являются одним из ключевых факторов космической погоды. Численная реализация метода позволяет применять его в оперативном режиме, что представляет интерес в задачах анализа природных данных и диагностики катастрофических событий.
Бесплатно
Метод анализа динамических изображений нефросцинтиграфии
Статья научная
Предложен метод автоматической обработки динамических нефросцинтиграмм, основанный на приближении кривой ренограммы экспоненциальной функцией. Метод позволяет получить объективные параметры состояния почек. Работа метода изучена на наборе радионуклидных изображений ренотрансплантата. Представлены результаты клинических исследований, подтверждающие диагностическую эффективность разработанного подхода. Анализ кинетики нефротропного индикатора обеспечивает точную оценку функционального состояния пересаженной почки. Выявлено два числовых параметра, показывающих более высокую диагностическую эффективность при их вычислении по построенной модели, чем при их вычислении по исходной ренограмме.
Бесплатно
Статья научная
Предложен метод автоматической обработки сцинтиграмм, позволяющий объективизировать оценку состояния паренхимы почки с помощью яркостных и геометрических характеристик сцинтиграмм при пороговой обработке. Работа метода изучается на наборе реальных радионуклидных изображений ренотрансплантата. Представлены результаты клинических исследований, подтверждающие эффективность разработанного способа. Полученные объективные числовые значения при пороговой обработке изображений с порогом от 40 % до 80 % максимальной яркости позволяют сформировать независимую оценку наличия или отсутствия очаговых изменений паренхимы почки.
Бесплатно
Статья научная
Распознавание рукописной подписи является важной проблемой в области исследований аутентификации личности и биометрической идентификации. Известны два метода распознавания рукописной подписи: если возможно оцифровать скорость движения пера, то говорят о динамическом распознавании; в противном случае, когда доступно только изображение подписи, говорят о статическом распознавании. Доказано, что при использовании динамического распознавания достигается большая точность, чем при использовании статического распознавания. В настоящей работе в качестве характеристик подписи используются амплитуды, частоты и фазы гармоник, извлечённых из сигналов подписи координат X и Y движения пера с помощью дискретного преобразования Фурье. Предварительно все сигналы подвергаются предобработке, включающей в себя устранение разрывов, устранение угла наклона, нормализацию позиции и масштабирование. В качества инструмента распознавания подписи по полученным признакам предлагается использовать нечёткий классификатор...
Бесплатно
Статья научная
В работе рассматривается задача поиска и распознавания на изображениях фрагментов, соответствующих одному из множества шаблонов. Предлагается метод быстрой корреляции по множеству тернарных шаблонов, который успешно разрешает перечисленные проблемы. Продемонстрировано его применение в двух задачах анализа изображений: поиска положения глаз на документальных фотографиях лиц и распознавания машиночитаемых строк на сканированных изображениях документов.
Бесплатно
Статья научная
В работе предложен метод визуального анализа и чтения речи по губам водителя при управлении транспортным средством. Автоматическое распознавание речи в акустически неблагоприятных динамических условиях является одной из актуальных задач искусственного интеллекта. Проблема эффективного автоматического чтения по губам во время дорожного движения на данный момент не решена из-за наличия различного рода помех (частые повороты головы, вибрация, динамическое освещение и т.п.). Кроме того, проблема усложняется отсутствием представительных баз данных визуальной речи. Для поиска и извлечения области интереса используется программная библиотека MediaPipe Face Mesh. Для анализа визуальной речи разработана интегральная нейросетевая архитектура (End-to-End). Визуальные признаки извлекаются из отдельного изображения с помощью свёрточной нейронной сети в связке с полносвязным слоем. Извлеченные нейросетевые признаки изображений являются входными данными для нейросети с длинной кратковременной памятью. В связи с небольшим объемом обучающих данных было предложено применять метод переноса обучения. Результаты по анализу и распознаванию визуальной речи водителя в процессе управления автомобилем представляют большие возможности для решения актуальной задачи автоматического чтения по губам. Экспериментальные исследования выполнены на собственном аудиовизуальном корпусе русской речи RUSAVIC, собранном в реальных условиях дорожного движения. Максимальная точность визуального распознавания 62 голосовых управляющих команд водителей составила 64,09 %. Полученные результаты могут быть использованы в системах аудиовизуального распознавания речи, применяемых в акустически сложной обстановке дорожного движения (высокая скорость движения, открытые окна или люк в автомобиле, одновременное проигрывание музыки, слабая шумоизоляция и т.п.).
Бесплатно
Метод визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений
Статья научная
В статье рассматривается разработка метода визуального внимания на основе ранжирования вершин графа по разнородным признакам изображений. Целью исследований является создание метода, позволяющего с высокой точностью обнаруживать объекты на изображениях с низким цветовым контрастом выделяемых и фоновых областей. Для вычисления области значимости изображение предварительно сегментируется на регионы. На основе регионов строится граф. Каждый регион связан со смежными регионами, а также с областями, примыкающими к смежным регионам. Регионы являются вершинами графа. Вершины графа ранжируются по признакам соответствующих областей изображения. Область значимости выделяется на основе запросов фоновых областей. К фоновым областям относятся регионы, примыкающие к краям изображения. В существующем подходе визуального внимания на основе ранжирования вершин графа использовались только цветовые признаки изображения. В предлагаемом методе для повышения точности дополнительно используются текстурные признаки и признаки формы. Для вычисления текстурных признаков используется функция энергии Габора. При анализе формы рассчитывается расстояние между центрами регионов. Результаты экспериментов представлены на тестовых изображениях. Построены кривые точности-полноты, показывающие преимущество разработанного метода.
Бесплатно
Метод встраивания информации в видео, стойкий к ошибкам потери синхронизации
Статья научная
В работе представлен новый метод стеганографического встраивания информации в цифровые видеопоследовательности. Отличительной особенностью предлагаемого метода является тот факт, что для извлечения информации не требуется временная (по номерам кадров) синхронизация исходной видеопоследовательности и видеопоследовательности со встроенной информацией, что обусловливает высокую устойчивость метода к ошибкам пропуска и замены кадров. Кроме того, данный метод обладает более высокой, по сравнению с другими методами данного класса, информационной ёмкостью. На основе предложенного метода разработана система встраивания информации в видео, использующая методы модуляции с расширением спектра. Приведены результаты экспериментальных исследований данной системы, показавшие её стойкость к атаке с приближённым вычислением ЦВЗ и к искажениям видеопоследовательности (сжатие с потерями, кадрирование и др.), а также высокую кодовую скорость в сравнении с наиболее известным методом данного класса (метод Дэйви и МакКея).
Бесплатно
Статья научная
В статье рассматриваются особенности задачи выделения быстродвижущихся объектов по изображениям, получаемым с подвижного фотоприёмного устройства. Предлагается алгоритм, основанный на вычислении межкадровой разности. Одновременно предложенный алгоритм устраняет недостаток известного метода, заключающийся в появлении инверсных изображений объекта.
Бесплатно
Метод выделения области макулярного отёка с использованием данных оптической когерентной томографии
Статья научная
В работе предложен метод выделения области диабетического макулярного отёка на изображениях глазного дна на основе анализа данных оптической когерентной томографии. Актуальность работы обусловлена необходимостью создания систем поддержки проведения операций лазерокоагуляции для повышения её эффективности. В основе предложенного подхода лежит набор методов и алгоритмов сегментации изображений, поиска особых точек и составления их дескрипторов. Алгоритм Кэнни применяется для поиска границы между стекловидным телом и сетчаткой на изображениях оптической когерентной томографии. Метод сегментации, основанный на алгоритме Краскала построения минимального остовного дерева взвешенного связного неориентированного графа, используется для выделения области сетчатки до пигментного слоя на изображении. С использованием полученных результатов сегментации была построена карта толщины сетчатки глаза и её отклонений от нормы. В ходе проведенных исследований были подобраны оптимальные значения параметров в алгоритмах Кэнни и графовой сегментации, позволяющие достичь ошибки сегментации в размере 5 %. Были рассмотрены методы SIFT, SURF и AKAZE для наложения рассчитанных карт толщины сетчатки глаза и её отклонений от нормы на изображение глазного дна. В случаях, когда вместе с данными оптической когерентной томографии предоставлен снимок с фундус-камеры аппарата оптической когерентной томографии, с помощью метода SURF возможно точное совмещение с изображением глазного дна.
Бесплатно
Метод выделения центральных линий кровеносных сосудов на диагностических изображениях
Статья научная
В работе приводится метод решения задачи выделения центральных линий кровеносных сосудов на биомедицинских диагностических изображениях, основанный на использовании методов глобальной оптимизации с использованием алгоритма поиска кратчайшего пути по графу Дийкстра. Оптимизируемый функционал формируется на основе нечеткого поля на- правлений, построенному по исходному изображению. В работе предложена технология оценивания диагностических параметров сосудов в области диска зрительного нерва основанная на методе сегментации. Рассчитываются геометрические признаки выделенных областей сосудов и области диска зрительного нерва. Проведены исследования зависимости качества работы алгоритма под воздействием различных видов шумов и искажений на синтезированных и натурных диагностических изображениях.
Бесплатно
Статья научная
Представлен метод вычисления разности двух произвольных пространственных фазовых распределений, восстановленных с цифровых голограмм. Предложенный метод применим в двухэкспозиционной цифровой голографической интерферометрии, особенно для случаев оценки возмущений между экспозициями на сильно зашумлённых или промодулированных спекл-структурой цифровых голограммах, поскольку для вычисления разности фаз не используется процедура получения абсолютных значений фазы для каждого из фазовых распределений. Вместо этого, по аналогии с классическим интерферометрическим методом двух экспозиций, на основе восстановленных распределений амплитуды и фазы рассчитывается интерференционная картина двух предметных волн, которая затем восстанавливается как цифровая голограмма тем же самым методом, который использовался для восстановления физически зарегистрированных голограмм. Преимущества предложенного метода наглядно представлены в численном эксперименте по вычислению разности фазовых распределений волновых фронтов, промодулированных спекл-структурой, и в физическом эксперименте по наблюдению динамики нагрева водного раствора фотосенсибилизатора лазерным излучением. Исследовано поведение предложенного метода в случае восстановления зашумлённых цифровых голограмм с различным уровнем шума.
Бесплатно
Статья научная
Предлагается эффективная вычислительная методика нахождения углов ориентации оптической оси жидкого кристалла, находящегося во внешнем электрическом поле, пригодная для различных граничных условий в ячейках с жидким кристаллом.
Бесплатно
Метод генерации обучающих данных для компьютерной системы обнаружения защитных масок на лицах людей
Статья научная
Мониторинг и оценка уровня безопасности отдельных граждан и общества в целом является одной из важнейших проблем современного мира, который вынужден меняться в связи с возникновением коронавируса COVID-19. Для повышения уровня безопасности общества необходимы новые информационные технологии, способные остановить распространение пандемии за счет минимизации угроз новых вспышек и мониторинга соблюдения людьми защитных мер. К таким технологиям относятся, в частности, компьютерные системы для автоматизированного отслеживания наличия защитных масок на лицах людей. Для таких систем предлагается метод генерации обучающих данных, который объединяет такие способы аугментации данных, как Mixup и Insert. Предложенный метод апробируется на двух корпусах - MAsked FAce и Real-World Masked Face Recognition Dataset, для которых достигаются значения невзвешенной средней полноты при обнаружении масок в 98,51 % и 98,50 %. Кроме того, эффективность предложенного метода апробируется на изображениях с имитацией защитных масок на лицах людей и предлагается автоматизированный способ для уменьшения ошибок I и II рода. С помощью предложенного автоматизированного способа удается сократить количество ошибок II рода с 174 до 32 для корпуса Real-World Masked Face Recognition Dataset и с 40 до 14 для изображений с нарисованными защитными масками на реальных лицах людей.
Бесплатно
Статья научная
При численном моделировании распространения излучения сквозь случайную среду для описания имитаторов турбулентности предложено использовать метод генерации случайного поля на основе разложения Карунена-Лоэва с различными типами корреляционных операторов. Свойства рассчитанных имитаторов случайной среды с Гауссовой корреляционной функцией были исследованы при моделировании распространения вихревых пучков Лагерра-Гаусса. Результаты моделирования показали, что увеличение порядка оптического вихря приводит, как и в эксперименте, к меньшей стабильности фазовой сингулярности пучков к случайным оптическим флуктуациям. Близость результатов моделирования и оптического эксперимента свидетельствует о перспективности предлагаемого подхода к синтезу имитаторов случайной среды.
Бесплатно
Метод дополнительного поля для синтеза фокусаторов
Статья научная
Предложен метод расчета фазового оптического элемента, фокусирующего в заданную область пространства и формирующего в этой области заданное распределение интенсивности. Расчет проводится в рамках дифракционного приближения и с помощью дополнительного поля. Приведены результаты численного эксперимента.
Бесплатно
Статья научная
Для случая фазовых объёмных голограмм показано влияние формфактора голограммы на её дифракционную эффективность. Понятие формфактора вводится по аналогии с классическим, используемым для вычисления усреднённого взаимодействия объектов сложной формы. Здесь понятие формфактора используется для определения усреднённой дифракционной эффективности голограмм, сформированных неравномерными по полю голограмм пучками. Показано, что эти поправки после их вычисления могут быть использованы как коэффициенты в классических формулах дифракционной эффективности. Влияние такого формфактора проявляется только при наличии одновременно двух факторов - нелинейности фотоотклика и неравномерности по полю голограммы формирующих её световых пучков. Предложен метод уменьшения влияния формфактора путём изменения по полю голограммы её видности, например, с помощью изменения степени пространственной когерентности или отношения интенсивности записывающих пучков.
Бесплатно
Метод защиты авторских прав на глубокие нейронные сети с помощью цифровых водяных знаков
Статья научная
В статье предлагается новый метод защиты авторских прав на глубокие нейронные сети. Основная идея метода заключается во встраивании цифровых водяных знаков в защищаемую модель путем ее дообучения на уникальном наборе псевдоголографических изображений (псевдоголограмм). Псевдоголограмма - это двумерный синусоидальный сигнал, кодирующий двоичную последовательность произвольной длины. Изменяя фазу каждой синусоиды, можно формировать различные изображения-псевдоголограммы на основе одной битовой последовательности. Предлагаемая схема встраивания заключается в генерации обучающей выборки таким образом, чтобы псевдоголограммы, сформированные на основе одной последовательности, попадали в один и тот же класс. При этом каждому классу будут соответствовать различные битовые последовательности. Верификация цифровых водяных знаков осуществляется путем подачи на вход модели различных псевдоголограмм и проверки соответствия скрытой в них последовательности определенному классу. Экспериментальные исследования подтверждают работоспособность метода, а также соответствие всем критериям качества, выдвигаемым к методам встраивания цифровых водяных знаков в нейронные сети.
Бесплатно
Метод защиты векторных карт с использованием изображения ЦВЗ как вторичного контейнера
Статья научная
В статье исследован метод встраивания цифрового водяного знака в векторные картографические данные на основе циклического сдвига списка вершин полигональных объектов. Предложена модификация метода, позволяющая автоматизировать процедуру аутентификации, а также повысить его стойкость к изменению содержимого карты. Основная идея улучшенного метода заключается в использовании «шумоподобного» изображения в качестве вторичного контейнера для цифрового водяного знака, представленного в форме битовой последовательности. Описан алгоритм формирования изображения-контейнера из последовательности цифровых водяных знаков, а также алгоритм извлечения такой последовательности. Проведено экспериментальное исследование информационной ёмкости изображения-контейнера и его стойкости к искажениям, моделирующим встраивание в картографические данные: квантованию и добавлению интерполяционного шума. Работоспособность метода также продемонстрирована на реальных картографических данных. Сформулированы рекомендации по рациональному выбору параметров встраивания цифрового водяного знака в зависимости от числа полигонов векторной карты.
Бесплатно