Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (287): Обработка изображений, распознавание образов
все рубрики
Разработка векторного алгоритма по технологии CUDA для трехмерного моделирования процесса лазерной коагуляции сетчатки

Разработка векторного алгоритма по технологии CUDA для трехмерного моделирования процесса лазерной коагуляции сетчатки

Широканев Александр Сергеевич, Андриянов Никита Андреевич, Ильясова Наталья Юрьевна

Статья научная

Для лечения диабетической ретинопатии в современной практике применяется лазерная коагуляция. В процессе лазерной операции параметры лазерного воздействия подбираются вручную врачом, что требует от врача достаточного опыта и знаний, чтобы достичь терапевтического эффекта. На основе математического моделирования процесса лазерной коагуляции можно оценить основные параметры без проведения операции. Однако сетчатка имеет достаточно сложную структуру, и при применении даже низкозатратных численных методов для моделирования требуется значительное время для получения результата. В связи с этим разработка эффективных по времени алгоритмов трехмерного моделирования является актуальной задачей, поскольку применение таких алгоритмов позволит обеспечить проведение комплексного исследования в рамках ограниченного времени. В настоящей работе проводится исследование времени выполнения алгоритмов, реализующих различные вариации применения метода расщепления и метода конечных разностей, адаптированных под поставленную задачу теплопроводности, выявляется наиболее эффективный алгоритм, который далее подвергается векторизации и реализации с использованием технологии CUDA. Исследование проводилось с использованием Intel Core i7-10875H и Nvidia RTX 2080 MAX Q и показало, что аналог векторного алгоритма, ориентированного на решение многомерной задачи теплопроводности, обеспечивает ускорение не более, чем в 1,5 раза, по сравнению с последовательным вариантом. Разработанный векторный алгоритм, ориентированный на применение метода прогонки по всем направлениям трехмерной задачи, существенно снижает временные издержки, затрачиваемые на копирование в память видеокарты, и обеспечивает 40-кратное ускорение по сравнению с последовательным алгоритмом трехмерного моделирования. На основе такого же подхода разработан параллельный алгоритм математического моделирования, который обеспечил 20-кратное ускорение при полной загрузке процессора.

Бесплатно

Разработка и исследование алгоритмов определения предпочитаемых пользователем остановок общественного транспорта в геоинформационной системе на основе методов машинного обучения

Разработка и исследование алгоритмов определения предпочитаемых пользователем остановок общественного транспорта в геоинформационной системе на основе методов машинного обучения

Бородинов Александр Александрович

Статья научная

В работе рассматривается задача определения предпочитаемых пользователем остановок в рекомендательной транспортной системе. Проведено сравнение эффективности использования различных методов машинного обучения для решения указанной задачи в системе персонализированных рекомендаций: метода опорных векторов, дерева решений, случайного леса, AdaBoost, алгоритма k-ближайших соседей, многослойного персептрона. Сравнение указанных традиционных методов машинного обучения производилось также с предложенным методом, разработанным на основе алгоритма вычисления оценок. Экспериментальные исследования использовали реальные данные мобильного приложения «Прибывалка-63», являющегося частью сервиса tosamara.ru. Подтверждена как работоспособность, так и эффективность предложенного метода.

Бесплатно

Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

Лобанова Виктория Александровна, Иванова Юлия Александровна

Статья научная

Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88.

Бесплатно

Распознавание выражений лиц на основе адаптации классификатора видеоданных пользователя

Распознавание выражений лиц на основе адаптации классификатора видеоданных пользователя

Чураев Е.Н., Савченко А.В.

Статья научная

В настоящей работе предложен метод распознавания выражений лиц по видео, позволяющий значительно увеличить точность при помощи адаптации модели к эмоциям конкретного пользователя, например, владельца мобильного устройства. На первом этапе нейросетевая модель, предварительно обученная распознавать выражения лиц на статических фото, применяется для извлечения визуальных признаков лиц на каждом видеокадре. Далее они агрегируются в единый дескриптор для короткого фрагмента видео, после чего обучается нейросетевой классификатор. На втором этапе предлагается выполнить адаптацию этого классификатора с использованием небольшого набора видеоданных с выражениями лиц конкретного пользователя. После принятия решения пользователь может корректировать предсказанные эмоции для дальнейшего повышения точности персональной модели. В рамках экспериментального исследования для набора данных RAVDESS показано, что подход с адаптацией модели под конкретного пользователя позволяет значительно (на 20 - 50 %) повысить точность распознавания выражений лиц по видео.

Бесплатно

Распознавание гомотопического типа объекта с помощью дифференциально-топологических инвариантов аппроксимирующего отображения

Распознавание гомотопического типа объекта с помощью дифференциально-топологических инвариантов аппроксимирующего отображения

Курочкин Сергей Владимирович

Статья научная

Предложен новый метод топологического анализа данных, позволяющий получить информацию о гомотопическом типе анализируемого объекта. В отличие от наиболее хорошо разработанных и широко применяемых методов, использующих понятие персистентных гомологий, данный метод основан на анализе дифференциальных инвариантов аппроксимирующего отображения. Таким образом, в противоположность комбинаторно-топологическому подходу, используются методы дифференциальной топологии и прямая аналогия с основным результатом теории Морса. При этом аппроксимирующее графический объект гладкое отображение может быть построено с использованием общедоступного инструментария, например, нейронной сети. Доказано, в частности, что метод позволяет полностью распознать гомотопический тип объекта на плоскости: топологическая степень некоторого вспомогательного отображения и количество окружностей в гомотопически эквивалентном представлении объекта в виде букета связаны соотношением. Работа алгоритма продемонстрирована на примере символов из базы данных MNIST и их трансформаций. Рассмотрены обобщения и открытые вопросы, возникающие в случае более высоких размерностей.

Бесплатно

Распознавание залежных земель на основе сезонных значений вегетационного индекса NDVI

Распознавание залежных земель на основе сезонных значений вегетационного индекса NDVI

Терехин Эдгар Аркадьевич

Статья научная

Статья посвящена исследованию возможностей дискриминантного анализа для распознавания залежных земель на основе их спектрально-отражательных характеристик. Предложена методика автоматизированного выявления залежей среди пашни, основанная на дискриминантом анализе сезонных значений вегетационного индекса NDVI. На основе экспериментальной информации, собранной с аграрных угодий Белгородской области, рассчитаны и оценены уравнения, позволяющие в автоматизированном режиме относить конкретное аграрное угодье к пашне или залежи. Точность выявления залежей составила 71 %. Установлено, что из сезонных значений вегетационного индекса, рассчитанного на основе спутниковых снимков MODIS, наибольший вклад в распознавание залежей вносят его значения конца сентября-первой половины октября. Показано, что эффективность минимальных значений NDVI угодий для автоматизированного распознавания залежей значительно выше, чем средних значений.

Бесплатно

Распознавание нарушенных лесных экосистем лесостепи на основе спектрально-отражательных характеристик

Распознавание нарушенных лесных экосистем лесостепи на основе спектрально-отражательных характеристик

Терехин Эдгар Аркадьевич

Статья научная

В статье представлены результаты оценки возможностей дискриминантного анализа для распознавания нарушенных лесных экосистем лесостепной зоны на основе спектрально-отражательных свойств. Предложен новый способ автоматизированного выявления участков нарушенных лесов среди покрытых лесом земель, основанный на дискриминантом анализе величины изменения коэффициентов спектральной яркости в различных зонах спектра. На основе данных с 1836 лесных участков, типичных для лесостепной зоны, вычислены и верифицированы математические зависимости, позволяющие в автоматизированном режиме относить конкретный лесной участок к категории нарушенных лесов или лесов без признаков нарушений. Точность распознавания нарушенных лесных участков составила около 90 %. Установлено, что величина изменения коэффициентов спектральной яркости в средней инфракрасной зоне вносит наибольший вклад в распознавание нарушенных лесных массивов среди величин изменения коэффициентов отражения в каналах сенсоров серии Landsat.

Бесплатно

Распознавание опасных аритмий по скалограммам ЭКГ

Распознавание опасных аритмий по скалограммам ЭКГ

Немирко А.П., Ба Махел А.С., Манило Л.А.

Статья научная

Данная работа посвящена автоматической классификации шести классов опасных аритмий по коротким фрагментам ЭКГ длительностью 2 с. Эта задача чрезвычайно важна для обнаружения опасных для жизни аритмий при непрерывном мониторном контроле. Особенно опасны фибрилляция желудочков и высокочастотная желудочковая тахикардия. Своевременное выявление этих опасных нарушений в клинике позволяет врачам эффективно применять электрическую дефибрилляцию, что спасает жизнь больного. Особенностью нашего подхода является использование уникальной техники преобразования сигналов ЭКГ в изображения (скалограммы) с использованием непрерывного вейвлет-преобразования. Для классификации аритмии использована нейронная сеть AlexNet с хорошо известной архитектурой глубокого обучения, которая обычно используется в задачах классификации изображений. В экспериментах использованы данные из базы данных PhysioNet, а также синтезированные данные ЭКГ, полученные с использованием метода SMOTE. Полученные результаты экспериментальных исследований показывают, что предлагаемый подход позволяет достичь средней точности в 98,7 % для всех классов, что превышает ранее полученные другими исследователями оценки максимальной точности в 93,18 %.

Бесплатно

Распознавание растительного покрова на гиперспектральных изображениях по показателю сопряжённости

Распознавание растительного покрова на гиперспектральных изображениях по показателю сопряжённости

Бибиков Сергей Алексеевич, Казанский Николай Львович, Фурсов Владимир Алексеевич

Статья научная

Исследуется алгоритм распознавания растительных культур на гиперспектральных изображениях, основанный на применении в качестве меры близости показателя сопряжённости с подпространством, образованным сигнатурами заданного класса. Цель работы - показать, что этот метод при проведении предварительной обработки данных, заключающейся во взвешивании компонент векторов признаков и разбиении классов на подклассы, обеспечивает более высокое качество распознавания по сравнению с наиболее популярным методом опорных векторов (SVM). При проведении экспериментов для сравнения с методом SVM использовалась реализация из пакета MatLab. Эта программа обеспечивает высокие результаты метода SVM на достаточно сложном тесте для распознавания близких типов растительности «Индиан Пайнс», на котором размечены 16 классов растительных культур. Тест является достаточно сложным, т.к. сигнатуры классов сильно коррелированы. Полученные результаты показывают возможность распознавания большого количества растительных культур, в т.ч. и наркосодержащих.

Бесплатно

Распознавание тест-объектов на тепловизионных изображениях

Распознавание тест-объектов на тепловизионных изображениях

Мингалев Александр Владимирович, Белов Андрей Вячеславович, Габдуллин Ильдар Масхутович, Агафонова Регина Ренатовна, Шушарин Сергей Николаевич

Статья научная

Представлен сравнительный анализ нескольких способов распознавания тест-объектов на тепловизионном изображении при настройке и проверке характеристик тепловизионных каналов в автоматизированном режиме. Рассмотрены способы распознавания изображений на основе корреляционного сопоставления изображений, на основе метода Виолы-Джонса, на основе классифицирующей сверточной нейронной сети LeNet, на основе классифицирующей сверточной нейронной сети GoogleNet (Inception v. 1), на основе детектирующей сверточной нейронной сети глубокого обучения типа Single Shot Multibox Detector (SSD) VGG16. Самое высокое значение функционала качества получено с использованием детектирующей сверточной нейронной сети глубокого обучения типа SSD VGG16. К основным достоинствам данного способа следует отнести инвариантность к изменению размеров тест-объектов, высокие значения таких параметров, как точность и полнота, а также отсутствие необходимости применения дополнительных методов для локализации областей интереса.

Бесплатно

Распознавание эмфиземы лёгких по данным компьютерной томографии

Распознавание эмфиземы лёгких по данным компьютерной томографии

Смелкина Наталья Алексеевна, Колсанов Александр Владимирович, Чаплыгин Сергей Сергеевич, Зельтер Павел Михайлович, Храмов Александр Григорьевич

Статья научная

В статье рассматривается простейшая технология автоматического распознавания эмфиземы лёгких по наборам двумерных диагностических изображений компьютерной томографии. Эта технология позволяет количественно оценить заболевание, то есть вычислить долю поражения лёгочной ткани, а также визуализировать очаги эмфиземы и гистограмму распределения интенсивностей в области интереса. Эксперимент на натурных данных показал погрешность распознавания по объёму поражённых областей около 7,5 %.

Бесплатно

Реверсивный стеганографический метод сокрытия информации, основанный на интерполяции изображений

Реверсивный стеганографический метод сокрытия информации, основанный на интерполяции изображений

Нагиева Абабил Фахраддин Гызы, Вердиев Сакит Гамбай Оглы

Статья научная

Обмен информацией посредством открытых компьютерных и коммуникационных сетей подвержен вероятному перехвату передаваемой информации третьей стороной. Для предотвращения этого разработаны и применяются различные методы защиты информации. В настоящей работе поставлена и решена задача разработки нового стенографического реверсивного метода сокрытия информации, основанного на интерполяции изображения. Разработанный алгоритм обладает более высоким объёмом внедряемой секретной информации при одновременном сохранении высокого визуального качества изображения со встроенной информацией. Результаты экспериментальных исследований, приведённые в статье, подтверждают вышесказанное.

Бесплатно

Реконструкция анатомических структур на основе статистической модели формы

Реконструкция анатомических структур на основе статистической модели формы

Смелкина Наталья Алексеевна, Косарев Руслан Николаевич, Никоноров Артем Владимирович, Байриков Иван Михайлович, Рябов Константин Николаевич, Авдеев Евгений Владимирович, Казанский Николай Львович

Статья научная

В статье представлен метод статистического моделирования формы, примененный для реконструкции анатомических структур с деформациями. Данный метод является перспективным для моделирования деформированных объектов, имеющих некоторую анатомическую форму. Метод статистического моделирования формы позволяет восстановить деформированный объект на основе информации об его анатомической форме и недеформированной части формы экземпляра, при этом учитывая особенности данного экземпляра и его вариативность относительно средней формы.

Бесплатно

Реконструкция изображений в дифракционно-оптических системах на основе сверточных нейронных сетей и обратной свертки

Реконструкция изображений в дифракционно-оптических системах на основе сверточных нейронных сетей и обратной свертки

Никоноров Артем Владимирович, Петров Максим Витальевич, Бибиков Сергей Алексеевич, Кутикова Виктория Витальевна, Морозов Андрей Андреевич, Казанский Николай Львович

Статья научная

В последнее время появились прорывные работы, посвященные изображающим оптическим системам на основе однокомпонентных дифракционных структур, таких как зонные пластинки и линзы Френеля. Такие системы на порядки превосходят классические рефракционные аналоги по весу и стоимости, существенно уступая в качестве получаемых изображений вследствие сильных оптических искажений, присущих дифракционной оптике. В настоящей работе показано, что применение гармонических линз совместно с последующей вычислительной реконструкцией изображений позволяет существенно повысить качество получаемых изображений. Предлагаемый процесс реконструкции состоит из предварительного этапа цветовой коррекции зарегистрированного изображения и устранения хроматического размытия на основе обратной свертки и сверточных нейронных сетей. Подобное совершенствование технологии изготовления дифракционных объективов и алгоритмов реконструкции способствует появлению нового класса сверхлегких изображающих систем широкого спектра применения, от дистанционного зондирования для нано- и пикоспутников до систем видеонаблюдения и устройств для экстремальной журналистики.

Бесплатно

Реконструкция функций и цифровых изображений по их знаковым представлениям

Реконструкция функций и цифровых изображений по их знаковым представлениям

Мясников Владислав Валерьевич

Статья научная

В работе рассматриваются вопросы реконструкции неявно заданных функций или цифровых изображений. Функции задаются с использованием наблюдений, каждое из которых представляет собой результат парного сравнения значений функции для двух случайных аргументов. Представлен анализ современного состояния исследований для частных постановок указанной проблемы: метода парных сравнений, используемого при принятии решений в случае конечного множества альтернатив; реконструкции предпочтений пользователей в многокритериальных задачах анализа; знаковых представлений изображений, используемых в качестве аппарата описания и анализа цифровых изображений. Предлагается унифицированный подход к реконструкции функций и изображений по их знаковым представлениям, основанный на переходе в пространство высокой размерности и построения линейного (для случая реконструкции функции и изображений) или нелинейного (в т.ч. непараметрического) классификатора (для реконструкции предпочтений). Для ряда алгоритмов классификации проведены экспериментальные исследования по оценке эффективности предложенного подхода на примере задачи реконструкции функции полезности в теории принятия решений и реконструкции функции яркости реальных изображений.

Бесплатно

Ретуширование данных дистанционного зондирования с использованием алгоритмов доопределения изображений в задаче генерирования подделок

Ретуширование данных дистанционного зондирования с использованием алгоритмов доопределения изображений в задаче генерирования подделок

Кузнецов Андрей Владимирович, Гашников Михаил Валерьевич

Статья научная

Исследуются алгоритмы ретуширования изображений при генерировании поддельных данных дистанционного зондирования Земли. Приводится обзор существующих нейросетевых решений в области генерирования и доопределения изображений дистанционного зондирования. Для ретуширования данных дистанционного зондирования Земли применяются алгоритмы доопределения изображений на основе свёрточных нейронных сетей и генеративно-состязательных нейронных сетей. Особое внимание уделяется генеративной нейросети с обособленным блоком предсказания контуров, включающей две последовательно соединённые генеративно-состязательные подсети. Первая подсеть доопределяет контуры изображения внутри ретушируемой области. Вторая подсеть использует доопределённые контуры для генерирования результирующей ретуширующей области. В качестве базы для сравнения используется прецедентный алгоритм доопределения изображений. Проводятся вычислительные эксперименты по исследованию эффективности указанных алгоритмов при ретушировании реальных данных дистанционного зондирования различных видов. Выполняется сравнительный анализ качества работы рассматриваемых алгоритмов в зависимости от типа, формы и размеров ретушируемых объектов и областей. Приводятся качественные и количественные характеристики эффективности работы исследуемых алгоритмов доопределения изображений при ретушировании данных дистанционного зондирования Земли. Экспериментально обосновывается преимущество генеративно-состязательных нейронных сетей при создании поддельных данных дистанционного зондирования.

Бесплатно

Ретуширование и восстановление отсутствующих частей изображений с помощью итерационного вычисления их спектров

Ретуширование и восстановление отсутствующих частей изображений с помощью итерационного вычисления их спектров

Кокошкин Александр Владимирович, Коротков Вадим Андреевич, Коротков Кирилл Вадимович, Новичихин Евгений Павлович

Статья научная

В представленной работе проводится сравнительный анализ нескольких методов, используемых в задачах заполнения лакун на изображениях: интерполяция кубическим сплайном, нейронная сеть и метод интерполяции последовательно вычисляемого спектра Фурье. Методы тестируются на глобальной карте поля интегрального паросодержания атмосферы. Показано, что предлагаемый нами метод интерполяции последовательно вычисляемого спектра Фурье является вполне конкурентоспособным по сравнению с альтернативными методами, особенно в случаях отсутствия априорной информации о характере потерянных данных. Предлагаемый нами метод цифровой виртуальной реконструкции изображений использует в качестве исходных все данные, которые есть в наличии. Представленные результаты свидетельствуют о существенном повышении качества цифровых изображений при использовании метода интерполяции последовательно вычисляемого спектра Фурье.

Бесплатно

Сегментация дефектов дорожного покрытия на основе формирования синтетических выборок с помощью глубоких генеративно-состязательных сверточных сетей

Сегментация дефектов дорожного покрытия на основе формирования синтетических выборок с помощью глубоких генеративно-состязательных сверточных сетей

Канаева Ирина Александровна, Иванова Юлия Александровна, Спицын Владимир Григорьевич

Статья научная

В данной работе рассматривается комплекс задач обнаружения различных дефектов дорожного полотна автомобильных дорог и современные методы их решения. Представленное сравнение общедоступных наборов данных позволяет сделать вывод о сложности и малой разработанности задачи сегментации дефектов дорожного покрытия по изображению общего вида автомобильных дорог. Для решения данной проблемы разработаны алгоритмы генерации синтетического набора данных для сегментации дефектов классов трещин и выбоин на основе методов компьютерной графики и генеративно-состязательных сетей. Проведено сравнение точности сегментации дефектов дорожного покрытия полносверточной нейронной сетью U-Net на реальном и комбинированных наборах данных.

Бесплатно

Семантическая сегментация ржавчин и пятнистостей пшеницы

Семантическая сегментация ржавчин и пятнистостей пшеницы

Ариничев Игорь Владимирович, Полянских Сергей Валерьевич, Ариничева Ирина Владимировна

Статья научная

В статье исследуется возможность семантической сегментации классификации желтой ржавчины и пятнистости пшеницы с помощью сверточной нейросетевой архитектуры U-Net. На основе собственного набора данных, включающего 268 изображений, собранной в естественных условиях и условиях инфекционных питомников ФНЦ БЗР, показано, что архитектура U-Net c декодерами ResNet способна качественно обнаруживать, классифицировать и локализовывать ржавчины и пятнистости даже в тех случаях, когда болезни присутствуют на растении одновременно. Для отдельных классов болезней основные метрики (accuracy, micro-/macro precision, recall и F1) колеблются в пределах от 0,92 до 0,96. Это указывает на возможность распознавания даже нескольких болезней на листе с точностью, не уступающей эксперту-фитопатологу. Метрики сегментации IoU и Dice составили соответственно 0,71 и 0,88, что говорит о достаточно высоком качестве попиксельной сегментации и подтверждается при визуальном анализе. Использованная при этом архитектура нейронной сети достаточно легковесна, что делает возможным ее использование на мобильных устройствах без подключения к сети.

Бесплатно

Семантическая сегментация спутниковых снимков аэропортов с помощью свёрточных нейронных сетей

Семантическая сегментация спутниковых снимков аэропортов с помощью свёрточных нейронных сетей

Горбачв Вадим Александрович, Криворотов Иван Андреевич, Маркелов Александр Олегович, Котлярова Екатерина Владимировна

Статья научная

Статья посвящена разработке эффективного алгоритма семантической сегментации для разметки элементов аэропортовой инфраструктуры на космических снимках оптического диапазона. В данной работе применены алгоритмы сегментации на основе глубоких свёрточных нейронных сетей. Они зарекомендовали себя в широком ряде задач, в том числе сегментации изображений наземной съёмки, где они показывают стабильно высокие результаты. В ходе работы были вручную размечены обучающие и тестовые изображения. Был произведён поиск оптимальной для данной задачи архитектуры нейронной сети. Исследованы различные комбинации энкодеров и декодеров. Для постобработки и учёта контекстной информации и соседства объектов различных классов с целью устранения выбросов применена модель условных случайных полей. Описаны особенности применённых решений на всех этапах подготовки алгоритма: подготовка данных, обучение нейронной сети и постобработка её результатов.

Бесплатно

Журнал