Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Применение ориентации градиента яркости для систем автосопровождения объектов
Статья научная
Рассматривается задача автосопровождения объекта, находящегося на сложном естественном фоне. Обнаружение объекта производится в каждом кадре видеопоследовательности путем поточечного сопоставления с эталоном. Предлагаемый метод основан на представлении каждой точки изображения ориентацией градиента яркости в локальной окрестности. В зависимости от своей ориентации окрестности разделяются на классы. Помимо классов анизотропных окрестностей, вводится класс окрестностей с изотропной структурой. Классы нумеруются, и номер класса окрестности принимается в качестве признака рассматриваемой точки. После кодировки изображение сканируется эталоном, используемая мера близости - поэлементное сравнение (компарация). В результате формируется компарационная матрица, каждый элемент которой есть число совпадений элементов эталона и текущего фрагмента изображения. Локация объекта производится по максимальному значению компарационной матрицы. Для достижения устойчивого сопровождения применяется особое правило перезаписи эталона - динамическая мера близости. Результаты тестирования показали более устойчивое сопровождение объекта по сравнению с использованием нормированной корреляционной меры.
Бесплатно
Статья научная
В работе предложены алгоритмы обнаружения нехарактерного поведения на основе главных компонент по характеристикам плотных траекторий движения. Проведено сравнение показателей точности и быстродействия с алгоритмом обнаружения по длинам векторов оптического потока. Результаты свидетельствуют о повышении быстродействия при использовании плотных траекторий и сохранении точности при обучении модели «мешка признаков» на сбалансированной выборке признаков поведения.
Бесплатно
Статья научная
Статья посвящена координатной привязке сканирующего зондового микроскопа к исследуемой поверхности. Координатная привязка имеет большое значение при исследованиях одних и тех же объектов различными зондами и в различных средах. В качестве объекта такой привязки предложено использовать реперные отметки, нанесённые на поверхность наноиндентором вдоль прямой линии через равные промежутки. Описан порядок смещения поля зрения микроскопа в процессе обнаружения реперных отметок. Представлен алгоритм их распознавания. Алгоритм основан на корреляционном анализе изображения с помощью эталонного изображения отметки с последующим выделением особых точек изображения по локальным максимумам коэффициента корреляции. При этом использовались дескриптор взаимных расстояний между парами особых точек и коэффициент Пирсона в качестве количественного критерия распознавания. Рассмотрено три варианта эталонов: окружность, круг с градиентной заливкой и круг со сплошной заливкой. Установлено, что количество особых точек может существенно превышать количество реперных отметок. Описан метод пороговой фильтрации особых точек по значениям коэффициента корреляции. Данная фильтрация подразумевает исключение особых точек, в окрестностях которых разность максимального и минимального значения коэффициента корреляции не превышает заданного порога. Представлены результаты, подтверждающие работоспособность предложенных алгоритмов. Выработаны рекомендации по выбору настроек алгоритмов распознавания и фильтрации.
Бесплатно
Статья научная
Целью работы является разработка алгоритма дифференциальной диагностики отёка сетчатки, изучение методов глубокого обучения и их применение для анализа изображений. В работе исследовано применение свёрточных нейронных сетей для задачи семантической сегментации слоёв сетчатки глаза и доказана его эффективность при выделении двух выбранных слоёв (пигментного эпителия и сетчатки). Был реализован алгоритм классификации заболеваний, основанный на интеллектуальном анализе выделенных нейронной сетью слоёв. Приведено доказательство его применимости для дифференциальной диагностики отёка сетчатки. Точность предсказания заболевания составила 90 %.
Бесплатно
Разработка алгоритма семантической сегментации аэрофотоснимков реального времени
Статья научная
Статья посвящена разработке эффективного алгоритма семантической сегментации изображений для работы в реальном времени, обладающего наилучшей точностью в своем классе. На основе сравнительного анализа методов предварительной сегментации, методов вычисления признаков по сегментам изображения, а также различных алгоритмов машинного обучения выявлены наиболее эффективные из них как по точности, так и по быстродействию. По результатам исследования построен модульный алгоритм семантической сегментации со временем выполнения, близким к реальному. Обучение и тестирование проводились на коллекции ISPRS «Vaihingen» аэрофотоснимков видимого и инфракрасного диапазонов, к которым прилагается пиксельная карта высот изображенной местности. Предложен оригинальный способ получения нормализованной матрицы высот по исходной цифровой модели рельефа.
Бесплатно
Статья научная
Стремительный рост количественных и качественных характеристик цифровых визуальных данных приводит к необходимости улучшения эксплуатационных показателей современных устройств обработки изображений. В данной работе предложены новые алгоритмы цифровой обработки двумерных изображений на основе метода Винограда в общем виде. Анализ полученных результатов показал, что использование метода Винограда сокращает вычислительную сложность обработки изображений до 84 % по сравнению с традиционным прямым методом цифровой фильтрации в зависимости от параметров фильтра и фрагментов изображения, не влияя при этом на качество обработки изображения. Составленные матрицы преобразования метода Винограда и разработанные алгоритмы могут быть использованы в системах обработки изображений для улучшения эксплуатационных характеристик современных микроэлектронных устройств, осуществляющих очистку от шума и сжатие изображений, а также распознавание образов. Перспективным направлением дальнейших исследований является аппаратная реализация разработанных алгоритмов на современных устройствах вычислительной техники, таких как программируемые пользователем вентильные матрицы и интегральные схемы специального назначения, разработка алгоритмов цифровой обработки изображений, используемой в сверточных нейронных сетях, на основе метода Винограда в общем виде для одномерных вейвлет-фильтров с децимацией и для свертки с шагом.
Бесплатно
Статья научная
Для лечения диабетической ретинопатии в современной практике применяется лазерная коагуляция. В процессе лазерной операции параметры лазерного воздействия подбираются вручную врачом, что требует от врача достаточного опыта и знаний, чтобы достичь терапевтического эффекта. На основе математического моделирования процесса лазерной коагуляции можно оценить основные параметры без проведения операции. Однако сетчатка имеет достаточно сложную структуру, и при применении даже низкозатратных численных методов для моделирования требуется значительное время для получения результата. В связи с этим разработка эффективных по времени алгоритмов трехмерного моделирования является актуальной задачей, поскольку применение таких алгоритмов позволит обеспечить проведение комплексного исследования в рамках ограниченного времени. В настоящей работе проводится исследование времени выполнения алгоритмов, реализующих различные вариации применения метода расщепления и метода конечных разностей, адаптированных под поставленную задачу теплопроводности, выявляется наиболее эффективный алгоритм, который далее подвергается векторизации и реализации с использованием технологии CUDA. Исследование проводилось с использованием Intel Core i7-10875H и Nvidia RTX 2080 MAX Q и показало, что аналог векторного алгоритма, ориентированного на решение многомерной задачи теплопроводности, обеспечивает ускорение не более, чем в 1,5 раза, по сравнению с последовательным вариантом. Разработанный векторный алгоритм, ориентированный на применение метода прогонки по всем направлениям трехмерной задачи, существенно снижает временные издержки, затрачиваемые на копирование в память видеокарты, и обеспечивает 40-кратное ускорение по сравнению с последовательным алгоритмом трехмерного моделирования. На основе такого же подхода разработан параллельный алгоритм математического моделирования, который обеспечил 20-кратное ускорение при полной загрузке процессора.
Бесплатно
Статья научная
В работе рассматривается задача определения предпочитаемых пользователем остановок в рекомендательной транспортной системе. Проведено сравнение эффективности использования различных методов машинного обучения для решения указанной задачи в системе персонализированных рекомендаций: метода опорных векторов, дерева решений, случайного леса, AdaBoost, алгоритма k-ближайших соседей, многослойного персептрона. Сравнение указанных традиционных методов машинного обучения производилось также с предложенным методом, разработанным на основе алгоритма вычисления оценок. Экспериментальные исследования использовали реальные данные мобильного приложения «Прибывалка-63», являющегося частью сервиса tosamara.ru. Подтверждена как работоспособность, так и эффективность предложенного метода.
Бесплатно
Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен
Статья научная
Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88.
Бесплатно
Статья научная
В данной работе представлена технология выделения областей интереса на изображениях ангио-ОКТ сетчатки глаза с целью количественного анализа параметров хориоидеи для выявления глазных заболеваний. Актуальность исследований заключается в том, что хориоидея является важным элементом глаза, отвечающим за питание сетчатки и обеспечение ее нормального функционирования. Нарушения в работе хориоидеи приводят к различным заболеваниям глаза, включая дегенеративные заболевания сетчатки и глаукому. Разработан метод оценки состояния хориоидеи, который основывается на нахождении участков отсутствия сосудистого сигнала на изображениях ангио-ОКТ сетчатки глаза. Предложены дополнительные признаки для оценки состояния хориоидеи. Проведён сравнительный анализ применимости предложенных признаков для классификации нормы и патологии. Полученные результаты исследований при различных параметрах в алгоритме расчета признаков показывают возможность применения разработанной технологии для построения классификатора. Результаты работы могут быть полезными для специалистов в области офтальмологии и помочь улучшить диагностику и лечение заболеваний глаза.
Бесплатно
Распознавание выражений лиц на основе адаптации классификатора видеоданных пользователя
Статья научная
В настоящей работе предложен метод распознавания выражений лиц по видео, позволяющий значительно увеличить точность при помощи адаптации модели к эмоциям конкретного пользователя, например, владельца мобильного устройства. На первом этапе нейросетевая модель, предварительно обученная распознавать выражения лиц на статических фото, применяется для извлечения визуальных признаков лиц на каждом видеокадре. Далее они агрегируются в единый дескриптор для короткого фрагмента видео, после чего обучается нейросетевой классификатор. На втором этапе предлагается выполнить адаптацию этого классификатора с использованием небольшого набора видеоданных с выражениями лиц конкретного пользователя. После принятия решения пользователь может корректировать предсказанные эмоции для дальнейшего повышения точности персональной модели. В рамках экспериментального исследования для набора данных RAVDESS показано, что подход с адаптацией модели под конкретного пользователя позволяет значительно (на 20 - 50 %) повысить точность распознавания выражений лиц по видео.
Бесплатно
Статья научная
Предложен новый метод топологического анализа данных, позволяющий получить информацию о гомотопическом типе анализируемого объекта. В отличие от наиболее хорошо разработанных и широко применяемых методов, использующих понятие персистентных гомологий, данный метод основан на анализе дифференциальных инвариантов аппроксимирующего отображения. Таким образом, в противоположность комбинаторно-топологическому подходу, используются методы дифференциальной топологии и прямая аналогия с основным результатом теории Морса. При этом аппроксимирующее графический объект гладкое отображение может быть построено с использованием общедоступного инструментария, например, нейронной сети. Доказано, в частности, что метод позволяет полностью распознать гомотопический тип объекта на плоскости: топологическая степень некоторого вспомогательного отображения и количество окружностей в гомотопически эквивалентном представлении объекта в виде букета связаны соотношением. Работа алгоритма продемонстрирована на примере символов из базы данных MNIST и их трансформаций. Рассмотрены обобщения и открытые вопросы, возникающие в случае более высоких размерностей.
Бесплатно
Распознавание залежных земель на основе сезонных значений вегетационного индекса NDVI
Статья научная
Статья посвящена исследованию возможностей дискриминантного анализа для распознавания залежных земель на основе их спектрально-отражательных характеристик. Предложена методика автоматизированного выявления залежей среди пашни, основанная на дискриминантом анализе сезонных значений вегетационного индекса NDVI. На основе экспериментальной информации, собранной с аграрных угодий Белгородской области, рассчитаны и оценены уравнения, позволяющие в автоматизированном режиме относить конкретное аграрное угодье к пашне или залежи. Точность выявления залежей составила 71 %. Установлено, что из сезонных значений вегетационного индекса, рассчитанного на основе спутниковых снимков MODIS, наибольший вклад в распознавание залежей вносят его значения конца сентября-первой половины октября. Показано, что эффективность минимальных значений NDVI угодий для автоматизированного распознавания залежей значительно выше, чем средних значений.
Бесплатно
Статья научная
В статье представлены результаты экспериментальной оценки эффективности систем технического зрения на базе КМОП-матриц с маской из поляризационных фильтров в сравнении с КМОП-матрицами с маской Байера на основе фильтров длины волны при обнаружении низкоконтрастных объектов интереса посредством алгоритмов искусственных нейронных сетей при различной освещенности сцены. Показана возможность использования искусственных нейронных сетей с трёхканальным входом, обученных на данных с дифференциацией каналов по длине волн, для анализа данных, дифференциация которых основана на поляризации волн. Показано преимущество использования данных о поляризации световых волн по сравнению с данными о длине световой волны при распознавании низкоконтрастных объектов интереса в ряде условий. В частности, использование системы поляризационного видения позволяет расширить рабочий диапазон освещенности и повысить на несколько порядков надежность обнаружения по сравнению с системой цветного видения для различных объектов интереса в исследованном диапазоне освещенности. Также мы впервые делаем общедоступным набор данных с камер машинного зрения на базе КМОП-матрицы с маской из поляризационных фильтров и КМОП-матрицы с маской Байера, полученных в синхронном режиме с одинаковыми параметрами съемки для одной и той же сцены с различной освещенностью.
Бесплатно
Статья научная
В статье представлены результаты оценки возможностей дискриминантного анализа для распознавания нарушенных лесных экосистем лесостепной зоны на основе спектрально-отражательных свойств. Предложен новый способ автоматизированного выявления участков нарушенных лесов среди покрытых лесом земель, основанный на дискриминантом анализе величины изменения коэффициентов спектральной яркости в различных зонах спектра. На основе данных с 1836 лесных участков, типичных для лесостепной зоны, вычислены и верифицированы математические зависимости, позволяющие в автоматизированном режиме относить конкретный лесной участок к категории нарушенных лесов или лесов без признаков нарушений. Точность распознавания нарушенных лесных участков составила около 90 %. Установлено, что величина изменения коэффициентов спектральной яркости в средней инфракрасной зоне вносит наибольший вклад в распознавание нарушенных лесных массивов среди величин изменения коэффициентов отражения в каналах сенсоров серии Landsat.
Бесплатно
Распознавание опасных аритмий по скалограммам ЭКГ
Статья научная
Данная работа посвящена автоматической классификации шести классов опасных аритмий по коротким фрагментам ЭКГ длительностью 2 с. Эта задача чрезвычайно важна для обнаружения опасных для жизни аритмий при непрерывном мониторном контроле. Особенно опасны фибрилляция желудочков и высокочастотная желудочковая тахикардия. Своевременное выявление этих опасных нарушений в клинике позволяет врачам эффективно применять электрическую дефибрилляцию, что спасает жизнь больного. Особенностью нашего подхода является использование уникальной техники преобразования сигналов ЭКГ в изображения (скалограммы) с использованием непрерывного вейвлет-преобразования. Для классификации аритмии использована нейронная сеть AlexNet с хорошо известной архитектурой глубокого обучения, которая обычно используется в задачах классификации изображений. В экспериментах использованы данные из базы данных PhysioNet, а также синтезированные данные ЭКГ, полученные с использованием метода SMOTE. Полученные результаты экспериментальных исследований показывают, что предлагаемый подход позволяет достичь средней точности в 98,7 % для всех классов, что превышает ранее полученные другими исследователями оценки максимальной точности в 93,18 %.
Бесплатно
Статья научная
В работе представлена технология распознавания пахотных земель по снимкам дистанционного зондирования Земли для решения задач землепользования на уровне региона РФ. Исследуется применение современных методов глубокого обучения для выделения границ пашни как по одиночным снимкам, так и по серии снимков среднего разрешения Sentinel-2. Согласно исследованиям, наилучшего качества удается достичь с использованием архитектуры UPerNet при выделении мультимасштабных признаков алгоритмом Swin Transformer v2. Рассматривается использование полученного векторного слоя пашни для решения задачи обнаружения незаконной распашки особо охраняемых природных территорий. Работа вносит значимый вклад в повышение эффективности региональных систем управления природными ресурсами, демонстрируя, как использование искусственного интеллекта и снимков дистанционного зондирования помогает автоматизировать решение задач землепользования.
Бесплатно
Распознавание растительного покрова на гиперспектральных изображениях по показателю сопряжённости
Статья научная
Исследуется алгоритм распознавания растительных культур на гиперспектральных изображениях, основанный на применении в качестве меры близости показателя сопряжённости с подпространством, образованным сигнатурами заданного класса. Цель работы - показать, что этот метод при проведении предварительной обработки данных, заключающейся во взвешивании компонент векторов признаков и разбиении классов на подклассы, обеспечивает более высокое качество распознавания по сравнению с наиболее популярным методом опорных векторов (SVM). При проведении экспериментов для сравнения с методом SVM использовалась реализация из пакета MatLab. Эта программа обеспечивает высокие результаты метода SVM на достаточно сложном тесте для распознавания близких типов растительности «Индиан Пайнс», на котором размечены 16 классов растительных культур. Тест является достаточно сложным, т.к. сигнатуры классов сильно коррелированы. Полученные результаты показывают возможность распознавания большого количества растительных культур, в т.ч. и наркосодержащих.
Бесплатно
Распознавание тест-объектов на тепловизионных изображениях
Статья научная
Представлен сравнительный анализ нескольких способов распознавания тест-объектов на тепловизионном изображении при настройке и проверке характеристик тепловизионных каналов в автоматизированном режиме. Рассмотрены способы распознавания изображений на основе корреляционного сопоставления изображений, на основе метода Виолы-Джонса, на основе классифицирующей сверточной нейронной сети LeNet, на основе классифицирующей сверточной нейронной сети GoogleNet (Inception v. 1), на основе детектирующей сверточной нейронной сети глубокого обучения типа Single Shot Multibox Detector (SSD) VGG16. Самое высокое значение функционала качества получено с использованием детектирующей сверточной нейронной сети глубокого обучения типа SSD VGG16. К основным достоинствам данного способа следует отнести инвариантность к изменению размеров тест-объектов, высокие значения таких параметров, как точность и полнота, а также отсутствие необходимости применения дополнительных методов для локализации областей интереса.
Бесплатно
Распознавание эмфиземы лёгких по данным компьютерной томографии
Статья научная
В статье рассматривается простейшая технология автоматического распознавания эмфиземы лёгких по наборам двумерных диагностических изображений компьютерной томографии. Эта технология позволяет количественно оценить заболевание, то есть вычислить долю поражения лёгочной ткани, а также визуализировать очаги эмфиземы и гистограмму распределения интенсивностей в области интереса. Эксперимент на натурных данных показал погрешность распознавания по объёму поражённых областей около 7,5 %.
Бесплатно