Обработка изображений, распознавание образов. Рубрика в журнале - Компьютерная оптика
Статья научная
This work considers the problem of quality assessment of multichannel image visualization methods. One approach to such an assessment, the Escore quality measure, is studied. This measure, initially proposed for decolorization methods evaluation, can be generalized for the assessment of hyperspectral image visualization methods. It is shown that Escore does not account for the loss of local contrast at the supra-pixel scale. The sensitivity to the latter in humans depends on the observation conditions, so we propose a modified wEscore measure which includes the parameters allowing for the adjustment of the local contrast scale based on the angular resolution of the images. We also describe the adjustment of wEscore parameters for the evaluation of known decolorization algorithms applied to the images from the COLOR250 and the Cadik datasets with given observational conditions. When ranking the results of these algorithms and comparing it to the ranking based on human perception, wEscore turned out to be more accurate than Escore.
Бесплатно
X-ray tomography: the way from layer-by-layer radiography to computed tomography
Статья научная
The methods of X-ray computed tomography allow us to study the internal morphological structure of objects in a non-destructive way. The evolution of these methods is similar in many respects to the evolution of photography, where complex optics were replaced by mobile phone cameras, and the computers built into the phone took over the functions of high-quality image generation. X-ray tomography originated as a method of hardware non-invasive imaging of a certain internal cross-section of the human body. Today, thanks to the advanced reconstruction algorithms, a method makes it possible to reconstruct a digital 3D image of an object with a submicron resolution. In this article, we will analyze the tasks that the software part of the tomographic complex has to solve in addition to managing the process of data collection. The issues that are still considered open are also discussed. The relationship between the spatial resolution of the method, sensitivity and the radiation load is reviewed. An innovative approach to the organization of tomographic imaging, called “reconstruction with monitoring”, is described. This approach makes it possible to reduce the radiation load on the object by at least 2 - 3 times. In this work, we show that when X-ray computed tomography moves towards increasing the spatial resolution and reducing the radiation load, the software part of the method becomes increasingly important.
Бесплатно
Статья научная
Данная статья посвящена применению свёрточных глубоких сетей доверия в качестве средства извлечения речевых признаков из аудиозаписей для решения задачи автоматической, текстонезависимой верификации диктора. В работе описаны область применения и проблемы систем автоматической верификации диктора. Рассмотрены типы современных систем верификации диктора, основные типы речевых признаков, используемых в системах верификации диктора. Описана структура свёрточных глубоких сетей доверия, алгоритм обучения данной сети. Предложено применение речевых признаков, извлекаемых из трёх слоёв обученной свёрточной глубокой сети доверия. Данный подход основан на применении методов анализа изображений как к уже выделенным признакам речевого сигнала, так и для их выделения из слоёв нейронной сети. Произведены экспериментальные исследования предложенных признаков на двух речевых корпусах: собственном речевом корпусе, включающем аудиозаписи 50 дикторов, и речевом корпусе TIMIT, включающем аудиозаписи 630 дикторов. Была произведена оценка точности предложенных признаков с применением классификаторов различного типа. Непосредственное применение данных признаков не дало увеличения точности по сравнению с использованием традиционных речевых признаков, таких как мел-кепстральные коэффициенты. Однако применение данных признаков в составе ансамбля классификаторов позволило достичь уменьшения равной ошибки 1-го и 2-го рода до 0,21 % на собственном речевом корпусе и до 0,23 % на речевом корпусе TIMIT.
Бесплатно
Автоматическая сегментация изображений процесса интрацитоплазматической инъекции сперматозоида
Статья научная
Данная работа посвящена решению методами глубокого обучения задачи мультиклассовой семантической сегментации изображений процесса интрацитоплазматической инъекции сперматозоида. В качестве входных данных использованы видеопоследовательности, на которых изображена вышеназванная процедура интрацитоплазматической инъекции сперматозоида. Для обучения нейросети выполнена ручная разметка 656 кадров, в результате которой каждый пиксель изображения был отнесен к одному из 4 классов: микроинъектор, микропипетка, яйцеклетка, фон. Проведен анализ современных методов решения, и экспериментальным путем выбраны наилучшие архитектура, кодировщики и гиперпараметры нейронной сети: сверточная нейронная сеть FPN (feature pyramid network) с кодировщиком resnext101, имеющим глубину 101 слой с 32 параллельными разделяемыми свертками. Построенная нейросетевая модель позволила получить эффективность сегментации IOU = 0,96 при скорости работы алгоритма 15 кадров в секунду.
Бесплатно
Статья научная
В настоящей работе описан разработанный метод автоматической субпиксельной географической привязки изображений, получаемых прибором КМСС-М с пространственным разрешением 60 метров, основанный на использовании восстановленного безоблачного и ежедневно актуализируемого эталонного изображения коэффициентов спектральной яркости низкого пространственного разрешения MODIS. Описываемый метод основан на максимизации значения корреляции Пирсона при поиске оптимального локального смещения участка корректируемого изображения путём сравнения с эталонным низкодетальным изображением. Для оценки эффективности метода при использовании на неоднородных территориях континентального охвата были проведены три эксперимента, позволяющие получить численные оценки ошибок привязки: эксперимент с использованием модельных наборов данных, эксперимент по оценке абсолютной ошибки привязки эталонных изображений MODIS и эксперимент по оценке ошибки привязки автоматически скорректированных данных КМСС-М. Экспериментальная оценка метода на основе модельных данных декаметрового разрешения Sentinel-2 (MSI) продемонстрировала его высокую устойчивость при работе в широком диапазоне физико-географических условий и сезона наблюдений. Средняя ошибка географической привязки эталона низкого пространственного разрешения MODIS, полученная во втором эксперименте для территории зернового пояса РФ за 2020 год наблюдений, оказалась менее 20 метров как в красном, так и в ближнем ИК-каналах. Результаты автоматической коррекции изображений КМСС-М на указанную территорию и год наблюдений, полученные в третьем эксперименте с помощью описанного метода, продемонстрировали в среднем субпиксельную точность привязки скорректированных изображений в красном и ближнем ИК-каналах, в то время как средняя абсолютная ошибка привязки исходных изображений КМСС-М составила 3 километра. Достигнутая в работе точность привязки скорректированных по данным низкого пространственного разрешения изображений КМСС-М обеспечивает возможность построения и анализа временных серий мультиспектральных измерений спектральной яркости земной поверхности для решения широкого спектра научных и практических задач дистанционного мониторинга растительного покрова. Технологическая гибкость разработанного метода обеспечивает его применимость к данным и других спутниковых систем для оптического дистанционного зондирования Земли.
Бесплатно
Автоматическое совмещение изображений оптической когерентной томографии и снимков глазного дна
Статья научная
Данная работа посвящена совмещению мультимодальных многомерных изображений: трехмерных данных оптической когерентной томографии и двумерных цветных изображений глазного дна. Регистрация этих двух модальностей может помочь корректировать положение полученных оптической когерентной томографией изображений на сетчатке. Некоторые существующие подходы совмещения глазного дна основаны на поиске ключевых точек, которые считаются инвариантными для аффинных преобразований и являются общими для двух изображений. Однако ошибки в определении таких точек могут привести к ошибкам регистрации. Также существуют методы итеративной настройки параметров преобразования, но они основаны на некоторых ручных настройках. В данной работе предложен метод, основанный на полном или частичном переборе возможных комбинаций преобразования изображения оптической когерентной томографии для поиска наилучшего приближения истинного преобразования. Наилучшее приближение определяется мерой сравнения пикселей предварительно обработанных изображений. Далее полученные преобразования сравниваются с имеющимися истинными преобразованиями для оценки качества алгоритма. Оценка преобразования с помощью алгоритма полного перебора показала лучшие результаты в сравнении с алгоритмом, основанным на поиске ключевых точек как минимум на порядок. Структура работы включает в себя предварительную обработку оптической когерентной томографии и изображений глазного дна с выделением кровеносных сосудов, случайный перебор или перебор по сетке возможных параметров преобразования (сдвиг, поворот и масштабирование), оценку качества алгоритма.
Бесплатно
Адаптивная интерполяция многомерных сигналов при дифференциальной компрессии
Статья научная
Исследуются алгоритмы интерполяции многомерных сигналов при дифференциальной компрессии. Предлагается подход к построению адаптивных интерполяторов, основанный на автоматическом выборе интерполирующей функции в каждой точке сигнала на основе признаков, вычисляемых по локальной окрестности. В рамках этого подхода предлагается адаптивный многомерный интерполятор, автоматически выбирающий в каждой точке сигнала интерполирующую функцию, обеспечивающую повышенную точность интерполяции для контуров. Для реализации этого выбора предлагается решающее правило, основанное на локальном признаке, характеризующем выраженность и направленность контура в каждой точке сигнала. Предложенный интерполятор реализован для трёхмерного случая, в котором переключение производится между шестью интерполирующими функциями: усредняющей функцией и функциями, учитывающими контуры пяти направлений. Производится экспериментальное исследование предложенного алгоритма на трёхмерных гиперспектральных данных дистанционного зондирования Земли. Экспериментально подтверждается, что использование предложенного интерполятора позволяет существенно повысить эффективность дифференциальной компрессии.
Бесплатно
Статья научная
Предлагается адаптивный интерполятор многомерного сигнала, выбирающий интерполирующую функцию в каждой точке сигнала посредством решающего правила, оптимизированного в многомерном признаковом пространстве с помощью дерева решений. Поиск разделяющей границы при разбиении вершин дерева решений осуществляется посредством рекуррентной схемы, позволяющей, кроме поиска границы, производить также выбор наилучшей пары интерполирующих функций из заранее заданного набора функций произвольного вида. Приводятся результаты вычислительных экспериментов на реальных многомерных сигналах, подтверждающие эффективность адаптивного интерполятора.
Бесплатно
Статья научная
Рассматривается адаптивный алгоритм стеганографического скрытия информации, основанный на итеративном внесении малозначительных искажений в блоки полноцветных изображений-контейнеров и использующий быстродействующие некриптографические хеш-функции для последующего извлечения скрытых данных. Особенностью алгоритма является модификация минимального числа элементов контейнера по сравнению с длиной скрываемых в него фрагментов сообщений, что позволяет увеличить показатели скрытой пропускной способности и снизить визуальную и статистическую заметность скрытых данных. Проводится сравнение алгоритма с современными алгоритмами адаптивного пространственного стегоскрытия в части оценки уровня искажающих изменений контейнеров. Рассматривается вариант повышения пропускной способности алгоритма за счёт мультиплексирования скрытых каналов, использующих общее подмножество элементов контейнера при встраивании в них различных сообщений.
Бесплатно
Адаптивный нейросетевой метод построения интерполяционной формулы для удвоения размера изображения
Статья научная
Предложена архитектура искусственной нейронной сети, решающей задачу построения интерполяционных формул для удвоения размера изображений. Обученная модель получает в качестве аргумента матрицу размера 4×4, а результатом работы является интерполяционная формула, представленная в виде весового вектора для 4 точек. Произведено сравнение основных оценок качества предложенного метода с некоторыми известными адаптивными подходами. Сравнительный анализ показал, что предложенный подход имеет лучшее качество интерполяции по сравнению с методами New Edge-Directed Interpolation и Directional Cubic Convolution Interpolation.
Бесплатно
Статья научная
Разрабатываются новые модели многоканальных (мульти- и гиперспектральных) изображений с использованием коммутативных гиперкомплексных алгебр (триплетных - для цветных и мультиплетных - для многоканальных). Гиперкомплексные алгебры обобщают алгебру комплексных чисел. Они содержат гиперкомплексные числа, представляющие собой линейную комбинацию нескольких мнимых единиц. Главная цель работы - показать, что коммутативные гиперкомплексные числа могут быть использованы при обработке многоканальных изображений в естественной и эффективной манере. В этой части работы мы предполагаем, что мозг животных оперирует гиперкомплексными числами, когда обрабатывает многоканальные изображения, которые возникают на ретине. В нашем подходе каждый многоканальный пиксел рассматривается не как K-мерный (K-Dimension) вектор, а как K -D гиперкомплексное число, где K есть число различных оптических каналов. Это создает эффективную математическую основу для различных функционально-числовых преобразований многоканальных изображений.
Бесплатно
Статья научная
Данная работа является развитием предыдущих публикаций авторов, в которых рассматривалась задача восстановления изображений, получаемых при горизонтальном смазе. В данной работе построена математическая модель удаления смаза на изображениях, получаемых при вращении вокруг вертикальной оси камеры, оптическая ось которой направлена под углом к горизонту. В этом случае смаз на матрице камеры происходит не по горизонтальным прямым, а по некоторым дугам. Приводятся результаты численных экспериментов, подтверждающие хорошее качество восстановления изображений и высокую производительность алгоритма.
Бесплатно
Статья научная
В данной работе рассматривается одно из направлений цифровой стеганографии - встраивание информации в сжатые JPEG-изображения. Введена схема встраивания информации на основе операции замены ДКП-коэффициентов. Предложены и исследованы варианты алгоритмической реализации данной схемы. Для повышения качества встраивания, характеризуемого значением PSNR, использован генетический алгоритм. Основным результатом исследования является стеганографический алгоритм встраивания информации в сжатые JPEG-изображения, отличающийся возможностью неравномерного распределения битов сообщения по блокам ДКП-коэффициентов. Выбор оптимальной области встраивания осуществляется с помощью генетического алгоритма.
Бесплатно
Статья научная
Ряд задач обработки разновременных изображений дистанционного зондирования Земли одной и той же территории требует выявления на изображении объектов, не характерных для территории и представляющих собой случайные искажения в составе сцены. К таким искажениям можно отнести облака, тени и другие объекты или результаты воздействия природных явлений, которые перекрывают часть наблюдаемой сцены или существенно меняют регистрируемую яркость объектов в её составе. Случайный характер искажений проявляется в том, что их наличие, расположение, размеры и форма зависят от времени регистрации изображений, т.е. проявляются не на всех снимках из анализируемой серии. В настоящей статье предлагается алгоритм детектирования искажений в составе сцены по серии разновременных изображений дистанционного зондирования Земли. Алгоритм основан на суперпиксельной сегментации изображений и обнаружении аномалий в многомерных потоках данных. Результатом являются маски случайных искажений в составе сценах для каждого из изображений в серии, что позволяет впоследствии в методах комплексирования данных учитывать только релевантные для сценах участки каждого из изображений...
Бесплатно
Алгоритм динамической сегментации пары последовательных кадров
Статья научная
Разработан алгоритм динамической сегментации пары кадров видео. Проведен сравнительный анализ качества сегментации для случаев поиска сдвигов и аффинных межкадровых преобразований для сегментов. Также произведено сравнение с некоторыми методами статической сегментации.
Бесплатно
Алгоритм на основе сэмплирования аэрозольных неоднородностей в задаче измерения скорости ветра
Статья научная
Разработан алгоритм на основе сэмплирования аэрозольных неоднородностей для обработки изображений в задаче лидарного измерения скорости ветра в атмосфере. Проверка разработанного алгоритма производилась с использованием синтезированных лидарных сигналов и на данных натурных измерений. Алгоритм обработки аэрозольных полей в координатах «дальность - время» позволяет существенно уменьшить погрешности лидарного времяпролётного метода измерения скорости ветра по сравнению с корреляционными методами измерения.
Бесплатно
Алгоритм обнаружения облачных объектов на многоспектральных снимках
Статья научная
Представлен многошаговый алгоритм обнаружения облачных объектов на многоспектральных снимках земной поверхности. На каждом шаге выполняется кластеризация пространственных пикселей многоспектрального снимка методом к-средних и к фрагментам полученных кластеров применяются спектральные критерии облачности / чистого неба. Эта процедура повторяется до тех пор, пока находятся «облачные» пиксели. «Облачные» пиксели, найденные на одном шаге, объединяются в один облачный объект. Представлены результаты тестирования этого алгоритма на снимках прибора HYPERION (199 ненулевых спектральных каналов в спектральном диапазоне 426 нм - 2400 нм) с высоким пространственным разрешением (30 м). Выбраны снимки с частичной облачностью над поверхностями пяти типов: океан, зеленая растительность, пустынная местность, городская застройка и снег. Выполнено сравнение результатов обработки этих снимков представленным алгоритмом и альтернативным алгоритмом, в котором те же спектральные критерии применяются независимо к каждому пространственному пикселю. Представлены средние для каждого облачного объекта спектры. Показано, что представленный алгоритм на каждом снимке находит от 1 до 3 облачных объектов, отвечающих распределению яркостей на соответствующих RGB-изображениях. Применение альтернативного алгоритма (без предварительной кластеризации) приводит к ошибкам обнаружения на краях облаков. Предложено три параметра для оценки качества получаемых облачных масок. Из них выбран наиболее информативный: отношение разброса спектров в «облачных» пикселях к разбросу спектров в «чистых» пикселях (отношение должно быть много меньше 1).
Бесплатно
Алгоритм определения групп крови по изображениям серологических планшетов
Статья научная
В работе рассматривается алгоритм для автоматизации системы медицинской экспресс-диагностики, предназначенной для определения группы крови путем анализа реакции агглютинации (склеивания эритроцитов). После забора крови и заполнения серологического планшета лаборанту достаточно разместить его в специальном сканере для последующего автоматического определения группы крови. Оцифровка данных и помощь лаборанту в распознавании планшетов позволяет решить сразу две критически важные задачи: хранение результатов анализа и контроль человеческого фактора. Предлагаемый алгоритм распознавания позволяет точно определить границы лунок и оценить степень агглютинации посредством легковесной свёрточной нейронной сети. Был собран уникальный набор данных с независимой оценкой степени агглютинации медицинскими экспертами. Наивысшая достигнутая точность оценки степени агглютинации на собранном наборе данных из 3231 изображения лунок оказалась сопоставима с оценкой среднего эксперта и составила 98,2 %.
Бесплатно
Статья научная
Статья посвящена проблеме организации совместной обработки пространственных данных в виде цифровых карт и космических снимков в составе программного комплекса органов исполнительной власти для поддержки принятия решений в противопаводковый период. Авторами проведен анализ проблемы построения зон затоплений на основе использования космических снимков и геоинформационных технологий. В работе описан алгоритм построения зон фактического затопления местности при разливах рек на основе радиолокационных космических снимков и анализа характерных точек рельефа, позволяющий повысить точность привязки снимка при малом числе опорных точек. В рамках проведенного экспериментального исследования была показана эффективность применения данного алгоритма: точность совмещения водной поверхности реки, полученной с космического снимка и с цифровой топографической карты с применением предложенного авторами алгоритма, повысилась на 40 %.
Бесплатно
Алгоритм сегментации аэрозольных неоднородностей
Статья научная
Разработан алгоритм сегментации аэрозольных неоднородностей атмосферы на поле относительных флуктуаций коэффициента обратного рассеяния, регистрируемого в координатах «Дальность - Время», на основе скользящего окна двумерной корреляционной функции. Полученный алгоритм позволяет надёжно выделять неоднородности, что может быть использовано в практических целях для исследования аэрозольного поля атмосферы и увеличения точности измерения скорости и направления ветра. Показано применение разработанного алгоритма для получения гистограммы распределения размеров аэрозольных неоднородностей из данных лидарного зондирования упругого рассеяния в приземном слое атмосферы на длине волны 355 нм.
Бесплатно