Детектирование пиков наномасштабных изображений в шумах

Бесплатный доступ

Предлагается новый помехоустойчивый алгоритм оценки положения и интенсивности пиков нанообъектов. Метод основан на обработке изображения по столбцам и строкам с использованием алгоритма поиска экстремумов по трем точкам в скользящем окне данных. Метод позволяет оценить положение и интенсивность пиков при отношении сигнал/шум до трех с вероятностью обнаружения до единицы, нулевой вероятностью пропуска пика и ложной тревоги.

Наномасштабные изображения, обработка изображений, детектирование пиков

Короткий адрес: https://sciup.org/142214863

IDR: 142214863   |   DOI: 10.18358/np-28-3-i124129

Текст научной статьи Детектирование пиков наномасштабных изображений в шумах

В последнее время значительно расширился круг задач, решаемых с помощью анализа изображений самых различных объектов в области криминалистики, биологии, медицины, микроэлектроники, фармацевтики, аналитической химии и в других приложениях. В работе [1] предложены новые подходы анализа химического состава поверхности гетерогенных образцов, названные "химическая визуализация" (chemical imaging). В основе лежит анализ корреляции между, как минимум, двумя изображениями, полученными различными методами, например время-пролетной вторичной ионной масс-спектрометрией (ToF-SIMS) и сканирующей электронной микроскопией (SEM), рентгеновской фотоэлектронной спектроскопией и атомной силовой микроскопией (AFM) и т. п. с последующей обработкой многомерных данных [2–4].

Концепция многосенсорного гиперспектрального образа анализируемого объекта объединяет неразрушающие методы анализа на основе рамановской (RMS), энергодисперсионной рентгеновской (EDX) и электронно-колебательной спектроскопии, а также SEM и ToF-SIMS. Полученные изображения обрабатываются методами многомерной статистики для получения обобщенных спектральных признаков с использованием методов главных компонент (PCA) и кластерного анализа. Эта концепция находит применение в области науки о жизни, материаловедения и геофизики, классификации клеток и аэрозолей в пробах окружающей среды [1].

Одной из задач, решаемых в теории обработки изображений, является получение данных о морфологии поверхности, например морфологии на- ноструктур, используемых в различных приложениях от распознавания отпечатков пальцев и диагностики печатных плат [5] до оценки шероховатости поверхности [6–8], определения размеров наночастиц [9] и качества биосимуляров в фармацевтической промышленности [10].

Достоверность принимаемых решений по оценке морфологических параметров, в частности наноструктур, зависит от точности оценок этих параметров в условиях сильных шумов и других помех. Настоящая работа посвящена оценке интенсивности и положения пиков изображений, характерных для комплексных исследований с использованием атомной силовой, туннельной или растровой электронной микроскопии.

Традиционный подход в анализе структуры поверхности при наличии шумов основан на предварительной фильтрации шума с использованием тех или иных хорошо известных алгоритмов. Однако эта операция неизбежно ведет к искажению характера поверхности — нарушению формы пиков, уменьшению их интенсивности и иногда положения максимумов. В предлагаемом алгоритме не требуется предварительная фильтрация. Он основан на методе поиска начала, максимума и конца пиков по производной в трех точках скользящего окна данных, предложенного в работе [11]. Поиск максимумов изображения нанообъектов выполняется в два этапа. На первом — путем обнаружения экстремумов по строкам и столбцам матрицы данных формируются кластеры точек в зоне вершины пика. Затем, используя иерархический кластерный анализ, локализуются эти кластеры и определяются их центры, величина и расположение которых принимаются за параметры пиков в изображении.

ОПИСАНИЕ АЛГОРИТМА

Изображение, содержащее множество пиков, может быть представлено в виде матрицы Z, элементы которой z ( i,j ) определяются формулой

L

z (i, j)=Ё Af ((i - ii), (j - ji))+p( i, j), i=1

где A l — интенсивность; f l — функция формы; i l , j l — положение l -го пика; L — число пиков; p^ij ) — аддитивный шум; i = 1 _ I , j = 1 _ J .

В простейшем случае в качестве модели функции fl может быть выбран двумерный гаусс fl (.) = Ai exP

где r 2 = ( i - i l ) 2 + ( j - j i ) 2 , p i — среднеквадратическая ширина пика.

В настоящей работе для проверки алгоритма используется более сложная модель пика, представляющая собой гауссов пик с эллипсоидальной формой сечения горизонтальной плоскостью. Тогда

r2 = ((i - ii) + (j - j i) )/Al -

- в^ ( ( i - i ) cos a i

-( j - Ji ) sin a i ) 2 1A 2.

Здесь 2µ — фокальное расстояние и 2β — большая полуось эллипса, в/ > Ц/, ai — угол наклона оси эллипса в плоскости (i, j),

A i =7 р 2 - ^ 2 .

Каждый j- й столбец матрицы Z образует I -мерный вектор-столбец Z j = [ zj ( i ) ] с элементами z j ( i ) .

Каждая i- я строка матрицы Z образует J -мерный вектор-строку Z i = [ z i ( j ) ] с элементами z - ( j ) .

Алгоритм обнаружения положения ( i , j ) и амплитуды A пиков изображения производится последовательной обработкой по столбцам и строкам матрицы Z с последующим анализом полученных данных с целью уточнения искомых параметров.

При обработке по столбцам Z j производится поиск перегибов (хребтов) в каждом столбце j матрицы Z. Для этой цели используется подход, подробно изложенный в работе [11] для одномерного случая. Суть предлагаемого алгоритма состоит в следующем.

Сформируем текущую выборку у из K +1 отсчетов с центром в точке i вектора Z j у = [ y(k)] = (zj(i- K2),-, zj(i),-, zj(i+ K2)), где k = 1_ K и K выбирается всегда четным числом из условия 0.5–0.7 от ширины пика на половине высоты в отсчетах. При этом во избежание скачков на границах Z j полагаем, что если (i - K/2)< 0, то у (i - K/2) = Z J (1) и, если (i + KI2)> I, то у (i + KI2) = Zj(I).

Рис. 1. Фрагмент столбца матрицы изображений с окном данных из девяти отсчетов ( K = 8) и аппроксимирующая парабола (сплошная линия) с точками t 1 , t 0 , t 2 ; th min , th max — минимальный и максимальный пороги обнаружения

Аппроксимируем отсчеты в окне y полиномом второй степени (параболой) у на сетке к = ( - К/ 2,...,0,..., К/ 2 ) :

у ( к ) = Р 1 к 2 + p 2 к + p 3 ,

где p 1 , p 2 , p 3 — коэффициенты полинома.

Выберем в интервале

такие, что t 1 = -

K

KK 2,2

1 0 = 0, 1 2 =

три точки t 1 , t 0 , t 2

K

, где

K

целое число, большее или равное .

На рис. 1 показан фрагмент столбца с окном данных из девяти отсчетов ( К = 8 ) и аппроксими-

рующая парабола с точками t 1 , t 0 , t 2 .

Величина первой производной параболы в точке t 1 будет равна

d 1 = 2 Р 1 t 1 + Р 2

и в точке t 2 :

d 2 = 2 p 1 1 2 + p 2 .

Величина второй производной параболы равна 2 p 1 .

Величина параболы в точке к = 0 равна средневзвешенному значению в скользящей выборке исходных данных в точке i :

Z j ( i ) = у ( 0 ) = p з .                       (3)

Используя формулы (1)–(3) рассмотрим алгоритм обнаружения хребтов в каждом столбце матрицы Z. В начале обработки исходных данных устанавливаются признаки обнаружения начала и вершины хребта:

р$ | 0, начало хребта необнаружено;

[ 1, начало обнаружено.

J 0, вершина хребта не обнаружена;

PSS 1,аршина^нааажана

Условие начала хребта имеет вид :

PS = 0; d 1 0; d 2 d 1 ; p 3 th min ,        (6)

где th min порог нижнего уровня, выбираемого по стандартному отклонению шума σ : th min = ( 1 ^ 2 ^ .

После обнаружения начала хребта устанавливаются признаки PS = 1 и PSS = 0.

Обозначим номера строк, в которых обнаружены начала хребтов, как I minmax.

Условие вершины хребта имеет вид :

PS = 1; d, > 0; d2 < 0; p, < 0; max (у )> th (7) 1 2 1 max где thmax — порог максимального уровня, выбираемый из условия thmax = (4 ^ 6)^ . После обнаружения вершины хребта устанавливаются признаки PS = 0 и PSS = 1. Обозначим номера строк, в которых обнаружены максимумы хребтов, как Imax .

Сформируем новую матрицу Z m данных, состоящую из столбцов матрицы Z и строк с номерами I max , т. е. Z m = Z( I max , 1 J )•

Выполним анализ матрицы Z m по строкам I max с использованием алгоритмов (4)–(7) с целью обнаружения номеров столбцов J max , в которых обнаружены максимумы.

В результате приведенного анализа матрицы данных Z получаем координаты пиков в виде таблицы [ I max J max ] .

Амплитуда A ( I max, J max ) обнаруженных пиков оценивается по точке максимума параболы при условии PSS = 1. Если форма пиков несимметричная, то в окрестности их вершины даже при отсутствии шума обнаруживается несколько максимумов, образующих кластер. За оценку положения такого пика принимается среднее взвешенное значение по каждой координате, а за интенсивность — максимальное значение интенсивности пиков, входящих в кластер. Признаком принадлежности кластеру принимается расстояние между точками, которое должно быть меньше минимального расстояния между пиками анализируемой поверхности, задаваемого по априорным данным. За оценку положения кластера принимается среднее взвешенное значение по каждой координате, а за интенсивность — максимальное значение интенсивности пиков, входящих в кластер.

МОДЕЛИРОВАНИЕ

Проверка эффективности алгоритма производилась по модельному спектру, состоящему из 81 пика гауссовой формы с эллипсоидальной формой сечения и добавлением белого шума (рис. 2, а). На рис. 2, б, показаны кластеры пиков изображения и их вершины, полученные на основе предлагаемого

Рис. 2. Изображение из 81 модельных пиков.

а — в шумах при отношении сигнал/шум, равном трем; б — кластеры пиков изображения с отметкой обнаруженных вершин пиков (O)

Абсолютные (для положения пиков по осям X и Y ) и относительные среднеквадратические ошибки (СКО) оценки параметров пиков при различных отношениях сигнал / шум (с/ш) для метода поиска экстремумов, изложенного в [12, 13], — 1 и предлагаемого метода — 2.

Параметр Отношение с/ш 3.0 10 20 100 Метод поиска экстремумов 1 2 1 2 1 2 1 2 Положение пика (в отсчетах): X Y 0 1 0 1 0 1 0 0 0 0.8 0 0 0 0 0 0 Положение пика (СКО): X Y 1.65 1.51 0.85 1.13 1.44 1.38 0.97 0.87 1.40 1.33 0.9 0.68 1.40 1.30 0.90 0.60 Амплитуда 0.15 0.075 0.12 0.029 0.120 0.021 0.120 0.020 Вероятность правильного обнаружения 0.907 0.931 0.976 0.999 0.970 1 0.986 1 Вероятность ложного обнаружения 0.727 0.034 0.028 0.002 0.020 0 0.013 0 алгоритма. Результаты сравнивались с программой определения экстремумов в изображении — extrema2. m, используемой в разложении по эмпирическим модам (BEMD) [12, 13], с предварительной фильтрацией шума на основе мультивейвлетов [14]. Относительная погрешность оценки координат и амплитуды пиков производилась по десяти реализациям шума. Погрешность положения пика определялась по его отклонению от истинного значения. Максимальные значения погрешностей для обоих методов обработки сведены в таблицу.

Кроме того, вычислялась вероятность правильного обнаружения как отношение числа обнаруженных пиков по всем десяти реализациям, положение которых отличается от заданных в модели не более, чем на четыре отсчета, к общему числу модельных пиков. Вероятность ложного обнаружения вычислялась как отношение числа обнаруженных пиков по всем десяти реализациям, не заданных в модели, к общему числу модельных пиков. Сравнение данных в столбцах методов 1 и 2 таблицы показывает явное преимущество предлагаемого алгоритма как по уровню погрешности оценки параметров пиков, так и по величине вероятности ложного обнаружения.

ЗАКЛЮЧЕНИЕ

Алгоритм детектирования предложенным методом позволяет повысить достоверность обнаружения пиков благодаря низкому уровню ошибки оценок и вероятности ложного обнаружения при малых отношениях сигнал/шум. Это позволяет значительно понизить порог чувствительности приборов и расширить диапазон оцениваемых параметров.

Работа поддержана государственным заданием № 007-00229-18-00.

Список литературы Детектирование пиков наномасштабных изображений в шумах

  • Ofner J., Brenner F., Wieland K. et al. Image-based chemical structure determination//Scientific reports. 2017 DOI: 10.1038/s41598-017-07041-x
  • Ofner J., Kamilli K.A., Eitenberger E. et al. Chemometric analysis of multisensor hyperspectral images of precipitated atmospheric particulate matter//Anal. Chem. 2015. Vol. 87, no. 18. P. 9413-9420 DOI: 10.1021/acs.analchem.5b02272
  • Gowen A.A., Dorrepaal R.M. Multivariate chemical image fusion of vibrational spectroscopic imaging modalities//Molecules. 2016. Vol. 21, no. 7 DOI: 10.3390/molecules21070870
  • Sobol O., Holzlechner G., Holzweber M. et al. First use of data fusion and multivariate analysis of ToF-SIMS and SEM image data for studying deuterium-assisted degradation processes in duplex steels//Surf. Interface Anal. 2016. Wiley Online Library DOI: 10.1002/sia.6015
  • Kaur B., Kaur S.P. Applications of mathematical morphology in image processing: a review//International Journal of Electronics & Communication Technology. 2013. Vol.4, no. 3. P. 15-17.
  • Толстихина А.Л. Атомно-силовая микроскопия кристаллов и пленок со сложной морфологией поверхности. Дис. … д-ра физ.-мат. наук. М.: ФГБУН Институт кристаллографии им. А.В. Шубникова РАН, 2013. 332 с.
  • Орлов А.А., Антонов Л.В. Алгоритмы обработки снимков промышленных изделий//Современные проблемы науки и образования. 2012. № 6. URL: http://science-education.ru/ru/article/view?id=7844.
  • Сойфер В.А., Куприянов А.В. Анализ и распознавание наномасштабных изображений: традиционные подходы и новые постановки задач//Компьютерная оптика. 2011. Т. 35, № 2. С. 136-144.
  • Чукланов А.П., Бородин П.А., Зиганшина С.А., Бухараев А.А. Алгоритм для анализа АСМ-изображений поверхностей со сложной морфологией//Ученые записки Казанского государственного университета. 2008. Т. 150, № 2. С. 220-227.
  • Reichelt W.N., Kaineder A., Brillmann M. et al. High throughput inclusion body sizing: Nano particle tracking analysis//Biotechnol. J. 2017. Vol. 12, № 6 DOI: 10.1002/biot.201600471
  • Новиков Л.В., Куркина В.В. Метод оценки параметров спектральных пиков//Научное приборостроение. 2017. Т. 27, № 3. С. 99-106. URL: http://213.170.69.26/mag/2017/abst3.php#abst12.
  • Dong W., Li X., Lin X. and Li Z. A bidimensional empirical mode decomposition method for fusion of multispectral and panchromatic Remote Sensing images//Remote Sens. 2014. Vol. 6, no. 9. P. 8446-8467 DOI: 10.3390/rs6098446
  • MathWorks. URL: http://www.mathworks.com/matlabcentral/fileexchange.
  • Rahman M.A., Khan A.S. A spatial spectral filtration (SSF) based correlated coefficients thresholding approach for image denoising//International Journal of Computer Science and Information Technologies. 2016. Vol. 7, № 3. P. 1097-1101.
Еще
Статья научная