Оценка параметров масс-спектрометрического пика в дублете

Автор: Манойлов Владимир Владимирович, Новиков Л.В.

Журнал: Научное приборостроение @nauchnoe-priborostroenie

Рубрика: Работы для масс-спектрометрии

Статья в выпуске: 3 т.22, 2012 года.

Бесплатный доступ

Предлагается метод оценки положения и интенсивности пика в дублете, скрытого главным пиком, интенсивность которого превышает искомый в 10 и более раз в присутствии шума. Положение главного пика при этом задано точно, его форма известна с некоторой точностью, а амплитуда неизвестна. Метод позволяет оценить параметры скрытого пика при отношении сигнал/шум от десяти и выше и расстоянии между пиками от половины ширины на половине высоты и более.

Обработка сигналов, метод независимых компонент, собственные векторы матриц, оценка параметров масс-спектрометрических пиков

Короткий адрес: https://sciup.org/14264804

IDR: 14264804

Текст научной статьи Оценка параметров масс-спектрометрического пика в дублете

В ряде практических приложений элементного, изотопного и других методов анализа требуется разделить компоненты дублета — смеси двух наложившихся пиков, амплитуда одного из которых в десятки раз превосходит второй. Оценка параметров таких пиков: в мультиплетах, и в частности в дублетах, основана на математических методах восстановления сигналов, искаженных аппаратной функцией. Среди этих методов, применяемых в приборостроении, наиболее известными являются метод Тихонова [1], метод максимального правдоподобия [2, 3], метод деконволюции [4, 5], метод на основе фильтров Винера [6], метод сингулярных разложений (SVD) [7], метод наименьших квадратов [8], метод сверток [9, 10], метод независимых компонент (ICA) [11] и др. С целью подавления шума во всех этих операциях в последнее время стали использовать избыточное вейвлет-преобразование с последующей пороговой обработкой [12]. В настоящей работе на основе идеи метода ICA предлагается метод разделения пиков известной формы в присутствии шумов.

ТЕОРИЯ

Предположим, что для разделения пиков в дублете требуется по суммарному пику и положению главного пика найти положение и амплитуду второго (маленького) пика. Как правило, форма главного и искомого пиков одна и та же, но они несколько смещены друг относительно друга. Амплитуда главного пика неизвестна. Модель такого сигнала можно представить в виде x1 = Cs1 + s2,

где C — произвольная положительная константа, определяющая амплитуду главного пика, C > 10, и может быть значительно больше 10; s1 , s2 — векторы-столбцы отсчетов размерности N главного (s1 ) и искомого (s2 ) пиков. Эти пики положительны, а суммарный вектор x1 образует вектор исходных данных, как правило искаженный аддитивным шумом. Пусть известна (с некоторой точностью) форма первого пика s1 , что при известном его положении позволяет сформировать вектор-столбец модели s0 = s1. Требуется, используя эту модель и исходный сигналx1, выделить из дублета компоненту s2 . Решение, т. е. оценкуsˆ2 , будем искать в виде s2 = a x1 + b s0. (2)

С учетом выражения (2), полагая что это — точное решение, образуем скалярные произведения исходных данных:

( s 2, x 1 ) = a ( x T x 1 ) + b ( s T x 1 ) = kx1 a + k 12 b ,

( s 2 , s o ) = a ( x T s o ) + b ( s T s o ) = k 21 a + k 22 b ,

которые удобно представить в матричном виде как:

f s T X 1 ) J k 11

T

V s 2 s 0 J   V k 21

kaa

1211 = k22 JVb JV

Построим двухстолбцовую матрицу x = ( x 1 s 0 ) .

Используя выражение (3) легко убедиться в том, что элементы матрицы K образованы произведе-

нием x T x . Введем далее вектор e 1 =

' e11

k e 21

и по-

ложим, что

( a )

kbJ" d

, где d — некоторая кон-

станта. Имея ввиду (1) и (2), положим a = de11 = 1.

Следовательно, b = de 21 = e 21 1e11

r a и к ь

r e 11 e 11 k e 21

Используя последнее выражение, покажем, что

Величина A j изменяется от A0 = — с шагом 0 0 e 11

-A A до A max, при которой норма отрицательной составляющей оценки s2- достигает минимума, а именно min A {||s2-||/||s2|}. Величину шага удобно выбирать из условия A A 0' = a | |s j -11|/||х11| при a = 0.1,...,0.5, чтобы обеспечить плавное достижение искомого минимума независимо от амплитуды главного пика.

вектор e 1 является собственным вектором матри-

ОПИСАНИЕ АЛГОРИТМА

цы K , для которого должно выполняться равенство K e 1 = А е 1, где А1 — собственное число. Действительно, продолжая равенства (4), имеем

K

Г a

k b

= — K e

Г e

Г e

.

k e 21 J    e l

k e 21

Следовательно, для оценки s ˆ2 из (2) будем иметь

s 2

e

= x +--- S o - e

Чтобы определить ошибку оценки sˆ2 и, следовательно, справедливость предположения (2), получим выражение для отношения e21 e11 . Из выражения (5) с учетом (4) будем иметь k21 e11 + (k22 - А ) e21 = 0

и e21          k21          C(s1 • so ) + (s2 • so)

e ? ( s T s o ) - a     ■      (

Вычисление А показывает, что А < ( S T s 0

поэтому

e

= - C 0, причем C 0 C .

e 11

Подставляя выражение (1) в (6), с учетом последнего вывода можно убедиться в том, что компенсация главного пика при вычислении оценки s ˆ2 происходит с избытком, т. е. в s ˆ2 на месте главного пика будет всегда присутствовать отрицательная составляющая.

С целью устранения этой компоненты вводится итерационная процедура sj = x, + Aj-1 s0, j = 1,2,...,j

2        1        0      0                      max

Алгоритм вычисления оценки ˆ2 включает выполнение следующих операций:

а) формирование вектора-столбца исходных

данных x 1 ;

  • б)    формирование вектора-столбца модели s 0 ;

  • в)    формирование матрицы x = ( x 1 s 0 ) ;

в) вычисление матрицы

K = (xT • x) =

xT v T k X1

X 1

s 0

T s 0

X 1

A

s 0 s 0 J

г) вычисление собственных векторов e =

= ( e 1 , e 2 ) =

e 11     e 12

k e 21    e 22

(и собственных

А = ( А , А 2 ) ) матрицы K ;

д) начало итерационного цикла

значений

j = 1 от

A 0 = e 21 / e 11 до A 0 j max;

е) вычисление оценки искомого вектора s j = x. + A j - 1 s0 ;

2         1         0 0

ж) подавление шума в оценке s ˆ j ;

  • з)    вычисление на каждой итерации функционала <  j н ki ж ii;

  • и)    вычисление минимума ε по нескольким итерациям. В качестве условия минимума прини-

мается выполнение неравенства

(=(j)- = ( j -2))/2< P.

где P — порог, величина которого определяется уровнем шума (например, P = с т / N + 5 •Ю - 2), σ — среднеквадратические отклонения (СКО) шума;

  • к)    если условие минимума не выполняется — переход к п. (д), иначе — к п. (л);

  • л)    оценка положения и амплитуды пика s ˆ2 на итерации j - 2 .

МОДЕЛИРОВАНИЕ

Проверка качества разделения компонент дублета по предлагаемому алгоритму выполнена в среде МАТЛАБ на двух моделях исходного сигнала x 1 = C s 1 + s 2 , где векторы s 1 и s 2 построены

  • а)    по формуле ассиметричной гауссианы (задний фронт в 2 раза круче переднего);

  • б)    в виде пика с плоской вершиной.

Модель пиков асимметричной гауссианы строилась по формуле:

  • S 1 ( t ) = 4exp { - ( t - t i ) 2/ 2 p k } ,         (8)

где A 1 — амплитуда, t 1 — положение, µk — среднеквадратическая ширина пика, причем pk = p 1 при t t 1 , pk = p при t t 1 и P 1 p .

Из отсчетов функции S 1 ( t ) формируется вектор s 1 , причем компонента этого вектора S 1 i = S 1 ( i A t ) , где интервал A t выбирается из условия 50-60 отсчетов на пик. По формуле (2) формируется также вектор s 2 с параметрами A 2 , t 2 , µ 2 k и строится модель исходных данных x 1 = C s 1 + s 2 с добавлением белого шума с дисперсией σ 2 при отношении сигнал/шум, определяемом как A 2 σ .

На рис. 1 показан исходный сигнал х 1 ( t ) на сетке t = - 100 A t ^ 100 A t при C = 10, p = 10, A = 1, t 1 = 0, p 1 = 2P p; A 2 = 1, t 2 = 15, p 2 = 2P p и отношении сигнал/шум 10. Из рисунка видно, что главный пик полностью скрывает искомый пик s 2 ( t ) . Это обстоятельство, а также наличие шума усложняют решение задачи разделения пиков.

Построим модель главного пика дублета s 0 ( t ) , используя формулу (8) с параметрами A 0 = 1, 1 0 = 0, p 0 = 2p p, сформируем матрицу x и вычислим матрицу K . Вычислим далее собственные векторы (и собственные значения) этой матрицы, используя команду eig и выполним операции в соответствии с пп. (д),…, (л) предлагаемого алгоритма .

Результат выделения искомого пика из дублета для приведенных выше исходных данных показан на рис. 1. Число итераций при этом оказалось равным 16. Итерационный процесс, который характеризуется зависимостью s ( j ) , проиллюстрирован на рис. 2.

По результатам моделирования вычислялись среднеквадратические отклонения (СКО) и смещения оценок параметров искомого пика по M реализациям шума ( M = 20):

Рис. 1. Бигауссова модель дублета.

X 1 ( t ) — исходные данные; s 2 ( t ) — искомый пик (штриховая линия); S2 ( t ) — оценка пика (сплошная линия)

Рис. 2. Кривая сходимости итерационного процесса s ( j ) = ||s j ||/||s j H для бигауссовой модели при отношении сигнал/шум 10

СКО положения

M

Z( km m=1

t 2

t 2,

смещения положения где

M 1ˆ t2  M E tm ;

1V1- m = 1

СКО амплитуды

ˆ

A 2, m

смещения амплитуды A - A , где

1 M

A 2 47E A 2 m ;

m = 1

СКО восстановления формы

M ту e 1^2 - s2i m, M m=1

где норма вычисляется при каждой реализации шума.

Алгоритм был апробирован при отношении сигнал/шум от 10 и более, при C = 10 и 100. Результаты сведены в табл. 1.

Модели пиков с плоской вершиной строятся из двух пиков гауссовой формы с ц = 4 А t , расстояние между которыми такое, что образуется плоская вершина. Ширина таких пиков выбиралась равной 30 А t . На рис. 3 показан исходный сигнал X j ( t ) из пиков с плоской вершиной на сетке t = - 100 А t ^ 100 А t    при C = 10; A 1 = 1, t 1 = 0,

A 2 = 1, 1 2 = 10 А t , ширине пиков 30 А t . Фронты пиков — гауссовой формы при ц = 4 А t и отношении сигнал/шум 10. Из рисунка видно, что главный пик полностью скрывает искомый пик s 2 ( t ) . Применение предлагаемой вычислительной процедуры позволило решить задачу оценки параметров скрытого в дублете пика s 2 ( t ) , численные результаты которой приведены в табл. 2. Результат выделения искомого пика из дублета для приведенных выше исходных данных проиллюстрирован на рис. 3.

Табл. 1. Погрешность оценки параметров пика бигауссовой формы в дублете при ц = 10А t , A , = 1, t 1 = 0, ц 1 = V2 ц ; A 2 = 1, 1 2 = 15А t , ц 2 = V2 ц

д g з s В о и и й ® К ч

О 5 и 5

О о

Погрешность оценки положения А t

Погрешность оценки амплитуды в %

СКО восстановления

СКО

Смещение

СКО

Смещение

С= 10

10

1.4

–1.65

7.2

–0.5

0.13

50

0.65

–1.8

3.2

–1

0.05

Без шума

0

–2

0

–1

0.004

С= 100

10

1.7

–1.4

9

0

0.15

50

0.65

–1.8

3.2

–1

0.05

Без шума

0

–2

0

–1

0.004

Рис. 3. Модель дублета с плоской вершиной: x 1 ( t ) — исходные данные; s 2 ( t ) — искомый пик (штриховая линия); s2 ( t ) — оценка пика (сплошная линия)

Табл. 2. Погрешность оценки параметров пика плоской формы в дублете при A = 1, t 1 = 0, A = 1, t 2 = 10 А t .

Ширина пиков — 30 А t , фронты пиков — гауссовой формы при ц = 4 А t

з S В о

% m

Он сЗ

S

3 Ч

О §

Погрешность оценки положения А t

Погрешность оценки амплитуды в %

м о к

н

О S

О m о о ад t;

О

и

СКО

Смещение

СКО

Смещение

С= 10

10

2.1

0.55

6

6

0.118

50

1

0

3.2

1.2

0.035

Без шума

0

0

0

–1

0.015

С= 100

10

2.05

0.6

7

7

0.13

50

1.1

0

3.5

1.2

0.04

Без шума

0

0

0

1.2

0.02

При моделировании изменялись положения главного и искомого пиков от 5 А t до 35 А t для бигаусса и от 10 А t до 35 А t для пика с плоской вершиной, т. е. от полного наложения до практически полного разделения. При максимальном разделении главного и исходного пиков для обеих моделей погрешности оценки положения и отклонения формы практически не изменились. Погрешность оценки амплитуды при этом уменьшилась на порядок.

ЗАКЛЮЧЕНИЕ

Рассмотренный метод может быть, в частности, полезен при оценке чистоты материалов, анализируемых на масс-спектрометре. Метод позволяет сделать вывод о том, существует или нет загрязнение исследуемого объекта, а если существует, то на какой массе находится сторонний объект, вызвавший загрязнение. В случае отсутствия загрязнения на месте искомого пика наблюдается только шум.

Метод оценки параметров одиночных пиков в дублетах представляет собой нелинейный итерационный процесс. Предлагаемый алгоритм быстро сходится, и он не требует аналитического описания формы пика: она может быть любой, в том числе построенной на основе экспериментальных данных.

Авторы благодарят Тимченко Н.А. за активное участие в обсуждении результатов работы.

Статья научная