Оценка параметров масс-спектрометрического пика в дублете
Автор: Манойлов Владимир Владимирович, Новиков Л.В.
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Работы для масс-спектрометрии
Статья в выпуске: 3 т.22, 2012 года.
Бесплатный доступ
Предлагается метод оценки положения и интенсивности пика в дублете, скрытого главным пиком, интенсивность которого превышает искомый в 10 и более раз в присутствии шума. Положение главного пика при этом задано точно, его форма известна с некоторой точностью, а амплитуда неизвестна. Метод позволяет оценить параметры скрытого пика при отношении сигнал/шум от десяти и выше и расстоянии между пиками от половины ширины на половине высоты и более.
Обработка сигналов, метод независимых компонент, собственные векторы матриц, оценка параметров масс-спектрометрических пиков
Короткий адрес: https://sciup.org/14264804
IDR: 14264804 | УДК: 621.38
Parameter estimation for the mass spectrometric peak in the doublet
We propose a method of estimating the position and the intensity of the peak in the doublet, mostly hidden peak, whose intensity is greater than the required 10 or more times in the presence of noise. The position of the main peak at exactly this set, its shape is known with some accuracy, but the amplitude is unknown. The method allows to estimate the parameters of the hidden peak at a signal / noise ratio of ten and above, and the distance between the peaks of the half-width at half height, and more.
Текст научной статьи Оценка параметров масс-спектрометрического пика в дублете
В ряде практических приложений элементного, изотопного и других методов анализа требуется разделить компоненты дублета — смеси двух наложившихся пиков, амплитуда одного из которых в десятки раз превосходит второй. Оценка параметров таких пиков: в мультиплетах, и в частности в дублетах, основана на математических методах восстановления сигналов, искаженных аппаратной функцией. Среди этих методов, применяемых в приборостроении, наиболее известными являются метод Тихонова [1], метод максимального правдоподобия [2, 3], метод деконволюции [4, 5], метод на основе фильтров Винера [6], метод сингулярных разложений (SVD) [7], метод наименьших квадратов [8], метод сверток [9, 10], метод независимых компонент (ICA) [11] и др. С целью подавления шума во всех этих операциях в последнее время стали использовать избыточное вейвлет-преобразование с последующей пороговой обработкой [12]. В настоящей работе на основе идеи метода ICA предлагается метод разделения пиков известной формы в присутствии шумов.
ТЕОРИЯ
Предположим, что для разделения пиков в дублете требуется по суммарному пику и положению главного пика найти положение и амплитуду второго (маленького) пика. Как правило, форма главного и искомого пиков одна и та же, но они несколько смещены друг относительно друга. Амплитуда главного пика неизвестна. Модель такого сигнала можно представить в виде x1 = Cs1 + s2,
где C — произвольная положительная константа, определяющая амплитуду главного пика, C > 10, и может быть значительно больше 10; s1 , s2 — векторы-столбцы отсчетов размерности N главного (s1 ) и искомого (s2 ) пиков. Эти пики положительны, а суммарный вектор x1 образует вектор исходных данных, как правило искаженный аддитивным шумом. Пусть известна (с некоторой точностью) форма первого пика s1 , что при известном его положении позволяет сформировать вектор-столбец модели s0 = s1. Требуется, используя эту модель и исходный сигналx1, выделить из дублета компоненту s2 . Решение, т. е. оценкуsˆ2 , будем искать в виде s2 = a x1 + b s0. (2)
С учетом выражения (2), полагая что это — точное решение, образуем скалярные произведения исходных данных:
( s 2, x 1 ) = a ( x T • x 1 ) + b ( s T • x 1 ) = kx1 a + k 12 b ,
( s 2 , s o ) = a ( x T • s o ) + b ( s T • s o ) = k 21 a + k 22 b ,
которые удобно представить в матричном виде как:
f s T • X 1 ) J k 11
T
V s 2 • s 0 J V k 21
kaa
1211 = k22 JVb JV
Построим двухстолбцовую матрицу x = ( x 1 s 0 ) .
Используя выражение (3) легко убедиться в том, что элементы матрицы K образованы произведе-
нием x T • x . Введем далее вектор e 1 =
' e11
k e 21
и по-
ложим, что
( a )
kbJ" d
, где d — некоторая кон-
станта. Имея ввиду (1) и (2), положим a = de11 = 1.
Следовательно, b = de 21 = e 21 1e11
r a и к ь
r e 11 e 11 k e 21
Используя последнее выражение, покажем, что
Величина A j изменяется от A0 = — с шагом 0 0 e 11
-A A до A max, при которой норма отрицательной составляющей оценки s2- достигает минимума, а именно min A {||s2-||/||s2|}. Величину шага удобно выбирать из условия A A 0' = a | |s j -11|/||х11| при a = 0.1,...,0.5, чтобы обеспечить плавное достижение искомого минимума независимо от амплитуды главного пика.
вектор e 1 является собственным вектором матри-
ОПИСАНИЕ АЛГОРИТМА
цы K , для которого должно выполняться равенство K e 1 = А е 1, где А1 — собственное число. Действительно, продолжая равенства (4), имеем
K
Г a
k b
= — K e
Г e
Г e
.
k e 21 J e l
k e 21
Следовательно, для оценки s ˆ2 из (2) будем иметь
s 2
e
= x +--- S o - e
Чтобы определить ошибку оценки sˆ2 и, следовательно, справедливость предположения (2), получим выражение для отношения e21 e11 . Из выражения (5) с учетом (4) будем иметь k21 e11 + (k22 - А ) e21 = 0
и e21 k21 C(s1 • so ) + (s2 • so)
e ? ( s T • s o ) - a ■ (
Вычисление А показывает, что А < ( S T • s 0
поэтому
e
= - C 0, причем C 0 > C .
e 11
Подставляя выражение (1) в (6), с учетом последнего вывода можно убедиться в том, что компенсация главного пика при вычислении оценки s ˆ2 происходит с избытком, т. е. в s ˆ2 на месте главного пика будет всегда присутствовать отрицательная составляющая.
С целью устранения этой компоненты вводится итерационная процедура sj = x, + Aj-1 s0, j = 1,2,...,j
2 1 0 0 max
Алгоритм вычисления оценки ˆ2 включает выполнение следующих операций:
а) формирование вектора-столбца исходных
данных x 1 ;
-
б) формирование вектора-столбца модели s 0 ;
-
в) формирование матрицы x = ( x 1 s 0 ) ;
в) вычисление матрицы
K = (xT • x) =
xT v T k X1
• X 1
• s 0
T s 0
• X 1
A
s 0 • s 0 J
г) вычисление собственных векторов e =
= ( e 1 , e 2 ) =
e 11 e 12
k e 21 e 22
(и собственных
А = ( А , А 2 ) ) матрицы K ;
д) начало итерационного цикла
значений
j = 1 от
A 0 = e 21 / e 11 до A 0 j max;
е) вычисление оценки искомого вектора s j = x. + A j - 1 s0 ;
2 1 0 0
ж) подавление шума в оценке s ˆ j ;
-
з) вычисление на каждой итерации функционала < j н ki ж ii;
-
и) вычисление минимума ε по нескольким итерациям. В качестве условия минимума прини-
мается выполнение неравенства
(=(j)- = ( j -2))/2< P.
где P — порог, величина которого определяется уровнем шума (например, P = с т / N + 5 •Ю - 2), σ — среднеквадратические отклонения (СКО) шума;
-
к) если условие минимума не выполняется — переход к п. (д), иначе — к п. (л);
-
л) оценка положения и амплитуды пика s ˆ2 на итерации j - 2 .
МОДЕЛИРОВАНИЕ
Проверка качества разделения компонент дублета по предлагаемому алгоритму выполнена в среде МАТЛАБ на двух моделях исходного сигнала x 1 = C s 1 + s 2 , где векторы s 1 и s 2 построены
-
а) по формуле ассиметричной гауссианы (задний фронт в 2 раза круче переднего);
-
б) в виде пика с плоской вершиной.
Модель пиков асимметричной гауссианы строилась по формуле:
-
S 1 ( t ) = 4exp { - ( t - t i ) 2/ 2 p k } , (8)
где A 1 — амплитуда, t 1 — положение, µk — среднеквадратическая ширина пика, причем pk = p 1 при t < t 1 , pk = p при t > t 1 и P 1 > p .
Из отсчетов функции S 1 ( t ) формируется вектор s 1 , причем компонента этого вектора S 1 i = S 1 ( i A t ) , где интервал A t выбирается из условия 50-60 отсчетов на пик. По формуле (2) формируется также вектор s 2 с параметрами A 2 , t 2 , µ 2 k и строится модель исходных данных x 1 = C s 1 + s 2 с добавлением белого шума с дисперсией σ 2 при отношении сигнал/шум, определяемом как A 2 σ .
На рис. 1 показан исходный сигнал х 1 ( t ) на сетке t = - 100 A t ^ 100 A t при C = 10, p = 10, A = 1, t 1 = 0, p 1 = 2P p; A 2 = 1, t 2 = 15, p 2 = 2P p и отношении сигнал/шум 10. Из рисунка видно, что главный пик полностью скрывает искомый пик s 2 ( t ) . Это обстоятельство, а также наличие шума усложняют решение задачи разделения пиков.
Построим модель главного пика дублета s 0 ( t ) , используя формулу (8) с параметрами A 0 = 1, 1 0 = 0, p 0 = 2p p, сформируем матрицу x и вычислим матрицу K . Вычислим далее собственные векторы (и собственные значения) этой матрицы, используя команду eig и выполним операции в соответствии с пп. (д),…, (л) предлагаемого алгоритма .
Результат выделения искомого пика из дублета для приведенных выше исходных данных показан на рис. 1. Число итераций при этом оказалось равным 16. Итерационный процесс, который характеризуется зависимостью s ( j ) , проиллюстрирован на рис. 2.
По результатам моделирования вычислялись среднеквадратические отклонения (СКО) и смещения оценок параметров искомого пика по M реализациям шума ( M = 20):
Рис. 1. Бигауссова модель дублета.
X 1 ( t ) — исходные данные; s 2 ( t ) — искомый пик (штриховая линия); S2 ( t ) — оценка пика (сплошная линия)
Рис. 2. Кривая сходимости итерационного процесса s ( j ) = ||s j ||/||s j H для бигауссовой модели при отношении сигнал/шум 10
СКО положения
M
Z( km m=1
t 2
t 2,
смещения положения где
M 1ˆ t2 M E tm ;
1V1- m = 1
СКО амплитуды
ˆ
A 2, m
смещения амплитуды A - A , где
1 M
A 2 47E A 2 m ;
m = 1
СКО восстановления формы
M ту e 1^2 - s2i m, M m=1
где норма вычисляется при каждой реализации шума.
Алгоритм был апробирован при отношении сигнал/шум от 10 и более, при C = 10 и 100. Результаты сведены в табл. 1.
Модели пиков с плоской вершиной строятся из двух пиков гауссовой формы с ц = 4 А t , расстояние между которыми такое, что образуется плоская вершина. Ширина таких пиков выбиралась равной 30 А t . На рис. 3 показан исходный сигнал X j ( t ) из пиков с плоской вершиной на сетке t = - 100 А t ^ 100 А t при C = 10; A 1 = 1, t 1 = 0,
A 2 = 1, 1 2 = 10 А t , ширине пиков 30 А t . Фронты пиков — гауссовой формы при ц = 4 А t и отношении сигнал/шум 10. Из рисунка видно, что главный пик полностью скрывает искомый пик s 2 ( t ) . Применение предлагаемой вычислительной процедуры позволило решить задачу оценки параметров скрытого в дублете пика s 2 ( t ) , численные результаты которой приведены в табл. 2. Результат выделения искомого пика из дублета для приведенных выше исходных данных проиллюстрирован на рис. 3.
Табл. 1. Погрешность оценки параметров пика бигауссовой формы в дублете при ц = 10А t , A , = 1, t 1 = 0, ц 1 = V2 ц ; A 2 = 1, 1 2 = 15А t , ц 2 = V2 ц
|
д g з s В о и и й ® К ч |
О 5 и 5 О о |
Погрешность оценки положения А t |
Погрешность оценки амплитуды в % |
СКО восстановления |
||
|
СКО |
Смещение |
СКО |
Смещение |
|||
|
С= 10 |
10 |
1.4 |
–1.65 |
7.2 |
–0.5 |
0.13 |
|
50 |
0.65 |
–1.8 |
3.2 |
–1 |
0.05 |
|
|
Без шума |
0 |
–2 |
0 |
–1 |
0.004 |
|
|
С= 100 |
10 |
1.7 |
–1.4 |
9 |
0 |
0.15 |
|
50 |
0.65 |
–1.8 |
3.2 |
–1 |
0.05 |
|
|
Без шума |
0 |
–2 |
0 |
–1 |
0.004 |
|
Рис. 3. Модель дублета с плоской вершиной: x 1 ( t ) — исходные данные; s 2 ( t ) — искомый пик (штриховая линия); s2 ( t ) — оценка пика (сплошная линия)
Табл. 2. Погрешность оценки параметров пика плоской формы в дублете при A = 1, t 1 = 0, A = 1, t 2 = 10 А t .
Ширина пиков — 30 А t , фронты пиков — гауссовой формы при ц = 4 А t
|
з S В о % m Он сЗ |
S 3 Ч О § |
Погрешность оценки положения А t |
Погрешность оценки амплитуды в % |
м о к н О S О m о о ад t; О и |
||
|
СКО |
Смещение |
СКО |
Смещение |
|||
|
С= 10 |
10 |
2.1 |
0.55 |
6 |
6 |
0.118 |
|
50 |
1 |
0 |
3.2 |
1.2 |
0.035 |
|
|
Без шума |
0 |
0 |
0 |
–1 |
0.015 |
|
|
С= 100 |
10 |
2.05 |
0.6 |
7 |
7 |
0.13 |
|
50 |
1.1 |
0 |
3.5 |
1.2 |
0.04 |
|
|
Без шума |
0 |
0 |
0 |
1.2 |
0.02 |
|
При моделировании изменялись положения главного и искомого пиков от 5 А t до 35 А t для бигаусса и от 10 А t до 35 А t для пика с плоской вершиной, т. е. от полного наложения до практически полного разделения. При максимальном разделении главного и исходного пиков для обеих моделей погрешности оценки положения и отклонения формы практически не изменились. Погрешность оценки амплитуды при этом уменьшилась на порядок.
ЗАКЛЮЧЕНИЕ
Рассмотренный метод может быть, в частности, полезен при оценке чистоты материалов, анализируемых на масс-спектрометре. Метод позволяет сделать вывод о том, существует или нет загрязнение исследуемого объекта, а если существует, то на какой массе находится сторонний объект, вызвавший загрязнение. В случае отсутствия загрязнения на месте искомого пика наблюдается только шум.
Метод оценки параметров одиночных пиков в дублетах представляет собой нелинейный итерационный процесс. Предлагаемый алгоритм быстро сходится, и он не требует аналитического описания формы пика: она может быть любой, в том числе построенной на основе экспериментальных данных.
Авторы благодарят Тимченко Н.А. за активное участие в обсуждении результатов работы.