Методика оценки эффективности моделей и обнаружения масс-спектрометрических пиков
Автор: Наумов В.В., Гребенщиков О.А.
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Исследования, приборы, модели и методы анализа
Статья в выпуске: 2 т.17, 2007 года.
Бесплатный доступ
В статье приведены результаты экспериментальных исследований выходных сигналов квадрупольного масс-спектрометра на базе автоматизированного комплекса, содержащего квадрупольный масс-спектрометр МХ-7306. Разработаны методика оценки эффективности моделей сигналов и оптимальный вариант корреляционного алгоритма сглаживания, обнаружения и идентификации масс-спектрометрических пиков; приведены аналитические выражения эффективности моделей пиков для различных аппроксимаций. Методика позволяет проводить выбор наилучшей с точки зрения вероятности правильного обнаружения аппроксимации масс-спектрометрического пика в каждом конкретном случае.
Короткий адрес: https://sciup.org/14264488
IDR: 14264488
Текст научной статьи Методика оценки эффективности моделей и обнаружения масс-спектрометрических пиков
Одной из особенностей масс-спектрометрических анализаторов состава и свойств веществ является необходимость проведения достаточно сложной обработки выходного сигнала детектора для получения конечных результатов, которая в настоящее время проводится цифровыми методами. Для успешного решения задач обработки необходимо оценить эффективность моделей масс-спектрометрических пиков, найти оптимальные с точки зрения минимизации погрешностей и вероятности правильного обнаружения пиков алгоритмы обработки. В связи с этим представляют интерес исследования характеристик выходных сигналов серийных масс-спектрометров типов МХ-7304А, МХ-7306 и алгоритмов автоматизации их обработки, которые проводились с использованием автоматизированных комплексов, описанных в работах [1-3].
МЕТОДИКА ОЦЕНКИ ЭФФЕКТИВНОСТИ МОДЕЛЕЙ ПИКОВ
Авторы рассматривали шесть аппроксимаций форм пиков, аналитические выражения и графические представления которых сведены в таблицу.
Если в качестве основного критерия при выборе параметров корреляционного алгоритма использовать наименьшие значения амплитуд пиков, которые достоверно идентифицируются на фоне шума, то, ограничиваясь анализом задачи обнаружения в случае аддитивной смеси детерминированного сигнала и белого шума, алгоритм может быть записан в виде [4]:
k
5 = S( I - 1 Ф ) • f ( t"1 0 ) * h 0 , (1)
i = 1
где к — ширина окна функции свертки, I. — регистрируемые отсчеты, 1 ф — интенсивность фона, f — точки модели пика, h 0 — заданный порог.
Рассмотрим разработанный согласно этой формуле вариант корреляционного алгоритма сглаживания и обнаружения масс-спектрометрических пиков [3]. Уровень порога h 0 задается величиной, большей ( 1 ф + 2^СКО) к /2, где, СКО — среднеквадратическое отклонение интенсивности фона. Алгоритм производит идентификацию пика, оценку его положения и максимального амплитудного значения, по которым производятся вычисление значений номера а.е.м. [1] и оценка интенсивности спектральных линий [5].
Для проведения анализа эффективности обнаружения пика рассмотрим аппроксимации формы пиков в виде, приведенном в таблице. В качестве критерия эффективности аппроксимаций можно воспользоваться значениями вероятностей правильного обнаружения пиков Р О и ложной тревоги Р Т, которые определяются по формулам [6]
Р о = 0.5 (1 - Ф( Z 2 )), Р т = 0.5 (1 - Ф( Z 1 )), (2)
где Ф( Z i, 2) — функция ошибок. Значения Z i , Z 2 в зависимости от амплитуды (интенсивности) пика масс-спектрометрического сигнала и СКО шума о ш определяются в соответствии со следующими выражениями [5]:
Z 1 =
h 0
ш
Z 2 = Z 1 — I^'F , (4)
с ш 2
k где F = ^ f2; I5 — амплитуда идентифицируе-i=0
мого пика; f = ft . - 1 0) = fi •At - 1 0); At — период
дискретизации сигнала.
Аппроксимации формы и параметры моделей пиков
№ |
Графическое представление |
Аналитическое выражение |
Параметры формы пиков |
F = Σ f i 2 |
|||||
1 |
α 0 i |
0 |
β 1 k |
f = |
a — , 0 < i < L k ° 1, i о < i < i в -—— , i . < i < k I k |
α ≠ β , i 0 ≠ i 1 , α >0, β >0, i 0 ≠ 0, i 1 ≠ k |
, a + в 2 k ( 1 1 ) k +--—---+ — 6 k 3 a в V V |
||
2 |
α 0 i |
0 |
α 1 k |
f =■ |
a k , 0 < i < i о 1, i 0 < i < — 1 a -—- , i, < i < k k |
α = β , i 0 ≠ i 1 , α >0, β >0, i 0 ≠ 0, i 1 ≠ k |
, a 4 k k +--- 3 k 3 a |
||
3 |
0 |
k |
f = 1, 0 < i < k |
i 0 = 0, i 1 = k |
k |
||||
4 |
α 0 i |
β 0 k |
f =■ |
a k , 0 < i < i 0 1, i = i 0 в -—i- , i < i < k I k 1 |
α ≠ β , i 0 = i 1 , α >0, β >0, i 0 ≠ 0, i 1 ≠ k |
k a + в 3 6 k |
|||
5 |
α 0 i 0 |
α k |
f ■■ |
a— , 0 < i < in k . / 1, i 0 < i < - 1 a - —-, i < i < k k |
α = β , i 0 = i 1 , α >0, β >0, i 0 ≠ 0, i 1 ≠ k |
k a --1-- 33 k |
|||
6 |
α 0 |
с |
f = - , 0 < i < k ik |
i 0 = i 1 = k |
k 11 11 36 k 2 |
В тех случаях, когда трудно принять решение о соотношении удельных весов ошибок ложного обнаружения и пропуска пика, можно считать их равноценными и оценивать эффективность аппроксимации только вероятностью правильного обнаружения Р О [6]. При этом условии из (2)-(4) с учетом того, что если Р Т = 1- Р О , то Ф( Z 1) = Ф( Z 2) и, следовательно, - Z 1 = Z 2, следует, что:
h 0 = ( I sm 1 2) F ;
i 4f
Z 2 =- 0.35 s , ° ш
где Ism — амплитуда наименьшего идентифицируемого пика.
Таким образом, чтобы оценить Р О по заданным значениям порога h 0 и отношения сигнал/шум I s / ош в соответствии с (2)-(4) или выбрать уровень порога по заданным значениям Р О и Ism в соответствии с (5), необходимо воспользоваться выражениями суммы F для каждой из приведенных в таблице аппроксимаций пика. Покажем получение выписанных в таблице выражений и использование методики.
ИСПОЛЬЗОВАНИЕ МЕТОДИКИ
Вычисление суммы F проведем для несимметричной трапецеидальной аппроксимации, т. к. соответствующим заданием значений параметров а , в , i 0, i । могут быть получены все остальные. Например, при а = в = 3 получается равнобокая трапеция; при i о = 0, i 1 = к — прямоугольник и т. д. Итак, сумма равна
i = 0 ^ k ) i = i 1 + 1 ^ k )
- i0 + 1 =
a v i 2 + в к 2 y к 2
к - i - 1
У i2 + ii - i0 + 1
i = 0
Далее, учитывая, что i 0 = к / а , i 1 = к - к / в , и используя формулу для суммы квадратов, получаем
6 к
2 к ( 1
Полученные соотношения позволяют записать формулу для вычисления Z 1 , Z 2 , h 0 в соответствии с (3)-(5) для всех рассматриваемых аппроксимаций пиков.
В частном случае, когда а = в = 3, получим F = = 5 к /9 + 1/ к , что отличается от приведенного в [6] соотношения на значение второго слагаемого. Таким образом, формула (7) позволяет более точно вычислить значения Z 1, Z 2, h 0, что особенно существенно при небольшом количестве используемых отсчетов к .
Для проведения сравнительного анализа эффективности рассматриваемых аппроксимаций достаточно проанализировать значения Z 2 , вычисленные в соответствии с (6), поскольку Ф( Z ) — монотонно возрастающая функция. Полученные результаты показывают, что величина Z 2 для всех аппроксимаций форм пиков одинаково зависит от отношения сигнал/шум. Следовательно, для проведения сравнительного анализа достаточно исследовать выражения, приведенные в таблице, в зависимости от значений параметров а , в , к .
Полученная классификация моделей полезного сигнала позволяет проводить выбор наилучшей с точки зрения вероятности правильного обнаружения аппроксимации в каждом конкретном случае в зависимости от значений параметров а , в , к . Например, при а = 1.7, в = 2.43, к = 20, что имеет место в автоматизированном комплексе [3], прямоугольная аппроксимация лучше несимметричной трапецеидальной и лучше несимметричной треугольной.