Методика оценки эффективности моделей и обнаружения масс-спектрометрических пиков

Автор: Наумов В.В., Гребенщиков О.А.

Журнал: Научное приборостроение @nauchnoe-priborostroenie

Рубрика: Исследования, приборы, модели и методы анализа

Статья в выпуске: 2 т.17, 2007 года.

Бесплатный доступ

В статье приведены результаты экспериментальных исследований выходных сигналов квадрупольного масс-спектрометра на базе автоматизированного комплекса, содержащего квадрупольный масс-спектрометр МХ-7306. Разработаны методика оценки эффективности моделей сигналов и оптимальный вариант корреляционного алгоритма сглаживания, обнаружения и идентификации масс-спектрометрических пиков; приведены аналитические выражения эффективности моделей пиков для различных аппроксимаций. Методика позволяет проводить выбор наилучшей с точки зрения вероятности правильного обнаружения аппроксимации масс-спектрометрического пика в каждом конкретном случае.

Еще

Короткий адрес: https://sciup.org/14264488

IDR: 14264488

Текст научной статьи Методика оценки эффективности моделей и обнаружения масс-спектрометрических пиков

Одной из особенностей масс-спектрометрических анализаторов состава и свойств веществ является необходимость проведения достаточно сложной обработки выходного сигнала детектора для получения конечных результатов, которая в настоящее время проводится цифровыми методами. Для успешного решения задач обработки необходимо оценить эффективность моделей масс-спектрометрических пиков, найти оптимальные с точки зрения минимизации погрешностей и вероятности правильного обнаружения пиков алгоритмы обработки. В связи с этим представляют интерес исследования характеристик выходных сигналов серийных масс-спектрометров типов МХ-7304А, МХ-7306 и алгоритмов автоматизации их обработки, которые проводились с использованием автоматизированных комплексов, описанных в работах [1-3].

МЕТОДИКА ОЦЕНКИ ЭФФЕКТИВНОСТИ МОДЕЛЕЙ ПИКОВ

Авторы рассматривали шесть аппроксимаций форм пиков, аналитические выражения и графические представления которых сведены в таблицу.

Если в качестве основного критерия при выборе параметров корреляционного алгоритма использовать наименьшие значения амплитуд пиков, которые достоверно идентифицируются на фоне шума, то, ограничиваясь анализом задачи обнаружения в случае аддитивной смеси детерминированного сигнала и белого шума, алгоритм может быть записан в виде [4]:

k

5 = S( I - 1 Ф ) f ( t"1 0 ) * h 0 ,            (1)

i = 1

где к — ширина окна функции свертки, I. — регистрируемые отсчеты, 1 ф — интенсивность фона, f — точки модели пика, h 0 — заданный порог.

Рассмотрим разработанный согласно этой формуле вариант корреляционного алгоритма сглаживания и обнаружения масс-спектрометрических пиков [3]. Уровень порога h 0 задается величиной, большей ( 1 ф + 2^СКО) к /2, где, СКО — среднеквадратическое отклонение интенсивности фона. Алгоритм производит идентификацию пика, оценку его положения и максимального амплитудного значения, по которым производятся вычисление значений номера а.е.м. [1] и оценка интенсивности спектральных линий [5].

Для проведения анализа эффективности обнаружения пика рассмотрим аппроксимации формы пиков в виде, приведенном в таблице. В качестве критерия эффективности аппроксимаций можно воспользоваться значениями вероятностей правильного обнаружения пиков Р О и ложной тревоги Р Т, которые определяются по формулам [6]

Р о = 0.5 (1 - Ф( Z 2 )), Р т = 0.5 (1 - Ф( Z 1 )), (2)

где Ф( Z i, 2) — функция ошибок. Значения Z i , Z 2 в зависимости от амплитуды (интенсивности) пика масс-спектрометрического сигнала и СКО шума о ш определяются в соответствии со следующими выражениями [5]:

Z 1 =

h 0

ш

Z 2 = Z 1 — I^'F ,           (4)

с ш 2

k где F = ^ f2; I5 — амплитуда идентифицируе-i=0

мого пика; f = ft . - 1 0) = fi •At - 1 0); At — период

дискретизации сигнала.

Аппроксимации формы и параметры моделей пиков

Графическое представление

Аналитическое выражение

Параметры формы пиков

F = Σ f i 2

1

α

0 i

0

β

1 k

f =

a ,    0 i L

k               °

1,            i о i i

в -— ,   i . <  i k

I k

α β , i 0 i 1 ,

α >0, β >0,

i 0 ≠ 0, i 1 k

, a + в 2 k ( 1   1 )

k +--—---+ —

6 k    3 a в

V         V

2

α

0 i

0

α

1 k

f =■

a k ,     0 i i о

1,            i 0 i 1

a -—- ,   i, i k

k

α = β , i 0 i 1 ,

α >0, β >0,

i 0 ≠ 0, i 1 k

, a 4 k k +---

3 k 3 a

3

0

k

f = 1, 0 < i < k

i 0 = 0,    i 1 = k

k

4

α

0          i

β

0      k

f =■

a k ,     0 i i 0

1,             i = i 0

в -—i- ,   i i k

I k 1

α β , i 0 = i 1 ,

α >0, β >0,

i 0 ≠ 0, i 1 k

k a + в 3 6 k

5

α

0          i 0

α

k

f ■■

a— ,     0 i in

k    .  /

1,            i 0 i - 1

a - —-,   i i k

k

α = β , i 0 = i 1 ,

α >0, β >0,

i 0 ≠ 0, i 1 k

k a

--1--

33 k

6

α

0

с

f = - , 0 < i < k ik

i 0 = i 1 = k

k 11

11

36 k 2

В тех случаях, когда трудно принять решение о соотношении удельных весов ошибок ложного обнаружения и пропуска пика, можно считать их равноценными и оценивать эффективность аппроксимации только вероятностью правильного обнаружения Р О [6]. При этом условии из (2)-(4) с учетом того, что если Р Т = 1- Р О , то Ф( Z 1) = Ф( Z 2) и, следовательно, - Z 1 = Z 2, следует, что:

h 0 = ( I sm 1 2) F ;

i 4f

Z 2 =- 0.35 s , ° ш

где Ism — амплитуда наименьшего идентифицируемого пика.

Таким образом, чтобы оценить Р О по заданным значениям порога h 0 и отношения сигнал/шум I s / ош в соответствии с (2)-(4) или выбрать уровень порога по заданным значениям Р О и Ism в соответствии с (5), необходимо воспользоваться выражениями суммы F для каждой из приведенных в таблице аппроксимаций пика. Покажем получение выписанных в таблице выражений и использование методики.

ИСПОЛЬЗОВАНИЕ МЕТОДИКИ

Вычисление суммы F проведем для несимметричной трапецеидальной аппроксимации, т. к. соответствующим заданием значений параметров а , в , i 0, i могут быть получены все остальные. Например, при а = в = 3 получается равнобокая трапеция; при i о = 0, i 1 = к — прямоугольник и т. д. Итак, сумма равна

i = 0 ^ k ) i = i 1 + 1 ^      k )

- i0 + 1 =

a v i 2 + в к 2 y к 2

к - i - 1

У i2 + ii - i0 + 1

i = 0

Далее, учитывая, что i 0 = к / а , i 1 = к - к / в , и используя формулу для суммы квадратов, получаем

6 к

2 к ( 1

Полученные соотношения позволяют записать формулу для вычисления Z 1 , Z 2 , h 0 в соответствии с (3)-(5) для всех рассматриваемых аппроксимаций пиков.

В частном случае, когда а = в = 3, получим F = = 5 к /9 + 1/ к , что отличается от приведенного в [6] соотношения на значение второго слагаемого. Таким образом, формула (7) позволяет более точно вычислить значения Z 1, Z 2, h 0, что особенно существенно при небольшом количестве используемых отсчетов к .

Для проведения сравнительного анализа эффективности рассматриваемых аппроксимаций достаточно проанализировать значения Z 2 , вычисленные в соответствии с (6), поскольку Ф( Z ) — монотонно возрастающая функция. Полученные результаты показывают, что величина Z 2 для всех аппроксимаций форм пиков одинаково зависит от отношения сигнал/шум. Следовательно, для проведения сравнительного анализа достаточно исследовать выражения, приведенные в таблице, в зависимости от значений параметров а , в , к .

Полученная классификация моделей полезного сигнала позволяет проводить выбор наилучшей с точки зрения вероятности правильного обнаружения аппроксимации в каждом конкретном случае в зависимости от значений параметров а , в , к . Например, при а = 1.7, в = 2.43, к = 20, что имеет место в автоматизированном комплексе [3], прямоугольная аппроксимация лучше несимметричной трапецеидальной и лучше несимметричной треугольной.

Статья научная