Инвариантная статистика в масс-спектрометрии
Автор: Леонов И.Е., Трифанов В.Н., Шубин В.М., Нестеров М.М.
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Исследования, приборы, модели и методы анализа
Статья в выпуске: 1 т.18, 2008 года.
Бесплатный доступ
В работе рассматриваются времяпролетные и квадрупольные масс-спектрографы. В первом случае измеряется интенсивность излучения, воспринимаемая детектором, как функция времени пролета частиц. Во втором случае измеряется интенсивность как функция напряженности магнитного поля. Обработку этих функций предлагается осуществлять методом инвариантной статистики. Этот метод позволяет получать статистический резонансный спектр интенсивностей как функций параметров порядка и вероятности возбуждения этих резонансов. Линии статистического спектра должны фиксировать частицы определенной массы. Вероятности возбуждения этих линий определяют относительные количества частиц наблюдаемых масс.
Короткий адрес: https://sciup.org/14264527
IDR: 14264527
Текст научной статьи Инвариантная статистика в масс-спектрометрии
Будем рассматривать времяпролетные и квадрупольные масс-спектрографы. Интенсивность регистрируемого детектором излучения есть функция времени пролета частиц — в первом случае. Во втором случае измеряется интенсивность как функция напряженности магнитного поля.
К обработке этих функций предлагается применить метод инвариантной статистики В.Н. Трифанова. Этот метод позволяет получать статистический резонансный спектр интенсивностей как функций параметров порядка (времени пролета, напряженности магнитного поля) и вероятности возбуждения этих резонансов. Линии статистического спектра должны фиксировать частицы определенной массы. Вероятности возбуждения этих линий определяют относительные количества частиц наблюдаемых масс.
В основе такой статистики лежат инварианты. Они не зависят от числа независимых событий в наблюдаемой совокупности. Такие инварианты позволяют найти резонансы параметров порядка и вероятности их возбуждения. Более того, возможна стратификация наблюдаемого резонансного спектра. Эта процедура открыта, она является синтезом эвристики и технологии. Конкретные образцы масс-спектрометрических данных дают возможность применять разные эвристические варианты их обработки по технологиям инвариантной статистики. Это должно позволить обнаруживать слабо проявленные зубцы и давать им соответствующую интерпретацию. Далее для каждой страты первого уровня можно построить стратификацию второго уровня. Такая процедура повторяется до тех пор, пока не исчезает асимметрия в резонансных спектрах, т. е. пока спектры не станут дискретно равномерными с максимальной энтропией и нулевой информацией. Такое иерархическое раскрытие резонансного спектра назовем ультраметрическим [1]. В отличие от фрактальной иерархии, в которой соблюдается принцип подобия распределений на всех уровнях, в ульт-раметрической иерархии этот принцип подобия нарушается. Каждый уровень обладает своим неповторимым резонансным спектром.
ТЕХНОЛОГИЯ ИНВАРИАНТНОЙ СТАТИСТИКИ
Прежде чем изложить технологию инвариантной статистики [2], договоримся, что состояние процесса характеризуется параметром порядка, а вероятность его реализации характеризуется интенсивностью процесса в этом состоянии. При этом допущении изложим технологию инвариантной статистики.
Состояния системы, наблюдаемые в процессе опыта, группируются вокруг отдельных точек с состояниями x k , k = 1, 2, …, N . Это означает, что практически вся информация о состояниях системы находится в области этих узловых точек. Континуальная система замещается алгебраической с дискретным множеством состояний x k с их вероятностями p k .
Статистические моменты состояний вплоть до момента требуемого порядка в системе замещенных точек образуют замкнутую систему, что позволяет получить однозначный закон распределения резонансных состояний. Число и значение замещающих точек, а также вероятности их возбуждения, подлежат определению по наблюдаемой выборке масс-спектрограммы.
Рассмотрим эту технологию подробнее. Пусть x — неделимое состояние-событие, а совокупность n таких событий обозначим
n xn =Е x •
Если неделимые события однородны, то такая сумма будет равна xn - nx,
-
а ее среднее значение
x n - nx .
Отклонения от средних равны xn = xn - xn, x = x - x •
В силу центрирования событий средние значения отклонений равны нулю:
xn -< xn - xn >- 0, x -< x — x >- 0.
Однако дисперсии и более высокие центральные моменты, как правило, не равные нулю, характеризуются нестабильностью и зависят от числа неделимых событий в совокупности. Поэтому для статистического анализа они мало информативны, поскольку информация об организации наблюдаемых событий (их внутренней связности) скрывается этой нестабильностью. В противоположность им статистические инварианты стабильны и информативны. Именно они проявляют внутреннюю организацию наблюдаемых событий.
Первый (диссипативный) инвариант ( G ), отражающий по существу основную идею инвариантной статистики, определяет масштаб флуктуаций неделимого события и равен отношению дисперсии к среднему значению наблюдаемого события:
G - x 2 / x n - x 2 / x •
Этот инвариант одинаков как для совокупности событий, так и для их неделимой части. Он стабилен и несет информацию о флуктуациях наблюдаемых событий. Для каждой выборки инвариант свой.
Кроме этого инварианта существует счетное множество инвариантов более высоких порядков. Все они также стабильны и информативны. Чем точнее требуется отображать организованность событий, тем больше таких инвариантов требуется привлекать к анализу наблюдаемых процессов. Такие инварианты можно получить, используя разложение моментов высоких порядков по степеням дисперсии наблюдаемых событий.
Формульная запись инвариантов применительно к моментам до шестого порядка включительно имеет вид:
-
а) по наблюдаемой совокупности событий:
G = D n / x n , D n = x n 2 (центрировано),
J, - x3-1D n xn
J 2 D J Dn ,
n
J 3 - xD - 10 J 1 D n ’
n
J 4 - -n- - (15 J 2 + 10 J 2 ) D n - 15 D 2;
Dn
-
б) для неделимых событий:
G - D / x , D - x 2 (центрировано),
J - x 3
-
1 D ,
J2 - -— 3 D,
2 D
J 10 JD , 3 D 1
J4 --D— (15J2 +10J2)D-15D2, где xn, x — совокупность событий и их неделимая часть; Dn, D — их дисперсии.
Построенные инварианты позволяют определить искомые резонансные спектры неделимых и наблюдаемых событий. Можно получить диадные и триадные спектры неделимых событий. Диадные спектры имеют два резонанса x 1 , x 2 ( x 1 < x 2 ). Три-адные спектры имеют три резонанса x 1 , x 3 , x 2 ( x 1 < < x 3 < x 2 ). Эти спектры имеют наименьшую информационную избыточность.
По теореме Колмогорова система с нулевой избыточностью имеет размерность 2 < e = 2.718 < 3. Коль скоро триада ближе к (e), то рассмотрим три-адную технологию более подробно.
Исследуем два альтернативных случая:
-
- в первом среднее значение x 3 наблюдаемо, т. е. ( x 3 - x ), и отклонение от него
x 3 -< x 3 - x >- 0 ;
-
- во втором — среднее значение не наблюдаемо, когда x 3 Ф x , и отклонение от него не равно нулю
x 3 -< x 3 - x >Ф 0.
При этом для обоих случаев размах резонансов равен
S - x 2 - x 1 .
Случай первый
Функциональное уравнение таково:
xmx(x2 -S,x + S2) = 0, xe (Xj,0,x2), для которого
S 1 = x 3 / x 2 = x 3 / D = J 1 , S 2 = J 2 - J 12 + 3 D .
При m = 2 функциональное уравнение приобретает вид x5 - S, x4 + S 2 x3 = 0, решая которое получаем резонансы x1 = (J1 - 712 D + 4 J2 - 3 JI) / 2, x2 = (J1 + 712 D + 4 J2 - 3 J12) / 2.
При этом размах резонансов ( S = x 2 - x i ) удовлетворяет условию
S 2 = 12 D + 4 J 2 - 3 J 12 .
Дисперсия неделимого события для x 5 равна
D = 0; D = (2 J 1 J 2 - J 3 - J 13 ) /(4 J 1 ).
Число неделимых событий в наблюдаемой совокупности равно n=Dn /D, где Dn — дисперсия наблюдаемой совокупности событий. Однако если размах наблюдаемой совокупности неизвестен, то число неделимых событий в этой совокупности определяется так n = Sn2 /(6Dn + 736Dn2 + Sn2(4J2 -3J12)).
При m = 3 функциональное уравнение имеет вид x6 - S1 x5 + S2 x4 = 0.
Решая его, получаем:
I (3 J 2 + J 12 ) 2 ( J 4 - J 1 J 3 + J 2 ( J 2 - J 12 )) +4.
N 16 6
В обоих случаях выбирается то D , которое лучшим образом удовлетворяет условию
0 < D < D n .
После определения D находим число событий в наблюдаемой совокупности n = D n / D .
Вероятность возбуждения резонансов неделимого события выражается так:
( x = x 1 ), p 1 = - D/ ( x 1 S ),
( x = 0), p = p 3 = ( D + x 1 x 2 )/( x 1 x 2 ),
( x = x 2), p 2 = D /( x 2 S ), S = x 2 - x 1 .
Любое ( n ) разбиваем на триаду ( n = n 1 + n 3 + n 2), число таких триад равно
N _ ( n + 1)( n + 2) , 2 ;
для каждой триады наблюдается резонансная смесь x = n 1 x 1 + n3x3 + n2x2 = n 1 x 1 + n2x2, x3 = 0.
Вероятность возбуждения такой смеси равна n!
p = , , p 1p 33 p 22 • n1! n 3! n 2!
Случай второй
В принятых обозначениях получаем необходимое количество функциональных уравнений:
x3 - S1 x2 + S 2 x - S3 = 0 , x4 - S1 x3 + S2 x2 - S3 x = 0, x5 - S1 x4 + S2 x3 - S3 x2 = 0, x6 - S1 x5 + S2 x4 - S3 x3 = 0.
Из первых двух уравнений находим
V - г3 - V т2 - V - т4 / т2 - V т3 / т2
S 3 = x S 1 x , S 2 = x / x S 1 x / x .
Включая два последних уравнения, получаем:
D 3 - A 1 D 2 + A 2 D - A 3 = 0,
A 1 = 2( J 12 - J 2),
2( J 4 - J 2 2 ) + 9( J 2 2 - J 4 ) - 12 J 1 ( J 1 J 2 - J 3)
A 2 =
-
а) D < 0, в этом случае задается n и определяется D = Dn / n ;
-
б) D > Dn , в этом случае принимается D = D n , n = 1.
Вероятности резонансов неделимого события:
( x = x 1 ), p 1 = ( D + x 2 x 3 ) / (( x 1 - x 2 )( x 1 — x 3 )),
( x = x 3 ), p 3 = ( D + x 1 x 2 ) / (( x 3 - x 1 )( x 3 - x 2 )),
( x = x 2 ), p 2 = ( D + x 1 x 3 ) / (( x 2 - x 1 )( x 2 - x 3 )).
Число оболочек резонансов наблюдаемых событий равно n = D n / D. Это число разбивается на триаду ( n = n 1 + n 3 + n 2), число таких триад равно
( n + 1)( n + 2)
.
Весь спектр наблюдаемых событий определяется числом таких разбиений в виде смесей x = n 1 x 1 + n 3x3 + n 2x2 = n 1 x 1 + n 2x 2, x3=0.
Вероятности возбуждения каждой такой смеси равны n!
Р = , , Р 1 ' P 33 P 22 .
n 1 ! n 3! n 2!
Таким образом, задача определения резонансного спектра и вероятности возбуждения решена.
Отметим, что резонансные спектры масс-спектрометрии выделяют наиболее вероятные точки сгущения частиц соответствующих масс. Однако наблюдаемые масс-спектрограммы континуальны и, как правило, многомодальны. В этом случае необходимо искать область притяжения каждой резонансной точки сгущения. Это проблема стратификации масс-спектрограмм. Решим ее.
СТРАТИФИКАЦИИ МАСС-СПЕКТРОГРАММ
Рассмотрим два ближайших резонанса наблюдаемой смеси ( x k , x k +1). Каждый из этих резонансов является резонансным центром (точкой сгущения) своей страты ( S k , S k +1), в пределах каждой из которых случайно флуктуируют резонансы простых событий x = ( x 1 , x 3, x 2) с вероятностями p = (р 1 , p 3, p 2). Эти флуктуации создают конусы рассеяния резонансов в пределах своих страт. Это рассеяние в одну сторону характеризуется резонансом x 1 , а в другую сторону резонансом x 2. Граница между стратами определяется точкой пересечения конусов рассеяния соседних страт (обозначим ее S k ). В результате встречной диссипации резонансов соседних страт получаем S k = x k + nx 2 = x k +1 - nx 1 . Из этого выражения находим параметр n и, подставляя его значение в исходное уравнение, находим
S k = ( x 2 x k +1 - x 1 x k ) / S , S = x 2 - x 1 .
Следует отметить фундаментальную особенность этого выражения. В нем внутренние граничные условия ( x 1 , x 2) согласованно сочетаются с внешними граничными условиями, проявленными в наблюдаемых резонансов смесей ( x k , x k +1). Еще отметим, что равномерное распределение получится при условии ( x 2 = - x i ), тогда S k = ( x k +1 + x k )/2. Как правило, такая ситуация возникает в статистически равномерных системах с максимальной энтропией. Но в реальных системах, обычно статистически неравномерных, такие случаи практически не встречаются в силу их неинформативно-сти.
Задача поиска резонансных точек сгущения в масс-спектрограммах для частиц с соответствующими массами требует информации. Такая информация присутствует в несимметричных неравновесных системах. Если нет информации, то и нет частиц с наблюдаемыми массами. Поэтому неравномерность распределения является хорошим критерием иерархического поиска частиц в ульт-раметрических структурах.
Но рассмотренная ситуация для стратификации масс-спектрограмм не единственная. В общем случае между любыми двумя состояниями можно найти равновесную границу по изложенной выше схеме. При таком подходе возникает возможность классификации потока частиц на отдельные классы с установленными границами между этими классами.