Методы обработки и исследование возможностей классификации масс-спектров выдыхаемых газов
Автор: Манойлов Владимир Владимирович, Кузьмин А.Г., Заруцкий И.В., Титов Ю.А., Самсонова Наталья Сергеевна
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Системный анализ приборов и измерительных методик
Статья в выпуске: 1 т.29, 2019 года.
Бесплатный доступ
Анализ состава выдыхаемого воздуха является одним из важных направлений неинвазивной медицины. В качестве примера использования данного метода в научном приборостроении рассматривается математическая обработка масс-спектров, полученных на квадрупольном масс-спектрометре МС7-200. Описываемые в работе методы обработки данных на основе линейного и квадратичного дискриминантного анализа позволяют разделить обрабатываемые масс-спектры выдыхаемых газов на две группы: масс-спектры выдыхаемых газов здоровых людей и масс-спектры выдыхаемых газов людей с возможными патологиями.
Математические методы обработки данных, масс-спектрометры, дискриминантный анализ
Короткий адрес: https://sciup.org/142218181
IDR: 142218181 | DOI: 10.18358/np-29-1-i106110
Текст научной статьи Методы обработки и исследование возможностей классификации масс-спектров выдыхаемых газов
Анализ состава выдыхаемого воздуха может использоваться в целях выявления заболеваний, предсказания реакции организма на конкретный вид лечения и мониторинга эффективности терапии. Диагностика на основе анализа выдыхаемых газов имеет ряд преимуществ по сравнению с традиционными лабораторными методами. Анализ газовой смеси безопасен для персонала, т.к. не связан с работой с химическими и биологическими жидкостями. Он является относительно дешевым, занимает немного времени и позволяет обнаруживать детектируемые вещества в минимальных концентрациях.
В качестве примера использования данного метода в аналитическом приборостроении рассматривается обработка масс-спектров, полученных на квадрупольном масс-спектрометре МС7-200 (рис. 1) с электронной ионизацией и прямым капиллярным вводом пробы при анализе наличия патологий у пациентов по спектрам выдыхаемых газов [1–5]. Забор выдыхаемого воздуха осуществлялся в специальные тестовые емкости, после чего производился анализ.
КРАТКАЯ ИНФОРМАЦИЯ О МАСС-СПЕКТРОМЕТРЕ МС7-200
Решаемые задачи:
-
• анализ состава выдыхаемого воздуха для здоровых и, возможно, больных людей,
-
• экологический анализ состава воздуха в населенных пунктах и на промышленных предприятиях,
-
• оценка состава газов в производственных процессах.
Описание работы прибора:
Анализируемый газ при давлении атмосферы через капиллярный ввод подается в камеру ионизации источника ионов с электронным ударом. Получившиеся ионы вводятся в масс-анализатор квадрупольного типа. Получившиеся в процессе регистрации масс-спектрометрические сигналы обрабатываются с помощью специализированного программного обеспечении и сравниваются со спектрами в библиотеке стандартных масс-спектров, затем проводится идентификация отдельных компонент спектра и определение их концентрации. Капиллярная система ввода пробы в масс-спектрометр позволяет проводить анализ на расстоянии до 5 м от прибора. Для анализа используется до 10 мл пробы в мин. При некоторых анализах проба нагревается. В вакуумной системе используется диффузионный или турбомолеку-лярный насос.
Основные технические параметры:
-
• диапазон регистрируемых масс:— от 2 до 300 а. е. м.,
-
• разрешение по массовым числам — 1,
-
• скорость регистрации — до 1 масс-спектра в с.
Области применения прибора:
-
• медицина — анализ состава выдыхаемых газов и процессов их изменения при дыхании, диагностика патологий по наличию компонент метаболизма в выдыхаемых пробах, санитарноэпидемиологический мониторинг;
-
• экология — оценка загрязнений в окружающем воздухе;
-
• промышленность — анализ выбросов в технологических процессах вредных веществ, таких как толуол, бензол, стирол и пр.
Рис. 1. Масс-спектрометр МС7-200
ОБРАБОТКА ДАННЫХ
При проведении массовых скрининговых профилактических осмотров с использованием масс-спектрометра МС7-200 актуальной представляется задача автоматической классификации людей по группам здоровья. В данной работе для такой классификации людей использованы методы линейного и квадратичного дискриминантного анализа масс-спектров выдыхаемых газов. Непосредственно перед классификацией в дискриминантном анализе необходимо сначала провести вычисление дискриминационных коэффициентов с помощью обучающей выборки. Обучающая выборка состоит из двух групп: первая группа — это масс-спектры выдыхаемых газов здоровых людей и вторая группа — это масс-спектры людей, имеющих патологии. После того как проведено обучение, приступают непосредственно к классификации.
Дискриминантными признаками для классификации служат значения амплитуд на определенных массах линейчатого масс-спектра (массы: 53 — изопрен, 58 — ацетон, 60 — уксус, 67 и 68 — изопрен), а также два отношения амплитуд пиков. Первым отношением является отношение амплитуды пика на массе 58 к амплитуде пика на массе 60. Вторым отношением является отношение амплитуды пика на массе 67 к амплитуде пика на массе 58.
Первым этапом обработки масс-спектров является обнаружение пиков и превращение непрерывного спектра в линейчатый. Для их обнаруже- ния используется метод поиска на основе согласованной фильтрации [6]. В этом методе используется свертка исходного сигнала с сигналом, описывающим форму пика. Свертка вычисляется следующим образом:
T
* i ( t ) = J f u ( t ) g(t - T )d T , (1)
где t — независимая переменная, время, f out ( t ) — зарегистрированный масс-спектр, g ( t ) — форма пика, T — длина масс-спектра.
В качестве формы пика в данной работе использовались две функции: первая — на основе гауссианы g(t) = exp I -(t[w)2 I, где w — средняя полуширина пика в масс-спектре, и вторая — на основе функции Эрмита ^(x) =
e
t 2
H n ( t ), ! π
n - 1 2
где H n ( t ) = ( - 1) n e t 2-d e n-
— полином Эрмита по-
рядка n . В данной работе n = 2.
В результате такой конволюции амплитуды пиков возрастают примерно в 20–25 раз, а среднее квадратичное отклонение шума примерно в 3– 5 раз для гауссовых функций и 10–15 раз для функций Эрмита. Функции Эрмита дают пре- имущество в повышении разрешения плохо разделенных пиков по сравнению функциями Гаусса.

Рис. 2. Эталонный масс-спектр
Процедура свертки позволяет надежно обнаружить пики спектра и определить их положение. При вычислении интеграла (1) используется теорема Планшереля, согласно которой преобразование фурье-свертки двух сигналов равно произведению их фурье-образов. После этого сигнал s 1 ( t ) вычисляется с помощью обратного преобразования Фурье.
Применение прямого и обратного преобразования Фурье использовано в данной работе, т.к. вычисление интеграла свертки по формуле (1) требует гораздо большего объема вычислений, чем выполнение прямого и обратного преобразований Фурье с помощью алгоритмов быстрого преобразования. Полученный сигнал s 1 ( t ) сравнивается с порогом h 0 , с помощью которого обнаруживаются пики и определяются их положения. Если величина s 1 ( t ) превышает порог h 0 , то эту точку t считаем принадлежащей пику.
Следующим шагом обработки является отбор масс-спектров здоровых людей для их включения в обучающую выборку. Необходимость выполнения этого шага объясняется тем, что даже в масс-спектрах практически здоровых людей могут содержаться спектральные линии с амплитудами, характерными для масс-спектров больных людей. Выполнение этого шага осуществляется путем вы- явления масс-спектров, содержащих наименьшее отклонение от эталонного масс-спектра, т.е. усредненного масс-спектра здоровых людей. На рис. 2 представлен эталонный масс-спектр. Наименьшее отклонение от эталонного масс-спектра вычислялось по следующим алгоритмам: евклидово расстояние (N2), "сити-блок" — сумма модулей разности амплитуд по каждой массе (N1), максимальная разность компонент. На основании проведенных вычислений была составлена обучающая выборка масс-спектров.
Результатом проведения обучения является набор коэффициентов дискриминантной функции, которые вычисляются по одному из алгоритмов многомерной статистики, рассмотренных в [6]. В качестве переменных в алгоритмах многомерной статистики использовались не исходные значения амплитуд пиков на определенных массах, а главные компоненты, полученные путем преобразования исходных данных по методу главных компонент (Principal Component Analisys — PCA).
С помощью вычисленных коэффициентов дискриминационных функций находятся границы, которые разделяют исходные масс-спектры выдыхаемых газов на группы: здоровых людей и людей с патологиями. На рис. 3 показаны результаты проведения дискриминантного анализа соответственно для линейного (рис. 3, а) и квадратичного методов (рис. 3, б).


Рис. 3. Результат дискримнантного анализа.
По горизонтальной оси — значения переменных по первой главной компоненте, по вертикальной оси — значения переменных по второй компоненте.
а — результат линейного дискриминантного анализа, б — результат квадратичного дискриминантного анализа
ЗАКЛЮЧЕНИЕ
Рассмотренные алгоритмы дают возможность автоматического принятия решений о различии масс-спектров без визуального анализа информации, представленной в графическом виде, и имеют следующие преимущества: простота реализации, возможность автоматического принятия решения о принадлежности проверяемого сигнала к определенному классу.
Работа выполнена в ИАП РАН в рамках государственного задания № АААА-А16-116041310010-6.
Список литературы Методы обработки и исследование возможностей классификации масс-спектров выдыхаемых газов
- Кузьмин А.Г., Ткаченко Е.И., Орешко Л.С., Титов Ю.А. Перспективы метода масс-спектрометрической аромадиагностики по составу выдыхаемого воздуха//Тезисы докладов X Евразийской научной конференции "ДОНОЗОЛОГИЯ-2014", 18-19 декабря 2014 г., СПб., 2014. С. 229-231
- Патент РФ № 94763, 27.05.2010.
- Кузьмин А.Г., Титов Ю.А. Малогабаритные масс-спектрометры для динамических исследований состава выдыхаемого воздуха//Труды I Международной научно-практической конференции "Высокие технологии, фундаментальные и прикладные исследования в физиологии и медицине". Ч. 3. СПб., 23-26 ноября 2010 г. Изд-во СПбГПУ, 2010. С. 266-270.
- Кузьмин А.Г., Ткаченко Е.И., Орешко Л.С., Титов Ю.А., Балабанов А.С. Метод масс-спектрометрической экспресс-диагностики по составу выдыхаемого воздуха//Медицинский академический журнал. 2016. Т. 16, № 4. С. 106-107.
- Kuzmin A.G., Tkachenko E.I., Oreshko L.S., Titov Yu.A., Balabanov A.S. The method of medical instant diagnostics based on real-time mass-spectrometric analysis of exhaled air composition//3rd ICMM PAN-ASIA PACIFIC CONGRESS ON MILITARY MEDICINE. Abstracts. 08.08.2016-12.08.2016. St.-Petersburg. Р. 181-182.
- Манойлов В.В., Титов Ю.А., Кузьмин А.Г., Заруцкий И.В. Методы обработки и классификации масс-спектров выдыхаемых газов с использованием дискриминантного анализа//Научное приборостроение. 2016. Т. 26, № 3. C. 50-57. URL: http://iairas.ru/mag/2016/full3/Art7.pdf.