Эффективность ранней диагностики рака легкого по составу выдыхаемого воздуха на основе нейросетевого и мультимодального подхода

Автор: Обходский А.В., Обходская Е.В., Лаконкин В.С., Родионов Е.О., Кульбакин Д.Е., Подолько Д.В., Сачков В.И., Чернов В.И., Чойнзонов Е.Л.

Журнал: Сибирский онкологический журнал @siboncoj

Рубрика: Клинические исследования

Статья в выпуске: 6 т.24, 2025 года.

Бесплатный доступ

Введение. Пятилетняя выживаемость больных раком легких (РЛ) составляет 22 %. Успешный исход борьбы с этим заболеванием во многом зависит от его выявления на ранних стадиях. Развитие РЛ определяется факторами риска: курением, профессиональными экспозициями, инфекциями, генетической предрасположенностью, наличием хронических заболеваний и др. Принятие во внимание факторов риска позволит повысить эффективность автоматизированных газоаналитических комплексов диагностики РЛ по выдыхаемому воздуху. Такие комплексы являются перспективными для применения масштабируемых алгоритмов нейросетевой обработки данных для неинвазивной диагностики РЛ на ранних стадиях. Цель исследования – оценка эффективности метода диагностики рака легкого по выдыхаемому воздуху на основе данных от 100 добровольцев и улучшение его характеристик путем применения мультимодального подхода, учитывающего состав выдыхаемого воздуха и факторы риска заболевания. Материал и методы. В базу данных, наряду с пробами выдыхаемого воздуха, включались данные анамнеза. Для обработки данных применялись нейронные сети с вариацией архитектур, обеспечивающие улучшение показателей эффективности диагностики. Набор данных для обучения нейросестевых классификаторов включал пробы выдыхаемого воздуха от 100 добровольцев, из них 47 здоровых лиц по данным диспансеризации и 53 пациента с морфологически подтвержденным РЛ. В качестве факторов риска заболевания анализировались возраст, факт курения и наличие хронической обструктивной болезни легких (ХОБЛ). Результаты. Интеграция данных, включающих состав выдыхаемого воздуха и факторы риска РЛ, при обработке единой нейронной сетью приводит к увеличению ее первоначальной мономодальной архитектуры на 3 %. Учет сравнительно небольшого количества факторов риска, таких как возраст, пол, курение и наличие ХОБЛ, позволяет повысить чувствительность классификатора на 1,89 %, специфичность – на 6,39 %. Лучшие показатели обобщающей способности нейросетевого классификатора достигаются при двухпоточной гибридной модели с нормализацией. Заключение. Учет данных анамнеза, таких как возраст, курение и наличие ХОБЛ, дополнительно к показателям состава выдыхаемого воздуха в едином нейросетевом классификаторе позволяет повысить точность диагностики рака легкого по выдыхаемому воздуху в среднем на 4 %. Этот эффект и расширение учитываемых факторов риска при диагностике рака легкого по выдыхаемому воздуху позволят повысить достоверность результатов скрининга.

Еще

Рак легких, неинвазивная диагностика, выдыхаемый воздух, факторы риска, мультимодальные данные, искусственная нейронная сеть, показатели эффективности

Короткий адрес: https://sciup.org/140313321

IDR: 140313321   |   УДК: 616.24-006.6-07   |   DOI: 10.21294/18144861-2025-24-6-7-18

Effectiveness of lung cancer early diagnosis by analysing exhaled breath composition using neural network and multimodal approach

Background. The five-year survival rate of lung cancer patients remains extremely low, with the average rate of 22 %. Early detection of this disease can improve survival rates and reduce mortality. Lung cancer development is influenced by various risk factors, with smoking being the most significant, followed by other factors like occupational exposure, infections, genetic predisposition, presence of chronic diseases, etc. Considering risk factors is crucial for improving the efficacy of automated gas analysis complexes for lung cancer diagnosis. These complexes are promising for the application of scalable neural network data processing algorithms for noninvasive diagnosis of early stage lung cancer. Purpose of the study: to evaluate the effectiveness of the multimodal lung cancer detection method by analyzing the exhaled breath composition from 100 volunteers using simultaneous assessment of the exhaled breath composition and risk factors. Material and Methods. Along with exhaled breath samples, the study database also recorded all volunteers’ medical history data. Neural networks with a variety of architectures were used for data processing. The dataset for training neural network classifiers included exhaled breath samples from 100 volunteers, including 47 from healthy subjects and 53 from patients with morphologically confirmed lung cancer. Data determining the age group, smoking status and the presence of chronic lung diseases were analyzed as risk factors for lung cancer. Results. The integration of data, including exhaled breath composition and lung cancer risk factors, into a single neural network results in a 3 % increase in its original monomodal architecture. Taking into account a relatively small number of risk factors, such as age, gender, smoking status and COPD, increases the classifier’s sensitivity by 1.89 % and specificity by 6.39 %. The best generalization performance of the neural network classifier is achieved with a two-stream hybrid model with normalization. Conclusion. By incorporating diverse patient history data, such as age, smoking history, and chronic diseases, in addition to exhaled air composition data, into a unified neural network classifier, the accuracy of the exhaled air method for lung cancer diagnosis can be increased by an average of 4 %. This improvement, coupled with the expanded range of risk factors considered in the future application of the exhaled air method for lung cancer diagnosis in medical practice, will improve the reliability of population screening results.

Еще