Модель прогнозирования 90-дневной послеоперационной летальности в хирургии рака пищевода на базе технологии машинного обучения

Салимзянов К.И.; Рябов А.Б.; Хомяков В.М.; Колобаев И.В.; Смоленов Е.И.; Салимзянов Б.И.; Salimzyanov K.I.; Ryabov A.B.; Khomyakov V.M.; Kolobaev I.V.; Smolenov E.I.; Salimzyanov B.I.

doi:10.21294/1814-4861-2026-25-2-35-45

Научные статьи \ Прикладные науки. Медицина. Технология \ Mедицинские науки \ Патология. Клиническая медицина \ Заболевания пищеварительной системы. Болезнь пищеварительного тракта

Модель прогнозирования 90-дневной послеоперационной летальности в хирургии рака пищевода на базе технологии машинного обучения

Автор: Салимзянов К.И., Рябов А.Б., Хомяков В.М., Колобаев И.В., Смоленов Е.И., Салимзянов Б.И.

Журнал: Сибирский онкологический журнал @siboncoj

Рубрика: Клинические исследования

Статья в выпуске: 2 т.25, 2026 года.

Бесплатный доступ

Цель исследования – разработка модели предоперационного прогнозирования 90-дневной летальности для оптимизации выбора тактики лечения у пациентов c резектабельным раком пищевода и кардиоэзофагеального перехода (Siewert 1). Материал и методы. Проведено ретроспективное когортное исследование 225 пациентов с резектабельным раком пищевода (n=179) и кардиоэзофагеального перехода Siewert I (n=46). Проведен анализ 79 предоперационных показателей. Отбор факторов риска выполняли на основании однои многомерной логистической регрессии. Выборка случайным образом была разделена на основную и контрольную группы (70/30). Разработка прогностической шкалы осуществлялась с использованием модели множественной логистической регрессии с L1-регуляризацией и нейросети TabNet, реализующей полосвязную архитектуру с механизмом внимания и позволяющей получать оценки важности отдельных признаков. Дискриминационная способность и калибровка модели оценивались по AUC-ROC и тесту Хосмера–Лемешова. Результаты. Госпитальная летальность составила 8,9 % (n=20), 30-дневная летальность – 1,3 % (n=3), 90-дневная летальность – 6,2 % (n=14). Наиболее значимыми предикторами летального исхода явились такие факторы, как снижение массы тела более 10 % до операции, 3–4 степень дисфагии, ECOG статус ≥2, ХОБЛ, одышка до операции, обширные торакальные операции в анамнезе, N2 по классификации TNM, тесное прилежание опухоли или ее инвазия в трахею/главные бронхи, цереброваскулярные заболевания в анамнезе, сахарный диабет, осложнения в процессе или после лучевой терапии. При оценке дискриминационной способности модели логистической регрессии AUC ROC в основной группе составила 0,86 (95 % ДИ 0,79–0,92) и в контрольной группе – 0,77 (95 % ДИ 0,72–0,83). С точки зрения калибровки модель была поддержана незначимым тестом χ2 Хосмера–Лемешова в обеих когортах: χ2=1,98, df=8 (p=0,98) в основной группе и χ2=4,72, df=8 (p=0,78) в контрольной группе. В результате использования нейросети TabNet удалось достичь улучшенных показателей по метрике AUC-ROC, составивших 0,95 (ДИ 95 % 0,92–0,98) для основной группы и 0,86 (95 % ДИ 0,82–0,96) для контрольной группы, калибровка модели – χ2=8,38, df=8 (p =0,39) и χ2=9,46, df=8 (p=0,30) соответственно. Модель реализована в виде прикладного приложения и может быть использована в реальных сценариях. Заключение. Разработана модель предоперационного прогнозирования 90-дневной летальности на базе технологии машинного обучения, продемонстрировавшая хорошую валидность и высокий уровень дискриминационной способности. Полученные результаты подтверждают перспективность применения методов машинного обучения для решения задач клинического прогнозирования в онкологической хирургии и подчеркивают потенциал их использования в практическом здравоохранении.

Рак пищевода, эзофагэктомия, прогнозирование риска, машинное обучение, искусственный интеллект, 30-дневная летальность, 90-дневная летальность

Короткий адрес: https://sciup.org/140314622

IDR: 140314622 | УДК: 616.329-089-037 | DOI: 10.21294/1814-4861-2026-25-2-35-45

A machine-learning-based model for predicting 90-day postoperative mortality in esophageal cancer surgery

Objective: to develop a preoperative model for predicting 90-day mortality to optimize treatment strategy in patients with resectable esophageal cancer and Siewert type I gastroesophageal junction cancer. Material and Methods. A retrospective cohort study included 225 patients with resectable esophageal cancer (n=179) and Siewert type I gastroesophageal junction cancer (n=46). A total of 79 preoperative variables were analyzed. Risk factors were selected using univariate and multivariate logistic regression. The dataset was randomly split into training and validation cohorts (70/30). The predictive model was developed using L1-regularized multivariable logistic regression and the TabNet neural network featuring a sparse attentive architecture that enables estimation of feature importance. Discriminative ability and calibration were assessed using AUCROC analysis and the Hosmer–Lemeshow test. Results. The in-hospital mortality, 30-day mortality and 90-day mortality rates were 8.9 % (n=20), 1.3 % (n=3), and 6.2 % (n=14), respectively. The most significant predictors of mortality included preoperative weight loss >10 %, grade 3–4 dysphagia, ECOG performance status ≥2, COPD, preoperative dyspnea, history of major thoracic surgery, TNM stage N2, tumor proximity to or invasion of the trachea/main bronchi, cerebrovascular disease history, diabetes mellitus, and complications during or after radiotherapy. The logistic regression model demonstrated an AUC-ROC of 0.86 (95 % CI 0.79–0.92) in the training cohort and 0.77 (95 % CI 0.72–0.83) in the validation cohort. Calibration was supported by non-significant Hosmer–Lemeshow χ2 tests in both cohorts: χ2=1.98, df=8 (p=0.98) and χ2=4.72, df=8 (p=0.78), respectively. The TabNet neural network achieved improved discrimination with AUC-ROC values of 0.95 (95 % CI 0.92–0.98) in the training cohort and 0.86 (95 % CI 0.82–0.96) in the validation cohort; calibration results were χ2=8.38, df=8 (p=0.39) and χ2=9.46, df=8 (p=0.30), respectively. The model has been implemented as a software application and can be used in real-world clinical scenarios. Conclusion. In this study, a machine learning-based model for preoperative 90-day mortality prediction was developed. It demonstrated good validity and high discriminative performance. The findings support the promise of machine learning methods for clinical risk prediction in cancer surgery and highlight their potential for implementation in routine healthcare practice.

Текст научной статьи Модель прогнозирования 90-дневной послеоперационной летальности в хирургии рака пищевода на базе технологии машинного обучения

Современная хирургия рака пищевода (РП) остается одной из наиболее сложных областей онкологии, она ассоциируется с высокими рисками послеоперационных осложнений, достигающих 74 % [1]. Несмотря на рост количества специализированных центров, показатели летальности после эзофагэктомии остаются на клинически значимом уровне, варьируя от 4 % для экспертных центров и до более 10 %, по данным национальных регистров [2, 3]. Внедрение малоинвазивных хирургических подходов в последние годы способствовало снижению уровня послеоперационных осложнений и улучшению непосредственных исходов лечения [4, 5].

Анализ послеоперационной летальности показал, что при традиционном представлении уровня смертности в течение первых 30 дней после операции скрывается значительное количество летальных исходов, поэтому показатели, выявляемые при оценке 90-дневной смертности, оказываются существенно выше [6, 7]. Сейчас во многих странах показатель 90-дневной летальности принят в качестве эталонной оценки качества медицинской помощи при лечении рака пищевода.

Одной из главных задач лечения данной группы пациентов является минимизация хирургических осложнений и летальных исходов, что в значительной степени достигается за счет надлежащего отбора больных для оперативного вмешательства. Поскольку существуют альтернативные варианты лечения в виде химиолучевой (ХЛТ), лучевой (ЛТ) и химиотерапии (ХТ), каждому пациенту требуется персонализированный подход с оценкой всех факторов риска и персональной тактикой лечения, который может обеспечить оптимальный баланс между надежностью, качеством жизни и ее продолжительностью. За последние несколько десятилетий в общей хирургии и онкохирургии для прогнозирования летальности предложено множество различных шкал [7–9]. Достигнут значительный прогресс в разработке моделей за счет совершенствования математических алгоритмов и автоматизации информационных систем, однако идеального инструмента пока нет.

Стоит отметить, что все шкалы имеют свои недостатки и не способны полноценно проанализировать все потенциальные факторы риска послеоперационных осложнений и летальных исходов. Кроме того, зачастую из-за низкой прогностической способности математических моделей, неосведомленности или неудобства использования шкал хирурги чаще полагаются на собственный опыт.

Цель исследования – разработка собственной модели предоперационного прогнозирования 90дневной летальности для оптимизации выбора тактики лечения у пациентов c резектабельным раком пищевода и кардиоэзофагеального перехода (Siewert I).

Материал и методы

В ретроспективном когортном исследовании изучена группа из 225 пациентов с резектабельным раком пищевода (n=179) и кардиоэзофагеального перехода (Siewert 1) (n=46), которым выполнена эзофагэктомия в условиях МНИОИ им. П.А. Герцена и МРНЦ им. А.Ф. Цыба с января 2018 по март 2025 г. с последующим 90-дневным послеоперационным наблюдением.

Критериями включения в исследование являлись: возраст больных от 18 до 90 лет; ре-зектабельный рак грудного отдела пищевода и кардиоэзофагеального перехода (Siewert I); отсутствие абсолютных противопоказаний для хирургического лечения после консультации анестезиолога и кардиолога. Критериями исключения пациентов из исследования являлись: возраст <18 или >90 лет; наличие признаков нерезектабельности опухоли; рецидив заболевания; рак шейного или верхнегрудного отдела пищевода, рак кардиоэзофагеального перехода (Siewert II–III); операции по отсроченной реконструкции пищевода; наличие ургентных ситуаций, требующих срочного хирургического вмешательства.

У каждого больного проанализировано 79 предоперационных показателей, обобщая все современные данные и включая наиболее значимые признаки существующих моделей прогнозирования в хирургии РП. Первичной конечной точкой была 90-дневная послеоперационная летальность, определяемая как смерть от всех причин в течение 90 дней после хирургического лечения, включая смерть во время первичной госпитализации, после выписки, после перевода в другое учреждение и при повторной госпитализации.

Для статистического анализа использовалась библиотека SciPy reference/, написанная на языке программирования Python. Для обработки немногочисленных пропусков (менее 1 % от общего объема данных) применялась методика Mean Imputation для числовых признаков и замена на наиболее часто встречающийся класс для категориальных признаков. Обработка категориальных признаков проводилась при помощи методик One Hot Encoding. Числовые признаки были нормализованы к диапазону значений от 0 до 1. Отбор признаков осуществлялся на основе комбинированного подхода, включающего результаты одномерной и многомерной логистической регрессии (с порогом отбора p<0,1) и оценку весовых коэффициентов модели. Все пациенты были случайным образом распределены на основную и контрольную группы в соотношении 70/30. Разработка модели и ее тестирование проводились на базе логистической регрессии с использованием L1 регуляризации. Переменные с p<0,1, после исключения параметров с редкой распространенностью, были включены в модель множественной регрессии для выявления многомерно значимых факторов риска летального исхода в течение 90 дней. Значимым прогностическим переменным присвоены взвешенные баллы, пропорциональные значениям коэффициента регрессии β. Окончательный балл для каждого пациента является результатом сложения всех баллов с последующим расчетом вероятности летального исхода.

Предоперационные факторы, формирующие общий хирургический риск, могут быть взаимосвязаны в сложных нелинейных сочетаниях более высокого порядка. Алгоритмы машинного обучения, являющиеся поддоменом искусственного интеллекта, представляют собой мощный инструмент для анализа сложной нелинейной системной динамики и выявления многомерных закономерностей, которые потенциально превосходят когнитивные возможности человека и возможности традиционных статистических методов в медицинских исследованиях. В пользу этого свидетельствует тот факт, что прогностические модели на основе машинного обучения уже продемонстрировали обнадеживающие результаты в прогнозировании долгосрочных онкологических исходов после хирургических вмешательств на верхних отделах желудочно-кишечного тракта. В этой связи для повышения точности предсказаний была задействована технология машинного обучения TabNet [10], использующая полосвязную архитектуру с механизмом внимания. Эта модель предназначена для анализа структурированных табличных данных и способна учитывать сложные нелинейные взаимодействия признаков.

В этой связи для повышения точности предсказаний, полученных с использованием логистической регрессии, на тех же предварительно обработанных признаках была обучена нейронная сеть TabNet. Обучение проводилось с функцией потерь (бинарная кросс-энтропия). Предварительная обработка данных для разработки модели машинного обучения включала удаление признаков с высокой корреляцией (>0,95) и низкой дисперсией. Подбор гиперпараметров выполнялся методом перебора по сетке (grid search) на обучающей выборке, при этом качество оценивалось с помощью 5-кратной кросс-валидации внутри обучающей подвыборки. В результате были выбраны наиболее оптимальные гиперпараметры модели TabNet (n_d=n_a=8, n_steps=4, γ=1,0, λ=0,001, скорость обучения=0,01, размер батча=32, momentum=0,9, количество эпох=50). Финальная модель была обучена на полном наборе тренировочных данных с использованием лучших найденных гиперпараметров. Предсказательная способность оценивалась на независимой контрольной выборке. Надежность модели оценивали по площади под ROC-кривой (AUC-ROC), калибровку – с помощью теста согласия Хосмера–Лемешоу.

Результаты

В текущем ретроспективном когортном исследовании в течение 7-летнего периода (2018–25 гг.) проанализировано 225 пациентов с резектабельным раком пищевода (n=179) и кардиоэзофагеального перехода (Siewert I) (n=46), которым выполнена эзофагэктомия в условиях МНИОИ им. П.А. Герцена и МРНЦ им. А.Ф. Цыба с последующим 90-дневным послеоперационным наблюдением. Количество всех послеоперационных осложнений составило 47 % (n=106), послеоперационные осложнения по Clavien–Dindo ≥IIIA – 34,2 % (n=77). Госпитальная летальность – 8,9 % (n=20), 30-дневная летальность (учитывались пациенты, выписанные из стационара) – 1,3 % (n=3) и 90-дневная летальность (без учета госпитальной и 30-дневной смертности) – 6,2 % (n=14). Причинами 90-дневной послеоперационной летальности послужили: несостоятельность анастомоза (n=4), пневмония (n=2), ТЭЛА (n=1), прогрессирование заболевания (n=2), некроз стебля (n=1), ОНМК (n=1), пищеводно-медиастинальный свищ (n=1), острый инфаркт миокарда (n=1), легочное кровотечение (n=1).

У каждого пациента проанализировано 79 предоперационных показателей: пол, возраст, индекс массы тела (ИМТ), функциональный статус по шкале ECOG (Eastern Cooperative Oncology Group), статус по шкале ASA (American Society of Anesthesiologists), сопутствующие заболевания

(ХОБЛ, ХСН, цереброваскулярные заболевания, ИБС, сахарный диабет, гипертоническая болезнь, заболевания опорно-двигательного аппарата), лабораторные показатели (гемоглобин, лейкоциты, тромбоциты, лимфоциты, нейтрофилы, общий белок, креатинин, мочевина, глюкоза, АЛТ, АСТ, K+, Na+), характеристики опухоли (локализация, морфология, стадия, классификация по TNM (UICC, 8-е издание), степень дифференцировки), характер и осложнения предоперационного лечения, параметры операции (вариант операции, объем лимфаденэктомии, вариант пластики, хирургический доступ). Редко встречающиеся параметры были отсортированы и исключены из анализа.

Пациенты случайным образом распределены на основную (n=175) и контрольную группы (n=50) для последующей проверки валидности модели. Для сравнения когорт использовался точный критерий Фишера. Обе группы существенно не отличались по анализируемым признакам (p>0,05). Не выявлено достоверных различий в показателях госпитальной летальности (9,1 % (n=16) в основной группе и 8 % (n=4) в контрольной группе; p=0,99), показателях 30-дневной летальности (1,1 % (n=2) в основной группе и 2 % (n=1) в контрольной группе; p=0,531) и показателях 90-дневной летальности (5,7 % (n=10) в основной группе и 8 % (n=4) в контрольной группе; p=0,519) между двумя когортами.

Одномерная логистическая регрессия из 79 параметров выявила 25 переменных, ассоциированных с риском летального исхода на уровне значимости p<0,1: индекс массы тела, снижение массы тела более 10 % до операции, степень дисфагии, ECOG статус, индекс ASA, курение в течение последнего года до операции, индекс курильщика, хроническая обструктивная болезнь легких (ХОБЛ), одышка до операции, обширные торакальные и абдоминальные операции в анамнезе, индекс T и N по классификации TNM (UICC, 8-е издание), уровень общего белка в крови, тесное прилежание опухоли или ее инвазия в трахею/ главные бронхи, определяемое по данным КТ или бронхоскопии, цереброваскулярные заболевания в анамнезе, выраженный периферический атеросклероз, сахарный диабет, ишемическая болезнь сердца (ИБС), хроническая сердечная недостаточность, тромбозы в анамнезе, предоперационное лечение, осложнения в процессе или после лучевой терапии, вариант пластики пищевода, лимфодиссекция по ходу возвратных гортанных нервов.

В множественный логистический регрессионный анализ были включены 25 переменных для выявления значимых факторов риска смерти в течение 90 дней; 5 параметров исключены из анализа ввиду отсутствия значимого влияния на летальный исход. Общее число событий составило 28, показатель events per variable (EPV) – 1,40. Взвешенные баллы присвоены каждой переменной с использованием линейного преобразования коэффициентов

Таблица/Table

Результаты многофакторного логистического регрессионного анализа и взвешенное распределение баллов в основной группе

Results of multivariate logistic regression analysis and weighted distribution of scores in the main group

Переменные/Variables β	p–value	Баллы/Scores
ИМТ (кг/м²)/BMI (kg/m²)
≤ 17 0,107	0,816	1
18–24 –	–	0
25–29 – 0,057	0,072	0
≥30 0,474	0,007	2
Снижение массы тела >10 % до операции/Weight loss of more than 10 % before surgery
Да/Yes 1,270	0,002	6
Нет/No –	–	0
Степень дисфагии по А.И. Савицкому/Dysphagia grade according to A. Savitsky
0–1 –	–	0
2 0,436	0,381	2
3–4 1,489	0,006	7
ECOG
0–	–	0
1 0,411	0,376	2
≥2 1,386	< 0,001	7
Индекс курильщика (пачка/лет)/Smoking index (pack/year)
≥15 0,432	0,097	2
1–14 или не курит/1–14 or doesn't smoke –	–	0
ХОБЛ средней или тяжелой степени ^А/Moderate to severe COPD ^А
Да/Yes 0,726	0,079	4
Нет/No –	–	0
Одышка до операции в покое или при незначительной физической нагрузке/ Shortness of breath before surgery at rest or with minor physical activity
Да/Yes 1,296	0,002	6
Нет/No –	–	0
Обширные торакальные операции в анамнезе/History of extensive thoracic surgery
Да/Yes 1,199	0,03	6
Нет/No –	–	0
N (TNM)
N0 –	–	0
N1 0,046	0,868	0
N2/N3 0,803	0,057	4
Общий белок (г/л)/Total protein (g/l)
>70 –0,197	0,095	–1
65–70 –	–	0
≤64 0,320	0,749	2
Тесное прилежание опухоли или ее инвазия в трахею/главные бронхи по данным КТ или бронхоскопии/ Close adherence of the tumor to or invasion of the trachea/main bronchi, determined by CT or bronchoscopy
Да/Yes 1,264	0,009	6
Нет/No –	–	0
Цереброваскулярные заболевания в анамнезе ^В/Cerebrovascular diseases in the history ^В
Да/Yes 0,945	0,021	5
Нет/No –	–	0
Периферический атеросклероз ^С/Peripheral atherosclerosis ^С
Да/Yes 0,583	0,067	3
Нет/No –	–	0
Сахарный диабет/Diabetes mellitus
Да/Yes 0,744	0,099	4
Нет/No –	–	0
Ишемическая болезнь сердца ^D /Coronary artery disease ^D
Да/Yes 0,330	0,087	2

Окончание таблицы /End of the Table

Переменные/Variables β	p–value Баллы/Scores
Нет/No –	–	0
Тромбозы в анамнезе ^Е/Thrombosis in the history ^Е
Да/Yes 0,492	0,091	2
Нет/No –	–	0
Предоперационное лечение/Preoperative treatment
ХЛТ или ЛТ/CRT or RT 0,449	0,094	2
ХТ/CT 0,051	0,357	0
Не было/No treatment –	–	0
Осложнения в процессе или после лучевой терапии ^F/Complications during	or after radiotherapy ^F
Да/Yes 1,419	< 0,001	7
Нет/No –	–	0
Вариант пластики пищевода/Type of esophageal reconstruction
Желудок/Stomach –	–	0
Толстая или тонкая кишка/Colon or small intestine 0,580	0,048	3
Лимфодиссекция по ходу возвратных гортанных нервов/Lymphadenectomy along the recurrent laryngeal		nerves
Да/Yes 0,144	0,093	1
Нет/No –	–	0

Примечания: ИМТ – индекс массы тела; ХОБЛ – хроническая обструктивная болезнь легких; ХЛТ – химиолучевая терапия; ЛТ – лучевая терапия; ХТ – химиотерапия; β – коэффициент регрессии β; А– ХОБЛ средней или тяжелой степени (например, эмфизема и/или хронический бронхит), приводящая к одному или нескольким из следующих состояний: функциональная инвалидность вследствие ХОБЛ (например, кислородная поддержка, неспособность выполнять повседневные действия, частые обострения), госпитализация в прошлом для лечения ХОБЛ, хроническая бронходилатирующая терапия пероральными или ингаляционными средствами, ОФВ1 <80 % от прогнозируемого; В – ОНМК, транзиторная ишемическая атака, дисциркуляторная энцефалопатия (хроническая ишемия головного мозга) или болезнь Паркинсона; С– стеноз брахиоцефальных артерий/артерий нижних конечностей > 70 %, наличие стентирования, шунтирования, эндартерэктомии, тромбэктомии в анамнезе; D – ПИКС (постинфарктный кардиосклероз)/стенокардия напряжения со стентированием/шунтированием в анамнезе/стенокардия напряжения без реваскуляризации; Е – ТЭЛА, тромбозы вен нижних конечностей или другие тромбозы в анамнезе; F – резкое нарастание дисфагии, приводящее к остановке терапии; кровотечение из опухоли; постлучевые эзофагиты RTOG ≥3 степени; постлучевые пневмониты RTOG ≥3 степени; таблица составлена авторами.

Notes: BMI – body mass index; COPD – chronic obstructive pulmonary disease; CRT – chemoradiotherapy; RT – radiotherapy; CT – chemotherapy; β – regression coefficient β; ^A – moderate or severe COPD (e.g., emphysema and/or chronic bronchitis) resulting in one or more of the following conditions: functional disability due to COPD (e.g., need for oxygen support, inability to perform activities of daily living, frequent exacerbations), prior hospitalization for COPD, chronic bronchodilator therapy (oral or inhaled), FEV₁<80 % of predicted; ^B – stroke, transient ischemic attack, chronic cerebral ischemia (dyscirculatory encephalopathy), or Parkinson’s disease; ^C – stenosis of the brachiocephalic arteries and/or lower extremity arteries >70 %; history of stenting, bypass surgery, endarterectomy, or thrombectomy; ^D – postinfarction cardiosclerosis / exertional angina with a history of stenting or bypass surgery / exertional angina without prior revascularization; ^E – pulmonary embolism (PE), deep vein thrombosis (DVT) of the lower extremities, or other thrombotic events in history; ^F – rapid progression of dysphagia leading to discontinuation of therapy; tumor-related bleeding; post-radiation esophagitis of grade ≥3 according to RTOG criteria; post-radiation pneumonitis of grade ≥3 according to RTOG criteria; created by the authors.

регрессии β (таблица). Финальный балл получен путем сложения всех 20 взвешенных баллов с последующим использованием формулы для расчета вероятности летального исхода (рис. 1).

Окончательный балл риска в группе обучения варьировался от -1 до +38, формируя основные 3 группы риска пациентов: низкий (сумма баллов <15), умеренный (сумма баллов 15 ≤ х ≤ 20) и высокий риск смертности (сумма баллов >20) (рис. 2). Границы категорий риска были определены эмпирически на основании распределения суммарного балла в исследуемой выборке и характера зависимости между его величиной и наблюдаемой 90-дневной летальностью. При выборе пороговых значений стремились выделить три клинически интерпретируемые группы с последовательным увеличением частоты неблагоприятного исхода и достаточной численностью пациентов в каждой категории.

Прогнозируемая вероятность хирургической 90-дневной смертности P(mortality), выраженная в процентах, рассчитана по следующей формуле:

p(mortality) = ₍₇.₆₇lo.47-»cor.)

x 100 ,

где p(mortality) – прогнозируемая летальность в течение 90 дней; score – сумма полученных баллов.

При оценке дискриминационной способности модели логистической регрессии AUC ROC в основной группе составила 0,86 (95 % ДИ 0,79–0,92) и в контрольной группе – 0,77 (95 % ДИ 0,72–0,83) (рис. 3). С точки зрения калибровки модель продемонстрировала удовлетворительное согласие между наблюдаемыми и ожидаемыми частотами событий, что подтверждается незначимым тестом χ2 Хосмера–Лемешоу в обеих когортах: для основной группы χ2=1,98, df=8 (p=0,98), для контрольной группы χ2=4,72, df=8 (p=0,78).

Для повышения точности предсказаний по сравнению с логистической регрессией была использована нейронная сеть TabNet, обученная на предварительно обработанных признаках (рис. 4). Подбор оптимальных гиперпараметров осущест-

Рис. 1. График вероятности летального исхода в зависимости от количества баллов.

Примечание: рисунок выполнен авторами

Fig. 1. Graph of the probability of a fatal outcome depending on the number of points. Note: created by the authors

Рис. 2. График уровня летальности пациентов по группам риска. Примечание: рисунок выполнен авторами Fig. 2. Graph of patient mortality rate by risk group.

Note: created by the authors

Рис. 3. ROC-кривая модели логистической регрессии в контрольной группе. Примечание: рисунок выполнен авторами Fig. 3. ROC-curve of the logistic regression model in the control group. Note: created by the authors

влялся методом перебора по сетке (grid search), при этом качество моделей оценивалось с помощью 5-кратной кросс-валидации. Финальная модель была обучена на полном наборе тренировочных данных с использованием лучших найденных гиперпараметров. В результате использования более сложной модели удалось достичь улучшенных показателей по метрике AUC-ROC (p=0,039), составивших 0,95 (ДИ 95 % 0,92–0,98) для основной группы и 0,86 (95 % ДИ 0,82–0,96) для контрольной группы по сравнению с AUC ROC 0,77 (95 % ДИ 0,72–0,83) в контрольной группе модели логистической регрессии (рис. 5). Калибровка (критерий согласия Хосмера–Лемешоу) для основной группы составила χ2=8,38, df=8 (p =0,39), для контрольной – χ2=9,46, df=8 (p=0,30).

Модель прогнозирования 90-дневной послеоперационной летальности на базе машинного обуче-

Вьюокие/Higli

Потеря веса > 10 % за 6 месяцев/ Weight loss > 10 % in 6 months

Дисфагия 3 или 4 степени/ Grade 3 or 4 dysphagia

ECOG1 Индекс курения г 15 лачка-лот/

Smoking index г 15 pack-years

ХОБЛ/СОРО Осложнения после лучевой терапии/ Complications after radiotherapy

N2 или N3 статус / N2 or N3 status Вовлечение трахеи или бронхов/ Involvement of the trachea or bronchi

ECOG a 2

Одышка до операции/ Shortness of breath before surgery

ИМТ 24-30 кг/м2 / BMI24-30 kg/m2

Общий белок > 70 г/л /Total protein > 70 g/l Предоперационное лечение / Preoperative treatment

Общий белок с 64 г/л /Total protein * 64 g/l

Цереброваскулярные заболевания / Cerebrovascular diseases

Nt (TNM) Дисфагия 2 степени/ Grade 2 dysphagia Пластика пищевода кишкой/ Intestinal plastic surgery Ишемическая болезнь сердца/ Coronary heart disease ИМТ a 30 КГ/М2 / BMI a 30 kg/m2

0 2 4 6 Низкие

Значение SHAP / SHAP value Low

Рис. 4. Распределение SHAP-значений для

20 наиболее значимых факторов в модели TabNet. Примечание: рисунок выполнен авторами Fig. 4. Distribution of SHAP values for the 20 most significant factors in the TabNet model. Note: created by the authors

Рис. 5. Сравнение ROC-кривых моделей на базе нейронной сети и логистической регрессии в контрольной группе.

Примечание: рисунок выполнен авторами

Fig. 5. Comparison of ROC-curves of models based on a neural network and logistic regression in the control group. Note: created by the authors ния зарегистрирована в качестве программы для электронных вычислительных машин в Федеральной службе по интеллектуальной собственности (RU2025681446).

Таким образом, в рамках настоящего исследования разработана модель предоперационного прогнозирования 90-дневной летальности после эзофагэктомии на базе технологии машинного обучения. Предложенная прогностическая шкала демонстрирует высокий уровень дискриминационной способности. Модель реализована в формате Telegram-бота (ссылка на бот: https://t.me/ EsophagoRiskBot), который после ввода параметров автоматически рассчитывает индивидуальный риск летального исхода и относит пациента к одной из трех категорий риска (низкий, умеренный, высокий). Такое стратифицирование позволяет более обоснованно выполнять отбор больных на хирургическое лечение. Пациентам умеренного риска целесообразно до начала терапии рекомендовать коррекцию модифицируемых факторов риска и проведение программы преабилитации, тогда как при выявлении пациентов с высоким риском летального исхода следует рассмотреть альтернативные варианты лечения, включая радикальную химиолучевую терапию или лекарственную противоопухолевую терапию.

Применение данной шкалы позволит практикующему врачу объективизировать предоперационную оценку риска, индивидуализировать выбор лечебной тактики и объема хирургического лечения, облегчить принятие клинических и организационных решений, а также улучшить качество информированности пациента.

Обсуждение

На данный момент достигнут значительный прогресс в развитии моделей за счет совершенствования математических алгоритмов, автоматизации информационных систем и применения систем искусственного интеллекта. Данное исследование продемонстрировало разработку шкалы предоперационного прогнозирования рисков 90-дневной летальности на базе нейронных сетей с глубокой оценкой множества предоперационных параметров, в том числе и онкологических. Преимуществом данной шкалы является активное обучение модели на новых данных, позволяющее ей находить новые скрытые взаимосвязи, что, в свою очередь, способствует совершенствованию прогностических способностей. Разработка мобильного приложения и чат-бота на базе данной модели позволит объективизировать выбор варианта лечения и облегчить повседневную работу врача в принятии решений. В шкале использованы 20 легкодоступных предоперационных параметров, не требующих дополнительной нагрузки на врача и пациента.

Разделение пациентов на три группы риска (низкий, умеренный, высокий) позволяет корректно выполнить отбор больных на хирургическое лечение. Пациентам группы умеренного риска перед началом лечения целесообразно предложить коррекцию модифицируемых факторов риска и программу преабилитации с целью снижения риска осложнений. У пациентов с высокими рисками летального исхода рекомендуется рассмотреть альтернативные варианты лечения, такие как радикальная ХЛТ или противоопухолевая лекарственная терапия. Кроме того, отдельным больным с полным клиническим ответом на ХЛТ или ЛТ стоить рассмотреть вариант строгого динамического наблюдения, особенно если вероятность летального исхода окажется очень высокой.

В отличие от большинства существующих шкал, ориентированных преимущественно на общеклинические и функциональные параметры пациента, предложенная модель дополнительно учитывает технические особенности операции, а также онкологические факторы. Такие показатели, как вариант реконструкции пищевода (желудок, толстая/тонкая кишка), лимфаденэктомия вдоль возвратных гортанных нервов и критерий N, отражают не только распространенность онкологического процесса, но и сложность хирургического вмешательства. Вышеуказанные параметры повышают клиническую ценность разработанной шкалы и позволяют более точно стратифицировать риски ранней летальности.

В нашем исследовании установлено, что вариант реконструкции пищевода статистически значимо увеличивал риски летального исхода в течение 90 дней (p=0,048). Пластика пищевода с использованием толстой или тонкой кишки ассоциировалась с более высокой смертностью. Полученные результаты полностью соответствуют данным зарубежных исследований, в которых кишечные кондуиты характеризуются как методики, сопровождающиеся более высокой частотой хирургических осложнений, включая несостоятельность анастомоза, ишемию трансплантата, инфекционные осложнения и дыхательную недостаточность [11, 12]. Такие вмешательства отличаются большей продолжительностью и травматичностью и, как правило, выполняются у соматически отягощенных пациентов, что ассоциируется с неблагоприятным течением раннего послеоперационного периода [11].

Отдельное внимание в настоящем исследовании уделено фактору лимфодиссекции по ходу возвратных гортанных нервов, продемонстрировавшему значимое влияние на 90-дневную летальность. В ряде исследований повреждение возвратного гортанного нерва является независимым предиктором послеоперационных дыхательных осложнений, в первую очередь аспирационной пневмонии [13–15]. Кроме того, паралич нервов сопровождается дисфонией и нарушением глотания, что существенно ограничивает возможность раннего энтерального питания и способствует развитию нутритивной недостаточности. Современные обзоры подчеркивают клиническую значимость профилактики повреждения возвратных гортанных нервов и обсуждают роль интраоперационного нейромониторинга как потенциального способа снижения частоты таких осложнений [16, 17].

Критерий N по классификации TNM в нашем исследовании достоверно увеличивал риски летального исхода. Это подтверждается данными литературы, где наличие метастатического поражения лимфатических узлов ассоциируется с более агрессивным течением заболевания и необходимостью выполнения расширенной лимфодиссекции в зоне средостения и возвратных гортанных нервов, что повышает риск интраоперационной травмы и тяжелых послеоперационных осложнений [18, 19]. Кроме того, пациенты с высокими значениями N-индекса чаще имеют снижение нутритивного статуса и функциональных резервов, что негативно отражается на течении послеоперационного периода [19].

Дополнительным направлением развития представленной шкалы является ее потенциальная адаптация к динамическому использованию с обновлениями рисков в зависимости от интраоперационных и ранних послеоперационных данных, таких как объем кровопотери, длительность хирургического вмешательства, вазопрессорная поддержка, интраоперационные и послеоперационные осложнения и др. Практическая ценность подобного подхода заключается в возможности влияния на тактику послеоперационного ведения. Высокий прогнозируемый риск летального исхода может служить основанием для усиленного мониторинга, более длительного нахождения в отделении интенсивной терапии, оптимизации нутритивной поддержки, превентивного формирования питательной стомы, более позднего начала энтерального питания, разделения хирургического лечения на два этапа (резекционный и отсроченный реконструктивный). Такой подход потенциально повысит точность прогнозирования 90-дневной летальности и обеспечит более гибкую стратификацию пациентов по степени хирургического риска непосредственно в периоперационном периоде.

Настоящее исследование имеет ряд ограничений, которые следует учитывать при интерпретации полученных результатов. Прежде всего, работа носит ретроспективный характер, что сопряжено с риском систематических ошибок, включая ошибку отбора и информационную ошибку. Несмотря на стандартизованный подход к сбору клинических данных, ретроспективный дизайн не позволяет полностью исключить влияние неполноты документации, неоднородности регистрации признаков и скрытых факторов смешения, способных повлиять как на состав выборки, так и на оценку прогностической значимости отдельных переменных.

Вторым важным ограничением является незначительный объем выборки и сравнительно небольшое число зарегистрированных летальных исходов при анализе большого количества исходных предоперационных признаков. При разработке модели на базе машинного обучения сохраняется риск переобучения (overfitting), когда модель частично адаптируется к особенностям конкретной обучающей выборки и вследствие этого демонстрирует более высокие показатели на внутренних данных, чем при применении в независимых популяциях. Хотя в исследовании использовались регуляризация, кросс-валидация и выделенная контрольная выборка, внутренняя валидация не может в полной мере заменить внешнюю проверку на независимом наборе данных.

Следует также отметить, что исследование, несмотря на включение пациентов из двух филиалов, по факту отражает опыт одного центра. Это снижает степень внешней валидности результатов, поскольку хирургическая тактика, подходы к перио-перационному ведению и критерии отбора больных могли быть идентичны и не в полной мере воспроизводимы в других учреждениях. Соответственно, перенос разработанной модели на более широкие клинические популяции требует осторожности.

Наконец, предложенная модель прошла только внутреннюю проверку и пока не была валидирована в независимых внешних когортах. В отсутствие многоцентровой проспективной апробации невозможно окончательно судить об ее устойчивости, воспроизводимости и клинической применимости. В связи с этим дальнейшие исследования должны быть направлены на внешнюю валидацию модели и ее тестирование в многоцентровом формате.

Заключение

На данный момент достигнут значимый прогресс в области разработки систем на базе искусственного интеллекта, и прогностические шкалы не являются исключением. Современные вычислительные подходы позволяют обрабатывать большие массивы медицинских данных и выявлять сложные нелинейные зависимости, недоступные для традиционных статистических методов. В рамках настоящего исследования разработана модель предоперационного прогнозирования 90-дневной летальности после эзофагэктомии с использованием технологии машинного обучения, продемонстрировавшая хорошую валидность и высокий уровень дискриминационной способ- ности. Полученные результаты подтверждают применимость методов машинного обучения для решения задач клинического прогнозирования в онкологической хирургии и подчеркивают потенциал их использования в практическом здравоохранении. Дальнейшее развитие модели с привлечением независимых центров и расширением базы пациентов представляется необходимым этапом для повышения ее воспроизводимости и клинической надежности. В многоцентровом формате появляется возможность учитывать вариабельность хирургических подходов и региональные особенности ведения пациентов, что будет способствовать формированию универсального инструмента оценки риска.