Искусственный интеллект в скрининге и ранней диагностике новообразований поджелудочной железы в условиях централизации лабораторной службы региона

Автор: Панин С.И., Суворов В.А., Зубков А.В., Безбородов С.А., Панина А.А., Коваленко Н.В., Донская А.Р., Шушкова И.Г., Быков А.В., Маренков Я.А.

Журнал: Сибирский онкологический журнал @siboncoj

Рубрика: Опыт работы онкологических учреждений

Статья в выпуске: 3 т.23, 2024 года.

Бесплатный доступ

Цель работы - определение оптимальной модели машинного обучения для создания программного обеспечения по скринингу и ранней диагностике новообразований поджелудочной железы в условиях централизации лабораторной службы региона. материал и методы. Основу клинического материала составили 1 254 пациента, проходивших обследование в централизованной лаборатории ГУЗ «Консультативно-диагностическая поликлиника № 2» Волгограда. Из них в дальнейшем 139 оперированы в ГБУЗ «Волгоградский областной клинический онкологический диспансер» по поводу злокачественных новообразований поджелудочной железы. В 65 (46,7 %) наблюдениях выполнена дистальная резекция поджелудочной железы, в 74 (53,3 %) - панкреатодуоденальная резекция. В 28 (20,1 %) случаях на момент выявления опухоли пациенты не имели клинической симптоматики. Статистическая обработка данных проводилась с использованием языка программирования Python. Для машинного обучения использованы 5 различных классификаторов.

Еще

Скрининг онкологических заболеваний, лабораторная диагностика, искусственный интеллект

Короткий адрес: https://sciup.org/140305918

IDR: 140305918   |   DOI: 10.21294/1814-4861-2024-23-3-124-132

Текст научной статьи Искусственный интеллект в скрининге и ранней диагностике новообразований поджелудочной железы в условиях централизации лабораторной службы региона

В Российской Федерации заболеваемость раком поджелудочной железы (РПЖ) растет: в 2012 г. она составила 10,46 на 100 тыс. населения, в 2022 г. – 14,03 на 100 тыс. населения. При этом отмечен один из наиболее низких среди других злокачественных опухолей показатель раннего выявления (I–II стадии) – 24,5 %, РПЖ IV стадии диагностирован у 58,1 % больных [1].

Использование искусственного интеллекта (ИИ) открывает новые возможности в лабораторной медицине на этапе скрининга и ранней диагностики различных нозологий. К преимуществам ИИ в сравнении с человеком относят способность обрабатывать больший объем информации, высокую скорость, отсутствие усталости и конфликтов при обучении, непрерывность деятельности [2]. С учетом того, что онкологические заболевания занимают одно из ведущих мест среди причин смертности в Российской Федерации, повышение эффективности скрининга и ранней диагностики новообразований, в том числе опухолей поджелудочной железы, представляется актуальным научным направлением [3]. Поскольку скрининг рака является одним из самых сложных в системе здравоохранения, его разработку следует начинать с региональных пилотных проектов [4].

Цель исследования – выбор оптимальной модели машинного обучения для создания программного обеспечения по скринингу и ранней диагностике новообразований поджелудочной железы в условиях централизации лабораторной службы региона.

Материал и методы

Исследование проведено на трех базах: ФГБОУ ВО «Волгоградский государственный медицинский университет» Минздрава РФ (ГУЗ «Консультативно-диагностическая поликлиника № 2» Волгограда (ГУЗ «КДП № 2»), ГБУЗ «Волгоградский областной клинический онкологический диспансер» (ВОКОД) и лаборатория информатизации и цифровизации здравоохранения ВолгГМУ). Основу клинического материала составили 1 254 пациента, проходивших обследование в централизованной лаборатории ГУЗ «КДП № 2» Волгограда.

Из них в последующем 139 больных оперированы в ВОКОД по поводу новообразований поджелудочной железы (табл. 1). В 65 (46,7 %) наблюдениях выполнена дистальная резекция поджелудочной железы, в 74 (53,3 %) – панкреатодуоденальная резекция. При этом в 28 (20,1 %) наблюдениях на момент выявления опухоли пациенты не имели клинической симптоматики. Лабораторные исследования крови проведены по 4 основным категориям (гематологические, биохимические, иммунохимические исследования; исследования системы гемостаза). При этом первичный набор данных включал в себя 62 различных параметра.

Характер распределения оцениваемых данных определяли на основании результатов теста Колмогорова–Смирнова. Мерами центральной тенденции, учитывая отсутствие гауссовского распределения у всех количественных признаков, служили медиана (Me) и межквартильный интервал (Q1-Q3). Статистически значимые различия находились с помощью проведения теста Манна–Уитни на полной выборке, с учетом уровня статистической значимости, равной 0,05.

Для исключения лабораторных параметров, не оказывающих значимого влияния на целевую переменную (факт наличия новообразования поджелудочной железы у обследуемого пациента) и не учитывающихся при обучении моделей, проведен факторный анализ. В свою очередь, каждый из учтенных и используемых в ходе машинного обучения параметров масштабирован с помощью стандартизации [5]. Также перед обучением модели выполнены поиск и удаление выбросов с использованием метода межквартильного диапазона [6].

При обучении использованы 5 различных моделей классификаторов: decision tree, random forest, k-nearest neighbors, hist gradient boosting, support vector machine (SVM) со стандартными гиперпараметрами библиотеки scikit-learn. Оценка результатов обучения проведена по следующим метрикам:

– матрица ошибок (confusion matrix) – матрица, используемая для измерения качества работы алгоритма классификации, она показывает количество истинно положительных, истинно отрицательных, ложноположительных и ложноотрицательных предсказаний;

– диагностическая точность – доля правильных предсказаний среди всех случаев;

– чувствительность – доля истинно положительных результатов среди всех реальных положительных случаев;

– прогностичность положительного результата – доля истинно положительных результатов среди всех положительных предсказаний алгоритма;

– F1 – гармоническое среднее точности и полноты, которое учитывает баланс между ними;

– функция потерь логистической регрессии (log loss) – мера оценки, которая показывает, насколько предсказания модели отличаются от фактических меток класса. Рассчитывается не на основе установленных классификатором меток, а на основе «вероятностей», с которыми модель относит рассматриваемый случай к каждому из классов;

– ROC-кривые – графическое представление качества бинарного классификатора, показывающее соотношение между долей истинно положительных результатов и долей ложноположительных результатов при различных пороговых значениях [7];

  • – специфичность – доля истинно отрицательных результатов среди всех реальных отрицательных случаев;

    – прогностичность отрицательного результата – доля истинно отрицательных результатов среди всех отрицательных предсказаний модели.

Таблица 1/table 1

Характер патологии поджелудочной железы the nature of pancreatic pathology

Характеристики опухоли/Characteristics of the tumor

Количество больных/Number of patients

Локализация опухоли поджелудочной железы/Localization of the pancreatic tumor

Головка/Head

74 (53,3 %)

Тело/Body

19 (13,7 %)

Хвост/Tail

46 (33 %)

Стадия (TNM8)/Stage (TNM8)

12 (8,6 %)

IB

22 (15,8 %)

IIA

41 (29,5 %)

IIB

46 (33 %)

III

18 (12,9 %)

Гистологический тип опухоли/Histological type of tumor Протоковая аденокарцинома/Ductal adenocarcinoma

128 (92,1 %)

Солидно-псевдопапиллярная опухоль/Solid-pseudopapillary tumor

6 (4,3 %)

Недифференцированный рак/Undifferentiated cancer

5 (3,6 %)

Примечание: таблица составлена авторами.

Note: created by the authors.

Результаты

Для определения оптимальной модели машинного обучения после статистической обработки первичного материала отобрано 808 из 1 254 клинических наблюдений. Участники исследования были разбиты в стандартном соотношении – 70 % на тренировочную выборку (468 – без патологии поджелудочной железы, 97 – с новообразованиями поджелудочной железы) и 30 % на тестовую выборку (201 участник без патологии, 42 – с новообразованиями поджелудочной железы). После сравнительного анализа, проведенного на базе теста Манна–Уитни, в ходе машинного обучения использованы 11 отобранных лабораторных показателей (табл. 2). Значимого влияния других 49 лабораторных показателей на целевую переменную

Таблица 2/table 2

Лабораторные предикторы новообразований поджелудочной железы laboratory predictors of pancreatic neoplasms

Сравнительная эффективность моделей машинного обучения comparative performance of machine learning models

Параметры сравнения/ Parameters of comparison

Пациенты с новообразованиями/ Patients with neoplasms (n=139)

Пациенты без новообразований/ Patients without neoplasms (n=669)

Значимость различий/ Significance of differences

Лейкоциты (×109/л)/ Leukocytes (×109/l)

7,6 [6,0–7,9]

6,2 [5,2–7,5]

U=59435,0 p<0,001

Эритроциты (×1012/л)/ Erythrocytes (×1012/l)

4,2 [4,1–4,7]

4,6 [4,3–5,0]

U=32614,5 p<0,001

Тромбоциты (×106/л)/Plateles (×106/l)

230,0 [221,0–303,0]

241,0 [205,0–283,0]

U=51483,5 p=0,046

Гемоглобин (г/л)/Hemoglobin (g/l)

132,0 [125,5–138]

137,0 [128,0–148,0]

U=35759,0 p<0,001

Гематокрит (%)/Hematocrit (%)

42,0 [38,0–42,0]

42,0 [39,0–45,0]

U=40947,5 p=0,026

MPV (фл)/MPV (fl)

9,0 [9,0–10,0]

10,0 [9,0–11,0]

U=28549,5 p<0,001

PDW (%)

17,0 [17,0–17,5]

16,0 [16,0–17,0]

U=69177,0 p<0,001

Моноциты (109/л)/Monocytes (109/l)

0,55 [0,46–0,55]

0.,44 [0,35–0,56]

U=60013,0 p<0,001

Глюкоза (ммоль/л)/Glucose (mmol/l)

5,6 [5,6–6,7]

5,5 [5,0–6,1]

U=61394,0 p<0,001

АСТ (Ед/л)/AST (U/l)

21,0 [21,0–34,5]

21,0 [17,5–26,0]

U=53697,5 p=0,004

Общий билирубин (мкмоль/л)/ Total bilirubin (mkmol/l)

11,0 [9,7–23,25]

10,7 [8,2–14,3]

U=58077,5 p<0,001

Список литературы Искусственный интеллект в скрининге и ранней диагностике новообразований поджелудочной железы в условиях централизации лабораторной службы региона

  • Shakhzadova A.O., Starinskii V.V., Lisichnikova I.V. Sostoyanie onkologicheskoi pomoshchi naseleniyu Rossii v 2022 godu. Sibirskii onkologicheskii zhurnal. 2023; 22(5): 5-13. https://doi.org/10.21294/1814-4861-2023-22-5-5-13.
  • Rumyantsev P.O. Rannyaya diagnostika agressivnykh form raka: al'yans spetsialistov, tekhnologii i iskusstvennogo intellekta. Luchevaya diagnostika i terapiya. 2023; 14(2): 7-14. https://doi.org/10.22328/2079-5343-2023-14-2-7-14.
  • Solodkii V.A., Kaprin A.D., Nudnov N.V., Kharchenko N.V., Khodorovich O.S., Zapirov G.M., Sherstneva T.V., Dibirova Sh.M., Kanakhina L.B. Sovremennye sistemy podderzhki prinyatiya vrachebnykh reshenii na baze iskusstvennogo intellekta dlya analiza tsifrovykh mammograficheskikh izobrazhenii. Vestnik rentgenologii i radiologii. 2023; 104(2): 151-62. https://doi.org/10.20862/0042-4676-2023-104-2-151-162.
  • Barchuk A.A., Raskina Yu.V., Smirnova O.V., Belyaev A.M., Bagnenko S.F. Skrining onkologicheskikh zabolevanii na urovne gosudarstvennykh programm: obzor, rekomendatsii i upravlenie. Obshchestvennoe zdorov'e. 2021; 1(1): 19-31. https://doi.org/10.21045/2782-1676-2021-1-1-19-31.
  • Raju N.G., Lakshmi K.P., Jain V.M., Kalidindi A., Padma V. Study the Influence of Normalization/Transformation process on the Accuracy of Supervised Classification. Third International Conference on Smart Systems and Inventive Technology (ICSSIT). Tirunelveli, India, 2020; 729-35, https://doi.org/10.1109/ICSSIT48917.2020.9214160.
  • Yang J., Rahardja S., Fränti P. Outlier detection: how to threshold outlier scores? In Proceedings of the International Conference on Artificial Intelligence, Information Processing and Cloud Computing (AIIPCC ‘19). Association for Computing Machinery, New York, NY, USA. 2019; 1-6. https://doi.org/10.1145/3371425.3371427.
  • Kelleher J.D., Mac Namee B., D’arcy A. Fundamentals of machine learning for predictive data analytics: algorithms, worked examples, and case studies. MIT press, 2020.
  • Zlokachestvennye novoobrazovaniya v Rossii v 2021 godu (zabolevaemost' i smertnost'). Pod red. A.D. Kaprina, V.V. Starinskogo, A.O. Shakhzadovoi. M., 2022. 252 s.
  • Hameed B.S., Krishnan U.M. Artificial Intelligence-Driven Diagnosis of Pancreatic Cancer. Cancers (Basel). 2022; 14(21): 5382. https://doi.org/10.3390/cancers14215382.
  • Singhi A.D., Koay E.J., Chari S.T., Maitra A. Early Detection of Pancreatic Cancer: Opportunities and Challenges. Gastroenterology. 2019; 156(7): 2024-40. https://doi.org/10.1053/j.gastro.2019.01.259.
  • Kirkegård J., Mortensen F.V., Heide-Jørgensen U., Cronin-Fenton D. Predictors of underlying pancreatic cancer in patients with acute pancreatitis: a Danish nationwide cohort study. HPB (Oxford). 2020; 22(4): 553-62. https://doi.org/10.1016/j.hpb.2019.08.013.
  • Gusev A.V., Evgina S.A., Godkov M.A. Iskusstvennyi intellekt v zdravookhranenii Rossii. Rol' laboratorii. Laboratornaya sluzhba. 2022; 11(2): 5-8. https://doi.org/10.17116/labs2022110215.
  • Singh G. Artificial intelligence in colorectal cancer: a review. Siberian Journal of Oncology. 2023; 22(3): 99-107. https://doi.org/10.21294/1814-4861-2023-22-3-99-107.
  • Mel'nikov P.V., Dovedov V.N., Kanner D.Yu., Chernikovskii I.L. Iskusstvennyi intellekt v onkokhirurgicheskoi praktike. Tazovaya khirurgiya i onkologiya. 2020; 10(3-4): 60-4. https://doi.org/10.17650/2686-9594-2020-10-3-4-60-64.
  • Faur A.C., Lazar D.C., Ghenciu L.A. Artificial intelligence as a noninvasive tool for pancreatic cancer prediction and diagnosis. World J Gastroenterol. 2023; 29(12): 1811-23. https://doi.org/10.3748/wjg.v29.i12.1811.
Еще
Статья научная