Разработка прогностической модели язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных

Автор: Замышляев П.С., Морозкина А.А., Трохина И.Е., Федин А.А., Ямашкина В.В.

Журнал: Огарёв-online @ogarev-online

Статья в выпуске: 7 т.12, 2024 года.

Бесплатный доступ

Среди заболеваний органов пищеварения язвенная болезнь двенадцатиперстной кишки продолжает оставаться одной из наиболее частых причин обращаемости людей за медицинской помощью. Проблема прогноза возможности возникновения и особенностей течения заболевания всегда была и остается важнейшим разделом в деятельности врачей и предметом интенсивной активности ученых в поиске решения задачи. В статье представили этапность и результат разработки прогностической модели язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных.

Искусственный интеллект, прогноз заболевания, язвенная болезнь

Короткий адрес: https://sciup.org/147250579

IDR: 147250579

Текст научной статьи Разработка прогностической модели язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных

Много остается неясного в различных механизмах рецидивов и увеличения риска и частоты осложнений заболевания после, казалось бы, успешной терапии. Кроме того, если говорить о впервые выявленных случаях ЯБ, то прогноз их течения является наиболее актуальным на данном этапе [5]. Исходя из этого, существует большая необходимость модернизации и более полного и активного использования различных компьютерных диагностических технологий, которые необходимо направить на прогнозирование течения ЯБ [6].

Известно, что ранее уже разрабатывались специализированные информационные комплексы, которые позволяют оценить факторы риска с использованием традиционных биостатистических методов, но в полной мере решить проблему разработки персонализированной профилактической стратегии они не могут в силу свойственных им фундаментальных математических ограничений. В то же время ИС продемонстрировали большие возможности в анализе сложных данных [7], однако их потенциал в рассматриваемой области медицины только предстоит изучить.

Цель работы: разработать прогностическую модель язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных.

Материалы и методы. Анализировали данные пациентов с язвенной болезнью и данные здоровых лиц, собранных ранее в рамках диссертационного исследования канд. мед. наук И. Е. Трохиной.

Диагноз определялся экспертно на основании анамнестических, клинических данных, результатов лабораторных и инструментальных методов исследования – эзофагогастродуоденоскопии (ЭФГДС), исследования на инфицированность Нelicobacter pylori. ЭФГДС проводили на основе общепринятой методики эндоскопами Olimpus, Exera (CIF160) в утренние часы, натощак. Анализировались данные лабораторных методов исследования (общего и биохимического анализов крови) при поступлении, на 7-е, 14-е, 30-е сутки течения заболевания. Кровь для исследования брали при первичном обращении до начала лечения и в течение времени при проведении терапии при получении информированного добровольного согласия обследуемых лиц. Использовались данные 27 здорового добровольца (группа 1), 28 больных с ЯБ ДПК (группа 2) и 28 больных с ЯБ ДПК, страдающих хронической ишемией головного мозга (группа 3).

Собранные обезличенные данные анализировались в среде JupyterLab с установленным ядром-интерпретатором языка Python версии 3.8 на компьютере (рабочей станции) с операционной системой Linux Ubuntu 22.04.3 LTS, применялись стандартные библиотеки для анализа данных.

Проводили сначала анализ объединенных данных групп 1 и 2 (то есть, здоровых лиц и больных ЯБ без хронической ишемии мозга), а затем объединенных данных групп 2 и 3 (то есть, только по отношению к данных больных ЯБ, но опционально дополнительно страдающих хронической ишемией головного мозга).

Результаты. Для построения прогностической модели данные были полуавтоматически (для исключения ошибок ручного редактирования) предобработаны: были удалены столбцы, по которым данные были однородны по двум группам (например, столбец с результатами теста на Helicobacter pylori , который у всех пациентов в выборке был положительный), проводился контроль пропусков значений (пропущенных значений не было выявлено). Собственно, исследовательский анализ данных после предобработки включал проверку характера данных, корреляционный анализ и применение метода главных компонент.

Проверка характера данных заключалась в оценке характера распределения записанных показателей исследуемых лиц и вычислении классических статистических показателей: среднего значения – mean, стандартного отклонения – std, минимального и максимального значений – min и max, значений, соответствующих 25, 50, 75 перцентилю распределения – 25‰, 50‰, 75‰ (рис. 1).

Интересная находка была обнаружена при визуализации данных и заключалась в том, что пациенты на основании двухпиковости распределения размеров язвы при поступлении и распределения интенсивности уменьшения язвы к окончанию второй недели лечения могут быть четко разделены на непересекающиеся фенотипы по следующим критериям: с язвой на момент поступления до 10 мм и более 10 мм, а также с уменьшением размеров язвы на 14 сутки лечения до 1 мм включительно и более 1 мм.

ЛФХ

Сфингомиелин

Фосфатидилхолин

Фосфатидилсерин

Фосфатидилинозит

count

65.00000

65.CCCCCC

65.000000

65.000000

65.000000

mean

1.12000

24.800769

47.762769

8.191385

0.734462

std

0.01723

0.605218

0.673699

0.150830

0.022983

min

1.09000

23.810000

46.060000

7.480000

0.640000

25 Mo

1.11000

24.660000

47.3 20000

8.120000

0.730000

50 Mo

1.12000

24.750000

48.030000

8.140000

0.740000

75 Mo

1.13000

24.800000

48.300000

8.260000

0.740000

max

1.20000

27.800000

48.800000

8.610000

0.770000

Рис. 1. Пример таблицы, полученной при проверке характера данных.

Далее представлены примеры визуализации распределений данных (рис. 2).

Рис. 2. Примеры гистограмм проверки характера данных.

Примечания: в столбцы сверху вниз распределены по 3 гистограммы (1-я – распределение без выбросов; 2-я – данные без обработки; 3-я – данные с лог-трансформацией), по оси ординат – частота встречаемости конкретного значения (ось абсцисс).

Следующим шагом исследовательского анализа данных стало проведение корреляционного анализа данных пациентов. Были удалены данные по показателям, коррелирующим с большим числом других показателей (в этом исследовании убирали показатели, имеющие более 3 коррелирующих с ними). Далее приведем примеры таких корреляций в визуальном представлении (рис. 3).

Рис. 3. Примеры визуального представления корреляции между исследованными признаками.

После чистки корреляций, обнаруженных с помощью стандартизации значений факторов и собственно поиска корреляций стандартными методами, проводили анализ с применением метода главных компонент. С помощью этого метода было выяснено, что практически всю вариабельность данных пациентов с ЯБ из выборки нашего исследования возможно соотнести с вариабельностью следующих признаков: длительностью анамнеза курения, а также различиями в показателях роста, массы тела, показателях анализов крови: гемоглобин, билирубин, щелочной фосфатазы (ЩФ) и диацилглицерола (ДАГ).

Заключение. Согласно нашим исследованиям, именно такие признаки как длительность анамнеза курения, рост, масса тела, гемоглобин, билирубин, ЩФ, ДАГ – вероятно, наиболее целесообразно использовать на следующих этапах исследований для построения прогностических моделей машинного обучения (искусственного интеллекта), нацеленных на формирование скрининговых заключений относительно ЯБ ДПК, а также построения моделей для выделения фенотипов пациентов.

Список литературы Разработка прогностической модели язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных

  • Лазаренко В.А., Антонов А.Е., Markapuram V.K., Awad K. Опыт нейросетевой диагностики и прогнозирования язвенной болезни по результатам анализа факторов риска // Бюллетень сибирской медицины. - 2018. - № 17 (3). - С. 88-95. EDN: YLEPPN
  • Кобринский Б.А. Искусственный интеллект и медицина: Возможности и перспективы систем, основанных на знаниях // Новости искусственного интеллекта. - 2019. - № 4. - С. 44-51.
  • Кобринский Б.А., Хавкин А.И., Волынец Г.В. Перспективы применения систем искусственного интеллекта в гастроэнтерологии // Экспериментальная и клиническая гастроэнтерология. - 2020. - № 179 (7). - С. 109-117. EDN: XBURPU
  • Миненок В.А. Использование искусственного интеллекта в медицине // М.: Сборник тезисов конференции CBAI "Вычислительная биология и искусственный интеллект для персонализированной медицины". - С. 75-76.
  • Маев И.В., Андреев Д.Н., Самсонов А.А., Черёмушкина А.С. Язвенная болезнь: современное состояние проблемы // Медицинский совет. - 2022. - № 16 (6). - С. 100-108. EDN: EDVQJU
  • Blaser M.J., Atherton J.C. Helicobacter pylori persistence: biology and disease //j. Clin. Invest. - 2020. - Vol. 113, no. 3. - P. 321-333.
  • Грибова В.В., Петряева М.В., Шалфеева Е.А. Облачный сервис поддержки принятия диагностических решений в гастроэнтерологии // Врач и информационные технологии. - 2019. - № 3. - С. 65-71. EDN: JJGMKZ
Еще
Статья научная