Математическая модель и программа прогнозирования успешности лечения на основе регрессионного анализа

Автор: Есипов Борис Алексеевич, Губанов Евгений Сергеевич, Боряев Евгений Александрович

Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc

Рубрика: Информационные технологии в медицине

Статья в выпуске: 4-2 т.16, 2014 года.

Бесплатный доступ

В данной статье рассмотрена математическая модель для прогнозирования результатов хирургического лечения с использованием статистического анализа данных о пролеченных больных.

Математическая модель, регрессионный многофакторный анализ, критериальное пространство

Короткий адрес: https://sciup.org/148203210

IDR: 148203210

Текст научной статьи Математическая модель и программа прогнозирования успешности лечения на основе регрессионного анализа

На современном этапе развития медицины информационные нагрузки достигают пределов человеческих возможностей. Возникает дилемма: либо приходится жертвовать полнотой анализа информации, либо необходимо шире использовать различные методы компьютерной поддержки принятия решений. Медицинские экспертные системы позволяют врачу не только проверить собственные диагностические предположения, но и обратиться к компьютеру за консультацией в трудных диагностических случаях [2].

Рак предстательной железы является одной из актуальных проблем современной онкоурологии. Существует множество методов лечения данной патологии.

Например, высокоинтенсивный фокусированный ультразвук (HIFU) является новым методом лечения локализованного рака предстательной железы [3]. Эффективность, а также последствия его использования, малоизучены в России. Этот современный метод имеет как положительные моменты в лечении рака предстательной железы, так и отрицательные.

Целью настоящей работы является разработка математической модели и применение математических методов анализа результатов хирургических вмешательств на основе статистических данных о пролеченных пациентах и прогнозирования успешности будущих операций.

Прогнозирование успешности операций и возможных послеоперационных осложнений яв-

ляется основной функцией врача-хирурга. Так или иначе, при принятии решения о проведении хирургической операции он руководствуется большим числом индивидуальных факторов, присущих пациенту, а так же предшествующим опытом лечения большого числа больных. В этом смысле интуиция врача – это знание , базирующееся на опыте, т.е. статистическом материале. Поэтому естественно развивать индустрию получения медицинских знаний в том числе и на глубокой обработке статистического материала.

Математический аппарат многофакторного регрессионного анализа является эффективным приемом для решения разнообразных медицинских задач.

Будем определять успешность медицинской операции некоторыми количественным критериями yj , j – номер критерия. В нашей работе мы применяли четыре критерия, измеряющих тяжесть послеоперационных осложнений: y1 – недержание мочи, y2 - острая задержка мочи, y3 – прогрессия заболевания, y4 - стриктура. Идеальное значение всех критериев y =0.

С каждым пациентом связано большое количество индивидуальных факторов, которые по вероятности влияют на успешность операции A , обозначим их x i , где i – номер фактора. Факторы могут быть как количественными, так и качественными. Дооперационные данные: возраст, стадия, предшествующие операции на предстательной железе, объем железы, наличие инфра-везикальной обструкции (данные урофлоумет-рии, объем остаточной мочи) и фактор, относящийся к техническим особенностям выполнения операции: объем предстательной железы подвергшейся воздействию высокоинтенсивного ультразвука – являются входными параметрами, влияющими на исход лечения.

y 2

y 20

Рис. 1. Зоны риска в пространстве критериев y10

Зоны риска

y 1

Первоначальные исследования использовали имеющиеся данные о 12 факторах: 1– возраст, 2 – стадия заболевания по TNM, 3 – ПСА, 4– сумма Глисона, 5- объем простаты, 6 – объем простаты перед HIFU, 7– длина простаты перед HIFU, 8 – ширина простаты перед HIFU, 9 – высота простаты перед HIFU, 10 – максимальная скорость потока мочи, 11– средняя скорость потока мочи, 12 – остаточная моча.

В настоящее время имеется достаточно большой статистический материал, содержащий однородные по видам терапий (HIFU, HIFU+ТУР) группы данных для большой выборки больных: (yj,xi ), что дает возможность применить методику статистического многофакторного регрессионного анализа. Она заключается в получении уравнений регрессии y j =f А (x1,x2, …xm) – где y j – среднее ожидаемое значение критерия j . Технически задача получение такой зависимости не представляет трудности при применении стандартных компьютерных программ. Другое дело определение значимости полученной зависимости и сопоставление выводов статистических методов с медицинскими рекомендациями. С точки зрения создания экспертной системы такая зависимость представляет собой знание, на основе которого можно построить многие интеллектуальные процедуры вывода. Действительно, если на обучающей выборке получено уравнение регрессии, то можно рассмотреть задачу классификации пациентов по критериям успешности операции А .

Предварительно разбиваем пространство критериев на две части – допустимую и недопустимую. Для этого медики - эксперты указывают границы допустимых значений критериев yj0. Тогда допустимым множеством критериев будет такое Y0, где по всем критериям выполняется не- равенство yj < yj0 , для всех j. Все другие сочетания значений критериев образуют недопустимое множество YR (зона риска). На рис. 1 показан пример зон риска для двух критериев.

Тогда можно классифицировать нового пациента с точки зрения успешности операции A . Для этого необходимо получить результаты анализов этого пациента по стандартизованной схеме (x1,x2, …xm), подставить эти значения в уравнение регрессии для предполагаемого вида терапии A и проверить полученные значения критериев на принадлежность к множеству Y0 .

Такой подход, очевидно, может быть применен для прогнозирования успешности любых видов лечения.

На рис. 2 приведена структурная схема программной системы. Она состоит из взаимосвязанных подсистем, каждая из которых выполняет фиксированный набор функций.

Кратко охарактеризуем назначение подсистем.

  • 1.    Подсистема управления – представляет собой систему меню;

  • 2.    Подсистема пациента – отвечает за добав-ление/редактирование характеристик пациента;

  • 3.    Подсистема обработки данных обследования – отвечает за решение уравнений регрессии;

  • 4.    Подсистема прогноза – на основе статистических данных производит регрессионный анализ и выдает результирующие данные об уравнениях регрессии, а так же решение о прогнозе успешности того или иного вида лечения;;

  • 5.    Справочная подсистема – дает необходимую информацию о программе и о том, как с ней работать;

  • 6 .    Подсистема визуализации – обеспечивает удобную работу с программой, информирует пользователя в процессе работы о каких-либо исключительных ситуациях или ошибках.

    Рис. 2. Структура программной системы


В работе рассмотрен пример применения такого подхода для прогнозирования HIFU-терапии. В исследование вошли 40 больных раком предстательной железы, пролеченных методом HIFU-терапии. Все пациенты перед лечением прошли комплексное обследование для определения стадии заболевания и состояния мочевыделительной системы.

Прогнозирование исхода лечения проведено с помощью программных средств на основе многофакторного регрессионного анализа.

В основу была положена модель линейной множественной регрессии yk = P 0 + P 1X1+ P 2x2+ ... + p mxm + £ k , где k- номер наблюдения (k=1,n) или в матричном виде y = Р X + E ,

Здесь y – вектор объясняемых переменных; E - вектор значений ошибки; Р - вектор коэффициентов; Х – матрица объясняющих переменных размером n• (m+1), в которой первый столбец содержит единичные элементы. Известно [1], что тогда оценки коэффициентов Р , полученные по методу наименьших квадратов, определяются выражением

Р = (XXy^’Y.

Это выражение справедливо и для других моделей регрессии, у которых неизвестными являются коэффициенты при любых степенях x .

На рис.3 представлена диаграмма прогнозирования результирующих параметров.

Рис. 3. Диаграмма прогнозирования результирующих параметров

Первые результаты показали работоспособность методики, хотя пока рано говорить о законченности системы прогнозирования и широком ее использовании. Выбранные 12 факторов для анализа показали хотя и заметную, но все-таки слабую корреляцию с критериями yj .

Рис. 4. Таблица пролеченных больных (обучающая выборка)

Коэффициент детерминации 35% – это значит, что только на одну треть критерии определяются выбранными показателями, а 65% этих величин зависят от чего-то другого (см. рис. 5). К счастью, разработанные программы дают возможность проэкспериментировать с другими факторами и найти то множество факторов, которое дает наибольшую корреляцию с критериями успешности. Это может привести к более широким предоперационным анализам больных.

Проведен эксперимент с классификацией нового пациента. Получены значения критериев:

y1 =1,37; y2 =1,43; y3 = 1,12; y4 = 0,98. Оказалось, что этому пациенту показана HIFU+ТУР-терапия, что совпало с рекомендацией врачей. На рис. 4 и 5 показаны некоторые фрагменты выходных форм документов, реализованных в компьютерной программе.

В заключение следует отметить, что практическая эффективность предлагаемых средств зависит от дальнейших исследований информативности входных факторов, получаемых как в предоперационных исследованиях, так и в процессе проводимых операций. Созданная программа частично по-

Рис 5. Пример результатов регрессионного анализа

зволяет выявить состав факторов, наиболее влияющих на результаты лечения на основе вычисления коэффициентов множественной корреляции.

Список литературы Математическая модель и программа прогнозирования успешности лечения на основе регрессионного анализа

  • Приходько А.И. Практикум по эконометрике: регрессионный анализ средствами Excel. Ростов н/Д.: Феникс, 2007. 266 с.
  • Андрейчиков А.В. Андрейчикова О.Н. Интеллектуальные информационные системы. М.: Финансы и статистика, 2006. 424 с.
  • HIFU -новый метод лечения рака простаты [Электронный ресурс]. URL: http://www.consmed.ru/news/view/526/(дата обращения 24.11.2013).
Статья научная