Непараметрический анализ в задачах охраны здоровья
Автор: Акулов В.А.
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 1 т.3, 2001 года.
Бесплатный доступ
Технология охраны здоровья, ориентированная на проблемы ранней диагностики, профилактики и лечения заболеваний, получившая название "Двойной скрини нг-тест", основана на выполнении и компьютерном анализе двух скрининг-тестов в условиях, максимально приближенных к реальным, связанным с профессиональной деятельностью. Первое обследование выполняется в начале работы (перед прогнозируемым стрессом), а второе в конце работы (после стресса). По реакции организма на реальные нагрузки, обусловленные производс твенной деятельностью (смещению жизненно важных показателей), осуществляется заключение о состоянии. Для оценки коллективного здоровья (здоровья в однородной группе) применяется не параметрический анализ данных.
Короткий адрес: https://sciup.org/148197626
IDR: 148197626
Текст научной статьи Непараметрический анализ в задачах охраны здоровья
Как показывает мировой и отечественный опыт, накопленный за последние 15 -20 лет, здравоохранение многими из своих успехов обязано медицинским технологиям. Важнейшими составляющими таких технологий являются технические средства врача, в частности, специализированные информационные системы. Одна из таких технологий, не имеющая ближайших аналогов в СНГ и получившая название "Двойной скрининг -тест" (ДСТ), разработана группой специалистов под руководством автора [1, 5]. ДСТ является технологией охраны здоровья трудоспособного населения. Ее основу составляет анализ реактивности организма, т. е. смещение жизненно важных параметров под действием реальных нагрузок, обусловленных производственной деятельностью пациентов. Необходимая диагностическая информация накапливается в результате двух обследований, разделенных по времени (схема ("До"- "После"). Например, начало работы ("До"), ее окончание ("После"). Это определило название технологии ("двойной").
Применение упомянутой схемы обследования способствует значительному (более, чем в два раза) увеличению объема диагностической информации по сравнению с традиционными схемами. С подобным увеличением связаны два важных обстоятельства: повышенная эффективность технологии и острая потребность в компьютерном анализе данных. Проблеме создания и апробации специализированного интерфейса и посвящена настоящая статья.
ДСТ и оценка коллективного здоровья
ДСТ является технологией, обеспечивающей количественную и качественную оценку состояния организма и степень его адаптации к конкретному виду профессиональной деятельности. С точки зрения принятия административных решений представляют интерес ряд задач, относящихся к проблеме так называемого коллективного здоровья. "Здорова ли группа в целом?", т. е. кто определяет "лицо" группы: здоровые или больные. "Кто из работников по объективным данным обладает наиболее слабым здоровьем и нуждается в адекватной помощи?" и т. п.
Так как тестирование выполняется дважды (схема "До" - "После"), что весьма принципиально, графически результаты представляются в виде 2-х кривых. В качестве типового примера на рис. 1 показаны результаты тестирования по группы пациентов по параметру SYS. В роли пациентов выступали операторы многоканального телефона одной из служб экстренной помощи населению.
Как видно, картина отличается значительным разнообразием. Если пациенты №№ 1, 4, 5, 11 практически не отреагировали на рабочие нагрузки, то пациенты №№ 3, 6, 14, 16 показали значительную реактивность. Отмечены переходы из одной нозологической группы в другую. Так из группы "норма" в группу "риск" переместились пациенты №№ 3, 7, 15, а из группы "риск" в группу "больные" - №№ 6, 9, 14.
Совершенно очевидно, что подобные зависимости строятся и для других парамет-

Рис. 1. Пример смещения (реактивности) АД в течение рабочего дня. По горизонтали отложены порядковые номера пациентов, по вертикали -систолическое артериальное давление (SYS)
ров, измеренных в количественной шкале. В итоге формируется задача анализа множества парных выборок. Специфика ДСТ такова, что число пациентов в группе, как правило, невелико и составляет 10 - 40 человек (малые и средние предприятия, распределения по возрасту, полу и другим признакам). Кроме того, неизвестным является закон распределения. Все это требует привлечения непараметрических методов анализа данных [2-4]. В результате проведенных обоснований [1, 5], были выбраны два из них: критерий знаков и критерий Вилкоксона.
В силу ряда причин разработчики интерфейса были ограничены рамками электронного процессора Excel, в котором отсутствует блок непараметрического анализа. Кроме того, как показал опыт эксплуатации и литературные данные [3], формулы описательной статистики, встроенные в базовый пакет, не отвечают требованиям со стороны ДСТ (низкая надежность и скорость вычислений). В итоге была сформулирована и решена серия задач, включающая в себя адаптацию непараметрических критериев к специфике ДСТ, контроль массивов исходных данных на предмет их соответствия требованиям со стороны непараметрического анализа, "прозрачность" математических моделей и простота работы на уровне начинающего пользователя системы Windows.
Адаптация критерия знаков к условиям ДСТ
Пусть X - исходная выборка, полученная при первом (начальном) тестировании, а
Y — повторная выборка, полученная при повторном тестировании пациентов. Тогда моделью ДСТ — исследований становится множество парных выборок вида:
X = {x i , Х 2 , • ' * , Xn}, Y = {У 1 » y 2 ’ * * * , yn}. (1)
Здесь x i , y i — результат измерения соответствующего параметра, например SYS (см. рис.1) i — го пациента, где i = 1, 2, „.n, n — количество пациентов в группе (объем выборки). В итоге, задача оценки смещений медицинских показателей (реактивность) сводится к типовым или близких к типовым задачам описательной и индуктивной статистики [2]. В целях сокращения изложения ограничимся интерпретацией критерия знаков применительно к ДСТ.
Вычислим разности z i = x i — y i и представим их в виде аддитивной модели
Z i =0 i + e„ (2)
где © i неслучайная величина, характеризующая эффект смещения центров распределений (1), e i — стандартная, нормально распределенная случайная величина.
Сформулируем нулевую гипотезу об отсутствии эффекта смещения H 0 и ей альтернативную H 1 — статистически значимое смещение центров распределения X и Y:
H o : © i = 0, H^ © * 0. (3)
Если справедлива гипотеза H 0 (см. (3)), то с учетом (2) имеем:
P(x i < y . ) = P(x . > у) = 0,5, (4)
где P(*)- вероятность соответствующего события.
Из (4) следует, что число положительных и отрицательных разностей z. не должно значительно отличаться от n/2. Обозначим их соответственно S+, S . В итоге, моделью ДСТ становится широко известная схема Бернулли для случая Р = 0,5. Таким образом, интерпретация парных данных (статистический вывод) принимает вид:
Max {S + , S} < S„ ^ H 0 , (5)
Max {S+, S} > S к p ^ H 1 . (6)
Критическое значение Sкр определяется по таблицам, причем
SKP = SKP ( a , (n - г)), (7)
где а - уровень значимости, г- число нулевых разностей z . [2].
Суммы S + , S - , г вычисляются по формулам:
1, если z j > 0, (zi< 0)
S + (-) =
S
0, если zi< 0, (zi > 0).
г = n - S+ - S - . (9)
Программный интерфейс
Эффективность ДСТ в значительной степени определяется эффективностью и доступностью программного интерфейса врача, что обусловлено массовым характером обработки и большим числом решаемых задач. Структурно интерфейс оформлен в виде блоков и построен в среде Excel, как получившей широкое распространение в медицинских учреждениях. Каждый из блоков включает в себя одну или несколько страниц и выполняет функции хранения исходных данных, предварительной обработки, рабочего поля и критериальных оценок.
Основным экраном является рабочее поле, на котором и осуществляется обработ ка и интерпретация данных (рис.2). Рабочее поле состоит из нескольких областей. Область (В9:С60) отведена под исходные данные (X, Y) (на рис.2 показан фрагмент). Несколько выше (А2:С7) выводятся показатели описательной статистики, позволяющие в оперативном порядке оценить крайние значения обрабатываемого параметра (Мин, Макс), центр распределения (М.ожид) и разброс. Если выборки не отвечают требованиям со стороны анализа, в частности, непарные выборки, в блоке (А8:С8) выводятся соответствующие аварийные сообщения.
В поле F25 формулируется статистический вывод. В приведенном примере выборки не имеют существенных отличий (гипотеза Н0, см. формулы (3)). Значительную часть экрана занимает парный график анализируемых выборок (X, Y), существенно облегчающий оценку состояний как отдельных пациентов, так и группы в целом.
Интерфейс ДСТ отличается исключительной простотой применения. Так, например, работа с экраном "рабочее поле" заключается в выполнении 3 - х процедур, доступных начинающему пользователю:
-
• Очистка полей исходных данных (нажатие кнопки в ячейке А10).
Рис. 2. Типовой экран "Рабочее поле" интерфейса ДСТ
-
• Ввод исходных данных X, Y с помощью обычных для Excel приемов, известных начинающему пользователю. По окончании ввода выдаются соответствующие результаты обработки, включая, таблицу с показателями описательной статистики, графическую иллюстрацию и статистический вывод.
-
• Чтение и распечатка результатов анализа.
Второй особенностью является компоновочная схема экрана. В отличие от широко распространенных "бухгалтерских" схем, результаты расчетов и, соответственно, расчетные формулы предшествуют исходным данным. Подобный простейший прием повысил наглядность, существенно сократил число рутинных операций и свел к минимуму вероятность ошибочных действий, возможных при ручном переносе блока формул, что важно при массовом характере обработки массивов переменной длины.
Третья особенность заключается в создании собственного блока непараметрической статистики (формулы 1 -9), поскольку в базовой системе Excel она не предусмотрена. Как показал опыт эксплуатации, а также литературные данные [3], процедуры описательной статистики организованы в Excel нерационально, а, главное, ненадежно. В связи с этим разработан собственный блок описательной статистики.
Четвертая особенность состоит в графической иллюстрации статистического вывода в виде отдельного экрана. Экран содержит графическую интерпретацию таблицы критических значений статистики S, а также точку, соответствующую фактическому значению S + . Подобное простое решение позволяет пользователю, не являющемуся специалистом в области непараметрической статистики, оценить "надежность" статистических выводов. В частности, если фактическое значение приближается к критическому, следует принять меры к накоплению статистических данных.
Апробация ДСТ- технологии в реальных условиях
ДСТ - технология в варианте, ориентированном на диагностику заболеваний системы кровообращения, и ее интерфейс были апробированы в реальных условиях. В общей сложности обследовано около тысячи человек, в числе которых, водители служебного и общественного транспорта, врачи санатория Волжский Утес (лечебное учреждения Управления делами Президента РФ), служащие банка, операторы многоканального телефона одной из экстренных служб крупного города, студенты, артисты джаза и т. д. Апробация подтвердила высокую эффективность ДСТ как технологии целом, так и ее программного интерфейса.
В результате компьютерного анализа получены уникальные данные. Так, например, при кажущейся близости условий труда, уровень возмущений и, соответственно, реактивность организма могут существенно отличаться. Примером является система кровообращения артистов одного из профессиональных джаз- оркестров (рис.3). Прежде всего, отметим уникальность самого эксперимента, когда получены количественные данные о состоянии системы кровообращения артистов на сцене. Кроме того, отметим, что артисты разделились на две группы. Если для первой группы характерна незначительная реактивность (пациенты № 1 - 8), то для другой наоборот- она оказалась ярко выраженной (№ 9 - 12). Как было установлено, в первую группу входили артисты оркестра, которые в ходе выступления мало волновались ("обычная работа"), а во вторую - солисты, которые испытывали значительный стресс.
Таким образом, при наблюдении за здоровьем необходимо тщательное обследование специфики рабочего места пациента. Даже в пределах одного помещения (сцена в рассматриваем случае) ситуация может отличаться самым коренным образом

Рис. 3. Реактивность системы кровообращения артистов джаза но параметру SYS
Другим важным результатом является то, что реактивность является ранним предвестником заболевания, когда оно находится в начальной стадии и не ощущается пациентом. Третьим результатом является то, что состояние некоторых групп пациентов может улучшаться в течение рабочего дня в случаях умеренной физической нагрузки и благоприятного морального климата. Примером служат метеозависимые люди.
Выводы
-
1. Разработан программный интерфейс, обеспечивающий информационное сопровождение технологии охраны здоровья, известной как "Двойной скрининг - тест". Технология предусматривающей количественную и качественную оценку состояний и степень адаптации организма к реальным нагрузкам, обусловленным производственной деятельностью людей (нагрузочный тест по схеме "До - После"). Оценка состояний осуществляется как по величине ряда жизненно важных параметров, так и их смещениям, вызванным реальными нагрузками (реактивность организма).
-
2. Интерфейс реализован в среде Excel, что потребовало создания серии специализированных блоков, ориентированных на массовую обработку парных данных. В их числе, блок подготовки исходных данных (проверка их корректности с точки зрения математических моделей), блок визуализации исходных данных и результатов расчетов, блок описательной статистики, блок непараметрического анализа. При разработке бло
-
3. Технология и ее интерфейс апробированы в реальных условиях (водители, операторы многоканальных телефонов одной из экстренной служб, врачи санатория Волжский Утес, артисты, студенты и т. д). В общей сложности обследовано около тысячи пациентов. Подтверждена высокая эффективность как самой технологии охраны здоровья, так и ее программного интерфейса.
ков найдены оригинальные и простые решения, направленные на повышение достоверности расчетов, простоты и удобства пользователей, не являющихся специалистами в области информатики.