Использование шанса и шансового отношения для выявления связи между качественными переменными

Бесплатный доступ

В статье рассмотрены прикладные статистические понятия, касающиеся шанса. Приведены примеры, иллюстрирующие применение данного метода для выявления зависимости между качественными переменными при лечении вируса гриппа N1H1.

Шанс, вероятность, отношение шансов, стандартная ошибка, доверительный интервал, вирус гриппа n1h1

Короткий адрес: https://sciup.org/142148113

IDR: 142148113

Текст научной статьи Использование шанса и шансового отношения для выявления связи между качественными переменными

Несколько десятилетий назад самым популярным способом выявления связи между качественными переменными был критерий Хи-квадрат. Но в последнее время многие исследователи отдают предпочтение вычислениям, связанным с шансами. Поскольку критерий отношения шансов не имеет жестких условий применимости, которые существуют у критерия Хи-квадрат, и к тому же статистика шансов интерпретируется значительно легче, то в настоящее время в основе многих расчетов и выводов о наличии связи между качественными признаками лежит понятие шанса.

Теоретическая часть

  • 1.    Шанс. Шанс [ odds ] – это отношение вероятности того, что событие А произойдет к вероятности того, что оно не произойдет.

Шансы и вероятности содержат одну и ту же информацию, но по-разному выражают ее. Если вероятность того, что событие А произойдет обозначить Р ( А ), то вероятность того, что событие не произойдет, будет равна 1- Р ( А ). Тогда шансовое преимущество события А (шанс) будет определяться выражением [1]:

q=P

1 - P ( A )

.

Известно, что вероятности противоположных событий в сумме дают 1. Шансы же противоположных событий в произведении дают 1:

P ( A ) x 1 P ( A ) = 1

1 - P ( A )    P ( A )     .

Интерпретация значения величины шанса следующая:

  • 1)    Если шанс равен 1, то вероятности наступления и того, что событие не произойдет, равны;

  • 2)    если шанс больше 1, то вероятность наступления события больше вероятности того, что событие не произойдет;

  • 3)    если шанс меньше 1, то вероятность наступления события меньше вероятности того, что событие не произойдет.

  • 2.    Отношение шансов. Отношение шансов (ОШ) (Odds Ratio) – отношение шансов события в одной группе к шансам события в другой группе, или отношение шансов того, что событие произойдет к шансам того, что событие не произойдет.

По вычисленным значениям шансов можно сделать только малоинформативные выводы: что, вероятнее, произойдет событие или не произойдет. Поэтому в прикладной статистике работают не только с шансами и шансовыми преимуществами, но также часто вычисляют и шансовые отношения. Отношение шансов существует для проявления определенного уровня дихотомической переменной в двух группах субъектов. Например, если два возможных состояния для переменной характеризуются как успех и неуспех, то отношение шансов является мерой шансов успехов в одной группе по отношению к другой [1].

Расчет OR (воздействия фактора риска) служит хорошим инструментом, но поскольку он основан на выборке, то он является не более чем оценкой. Точность этой оценки отчасти зависит от размера выборки и в целом чем больше выборка, тем правдоподобнее оценка, хотя следует с большой осторожностью подходить к интерпретации OR в исследованиях с огромными размерами выборки. Поэтому в дальнейшем будет целесообразно рассмотреть точность полученной оценки, а также кроме расчета OR вычислить стандартное отклонение и доверительный интервал.

Математически отношение шансов легко получить, если представить данные в виде таблицы 1 сопряженности.

Таблица 1

Таблица сопряженности 2×2

В 1

В 2

Всего

А 1

f 11

f 12

f 10

А 2

f 21

f 22

f 20

Всего

f 01

f 02

f 00

В этом случае оценку отношения шансов можно найти по формуле:

o = / 11 x f 22 f 12 x f 21

.

Так как данное выражение является дробью, то при условии f 12 = 0 или f 21 = 0 оно теряет математический смысл. Поэтому в этом случае, или если вообще в любой ячейке встречается частота, равная нулю, формулу (2) использовать нельзя. В связи с этим было предложено преобразовать выражение для оценки шансов в следующее [1]:

o, = ( f ii + 0,5) x ( f 22 + 0,5) ( / 12 + 0,5) x ( f 21 + 0,5)

.

Отношение шансов используется для представления результатов мета-анализов и исследований случай-контроль. Если заболевание очень редкое – маленькие частоты событий, то отношение шансов примерно равно относительному риску. Значения ОШ от 0 до 1 соответствуют снижению риска, более 1 – его увеличению. ОШ, равное 1, означает отсутствие эффекта. Общая схема интерпретации величины отношения шансов выглядит следующим образом:

  • 1)    если отношение шансов равно 1, то шанс для первой группы равен шансу для второй группы, это свидетельствует об отсутствии различий между сравниваемыми группами;

  • 2)    если отношение шансов больше 1, то шанс для первой группы больше шанса для второй

группы;

  • 3)    если отношение шансов меньше 1, то шанс для первой группы меньше шанса для второй группы.

  • 3.    Стандартная ошибка отношения шансов. Как было сказано выше, находя значение отношения шансов, мы находим только оценку отношения шансов. Величина стандартной ошибки позволяет оценить точность полученной оценки отношения шансов. Стандартную ошибку отношения шансов можно оценить при помощи следующего выражения [1]:

    станд. ошибка ( о ) = о х



    111 . f 11      f 12      f 21 f 22



  • 4.    Доверительные интервалы для отношения шансов. Доверительный интервал – интервал значений, который с заданной доверительной вероятностью накрывает истинное значение оцениваемого параметра. Существует несколько различных способов построения доверительного интервала для отношения шансов. Рассмотрим один из них, который предложен в [1]. Как замечают сами авторы, процесс поиска границ доверительного интервала является итерационным, а следовательно, и весьма громоздким. Однако довольно часто для практических задач достаточно найти приблизительные границы доверительного интервала: ω L – нижняя граница и ω U – верхняя граница. Чтобы получить более точные оценки границ доверительного интервала воспользуемся формулами:

Если значение отношения шансов для нежелательных исходов (например, осложнение или смерть) меньше 1, то это свидетельствует об эффективности метода лечения, направленного на снижение риска этого исхода.

Данная формула для вычисления стандартной ошибки отношения шансов применима, если отношение шансов находится по формуле (2). Если же величина отношения шансов находится по формуле (3), то стандартную ошибку следует вычислять по нижеприведенной формуле:

станд. ошибка ( о ) = о х --и--и--и-------- .                (5)

] f л + 0,5 f 2 + 0,5 f 21 + 0,5 f 22 + 0,5                 "

Следует иметь в виду, что само по себе значение OR нечувствительно к размеру выборки, однако от размера выборки зависит размер стандартного отклонения и точность полученных выводов. Величина стандартной ошибки нужна также для построения доверительного интервала для отношения шансов.

® L = exP( L ' - c a /2 х SE ( L ')) ,                               (6)

to u = exp( L ' + c a /2 х SE ( L *)) ,

где c a /2 = 1,96 - процентная точка стандартного нормального распределения = 0,95);

L' = ln ( o ');

SE ( L' ) =

f 11 + 0,5

+ f 12 + 0,5

+ f 21 + 0,5 + f 22 + 0,5 .

Рассчитав данные значения, мы получим интервал, в котором с доверительной вероятностью 0,95 лежит истинное значение отношения шансов.

Расчетно-аналитическая часть

Пример 1 . По данным Управления Роспотребнадзора в Республике Мордовия в 2009-2010 гг. было зарегистрировано 75 случаев заболевания вирусом N1H1 («свиной грипп») среди взрослых людей (18-58 лет) и 45 случаев среди детей (до 18 лет). Среди взрослых было 9 летальных исходов, среди детей летальных исходов не было. Данные по заболеваемости и результатам лечения представлены в таблице 2.

Таблица 2

Частоты результатов лечения вируса N1H1 в Республике Мордовия в 2009-2010 гг.

Возраст

Результат лечения

Летальный

Выздоровление

Всего

Дети 0-17 лет

f 11 = 0

f 12 = 45

45

Взрослые 18-58 лет

f 21 = 9

f 22 = 66

75

Всего

9

111

120

Разделим данную таблицу на две, в каждой из которых будет информация только о категории больных одного возраста.

Пример 1.1. Вычислим шансы результата лечения для пациентов возрастной группы 0-18

лет.

Таблица 3

Частоты результатов лечения вируса N1H1 в 2009-2010 гг. в Республике Мордовия среди детей

Результат лечения

Число пациентов

Выздоровление ( f 12)

45

Летальный исход ( f 22)

0

Всего

45

Среди 45 детей, заболевших вирусом «свиного гриппа», летальных исходов не было. Пусть событие А дет , состоит в том, что любой ребенок из перенесших инфекцию окажется выздоровевшим. Тогда вероятность этого события будет равна Р ( А дет ) = 45/45 = =1,00. А вероятность противоположного события В дет , состоящего в том, что заболевание закончилось летальным исходом, будет нулевой, т.е. Р ( В дет ) = 0/45 = 0. Тогда для любого пациента из группы детей шанс, что он излечится, будет равен «бесконечно большой величине».

Для любого же ребенка, перенесшего вирус N1H1, шанс, что заболевание закончится летальным исходом, будет равен:

odds ( B . „) = - PB ®^- = £ = 0.

дет' 1 - P ( B дет)   1

Значение шанса летального исхода, равного нулю, говорит о 100%-ной выживаемости среди детей, перенесших данное заболевание. Однако не стоит забывать, что данный коэффициент рассчитан только по данным этой выборки. Поэтому к данному значению нужно относиться как к одному из частных случаев, имеющих максимальный положительный эффект и, возможно, отражающему общее соотношение выздоровления среди взрослых и детей.

Пример 1.2. Вычислим шансы результатов лечения для пациентов возрастной группы 1858 лет.

Таблица 4

Частоты результата лечения вируса N1H1 в 2009-2010 гг. в Республике Мордовия среди взрослых пациентов

Результат лечения

Число пациентов

Выздоровление ( f 22)

66

Летальный исход ( f 21)

9

Всего

75

Найдем шансовое преимущество события Аврс, состоящего в выздоровлении взрослого пациента, исходя из данных таблицы 4. Количество взрослых людей, заболевших вирусом гриппа N1H1, составило 75 человек. Из них 66 человек выздоровело, а в 9 случаях наблюдался летальный исход. Таким образом, Р (Авзр) = 66/75 = 0,88. А вероятность противоположного события, состоящего в том, что заболевание закончилось летальным исходом, равна 1 - Р (Авзр) = 1 – 0,88 = 0,12. Тогда для любого пациента из взрослой группы шансовое преимущество, что он излечится, будет равно odds (A взр) =

P ( A взр ) = 0,88 1 - P ( A взр ) "0,12

= 7,333.

Так как odds (Авзр) = 7,333 > 1, то вероятность выздоровления пациента больше вероятности летального исхода, и не просто больше, а больше в 7,333 раза. Для нового заболевания, с которым до этого врачам не приходилось сталкиваться, это достаточно хороший показатель эффективности лечения.

Если ввести событие В взр , которое будет состоять в том, что результат лечения взрослого пациента – летальный исход, то шанс, что заболевание закончится летальным исходом, будет равен: odds ( BB3 d) = P ( B взр ) = ^,12 = 0,136.

v взр7 1 p ( в взр ) 0,88

Так как odds ( В взр ) = 0,136 < 1, то вероятность летального исхода меньше вероятности выздоровления, что, несомненно, радует. Чем меньше будет данное значение, тем больше шансов выздороветь-выжить у больного.

Пример 2. Вычислим отношение шансов и сделаем выводы об эффективности лечения для пациентов различных возрастных групп по данным таблицы 2 (см. пример 1).

В случае, когда все значения частот в таблице сопряженности отличны от нуля, для вычисления оценки отношения шансов следует использовать формулу (2). Но так как в рассматриваемом примере f 11 = 0, то следует воспользоваться формулой (3). Получаем:

o, = (0 + 0,5) X (66 + 0,5) = 33,25 = 0 077 (45 + 0,5) x (9 + 0,5) 432,25     ,    "

Так как отношение шансов отлично от единицы, следовательно, можно сделать вывод о существенном различии в эффективности лечения взрослых пациентов и детей. Полученное значение о' = 0,077 < 1 говорит о том, что шансы, т.е. относительный риск летального исхода для первой группы пациентов – детей, статистически значимо ниже, чем для второй группы пациентов – взрослых. Так как мы вычисляли отношение шансов для нежелательного исхода – летального, и оно получилось меньше единицы, то в целом это свидетельствует об эффективности метода лече- ния, направленного на снижение риска этого исхода.

Пример 3. Вычислим стандартную ошибку отношения шансов. Так как в ячейке f 11 значение частоты равно 0, воспользуемся формулой (5) для вычисления стандартной ошибки. Получим:

станд. ошибка ( о ' ) = 0,077 х

у 0 + 0,5 45 + 0,5 9 + 0,5 66 + 0,5

= 0,077 х V 2,142 = 0,113 .

Пример 4. Используя стандартную ошибку отношения шансов, рассчитаем границы доверительного интервала для отношения шансов. Для этого сначала следует найти натуральный логарифм отношения шансов и SE ( L '). Имеем следующие расчеты: L' = ln (0,077) = - 2,564,

SE ( L ') = I 1— +-- 1-- + —— +-- 1--- = J 2,142 = 1,464.

\ 0 + 0,5 45 + 0,5 9 + 0,5 66 + 0,5

Осталось только найти нижнюю и верхнюю границы доверительного интервала:

to L = exp( - 2,564 - 1,96 х 1,464) = 0,004; ro L = exp( - 2,564 + 1,96 х 1,464) = 1,356.

Итак, с доверительной вероятностью 0,95 значение величины отношения шансов, о ' = 0,077 лежит в интервале от 0,004 до 1,356. Доверительный интервал получается достаточно большим и выходит за границы единицы в большую сторону на 0,356, тогда как отклонение влево составляет 0,996. Таким образом, большинство значений, входящих в этот интервал, меньше единицы, и следовательно, применяемое лечение дает положительный результат.

Статья научная