Статистические связи с дозой облучения и оценка радиационных рисков неонкологических заболеваний эндокринной системы ликвидаторов Чернобыльской аварии с учётом возможных ошибок в постановке и регистрации диагнозов
Автор: Горский А.И., Чекин С.Ю., Максютов М.А., Карпенко С.В., Туманов К.А., Зеленская Н.С., Лашкова О.Е.
Рубрика: Научные статьи
Статья в выпуске: 1 т.32, 2023 года.
Бесплатный доступ
Исследованы статистические связи заболеваний эндокринной системы участников ликвидации последствий аварии на Чернобыльской АЭС (ликвидаторов) с дозой облучения по данным наблюдений Национального радиационно-эпидемиологического регистра с 1986 по 2020 гг. Всего среди 41979 ликвидаторов установлено 107713 диагнозов заболеваний, входящих в рубрики Е00-E90 Международной классификации болезней (МКБ-10). Анализ статистических связей доз облучения и структуры диагнозов заболеваний проведён статистическими методами Data Mining, свободными от априорных предположений о вероятностных распределениях доз и диагнозов, и моделей связи заболеваний с дозой облучения. Выявлены статистически значимые связи с дозой облучения для рубрик диагнозов заболеваний E01 (йодная недостаточность), E04 (зоб), E06 (тиреоидит), E11 (сахарный диабет II типа). Связи с дозой облучения для отдельных диагнозов в основном представлены парой диагнозов E01.2 (зоб эндемический, связанный с йодной недостаточностью) и E04.0 (нетоксический диффузный зоб). Выявленные статистические связи подтверждаются оценками избыточного относительного риска (ERR) и относительного риска (RR). Пороговая зависимость RR от дозы облучения, с порогом около 0,3 Гр, свидетельствует о том, что действие радиации на эндокринную систему человека является детерминированным эффектом (относится к тканевым реакциям). Полученные количественные оценки радиационных рисков заболеваний эндокринной системы среди ликвидаторов являются устойчивыми по отношению к показателю специфичности диагностики, вплоть до показателя специфичности 90%. Использованный общий статистический метод Data Mining поиска связей между диагнозами заболеваний и дозой облучения является полезным для выявления тех заболеваний, для которых необходимо получить оценки радиационного риска традиционными методами радиационной эпидемиологии.
Ликвидаторы последствий аварии на чаэс, мужчины, неонкологические заболевания, эндокринная система, доза облучения, статистическая связь с дозой, интеллектуальный анализ данных "data mining", программа "статистика", анализ связи
Короткий адрес: https://sciup.org/170197398
IDR: 170197398 | DOI: 10.21870/0131-3878-2023-32-1-21-35
Текст научной статьи Статистические связи с дозой облучения и оценка радиационных рисков неонкологических заболеваний эндокринной системы ликвидаторов Чернобыльской аварии с учётом возможных ошибок в постановке и регистрации диагнозов
Эндокринная система – интегрированная система малых органов, которая включает в себя секрецию внеклеточных сигнальных гормонов, способствующих регулированию метаболизма, роста, половой зрелости, воспроизводства, функции тканей и поведения. Эндокринная система состоит из центральных эндокринных желёз (гипоталамус, эпифиз и гипофиз) и периферийных эндокринных желёз (щитовидная железа, паращитовидная железа и надпочечники) [1].
Нарушения эндокринной системы часто возникают после лучевой терапии, они встречаются у 50% лиц, перенёсших рак в детстве, и включают нарушение роста, дисфункцию щитовидной и паращитовидной желёз, ожирение, нарушение полового созревания и бесплодие. Большинство заболеваний эндокринной системы возникает при краниальном облучении (облучение черепа), лучевой терапии опухолей мозга фракционированными дозами 1-2 Гр, достигающими за период лечения нескольких десятков грей [1].
Горский А.И.* – вед. науч. сотр., к.т.н.; Чекин С.Ю. – зав. лаб.; Максютов М.А. – зав. отд., к.т.н.; Карпенко С.В. – инженер; Туманов К.А. – зав. лаб., к.б.н.; Зеленская Н.С. – науч. сотр.; Лашкова О.Е. – науч. сотр. МРНЦ им. А.Ф. Цыба – филиал ФГБУ «НМИЦ радиологии» Минздрава России.
Среди лиц, переживших атомные бомбардировки в Японии [2], исследовали нераковые заболевания щитовидной железы, такие как узлы и аутоиммунные заболевания. В диапазоне эквивалентных доз облучения от 0,087 до 0,45 Зв были выявлены статистически значимые связи с дозой для всех твёрдых узлов, злокачественных новообразований, доброкачественных узлов и кист. Отмечалось отсутствие значимых связей с дозой облучения для аутоиммунных заболеваний щитовидной железы. Среди участников ликвидации последствий аварии на Чернобыльской АЭС (ликвидаторов) наблюдались статистически значимые связи заболеваний эндокринной системы с поглощённой дозой внешнего гамма-облучения всего тела [3]. В рамках линейной бес-пороговой модели «доза-эффект» избыточный относительный риск на единицу дозы (ERR/Гр) был равен 0,42 с 95% доверительными пределами (ДП) от 0,29 до 0,55.
В данной работе проводится исследование статистических связей заболеваний эндокринной системы, расстройства питания и нарушения обмена веществ ликвидаторов (рубрики E00-E90 Международной классификации болезней (МКБ-10)) [4] с дозой облучения с использованием современных методов «Data Mining» [5] и непараметрических оценок радиационного риска.
Материалы и методы
В исследовании использованы данные наблюдений Национального радиационно-эпидемиологического регистра (НРЭР) за когортой ликвидаторов с 1986 по 2020 гг. Когорта сформирована с использованием следующих условий выбора:
-
1) ликвидаторы-мужчины, имеющие официальные данные об индивидуальной дозе внешнего гамма-облучения всего тела;
-
2) ликвидаторы, зарегистрированные в НРЭР до конца 1991 г.;
-
3) ликвидаторы, въехавшие в зону работы в период 1986-1987 гг.;
-
4) ликвидаторы, имеющие доступную информацию о статусе здоровья за период наблюдения 1986-2020 гг.
Для проведения анализа заболеваемости болезнями эндокринной системы, расстройства питания и нарушения обмена веществ по вышеописанным критериям выборки в когорту вошли 69438 ликвидаторов со средней дозой внешнего облучения всего тела 0,133 Гр. Среди этих ликвидаторов зарегистрирован 37301 впервые выявленный случай заболеваний болезнями эндокринной системы (среди всего диапазона исследуемых кодов E00-E90).
Для анализа дозовой зависимости заболеваемости все случаи заболеваний были разделены на две дозовые группы: с дозой внешнего облучения меньше или равной 0,15 Гр (группа 0, средняя доза 0,07 Гр) и дозой больше 0,15 Гр (группа 1, средняя доза 0,22 Гр), и две возрастные группы: до 50 лет (группа 0, средний возраст 42,1 лет) на момент заболевания и свыше 50 лет (группа 1, средний возраст 59,6 лет). Возраст на момент облучения тоже может быть фактором риска, поэтому была рассмотрена групповая переменная – возраст при облучении: группа 0 – возраст при облучении до 35 лет включительно, группа 1 – возраст старше 35 лет. Время постановки диагноза после облучения не рассматривалось, так как оно коррелировано с возрастом при диагнозе и возрастом при облучении.
Элементами данных для каждого члена когорты были условный номер ликвидатора (номер транзакции), коды (диагнозы) заболеваний по классификации МКБ-10 и групповые переменные: дозовые группы, возраст ликвидатора при диагнозе, возраст при облучении и времени после начала облучения.
Для анализа использовался программный модуль из пакета статистических программ «Статистика» [5] под названием «Sequence, Association, and Link Analysis», который осуществляет один из методов интеллектуального анализа данных: «Анализ последовательности, ассоциации и связи». Модуль определяет ассоциативные связи переменных, их временные последовательности и кластеры. Ниже приведены основные термины, используемые в этих методах анализа.
«Транзакция» (Transaction) в контексте данной задачи – это число ликвидаторов с заболеваниями; ликвидаторы имеют ещё дополнительные категориальные признаки: дозовую группу и возраст при диагнозе.
«Поддержка» (Support) – отношение числа транзакций, содержащих определённый набор данных (набор доз, возрастов и диагнозов заболевания), к общему количеству транзакций (в данном случае числу заболеваний n). Например, «поддержка» набора данных, состоящих всего из двух элементов данных А и С, является отношением числа транзакций, содержащих элементы А и С, к общему числу транзакций, т.е. совместной вероятностью событий вхождения элементов А и С, P(A,C) в набор данных.
«Достоверность» (Confidence) показывает вероятность осуществления правила, что из наличия в транзакции (у члена когорты) набора А следует наличие в ней набора С: Confidence (if A→C)=Support(A,C)/Support(A). «Достоверность» в данном контексте представляет собой условную вероятность C при условии A, P(C|A)=P(A,C)/P(A). Здесь «достоверность» правила не является достаточной характеристикой для оценки связи.
«Полезность» правила (lift) определяется как lift(if A→C)=Confidence (if A→C)/Support(C)=
P(AC)/(P(A)xP(C)). Из этого определения следует, что если lift=1, то события А и С независимы, и статистическая связь А и С отсутствует. Чем больше величина lift, тем больше мера статистической связи А и С, и тем более полезно правило связи. Критерием полезности правила счита- ется условие lift>1. Полезность правила является также недостаточной характеристикой связи заболевания с дозой облучения или с категорией возраста при диагнозе.
Для оценки достоверности статистической связи заболевания с дозой облучения или воз- растом при диагнозе используется понятие «отношение шансов» (ОR, odds ratio), которое оценивает вероятности заболевания в сравниваемых дозовых группах, возрастных группах [6, 7]:
OR = 1 +
con/-(1-li/t)
(con/-iy(con/-li/t-supy
Если ОR в одной из групп больше 1, статистическая связь этой группы с дозой облучения присутствует. Статистическая значимость связи определяется заданными доверительными пределами, которые определяются из выражения [8]:
OR (1+1.96/Z) , (2)
где функция х определяется из уравнения [6, 7]:
Z2 = n • (lift - 1)2 •
sup-conf
(conf-sup) • (li/t-conf) .
Результаты
Общая численность ликвидаторов, имеющих диагнозы рассматриваемых рубрик заболеваний, – 41979 человек. Число диагнозов рубрик E по МКБ-10, установленных за период наблюдения с 1986 по 2020 гг., равно 107713, это все различные диагнозы, зарегистрированные для каждого ликвидатора за период наблюдения. Средняя доза в дозовой группе 0 – 0,07 Гр, средний возраст – 45,7; в группе 1 средняя доза – 0,22 Гр, средний возраст – 44.8 лет.
Рассмотрим структуру диагнозов с кодами рубрик Е по МКБ-10 (в скобках приведены численность диагнозов и доли от полного числа заболеваний для значений больше 2%):
E00-E07 Болезни щитовидной железы (73863, 68,5%);
E01 Болезни щитовидной железы, связанные с йодной недостаточностью, и сходные состояния (14340, 13,3%);
E01.2 Зоб (эндемический), связанный с йодной недостаточностью, неуточнённый;
E04 Другие формы нетоксического зоба (40625, 37,7%);
Е04.0 Нетоксический диффузный зоб;
-
Е04.1 Нетоксический одноузловой зоб;
-
Е04.9 Нетоксический зоб неуточнённый;
E06 Тиреоидит (9015, 8,4%);
Е07 Другие болезни щитовидной железы (4326, 4%);
E10-E14 Сахарный диабет (13753, 12,8%);
Е11 Сахарный диабет II типа (12248, 11,4%);
-
Е11.2 Инсулиннезависимый сахарный диабет с поражением почек;
-
Е11.7 Инсулиннезависимый сахарный диабет с множественными осложнениями;
E15-E16 Другие нарушения регуляции глюкозы и внутренней секреции поджелудочной железы (151);
E20-E35 Нарушения других эндокринных желез (697);
E40-E46 Недостаточность питания (235);
E50-E64 Другие виды недостаточности питания (153);
E65-E68 Ожирение и другие виды избыточности питания (11106, 10,3%);
Е66 Ожирение (10528, 9,8%);
-
Е66.9 Ожирение неуточнённое;
E70-E90 Нарушения обмена веществ (5339, 4%).
Максимальное число заболеваний в рубриках наблюдается для йодной недостаточности (13,3%), зоба (37,7%), тиреоидита (8,4%), сахарного диабета II типа (11,4%), ожирения (9,8%), ожирения и других видов избыточности питания (10,3%). Общие характеристики когорты приведены на рис. 1-3.
На рис. 1 приводится распределение доз облучения ликвидаторов, имеющих заболевание. Как следует из рис. 1, большая часть диагнозов заболеваний эндокринной системы зафиксирована среди ликвидаторов, имеющих дозы около 0,1 и 0,25 Гр, что соответствует общему распределению ликвидаторов по дозам облучения.
На рис. 2 представлено распределение доз облучения ликвидаторов с впервые выявленными случаями заболеваний эндокринной системы. Наибольшее число случаев наблюдается так же для доз около 0,1 и 0,25 Гр в соответствии с рис. 1.
На рис. 3 дано возрастное распределение ликвидаторов с впервые выявленными случаями заболеваний для двух дозовых групп, откуда следует, что процентные возрастные распределения в дозовых группах близки.

Доза (Гр)
Рис. 1. Гистограмма распределения доз облучения ликвидаторов, имеющих диагнозы заболеваний эндокринной системы.

Доза (Гр)
Рис. 2. Гистограмма распределения доз облучения ликвидаторов с впервые выявленными случаями заболеваний.
В табл. 1 приведены результаты анализа связи дозы облучения свыше 0,15 Гр с заболеваемостью ликвидаторов для рубрик заболеваний в различных возрастных группах (возраст при диагнозе и возраст при облучении). Доза облучения в дозовой группе более 0,15 Гр представлена как причина (body), в таблице не приведена. В таблице приведены результаты действия причины (body) на следствие (head) – диагнозы и рубрики заболеваний в возрастных группах. Для сокращения записей использована следующая нотация: ad0,1 – группы возраста при диагнозе, ae0,1 – группы возраста при облучении. В остальных колонках – результаты оценки параметров статистической связи в рамках анализа. В последней колонке приведены значения нижнего 95% ДП.
Следует отметить, что практически все правила связи заболеваний с дозой в дозовой группе до 0,15 Гр имеют lift меньше 1, что является убедительным доказательством наличия дозовой зависимости приведённых в таблице рубрик заболеваний. Статистические связи, приведённые в табл. 1, статистически значимы, нижний 95% ДП больше единицы, и сортированы по значению OR.

■ £0.15 Гр
>0.15 Гр
Возраст, лет
Рис. 3. Гистограммы возрастных распределений ликвидаторов с впервые выявленными заболеваниями для двух дозовых групп.
Таблица 1
Результаты анализа связей диагнозов ликвидаторов с дозой облучения в различных возрастных группах для рубрик диагнозов заболеваний эндокринной системы
(код E по МКБ-10)
Номер |
Следствие (head) |
Поддержка (support) |
Достоверность (confidence) |
Полезность правила (lift) |
Статистика χ 2 |
Отношение шансов (OR) |
Нижняя граница 95% ДП (low) |
1 |
ae0, E04, E06 |
0,020 |
0,050 |
1,098 |
12,905 |
1,184 |
1,080 |
2 |
E04, ae1, ad1, E01 |
0,031 |
0,077 |
1,091 |
17,381 |
1,174 |
1,089 |
3 |
E04, E07 |
0,026 |
0,064 |
1,089 |
13,790 |
1,168 |
1,076 |
4 |
ad0, E04, E11 |
0,027 |
0,066 |
1,088 |
13,990 |
1,166 |
1,076 |
5 |
ad0, E04, ad1, E11 |
0,024 |
0,061 |
1,087 |
12,677 |
1,164 |
1,071 |
6 |
E04, E11 |
0,033 |
0,083 |
1,082 |
15,594 |
1,158 |
1,077 |
7 |
ad0, E04, E07 |
0,023 |
0,058 |
1,084 |
11,185 |
1,157 |
1,062 |
8 |
E04, ad1, E11 |
0,031 |
0,077 |
1,081 |
14,267 |
1,155 |
1,072 |
9 |
E04 |
0,266 |
0,666 |
1,030 |
46,084 |
1,153 |
1,106 |
10 |
ae1, ad1, E01 |
0,043 |
0,107 |
1,076 |
18,034 |
1,150 |
1,078 |
11 |
E04, ae1, ad1 |
0,096 |
0,239 |
1,065 |
33,775 |
1,148 |
1,096 |
12 |
ad0, E04, ae1, ad1 |
0,052 |
0,131 |
1,073 |
20,695 |
1,147 |
1,081 |
13 |
ad0, E04, ad1, E06 |
0,022 |
0,055 |
1,078 |
9,147 |
1,145 |
1,049 |
14 |
E04, ad1, E06 |
0,027 |
0,067 |
1,075 |
10,388 |
1,141 |
1,053 |
15 |
ad0, E04, E06 |
0,034 |
0,085 |
1,072 |
12,472 |
1,138 |
1,059 |
16 |
E04, E06 |
0,039 |
0,097 |
1,071 |
13,843 |
1,137 |
1,062 |
17 |
ad0, E11 |
0,041 |
0,104 |
1,068 |
13,968 |
1,133 |
1,061 |
18 |
ad0, ae0, E06 |
0,032 |
0,080 |
1,069 |
10,854 |
1,132 |
1,051 |
19 |
E04, E66 |
0,036 |
0,090 |
1,066 |
11,080 |
1,126 |
1,050 |
20 |
ad0, E04, ae1, ad1, E01 |
0,022 |
0,055 |
1,067 |
6,883 |
1,124 |
1,030 |
21 |
ad1, E07 |
0,020 |
0,051 |
1,067 |
6,223 |
1,123 |
1,025 |
22 |
ad0, ad1, E11 |
0,036 |
0,091 |
1,064 |
10,724 |
1,123 |
1,048 |
23 |
ad0, ae0, E11 |
0,022 |
0,055 |
1,066 |
6,623 |
1,122 |
1,028 |
24 |
ad0, ae1, ad1, E01 |
0,026 |
0,066 |
1,065 |
7,736 |
1,121 |
1,034 |
25 |
E04, E01 |
0,079 |
0,198 |
1,055 |
19,896 |
1,120 |
1,065 |
26 |
E04, ae1, E01 |
0,039 |
0,097 |
1,062 |
10,790 |
1,119 |
1,046 |
27 |
ad0, E04, E66 |
0,030 |
0,075 |
1,062 |
8,325 |
1,117 |
1,036 |
28 |
E04, ad1, E66 |
0,030 |
0,075 |
1,060 |
7,678 |
1,113 |
1,032 |
29 |
ad0, ad1, E06 |
0,029 |
0,074 |
1,059 |
7,362 |
1,111 |
1,030 |
30 |
E04, ad1 |
0,141 |
0,352 |
1,042 |
24,768 |
1,110 |
1,065 |
31 |
E04, ad1, E01 |
0,046 |
0,115 |
1,056 |
10,665 |
1,109 |
1,042 |
32 |
ad0, E04 |
0,216 |
0,541 |
1,027 |
23,282 |
1,101 |
1,059 |
33 |
ad0, E04, ad1, E66 |
0,024 |
0,061 |
1,055 |
5,122 |
1,101 |
1,013 |
34 |
ad0, ae0, E04, E01 |
0,040 |
0,100 |
1,053 |
8,121 |
1,101 |
1,030 |
Продолжение таблицы 1
Номер |
Следствие (head) |
Поддержка (support) |
Достоверность (confidence) |
Полезность правила (lift) |
Статистика χ 2 |
Отношение шансов (OR) |
Нижняя граница 95% ДП (low) |
35 |
ae0, E06 |
0,033 |
0,084 |
1,053 |
6,677 |
1,099 |
1,023 |
36 |
ad0, E04, E01 |
0,070 |
0,175 |
1,046 |
12,035 |
1,096 |
1,041 |
37 |
ae0, E04, E01 |
0,040 |
0,101 |
1,049 |
7,265 |
1,095 |
1,025 |
38 |
ad0, E06 |
0,053 |
0,134 |
1,047 |
9,118 |
1,094 |
1,032 |
39 |
E66, E11 |
0,023 |
0,058 |
1,051 |
4,187 |
1,093 |
1,004 |
40 |
ad0, E04, ad1 |
0,091 |
0,228 |
1,042 |
13,484 |
1,092 |
1,042 |
41 |
ae1, ad1, E06 |
0,027 |
0,068 |
1,049 |
4,562 |
1,090 |
1,007 |
42 |
E04, ae1 |
0,134 |
0,336 |
1,032 |
13,832 |
1,082 |
1,038 |
43 |
ae1, E11 |
0,039 |
0,098 |
1,042 |
5,033 |
1,079 |
1,010 |
44 |
ad1, E06 |
0,043 |
0,106 |
1,041 |
5,301 |
1,078 |
1,011 |
45 |
ad0, ae0, E04 |
0,125 |
0,313 |
1,032 |
12,136 |
1,078 |
1,033 |
46 |
E06 |
0,067 |
0,166 |
1,038 |
7,650 |
1,078 |
1,022 |
47 |
ad1, E01 |
0,063 |
0,158 |
1,038 |
7,235 |
1,077 |
1,020 |
48 |
ae1, ad1, E11 |
0,038 |
0,095 |
1,040 |
4,612 |
1,077 |
1,006 |
49 |
ae1, E01 |
0,057 |
0,143 |
1,037 |
6,047 |
1,073 |
1,014 |
50 |
ad0, E04, ad1, E01 |
0,037 |
0,092 |
1,039 |
4,035 |
1,073 |
1,002 |
51 |
ae0, E04 |
0,132 |
0,330 |
1,028 |
10,379 |
1,071 |
1,027 |
52 |
ad0, E66 |
0,052 |
0,131 |
1,036 |
5,254 |
1,071 |
1,010 |
53 |
E11 |
0,068 |
0,170 |
1,031 |
5,312 |
1,064 |
1,009 |
54 |
E01 |
0,115 |
0,288 |
1,025 |
6,968 |
1,060 |
1,015 |
Примечание: Группы по возрасту на момент диагноза: до 50 лет (ad0) и старше 50 лет (ad1); группы по возрасту при облучении: до 35 лет (ae0) и старше 35 лет (ae1).
Всего выявлено 54 статистически значимых связей наборов рубрик заболеваний с дозой облучения свыше 0,15 Гр. Как следует из табл. 1, значимые связи с дозой облучения наблюдаются для отдельных рубрик по МКБ-10 вне зависимости от значений возрастных групповых переменных: Е01 (правило 54), E04 (правило 9), E06 (правило 46), E11 (правило 53) – значение OR для этих рубрик варьируется от 1,06 до 1,15.
Следует особо выделить рубрику Е04 (зоб), для которой поддержка достаточно велика (27%, число заболевших около 11 тыс. человек), достоверность – 67%, значение OR равно 1,15 и статистически значимо. Эта рубрика присутствует в 30 из 54 правил. Также выявлены связи, содержащие наборы из двух заболеваний, большинство из которых содержит рубрику E04. Определённый интерес представляет совместный набор ожирения и сахарного диабета II типа (правило 39), для которого тоже выявлена дозовая зависимость заболеваний. Относительный риск заболевания (OR), индуцированный дозой свыше 0,15 Гр, максимален для набора Е04, Е06 при возрасте при облучении до 35 лет и равен 1,18. Наборы для трёх заболеваний для рассматриваемых данных редки и не встречаются вследствие заданных ограничений по поддержке (support) и достоверности (confidence).
-
Анализ связей в табл. 1 представляет сложную задачу, обусловленную большим количеством этих связей и групповых переменных. В арсенале программы «Статистика» имеются инструменты, которые могут визуализировать связи, в частности, при помощи представления Web graph.
Рассмотрим для примера статистические значимые связи заболеваний с дозой облучения в группе dg1 (доза свыше 0,15 Гр) и их зависимость от групповых возрастных переменных, используя Web graph (рис. 4). Размеры узлов (эллипсов), где пересекаются связи (линии), иллюстрируют поддержку переменной (больше размер – больше поддержка). Максимальную поддержку (число ликвидаторов с заболеванием) имеет заболевание E04 и число ликвидаторов, имеющих диагноз в возрастной группе ad0, где узел также имеет большой размер, то есть большинство заболеваний выявляются в возрасте до 50 лет. Толщина линий означает совместную поддержку связи двух переменных (линия толще – больше поддержка), поддержка также максимальна для связи E04-ad0 (правило 32). Цвет и темнота цвета линий означают лифт двух переменных (палитра цветов меняется от зелёного к красному с увеличением темноты цвета). Например, связь E04-ad1 имеет больший лифт (правило 30), чем правило 32 Е04-ad0 (цвет с большим содержание красного, хотя и более светлый).

Рис. 4. Граф (Web graph) связей отдельных рубрик заболеваний эндокринной системы (код Е по МКБ-10) и их зависимость от групповых возрастных (а) и дозовых (d) переменных.
Рассмотрим пример ещё одного способа визуализации в программе «Статистика» результатов, приведённых в табл. 1, при помощи графика правил (Rule graph). На рис. 5 представлены правила «body-head, причина-следствие» для рубрики E04 и её связь с групповыми переменными. Размер эллипса означает поддержку (support) правила, цвет – достоверность (confidence) в той же палитре цветов от зелёного к красному с изменением интенсивности. Напомним, что это не прямая причинно-следственная связь, а статистическая. Рассмотрим связи рубрики E04 с возрастом при диагнозе до 50 лет (ad0).
Максимальную поддержку имеет Е04 (эллипсы одинаковы, независимо от направления связи). Если ad0 выступает как причина, то достоверность правила больше (эллипс темнее), чем когда ad0 представляет следствие (эллипс красный). Отсюда следует вывод, что Е04 зависит от ad0 и в меньшей степени от ad1 (эллипс меньшего размера и оранжевый), то есть заболевания случаются чаще в возрасте до 50 лет. С другой стороны, Е04 слабо зависит от возраста при облучении, так как эллипсы близки по размеру и цвету.
В табл. 2 приведены статистически значимые связи с дозой облучения отдельных диагнозов и наборов диагнозов. Всего выявлено 39 наборов значимых статистических связей заболеваний с дозой облучения. Связи для отдельных диагнозов без значений групповых переменных представлены заболеваниями E01.2, E66.9, E04.0, E11.0, E11.7. Диагноз E04.0 имеет максимальную поддержку (21%) и достоверность (52%). В большинстве двойных наборов фигурирует E04.0. Уменьшение числа значимых правил обусловлено уменьшением численности диагнозов в рассматриваемых группах и действием заданных ограничений в анализе по поддержке и достоверности.
E01
ad==1

ae==1

E04
ae==0
ad==0







ad==0 ae==0
E04 ae==1 ad==1 E01
Head
Рис. 5. График связей причина-следствие (body-head) для рубрик E01 и E04 диагнозов заболеваний эндокринной системы.
Таблица 2
Результаты анализа связей диагнозов ликвидаторов с дозой облучения в различных возрастных группах для рубрик диагнозов заболеваний эндокринной системы
(код E по МКБ-10)
Номер |
Следствие (head) |
Поддержка (support) |
Достоверность (confidence) |
Полезность правила (lift) |
Статистика χ 2 |
Отношение шансов (OR) |
Нижняя граница 95% ДП (low) |
1 |
ae1, ad1, E01.2 |
0,024 |
0,061 |
1,126 |
25,151 |
1,243 |
1,142 |
2 |
ad0, ae0, E04.0, E01.2 |
0,022 |
0,054 |
1,105 |
15,831 |
1,199 |
1,096 |
3 |
ae0, E04.0, E01.2 |
0,022 |
0,054 |
1,104 |
15,524 |
1,197 |
1,094 |
4 |
ad1, E01.2 |
0,035 |
0,088 |
1,098 |
23,487 |
1,192 |
1,110 |
5 |
E04.0, ad1, E01.2 |
0,021 |
0,053 |
1,098 |
13,706 |
1,185 |
1,083 |
6 |
ae1, E04.0, ad1 |
0,070 |
0,175 |
1,084 |
38,375 |
1,181 |
1,120 |
7 |
ad0, ad1, E01.2 |
0,028 |
0,070 |
1,093 |
16,464 |
1,177 |
1,088 |
8 |
E04.0, E01.2 |
0,042 |
0,104 |
1,089 |
23,498 |
1,176 |
1,102 |
9 |
E04.0 |
0,208 |
0,520 |
1,045 |
55,547 |
1,160 |
1,116 |
10 |
E04.0, ad1 |
0,104 |
0,259 |
1,067 |
40,590 |
1,158 |
1,107 |
11 |
ad0, E04.0, E01.2 |
0,039 |
0,097 |
1,080 |
17,475 |
1,155 |
1,080 |
12 |
ad0, ae1, E04.0, ad1 |
0,043 |
0,107 |
1,078 |
18,868 |
1,154 |
1,082 |
13 |
E11.7 |
0,024 |
0,060 |
1,077 |
9,723 |
1,143 |
1,051 |
14 |
E04.9, E04.0, ad1 |
0,021 |
0,053 |
1,076 |
8,342 |
1,140 |
1,043 |
15 |
E01.2 |
0,073 |
0,183 |
1,065 |
24,634 |
1,139 |
1,082 |
16 |
E04.0, E04.1 |
0,033 |
0,083 |
1,072 |
12,104 |
1,137 |
1,058 |
17 |
ae1, E04.0, E01.2 |
0,020 |
0,050 |
1,074 |
7,445 |
1,136 |
1,037 |
18 |
ad0, ae0, E01.2 |
0,037 |
0,092 |
1,070 |
12,837 |
1,135 |
1,059 |
19 |
E04.9, ae1, ad1 |
0,026 |
0,064 |
1,072 |
9,098 |
1,134 |
1,045 |
20 |
ae0, E01.2 |
0,037 |
0,092 |
1,067 |
11,867 |
1,129 |
1,054 |
21 |
ad1, E11.7 |
0,023 |
0,057 |
1,069 |
7,536 |
1,128 |
1,035 |
22 |
ad1, E11 |
0,028 |
0,070 |
1,068 |
8,954 |
1,127 |
1,042 |
23 |
E11 |
0,031 |
0,076 |
1,066 |
9,440 |
1,125 |
1,043 |
24 |
ad0, E01.2 |
0,066 |
0,165 |
1,060 |
18,268 |
1,124 |
1,065 |
25 |
ae1, E01.2 |
0,036 |
0,091 |
1,064 |
10,476 |
1,121 |
1,046 |
26 |
ad0, E04.0, ad1 |
0,073 |
0,183 |
1,056 |
18,370 |
1,118 |
1,063 |
27 |
ae0, E04.0 |
0,106 |
0,266 |
1,050 |
23,393 |
1,117 |
1,068 |
28 |
ad0, E04.0 |
0,178 |
0,444 |
1,037 |
27,971 |
1,112 |
1,069 |
29 |
ad0, E04.0, E04.1 |
0,028 |
0,071 |
1,060 |
7,198 |
1,112 |
1,029 |
30 |
ad0, ae0, E04.0 |
0,103 |
0,258 |
1,048 |
21,038 |
1,111 |
1,062 |
Продолжение таблицы 2
Номер |
Следствие (head) |
Поддержка (support) |
Достоверность (confidence) |
Полезность правила (lift) |
Статистика χ 2 |
Отношение шансов (OR) |
Нижняя граница 95% ДП (low) |
31 |
E04.0, E04 |
0,025 |
0,062 |
1,058 |
5,940 |
1,108 |
1,020 |
32 |
E04.0, ad1, E04.1 |
0,023 |
0,058 |
1,058 |
5,534 |
1,107 |
1,017 |
33 |
ad0, ae0, E04.1 |
0,027 |
0,067 |
1,054 |
5,583 |
1,100 |
1,016 |
34 |
ad1, E04 |
0,023 |
0,058 |
1,052 |
4,335 |
1,095 |
1,005 |
35 |
ae1, E04.0 |
0,102 |
0,255 |
1,040 |
14,247 |
1,091 |
1,043 |
36 |
ad0, ae1, E01.2 |
0,029 |
0,073 |
1,047 |
4,588 |
1,087 |
1,007 |
37 |
E04.9, ae1 |
0,033 |
0,083 |
1,045 |
4,975 |
1,085 |
1,010 |
38 |
E04.9, E04.0 |
0,035 |
0,087 |
1,044 |
4,957 |
1,083 |
1,010 |
39 |
ad0, E66.9 |
0,036 |
0,089 |
1,043 |
4,753 |
1,080 |
1,008 |
Примечание: Группы по возрасту на момент диагноза: по возрасту на момент диагноза: до 50 лет (ad0) и старше 50 лет (ad1).
Максимальное значение OR выявлено для набора ae1, ad1, E01.2, равное 1,24. Наиболее часто встречаются диагнозы E01.2 (зоб эндемический с йодной недостаточностью), Е04.0 (нетоксический диффузный зоб), Е04.1 (нетоксический одноузловой зоб). Довольно неожиданно появление связей с дозой облучения инсулиннезависимого сахарного диабета с комой Е11.0 (правило 22) и инсулиннезависимого сахарного диабета с множественными осложнениями (правило 21), а также Е66.9 ожирение неуточнённое (правило 39).
Для рубрик заболеваний, среди которых выявлены статистически значимые связи установленного диагноза и дозы облучения, т.е. для рубрик E01 (йодная недостаточность), E04 (зоб), E06 (тиреоидит), E11 (сахарный диабет II типа), а также для пары кодов диагнозов E01.2 и E04.0, фигурирующих в большинстве двойных наборов диагнозов, были получены оценки радиационного риска в терминах избыточного относительного риска на единицу дозы (ERR/Гр). Методы оценки ERR изложены авторами ранее [3].
В табл. 3 представлены оценки избыточного относительного риска заболеваемости, 95% доверительные интервалы этих оценок, а также число случаев впервые выявленных заболеваний для болезней эндокринной системы, расстройства питания и нарушения обмена веществ (E00-E90 по МКБ-10) в целом.
Таблица 3 Коэффициенты избыточного относительного риска (ERR/Гр) заболеваемости болезнями эндокринной системы, расстройства питания и нарушения обмена веществ (E00-E90 по МКБ-10) в целом и по рубрикам в когорте российских ликвидаторов последствий аварии на Чернобыльской АЭС за период наблюдения 1992-2020 гг.
Заболевание |
Наблюдаемые случаи заболеваний |
ERR/Гр |
95% ДИ |
p-value |
Болезни эндокринной системы, расстройства питания и нарушения обмена веществ (E00-E90) |
37301 |
0,48 |
0,33; 0,64 |
<0,001 |
Болезни щитовидной железы (E00-E07) |
32142 |
0,45 |
0,29; 0,62 |
<0,001 |
Болезни щитовидной железы, связанные с йодной недостаточностью, и сходные состояния (E01) |
10898 |
0,33 |
0,07; 0,61 |
0,011 |
Зоб (эндемический), связанный с йодной недостаточностью, неуточнённый (E01.2); нетоксический диффузный зоб (E04.0) |
3788 |
0,61 |
0,15; 1,13 |
0,007 |
Другие формы нетоксического зоба (E04) |
25000 |
0,53 |
0,34; 0,72 |
<0,001 |
Тиреодит (E06) |
6110 |
-0,04 |
-0,31; 0,27 |
>0,5 |
Сахарный диабет (E10-E14) |
6797 |
0,85 |
0,48; 1,26 |
<0,001 |
Сахарный диабет II типа (E11) |
6112 |
0,92 |
0,53; 1,37 |
<0,001 |
Непараметрические оценки относительного радиационного риска (RR) заболеваний эндокринной системы (E00-E90) по отношению к контрольной дозовой группе с дозами облучения менее 0,025 Гр приведены на рис. 6.

• RR ^е ^™ ^е НГ 95%ДИ ВГ 95%ДИ —е RR, специфичность=90%
Рис. 6. Относительный радиационный риск (RR) заболеваний эндокринной системы ликвидаторов (рубрики E00-E90 МКБ-10).
На рис. 6 показано, что оценки радиационных рисков заболеваний эндокринной системы среди ликвидаторов являются устойчивыми по отношению к показателю специфичности диагностики: с учётом показателя специфичности 90% оценки радиационных рисков остаются в пределах 95% доверительного интервала (95% ДИ) оценок, проводившихся без учёта показателей качества диагностики. Методы оценки радиационных рисков с учётом показателей чувствительности и специфичности диагностики изложены авторами ранее [9]. Как было показано, оценки RR устойчивы к варьированию показателя чувствительности диагностики в широких пределах, как минимум, от 100% до 50% [9].
Обсуждение результатов
Основной задачей данного анализа являлось определение зависимости от дозы облучения рубрик заболеваний и отдельных диагнозов для заболеваний органов эндокринной системы современными поисковыми методами «Data mining» для последующего анализа дозовой зависимости независимыми классическими методами эпидемиологического анализа. Поисковые алгоритмы, используемые «Data mining», позволяют оперативно решить задачи поиска исследуемых правил для больших объёмов данных «Big data», в отличие от традиционных подходов, для которых потребуются многомерные регрессионные модели и гипотезы для распределений случайных переменных, требующих больших ресурсов памяти вычислительных средств и временных затрат.
Программное обеспечение «Статистика» позволяет решить эту задачу в рамках значимости правил связи заболеваний с дозой облучения с использованием критерия хи-квадрат. В данной работе значимость статистической связи определена с использованием классического понятия эпидемиологии – отношения шансов (близкий аналог относительного риска) с определением доверительных пределов.
Инструментарий модуля «анализа связи» в принципе позволяет определить все статистические связи между всеми переменными, рассматриваемые в анализе на уровне рубрик и отдельных диагнозов (независимо от их количества). К недостаткам данного подхода можно отнести большое число правил в случае многочисленных групповых переменных.
Большинство выявленных правил связи неонкологических заболеваний эндокринной системы с дозой облучения выявлено для заболеваний щитовидной железы (34 правила). В основном это диагнозы Е01.2 (зоб эндемический, связанный с йодной недостаточностью), Е04.0 (нетоксический диффузный зоб), Е04.1 (нетоксический одноузловой зоб). Выявлены также связи с дозой облучения ожирения (E66.9) и сахарного диабетом II типа (E11). Комментировать данные результаты достаточно сложно, так как тканевые реакции на облучение в настоящее время ещё мало изучены [1].
Выявленные статистические связи подтверждены традиционными параметрическими и непараметрическими оценками радиационных рисков как в линейной модели избыточного относительного риска (ERR), так и в непараметрической модели относительного риска (RR). Зависимость RR от дозы облучения (рис. 6) демонстрирует близость зависимости «доза-эффект» к пороговой зависимости с порогом около 0,3 Гр, что предоставляет аргументы в пользу детерминированных эффектов действия радиации на эндокринную систему человека.
Выводы
С использованием общих статистических подходов Data Mining выявлены статистически значимые связи с дозой облучения ликвидаторов для рубрик заболеваний E01 (йодная недостаточность), E04 (зоб), E06 (тиреоидит), E11 (сахарный диабет II типа). Связи с дозой облучения для отдельных диагнозов представлены парой диагнозов E01.2 (зоб эндемический, связанный с йодной недостаточностью) и E04.0 (нетоксический диффузный зоб).
Выявленные статистические связи подтверждаются оценками избыточного относительного риска (ERR) и относительного риска (RR). Пороговая зависимость RR от дозы облучения свидетельствует о том, что действие радиации на эндокринную систему человека является детерминированным эффектом (относится к тканевым реакциям).
Полученные количественные оценки радиационных рисков заболеваний эндокринной системы среди ликвидаторов являются устойчивыми по отношению к показателю специфичности диагностики, вплоть до показателя специфичности 90%.
Использованный общий статистический метод Data Mining поиска связей между диагнозами заболеваний и дозой облучения является полезным для выявления тех заболеваний, для которых необходимо получить оценки радиационного риска традиционными методами радиационной эпидемиологии.
Список литературы Статистические связи с дозой облучения и оценка радиационных рисков неонкологических заболеваний эндокринной системы ликвидаторов Чернобыльской аварии с учётом возможных ошибок в постановке и регистрации диагнозов
- Отчёт МКРЗ по тканевым реакциям, ранним и отдалённым эффектам в нормальных тканях и органах - пороговые дозы для тканевых реакций в контексте радиационной защиты. Труды МКРЗ (Публикация 118) /пер. с англ., под ред. А.В. Аклеева, М.Ф. Киселева. Челябинск: Книга, 2012. 384 с.
- Imaizumi M., Usa T., Tominaga T., Neriishi K., Akahoshi M., Nakashima E., Ashizawa K., Hida A., Soda M., Fujiwara S., Yamada M., Ejima E., Yokoyama N., Okubo M., Sugino K., Suzuki G., Maeda R., Nagataki S., Eguchi K. Radiation dose-response relationships for thyroid nodules and autoimmune thyroid diseases in Hiroshima and Nagasaki atomic bomb survivors 55-58 years after radiation exposure //JAMA. 2006. V. 295, N 9. P. 1011-1022.
- Чекин С.Ю., Максютов М.А., Кащеев В.В., Карпенко С.В., Туманов К.А., Кочергина Е.В., Зеленская Н.С., Лашкова О.Е. Оценка радиационных рисков неонкологических заболеваний среди российских участников ликвидации последствий аварии на Чернобыльской АЭС //Радиация и риск. 2021. Т. 30, № 1. С. 78-93.
- Международная статистическая классификация болезней и проблем, связанных со здоровьем, 10-й пересмотр (МКБ-10). Т. 1 (часть 1). Женева: ВОЗ, 1995. 698 с.
- Пакет статистических программ "Статистика". [Электронный ресурс]. URL: http://www.statsoft.ru (дата обращения 12.12.2022).
- Горский А.И., Максютов М.А., Туманов К.А., Кочергина Е.В., Корело А.М. Статистические связи смертности ликвидаторов с дозой облучения //Радиация и риск. 2018. Т. 27, № 1. С. 22-32.
- Горский А.И., Максютов М.А., Туманов К.А., Власов О.К., Кочергина Е.В., Зеленская Н.С., Чекин С.Ю., Иванов С.А., Каприн А.Д., Иванов В.К. Анализ статистических связей смертности от злокачественных новообразований с дозой облучения радионуклидами населения регионов, загрязнённых вследствие аварии на ЧАЭС //Медицинская радиология и радиационная безопасность. 2019. Т. 64, № 6. С. 5-11.
- Mietenen O.S. Confounding and effect-modification //Am. J. Epidemiol. 1974. V. 100, N 5. P. 350-353.
- Горский А.И., Чекин С.Ю., Максютов М.А., Щукина Н.В., Кочергина Е.В., Зеленская Н.С., Лашкова О.Е. Метод оценки радиационных рисков заболеваемости солидными злокачественными новообразованиями, учитывающий возможные ошибки в постановке и регистрации диагнозов //Радиация и риск. 2022. Т. 31, № 4. С. 53-63.