Структура информационного хранилища системы поддержки принятия клинических решений
Автор: Богданова Д.Р., Шахмаметова Г.Р., Ниязгулов А.М.
Журнал: Онтология проектирования @ontology-of-designing
Рубрика: Методы и технологии принятия решений
Статья в выпуске: 2 (52) т.14, 2024 года.
Бесплатный доступ
Рассматривается построение на основе онтологического подхода информационного хранилища системы поддержки принятия клинических решений слабо-формализуемой предметной области лечения бронхолёгочных заболеваний. Приведён обзор подходов к созданию баз знаний в этой предметной области. Описан метод извлечения знаний, основанный на правилах из клинических рекомендаций и поиске зависимостей между словами в предложениях с учётом последовательности применения правил. Информационное хранилище системы поддержки принятия клинических решений наполняется онтологической и продукционной базами знаний при помощи предложенного метода извлечения знаний. Разработана онтология выбранной предметной области, проведены исследования её качества на основе анализа топологии графа при помощи метрик когнитивной эргономичности. Показана эффективность описанного метода извлечения знаний. Разработана оригинальная архитектура системы поддержки принятия клинических решений.
Онтология, клинические рекомендации, система поддержки принятия решений, продукционные правила, база знаний, информационное хранилище
Короткий адрес: https://sciup.org/170205621
IDR: 170205621 | DOI: 10.18287/2223-9537-2024-14-2-270-278
Текст научной статьи Структура информационного хранилища системы поддержки принятия клинических решений
В медицине особенно актуальна организация процесса обработки, хранения и использования данных ввиду большого объёма накопленной информации в области диагностики и лечения пациентов.
Онтология предметной области (ПрО) – формализованное описание структуры медицинских знаний и терминологии используется для описания знаний о заболеваниях, процедурах лечения, симптомах, физиологии, патологиях и др. Клинические рекомендации – согласованные рекомендации для диагностики и лечения пациентов, основанные на методах с доказанной эффективностью. Информация о пациенте – личные данные, диагноз, история болезни, результаты анализов, результаты функциональной диагностики.
Указанные данные применяются для создания медицинских информационных, экспертных или рекомендательных систем, в которых накопленную информацию объединяют в базы знаний (БЗ), формируя на их основе методы решения задач (диагностика пациента или назначение лечения). Эффективность использования сформированной БЗ зависит от типа хранимой информации, её структурированности и связей между элементами системы поддержки принятия решений (СППР). По данным исследования [1] лишь 10–20% информации, используемой в медицинских учреждениях, представлено в структурированной форме. Примером представления информации в неструктурированном виде являются тексты клиниче- ских рекомендаций. При формировании структуры БЗ необходим анализ таких текстов, который в медицинских учреждениях выполняют специалисты.
Для структурирования данных в текстах клинических рекомендаций разработан алгоритм и программное обеспечение (ПО) [2], которые позволяют структурировать текст для последующего использования в БЗ СППР. Разработанные средства автоматически выделяют ключевые слова и строят на их основе карты понятий. Результатом является сформированный набор продукционных правил (ПП), который может применяться при построении СППР. В общем виде ПП можно представить как логические правила, описывающие связи между медицинскими симптомами и заболеваниями, а также определяющие эффективные методы лечения в зависимости от представленных входных данных. Такие правила интегрируются в БЗ и могут быть использованы при диагностике пациента или назначении лечения.
В области построения БЗ клинических рекомендаций используются несколько различных подходов, на основе которых разработаны ПО. В работе [3] предложена архитектура БЗ системы поддержки принятия врачебных решений, основанная на графовой базе данных (БД). В качестве источника знаний использованы клинические рекомендации, из них выделены типы связей и понятий, на их основе создана метамодель для БЗ СППР. В работе [4] представлена медицинская экспертная система на основе БЗ, построенная с использованием семантических сетей и нечёткой логики. Разработанное ПО позволяет врачу на основе данных о диагнозе пациента и течении болезни получать список рекомендаций. СППР, ориентированная на пациента и использование отзывов из социальных сетей, предложена в [5]. Отзывы пациентов анализируются на предмет тональной окраски и преобразуются в структурированные данные, которые используются для создания БЗ о пациенте. В рамках исследования проблемы избыточной массы тела у детей в [6] представлены разработки в области создания БЗ для медицинских экспертных систем. Для формирования БЗ экспертных диагностических систем предложено использовать нечёткие нейронные сети [7]. Перечисленные и другие СППР применяются для решения конкретных задач или затрагивают определённую сферу медицины. Большинство предложенных реализаций находятся на стадии проекта либо прототипа. Зарубежные разработки не обладают поддержкой русского языка, что затрудняет обработку информации и построение БЗ с их помощью.
Возможным средством решения задачи построения информационного хранилища СППР ПрО лечения бронхолёгочных заболеваний может стать онтология [8]. Онтологический подход позволяет связать терминологию и клинические рекомендации и на их основе разработать деревья принятия решений, из которых формируются ПП. Совокупность правил позволит объединить в единую БЗ клинические рекомендации [9].
1 Извлечение знаний для формирования информационного хранилища 1.1 Структура метода
В СППР объектами исследования являются рентгенологические снимки, истории болезней, симптомы заболеваний, клинические рекомендации, представленные в описательном виде. Для их описания необходимо использование специальных технологий обработки слабоструктурированных и слабоформализованных данных [10]. Одной из таких технологий является метод извлечения знаний, определяемый построенными деревьями зависимостей между словами в предложении с учётом использования последовательности применения ПП. В процессе построения БЗ клинических рекомендаций при помощи метода извлечения знаний необходимо выполнить следующие этапы обработки данных [11]:
-
1) создание онтологий ПрО – описание концептуальной структуры медицинских знаний [12];
-
2) автоматическое выявление текстов клинических рекомендаций по конкретным заболеваниям (например, бронхолёгочным болезням) [13];
-
3) программная генерация деревьев принятия решений на основе онтологии ПрО и клинических рекомендаций [14];
-
4) формирование набора ПП, на основе которых составляется БЗ СППР.
-
1.2 Онтологическая БЗ
Онтологическая БЗ разрабатываемого информационного хранилища СППР реализована на языке OWL . В качестве языка запросов к данным онтологии используется SPARQL . Моделирование онтологий осуществляется на базе Protégé 1 . Фрагмент дерева классов онтологии, разработанного при помощи плагина OntoGraf , представлен на рисунке 1.

Рисунок 1 – Фрагмент дерева классов онтологии ( Protégé - OntoGraf )
-
1.2.1 Иерархия классов
Иерархия классов онтологической БЗ разрабатываемого информационного хранилища СППР представлена в виде дерева (часть иерархии классов разработанной онтологии представлена на рисунке 2). Среди множества его ветвей для примера можно выделить следующие классы.
-
■ «Диагноз по COVID-19» включает степени тяжести болезни (лёгкая, среднетяжёлая, тяжёлая).
-
■ «Диагностика» подразделяется (со всеми дополнительными подклассами и подпунктами) на инструментальную, лабораторную, подробную оценку (анамнез заболевания, жалобы, эпидемиологический анализ) и физикальное обследование.
-
■ «Лабораторное оборудование» включает инструменты, необходимые для диагностики и лечения указанного заболевания (аппарат ИВЛ, бронхоскоп, 12-канальный ЭКГ и др.).
-
1.2.2 Метрики качества онтологии
Исследования качества онтологии проводилось на основе анализа топологии графа. В качестве основных метрик были использованы метрики когнитивной эргономичности [15]: 1) Глубина онтологии . Путь графа – последовательность соединённых вершин от корня до листа. Этот параметр необходимо учитывать при оценке относительной, средней или максимальной глубины графа. Максимальная глубина в четыре ветви (последовательности) является доступной для восприятия и легко анализируемой.
-
2) Ширина онтологии определяет количество вершин и оценивается с трёх точек зрения – как абсолютная (сумма вершин), средняя или максимальная (количество вершин на самом большом уровне иерархии гра-
- 1 Protégé (the Stanford Center for Biomedical Informatics Research at the Stanford University School of Medicine). Официальный сайт. https://protege.stanford.edu.
фа). Средняя ширина онтологии разрабатываемой системы - 4,3 вершины. По этому показателю онтология является хорошо проработанной и разделённой на иерархии с точки зрения когнитивной эргономики.
-
3) Запутанность онтологии рассматривается с позиции множественного наследования – как количество вершин графа онтологии, у которых есть несколько непосредственных суперклассов. Поскольку в рассматриваемой онтологии такого наследования нет, данная метрика имеет оптимальный нулевой показатель.
-
4) Количество анонимных классов также равняется нулю, что позволяет улучшить воспринимаемость и читаемость разработанной онтологии.
Оценка онтологии проводится на всех этапах разработки ПО.
1.3 Деревья принятия решений
В основе разрабатываемого информационного хранилища СППР лежат деревья решений – иерархические структуры, состоящие из ПП, которые могут быть сгенерированы во время обучения модели [16]. Как правило, деревья применяются для анализа массивов информации и решения задач классификации [17]. Структура дерева принятия решений может быть описана как совокупность «ветвей» (с описанием признаков и условий) и узлов – значений целевой функции («листьев»). Классификация новых признаков происходит при перемещении по ветвям с последующим получением значений из узлов. Ключевой особенностью деревьев принятия решений является простота генерации ПП, описываемых на есте-
F-|t Thing ▼..... Диагноз_по_СОУ1О_19 | Y ФСтелень_тяжести_болезни | |......ФЛегкая_степень
I I...... Средне-Тяжёлая_степень
I 1...... Тяжёлая_степень
Y..... Диагностика
I Y-ф Инструментал ь н ая_д и а гн ости ка i...... Флучевая_ди а гностика ; ; i......пульсоксиметрия
I I 1......Фэкг i Y фЛабораторная_диагностика
| к Общая
I I Y ФЭтилогическая i...... выявление_антигена_5АК5-СоУ-2 | | |......фВыявление_иммуноглублинов_класа_АгМ_и_С_к_5АИ5-СоУ-2
фВыявление_РНК_5АЕ8СоУ-2
▼ ФПодробнаяоценка фаначнез_заболевания Ф жалобы эпидемиологичкий_аначнез
[ Y • Физикальное_обследование
| |......Ф аускультация_и_перкусия_легких
; ;......ФИзмерение_5рО2
| |......Физмерение_ЧСС,АД,ЧДД
| |......Фиследование_органов_брюшной_полости_с_определением_разиеров_печени
; ;..... оценка_слизистых_оболочек
| |..... оценка_уровня_сознания
| |...... пальпац ия_л имфатичес ких_у злов
। ....... термометрия
Y ФЛабораторное_оборудование
| [......Ф 12-канальный_ЭКГ i i...... Bipap
Аппарат_ИВЛ | [......ФБронхоскоп I i......ФВидеобронхоскоп I i......фГелевая_подушка_для_прон-позиции | [......фГематологический_анализатор I i......Ф Градусник i i......ФДефибриллятор | [......фИнфузионный_насос i i......ФКислородный_концентратор ! i......ФМонитор_пациента
Рисунок 2 – Часть иерархии классов онтологической базы знаний информационного хранилища СППР ( Protégé )
ственном языке. В качестве примера приведён фрагмент одной из ветвей дерева принятия
решений, построенного на базе структурированных текстов клинических рекомендаций (рисунок 3).

Рисунок 3 – Фрагмент одной из ветвей дерева принятия решений по диагностике бронхиальной астмы
Из представленного фрагмента ветви дерева принятия решений можно сформировать ряд ПП по диагностике бронхиальной астмы у пациента с соответствующими симптомами.
Структура ПП на основе дерева принятия решений в формате, подходящем для использования в БЗ клинических рекомендаций СППР в общем виде выглядит как связка двух блоков – «Условий и симптомов» (начинается с ключевого слова ЕСЛИ ) и «Лечения» (ключевое слово ТО ). Примеры разработанных ПП:
-
■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха больше 30%, ТО может быть поставлен диагноз «Ступень 4: Персистирующая бронхиальная астма тяжёлого течения»;
-
■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха от 20 до 30%, ТО может быть поставлен диагноз «Ступень 3: Персистирующая бронхиальная астма средней степени тяжести»;
-
■ ЕСЛИ у пациента объём форсированного воздуха за первую секунду маневра форсированного выдоха меньше 60% И колебания пиковой скорости выдоха менее 20%, ТО диагноз «астма» не подтверждён.
-
1.4 Построение деревьев принятия решений
Рисунок 4 – Порядок построения деревьев решений
Наиболее затратным с точки зрения ресурсов вычислительных устройств является этап автоматической генерации деревьев принятия решений на основе текстов клинических рекомендаций и онтологии, т. к. массивы обрабатываемых данных могут быть большими.
Порядок построения деревьев принятия решений показан на рисунке 4. Сформированные деревья принятия решения используются для наполнения соответствующих БЗ клинических рекомендаций СППР.
2 Реализация системы
Реализация медицинской СППР находится на этапе прототипирования, разработки и тестирования отдельных компонентов. Предложено создание единого информационного хранилища путём объединения отдельных элементов:
-
■ БД - общее хранилище информации о пациентах (история болезни, личные данные);
-
■ онтологическая БЗ;
Рисунок 5 – Общая структура информационного хранилища
-
■ продукционная БЗ - хранилище
ПП и деревьев принятия реше ний, сформированных на основе текстов клинических рекомендаций;
-
■ метаданные - дополнительная информация о содержимом или объектах БЗ.
Разработана общая структура информационного хранилища, представленная на рисунке 5.
Фрагмент модели БД информационного хранилища представлен на рисунке 6.
На выходе СППР формирует отчёт для специалиста с рекомендациями по лечению пациента, полученный на основе анализа данных.
Физ лицо
Код физ лицо
Паспортные данные ФИО
Соц номер

Код врача
Код
Звание
Категория
Разряд
Код физ лицо (FK)
Н азнач. проц, специалисто в
Диод специалиста
Код назначенной проц
Код пациента (FK)
Дата
Запись
Код врача (FK)
Код методики (FK)
Р
Определяет
Р
Входит
/*Код истории
Код врача (FK) Код пациента (FK) Код специалиста (FK)
Код назначенной проц (FK)
Ведет
История болезни

Пациент
Код пациента
Код физ лица (FK)
Код
Дата заезда
Дата выезда
Стоимость лечения
Кабинет процедуры Код кабинета Количество аппаратов Код процедуры
Ограничивает
Управляет
Мед. тех. ограничения и методики
Код методики I
График работы кабинетов ХКод графика работы
Код кабинета (FK) Код календаря (FK) День недели Обед начало
Обед конец
Время начало
\^Врем^
окончание

Р
Ограничивают
Составление расписания
Код графика отпуска процедур
Код специалиста (FK)
Код кабинета (FK)
Код методики (FK)
Код графика работы (FK)
Код пациента (FK)
Код назначенной проц (FK)
Код календаря (FK) День недели Время начало Обед начало Обед конец Время окончания
Код специалиста (FK)
Код назначенной проц (FK)
Код пациента (FK)
Результаты анализа \3аболевания___
Р
Определяет
Определяет
Управляет
Календарь
Код календаря
Число
Месяц
Год
Неделя
День недели
Критерии эффективности расписания
Определяет/ Код критерия
Оценивает
Определяет
Р
Оказание мед. услуг
Код специалиста (FK)
Код кабинета (FK)
Код графика работы (FK)
Код методики (FK)
Код графика отпуска процедур (FK)
Код пациента (FK)
Код назначенной проц (FK)
Получает
Рисунок 6 – Фрагмент модели базы данных информационного хранилища
Заключение
Разрабатываемое информационное хранилище может стать основой медицинской СППР, применяемой для постановки диагноза и назначения лечения пациентов.
Предложенный метод отличает использование автоматического формирования деревьев принятия решений на основе текстов клинических рекомендаций и онтологии.
Список литературы Структура информационного хранилища системы поддержки принятия клинических решений
- Why unstructured data holds the key to intelligent healthcare systems. HIT Consultant; 2015. https://hitconsultant.net/2015/03/31/tapping-unstructured-data-healthcares-biggest-hurdle-realized/.
- Shakhmametova G., Yusupova N., Zulkarneev R., Khudoba Y. Concept Map for Clinical Recommendations Data and Knowledge // Proc. of the 8th International Conference on Applied Innovations in IT (ICAIIT). 2020. P.71-76. EDN: PXBUZZ.
- Киселев К.В., Ноева Е.А., Выборов О.Н., Зорин А.В. Разработка архитектуры базы знаний системы поддержки принятия врачебных решений, основанной на графовой базе данных. Медицинские технологии. Оценка и выбор. 2018. № 3(33). С.42-48. DOI: 10.31556/2219-0678.2018.33.3.042-048.
- Жулева С.Ю., Крошилин А.В., Крошилина С.В. Формирование базы знаний в экспертных системах медицинского назначения // Современные проблемы науки и образования. 2015. № 2-2. С.23. EDN: UZIYCF.
- Yang, J., Xiao, L. & Li, K. Modelling clinical experience data as an evidence for patient-oriented decision support // BMC Medical Informatics and Decision Making. 2020. № 20. DOI: 10.1186/s12911-020-1121-4.
- Бурцева А.Л., Берестнева Е. В., Степаненко Н. П. Создание базы знаний для медицинской экспертной системы. Современные наукоѐмкие технологии. 2016. № 3 (часть 1). С.14-17. EDN: VSYAGP.
- Катасѐв А.С. Ахатова Ч.Ф. Гибридная нейронечѐткая модель интеллектуального анализа данных для формирования баз знаний мягких экспертных диагностических систем. Наука и образование: научное издание МГТУ им. Н.Э. Баумана. 2012. № 12. С.34-42. EDN: PMKDOP.
- Sim I., Gorman P., Greenes R.A., Haynes R.B., Kaplan B., Lehmann H., et al. Clinical decision support systems for the practice of evidence-based medicine. J Am Med Inform Assoc. 2001. № 8(6). P.527–534. DOI: 10.1136/jamia.2001.0080527.
- Григорьев Л. Ю., Заблоцкий А. А., Кудрявцев Д. В. Технология наполнения баз знаний онтологического типа. Информатика, телекоммуникации и управление. 2012. №3 (150). С.27-36.
- Кобринский Б.А. Системы поддержки принятия врачебных решений: история и современные решения. Методология и технология непрерывного профессионального образования. 2020. №4 (4). С.21-36. DOI: 10.24075/MTCPE.2020.022.
- Дармахеева Т.А., Хаптахаева Н.Б. Моделирование системы управления активацией продукционных правил с использованием автоматного программирования. Вестник БГУ. Математика, информатика. 2018. №3. С.40-59. DOI: 10.18101/2304-5728-2018-3-40-59.
- Грибова В.В., Петряева М.В., Окунь Д.Б., Шалфеева Е.А. Онтология медицинской диагностики для интеллектуальных систем поддержки принятия решений. Онтология проектирования. 2018. Т.8. №1(27). С.58-73. DOI: 10.18287/2223-9537-2018-8-1-58-73.
- Вафин Р.Р. Автоматическое извлечение информации из клинических рекомендаций с применением интеллектуального анализа текста // Мавлютовские чтения: материалы XIII Всероссийской молодежной научной конференции. 2019. Т. 4. Ч. 2. С. 74-77.
- Зайцева Т.В., Васина Н.В., Пусная О.П., Смородина Н.Н. Программная реализация метода деревьев решений для решения задач классификации и прогнозирования. Экономика. Информатика. 2013. №8-1. С.121-127. EDN: RPYDEL.
- Гаврилова Т.А., Горовой В.А., Болотникова E.С., Голенков В.В. Субъективные метрики оценки онтологий // Материалы Всероссийской конференции с международным участием «Знания-Онтологии-Теории» (ЗОНТ-2009), Новосибирск, 22–24 октября 2009 года. С.178-186. EDN: YMWMYT.
- Жаркова О.С., Шаропин К.А., Сеидова А.С., Берестнева Е.В., Осадчая И.А. Построение систем поддержки принятия решений в медицине на основе деревьев решений // Современные наукоемкие технологии. 2016. №6 (часть 1). С.33-37. EDN: WCDUOD.
- Кафтанников И.Л., Парасич А.В. Особенности применения деревьев решений в задачах классификации // Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. 2015. №3. С.26-31. DOI: 10.14529/ctcr150304.