Метод нахождения подмножеств согласованных признаков при прогнозировании эффективности реабилитации пациентов после перенесенной коронавирусной инфекции
Автор: Ходашинский И. А., Смирнова И. Н., Бардамова М. Б., Сарин К. С., Светлаков М. О., Зайцев А. А., Тицкая Е. В., Тонкошкурова А. В., Антипова И. И., Ходашинская А. И., Зарипова Т. Н.
Журнал: Сибирский журнал клинической и экспериментальной медицины @cardiotomsk
Рубрика: Экспериментальные исследования
Статья в выпуске: 4 т.38, 2023 года.
Бесплатный доступ
Коронавирусная инфекция вызывает длительно протекающий постковидный синдром, что определяет необходимость проведения медицинской реабилитации. Применение современных технологий машинного обучения для прогнозирования эффективности реабилитации способно персонифицировать процесс оказания помощи.Цель: создание метода построения модели прогнозирования эффективности реабилитации пациентов, перенесших COVID-19.Материал и методы. В исследование были включены 64 пациента, поступившие на стационарный этап реабилитации после COVID-19, средний возраст составил 56,92 ± 9,29 лет. Для получения информации о состоянии здоровья пациентов были проведены физикальный осмотр, тест шестиминутной ходьбы (ТШХ), клинический и биохимический анализы крови, спирометрия. Полученная база данных была обезличена и трансформирована в набор данных для задачи классификации, выходной меткой которого являлся бинарный признак, свидетельствующий о наличии или отсутствии улучшения результата ТШХ как минимум на 15%. Апробация предложенного метода определения согласованного подмножества признаков проведена с использованием фильтров ReliefF, χ2-квадрат и алгоритма минимальной избыточности и максимальной информативности, в качестве обертки применялся бинарный генетический алгоритм NSGA2. Проведено построение предварительных моделей машинного обучения на найденных подмножествах признаков линейным методом опорных векторов.Результаты. В процессе апробации предложенного метода в задаче прогнозирования эффективности реабилитации пациентов после COVID-19 было выявлено подмножество признаков, позволившее достигнуть максимального значения коэффициента конкордации. Найденное множество включает следующие признаки: пол пациента, наличие сопутствующих заболеваний, одышка, кашель, наличие жалоб на желудочно-кишечный тракт, результат ТШХ, уровень D-димеров, оценка одышки по шкале Борга.Заключение. Предложенный метод позволил определить признаки, имеющие наибольшую важность для прогноза эффективности реабилитации пациентов, перенесших COVID-19.
Коронавирусная инфекция covid-19, реабилитация, прогнозирование, машинное обучение, алгоритмы фильтрации признаков
Короткий адрес: https://sciup.org/149144449
IDR: 149144449 | УДК: 616.98:578.834.1]-036.82/.86-037 | DOI: 10.29001/2073-8552-2023-655
Method for finding subsets of consensus features in predicting the effectiveness of rehabilitation of patients after COVID-19
Coronavirus infection causes long-term post-Covid syndrome, which determines the need for medical rehabilitation. The use of modern machine learning technologies to predict the effectiveness of rehabilitation can personalize the process of providing assistance.Aim: To create a method for constructing a model to predict the effectiveness of patients rehabilitation who have suffered COVID-19.Material and Methods. The study included 64 patients admitted for inpatient rehabilitation after COVID-19. The average age was 56.92±9.29 years. To obtain information about the patients' health status, a physical examination, six-minute walk test (SHT), clinical and biochemical blood tests, and spirometry were performed in order to obtain information about the health status of the patients. The collected data were anonymized and transformed into a data set for the classification task, the output label of which was a binary attribute indicating the presence or absence of an improvement in the six-minute walk test result by at least 15 %. The proposed method for determining a consistent subset of features was tested by ReliefF, χ2-squared filters and the minimum redundancy and maximum information content algorithm; the binary genetic algorithm NSGA2 was used as a wrapper. The construction of preliminary machine learning models on the found subsets of features using the linear support vector machine was carried out.Results. In the process of testing the proposed method in the task of predicting the effectiveness of rehabilitation of patients after COVID-19, a subset of signs was identified that made it possible to achieve the maximum value of the concordance coefficient. The found set includes the following characteristics: gender, concomitant diseases, shortness of breath, cough, complaints about the gastrointestinal tract, six-minute walk test result, D-dimer level, assessment of shortness of breath according to the Borg scale.Conclusion. The proposed method allowed identifying the signs that are of the greatest importance for predicting the effectiveness of patients’ rehabilitation who have had COVID-19.
Список литературы Метод нахождения подмножеств согласованных признаков при прогнозировании эффективности реабилитации пациентов после перенесенной коронавирусной инфекции
- Воробьева Ю.Д., Дюкова Г.М. Астенический синдром в контексте пандемии COVID-19. Медицинский алфавит. 2020;(33):26-34. https://doi.org/33667/2078-5631-2020-33-26-34.
- Молочков А.В., Терпигорев С.А., Белоусова Е.А., Ватазин А.В., Древаль А.В., Зулькарнаев А.Б. и др. Особенности комплексного лечения пациентов с новой коронавирусной инфекцией (COVID-19): методические рекомендации по ведению стационарных пациентов. Альманах клинической медицины. 2020;48(Спецвыпуск 1):S91-S142. https://doi.org/10.18786/2072-0505-2020-48-041.
- Бубнова М.Г., Персиянова-Дуброва А.Л., Лямина Н.П., Аронов Д.М. Реабилитация после новой коронавирусной инфекции (COVID-19): принципы и подходы. CardioСоматика. 2020;11(4):6-14. https://doi.org/10.26442/22217185.2020.4.200570.
- Negrini S., Ferriero G., Kiekens C., Boldrini P. Facing in real time the challenges of the COVID-19 epidemic for rehabilitation. Eur. J. Phys. Rehabil. Med. 2020;56(3):313-315. https://doi.org/10.23736/S1973-9087.20.06286-3.
- Смирнова И.Н., Хон В.Б., Зайцев А.А., Левицкий Е.Ф., Тицкая Е.В. Автоматизированная система оценки эффективности санаторно-курортного лечения. Врач и информационные технологии. 2012;(1):64-69.
- Временные методические рекомендации Министерства здравоохранения России. Профилактика, диагностика и лечение новой коронавирусной инфекции (COVID-19). Версия 15 от 22.02.2022. URL: https://static-0.minzdrav.gov.ru/system/attachments/attaches/000/059/392/original/ВМР_COVID-19_V15.pdf (20.11.2023).
- Островский В.К., Макаров С.В., Янголенко Д.В., Родионов П.Н., Кочетков Л.Н., Асанов Б.М. Показатели крови и лейкоцитарный индекс интоксикации при оценке тяжести течения и определении прогноза воспалительных, гнойных и гнойно-деструктивных заболеваний органов брюшной полости и легких. Ульяновский медико-биологический журнал. 2011;(1):73-78.
- Ходашинский И.А., Сарин К.С. Отбор классифицирующих признаков с помощью популяционного случайного поиска с памятью. Автоматика и телемеханика. 2019;(2):161-172. https://doi.org/10.1134/S0005231019020107.
- Ходашинский И.А., Сарин К.С. Отбор классифицирующих признаков: сравнительный анализ бинарных метаэвристик и популяционного алгоритма с адаптивной памятью. Программирование. 2019;(5):3-9. https://doi.org/10.31857/S013234742105006X.
- Рыков А.С. Системный анализ: модели и методы принятия решений и поисковой оптимизации. М.: Издательский Дом МИСиС; 2009:607. URL: https://lib-bkm.ru/13995 (20.11.2023).
- Kononenko I., Šimec E., Robnik-Šikonja M. Overcoming the myopia of inductive learning algorithms with RELIEFF. Applied Intelligence. 1997;7(1):39-55. https://doi.org/10.1023/A:1008280620621.
- Robnik-Šikonja M., Kononenko I. Theoretical and empirical analysis of ReliefF and RReliefF. Machine Learning. 2003;53(1/2):23-69. https://doi.org/10.1023/A:1025667309714.
- Ding C., Peng H. Minimum redundancy feature selection from microarray gene expression data. J. Bioinform. Comput. Biol. 2005;3(2):185-205. https://doi.org/10.1142/s0219720005001004.
- Darbellay G.A., Vajda I. Estimation of the information by an adaptive partitioning of the observation space. IEEE Transactions on Information Theory. 1999;45(4):1315-1321. https://doi.org/10.1109/18.761290.
- Deb K., Agrawal S., Pratap A., Meyarivan T. A fast and elitist multiobjective genetic algorithm: NSGA-II. IEEE Trans. Evol. Comput. 2002;6:182-197. https://doi.org/10.1109/4235.996017.
- LinearSVC. User Guide Scikit-learn Website. URL: https://scikitlearn.org/stable/modules/generated/sklearn.svm.LinearSVC.html (20.11.2023).