Извлечение симптомов и автоматическое предсказание диагноза по медицинским клиническим записям
Автор: Сердюк Ю.П.
Журнал: Программные системы: теория и приложения @programmnye-sistemy
Рубрика: Медицинская информатика
Статья в выпуске: 4 (63) т.15, 2024 года.
Бесплатный доступ
В статье представлена система, которая извлекает симптомы заболеваний из медицинских клинических записей (текстов на естественном русском языке) и автоматически предсказывает по ним диагноз в виде наименования заболевания и его кода в соответствии со справочником МКБ-10. Система ограничена предметной областью из 6 пульмонологических заболеваний (хроническая обструктивная болезнь легких, пневмония, бронхиальная астма и др.) и COVID-19. Извлечение симптомов реализовано с помощью нескольких нейронных сетей, выделяющих отдельные медицинские сущности и связи между ними. Предсказание диагноза также реализовано в виде классификатора на основе нейронной сети. Для обучения извлечению симптомов создан аннотированный корпус предложений. Описаны принципы и правила разметки симптомов. Представлен корпус текстов для обучения классификатора предсказанию диагнозов. Приведены оценки точности при тестировании обеих подсистем. Точность предсказания диагноза на данной предметной области составила 88,5%. Даны сравнения с аналогичными работами по извлечению симптомов из текстов на различных языках, а также по автоматическому предсказанию диагнозов, включая системы типа ChatGPT.
Системы поддержки принятия врачебных решений, извлечение симптомов, автоматическое предсказание диагнозов, bert-модели, системы на основе chatgpt
Короткий адрес: https://sciup.org/143183788
IDR: 143183788 | DOI: 10.25209/2079-3316-2024-15-4-153-181
Список литературы Извлечение симптомов и автоматическое предсказание диагноза по медицинским клиническим записям
- Романов Н. А., Сачек М. М. Системы поддержки принятия клинических решений: современное состояние и проблемы // Вопросы организации и информатизациии здравоохранения.– 2018.– №3.– С. 18–25. hUtRtpLs://rnpcmt.by/files/[Р0И01Н06Ц/]obj/110/72183/doc/1_Probl_2_18-25.pdf
- Osheroff J. A. Improving medication use and outcomes with clinical decision support: a step-by-step guide.– HIMSS Publishing.– 2009.– ISBN 9780980069730.– 300 pp.
- Yalunin A., Nestrov A., Umerenkov D. RuBioRoBERTa: a pre-trained biomedical language model for Russian language biomedical text mining.– 2022.– 5 pp. arXivarXiv 2204.03951 https://doi.org/10.48550/arXiv.2204.03951
- Blinov P., Avetisian M., Kokh V., Umerenkov D., Tuzhilin A. Predicting clinical diagnosis from patients electronic health records usin BERT-based neural networks, Artificial Intelligence in Medicine: 18th Int. Conf. on Art. Intel. In Medicine, AIME 2020 (Minneapolis, MN, USA, August 25-28, 2020), Lecture Notes in Computer Science.– vol. 12299, Cham: Springer.– 2020.– ISBN 978-3-030-59136-6.– Pp. 111–121. https://doi.org/10.1007/978-3-030-59137-3_11
- Garg R.K., Urs V. L., Agarwal A. A., Chaudhary S. K., Paliwal V., Kar S. K. Exploring the role ChatGPT in patient care (diagnosis and treatment) and medical research: a systematic review // Health Promotion Perspectives.– 2023.– Vol. 13.– No. 3.– Pp. 183–191. https://doi.org/10.34172/hpp.2023.22
- Steinkamp J. M., Bala W., Sharma A., Kantrowitz J. J. Task definition, annotated dataset, and supervised natural language processing models for symptom extraction from unstructured clinical notes // Journal of Biomedical Informatics.– 2020.– Vol. 102.– id. 103354.– 9 pp. https://doi.org/10.1016/j.jbi.2019.103354
- Гаврилов Д. В., Кирилкина А. В., Серова Л. М. Алгоритм формирования подозрения на новую коронавирусную инфекцию на основе анализа симптомов для использования в системах поддержки принятия врачебных решений // Врач и информационные технологии.– 2020.– №4.– С. 51–58. https://doi.org/10.3769[0Р/И18Н1Ц1-]0193-2020-4-5hU1t-Rt5p8Ls://vit-j.ru/upload/uf/067/8j4r6gsg3z5msbqzyycv5kask6cd7mae/total.pdf
- Umerenkov D., Zubkova G., Nesterov A. Deciphering diagnosis: how large language models explanations influence clinical decision making.– 2023.– 11 pp. arXivarXiv 2310.01708 https://doi.org/10.48550/arXiv.2310.01708
- Tutubalina E., Alimova I., Miftahutdinov Z., Sakhovskiy A., Malykh V., Nikolenko S. The Russian Drug Reaction Corpus and neural models for drug reactions and effectiveness detection in user reviews // Bioinformatics.– 2021.– Vol. 37.– No. 2.– Pp. 243–249. https://doi.org/10.1093/bioinformatics/btaa675
- Barile J., Margolis A., Cason G., Kim R., Kalash S., Tchaconas A., Milanaik R. Diagnostic accuracy of a large language model in pediatric case studies // JAMA Pediatrics.– 2024.– Vol. 178.– No. 3.– Pp. 313–315. https://doi.org/10.1001/jamapediatrics.2023.5750
- Сердюк Ю.П., Власова Н. А., Момот С. Р. Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей // Программные системы: теория и приложения.– 2023.– Т. 14.–№1(56).– С. 95–123. hUtRtpLs://psta.psiras.ru/rheattdp/sp:/st/ad2o0i.2o3r_g/11_09.255-122039./p2d0f79-3316-2023-14-1-95-123
- Shang Yu-M., Huang H., Mao X. L. OneRel: Joint entity and relation extraction with one module in one step // The Thirty-Sixth AAAI Conference on Artificial Intelligence (AAAI-22) (February 22–March 1, 2022, online).– Curran Associates, Inc..– 2022.– ISBN 9781713855743.– Pp. 11285–11293. hUtRtpLs://cdn.aaai.org/ojsh/t2t1p3s:7/9//d2o1i3.o7r9g-/1130-2.458359520-1/-a2r-X20iv2.220260238.0.p5d41f 2
- Joshi M., Chen D., Liu Y., Weld D. S., Zettlemoyer L., Levy O. SpanBERT: improving pre-training by representing and predicting spans // Transactions of the Association for Computational Linguistics.– 2020.– Vol. 8.– Pp. 64–77. https://doi.org/10.1162/tacl_a_00300
- Lybarger K., Ostendorf M., Thompson M., Yetisgen M. Extracting COVID-19 diagnoses and symptoms from clinical text: A new annotated corpus and neural event extraction framework // Journal of Biomedical Informatics.– 2021.– Vol. 117.– id. 103761.– 13 pp. https://doi.org/10.1016/j.jbi.2021.103761
- Thirunavukarasu A. J., Ting D. S. J., Elangovan K., Gutierrez L., Tan T. F., Ting D. S. W. Large language models in medicine // Nat. Med.– 2023.– Vol. 29.– No. 8.– Pp. 1930–1940. https://doi.org/10.1038/s41591-023-02448-8
- Shah N. H., Entwistle D., Pfeffer M. A. Creation and adoption of large language models in medicine // JAMA.– 2023.– Vol. 330.– No. 9.– Pp. 866–869. https://doi.org/10.1001/jama.2023.14217
- Singhal K., Azizi S., Tu T., Mahdavi S. S., Wei J., Chung H. W., Scales N., Tanwani A., Cole-Lewis H., Pfohl S., Payne P., Seneviratne M., Gamble P., Kelly Ch., Babiker A., Schärli N., Chowdhery A., Mansfield Ph., Demner-Fushman D., Agüera y Arcas B., Webster D., Corrado G. S., Matias Y., Chou K., Gottweis J., Tomasev N., Liu Y., Rajkomar A., Barral J., Semturs Ch., Karthikesalingam A., Natarajan V. Large language models encode clinical knowledge // Nature.– 2023.– Vol. 620.– No. 7972.– Pp. 172–180. https://doi.org/10.1038/s41586-023-06291-2
- Young C. C., Enichen E., Rivera Ch., Auger C. A., Grant N., Rao A., Succi M. D. Diagnostic accuracy of a custom large language model on rare pediatric disease case reports // American Journal of Medical Genetics, Part A.– 2024.– id. e63878. https://doi.org/10.1002/ajmg.a.63878
- Kanjee Z., Crowe B., Rodman A. Accuracy of generative artificial intelligence model in a complex diagnostic challenge // JAMA.– 2023.– Vol. 330.– No. 1.– Pp. 78–80. https://doi.org/10.1001/jama.2023.8288
- Gargari G. K., Fatehi F., Mohammadi I., Firouzabadi S. R., Shafiee A., Habibi Gh. Diagnostic accuracy of large language models in psychiatry // Asian Journal of Psychiatry.– 2024.– Vol. 100.– id. 104168. https://doi.org/10.1016/j.ajp.2024.104168
- Nielsen M. Neural networks and deep learning, free online book.– 2016. nUeRuLralnetworksanddeeplearning.com