Перспективы использования больших языковых моделей для совершенствования кардиологической помощи
Автор: Квер Д., Тополь Э.Д.
Журнал: Juvenis scientia @jscientia
Рубрика: Переводные статьи
Статья в выпуске: 1 т.11, 2025 года.
Бесплатный доступ
Сердечно-сосудистые заболевания остаются ведущей причиной смерти во всём мире, и их раннее выявление и прогнозирование по-прежнему является важной проблемой. Технологии искусственного интеллекта (ИИ) могут помочь справиться с этой задачей, поскольку они обладают большим потенциалом для ранней диагностики и прогнозирования возникновения этих заболеваний. Глубокие нейронные сети (DNN) могут повысить точность интерпретации медицинских изображений, а данные, предоставленные ими, содержат ценную информацию, которая не была бы выявлена кардиологами другим способом. Благодаря последним достижениям при использовании моделей с архитектурой трансформера, мультимодального ИИ и больших языковых моделей (LLM) появилась возможность интеграции электронных медицинских карт с изображениями, геномной информацией, сигналами биосенсоров и другими данными, что потенциально может улучшить диагностику и выделить пациентов высокого риска для применения стратегий первичной профилактики. Несмотря на то что основное внимание уделяется использованию ИИ для помощи в работе клиницистам, он может также быть полезным пациентам и оказывать немедленную помощь в диагностике, например, при аритмии, и в настоящее время изучается его применение для визуализации в автоматическом режиме. Перед использованием ИИ в клинической практике следует рассмотреть потенциальные риски, такие как нарушение конфиденциальности данных и диагностические ошибки. В статьях этой серии исследуются возможности и ограничения моделей ИИ в кардиологии и преследуется цель выявить особые препятствия и варианты применения моделей ИИ, способствующие их интеграции в систему здравоохранения.
Короткий адрес: https://sciup.org/14133130
IDR: 14133130 | DOI: 10.32415/jscientia_2025_11_1_25-35
Текст научной статьи Перспективы использования больших языковых моделей для совершенствования кардиологической помощи
Translated article
EDN: JBJJXS
The Potential for Large Language Models to Transform Cardiovascular Medicine (Russian Translation)
Giorgio Quer, Eric J. Topol
-
1 Scripps Research Translational Institute, La Jolla, CA, USA
Translator: Lilia V. Paykova 2
Editor: Ivan Yu. Pchelin 2
-
2 Saint Petersburg State University, Saint Petersburg, Russia
This article is licensed under a Creative Commons Attribution 4.0 International License © Quer G., Topol E.J., 2025
ОДНОМОДАЛЬНЫЕ КОНТРОЛИРУЕМЫЕ МОДЕЛИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В условиях роста количества пациентов с сердечно-сосудистыми заболеваниями отмечается острая необходимость в новых подходах для раннего выявления этих заболеваний [1]. При использовании контролируемого обучения (то есть обучения на основе размеченного тренировочного набора данных) для одномодальных задач (задач с одним типом данных) на основе ввода сотен тысяч размеченных записей в глубокие нейронные сети (Deep Neural Networks — DNN) было доказано, что в электрокардиограмме (ЭКГ) в 12 отведениях содержится гораздо больше информации, чем могут выявить опытные кардиологи. Такие глубокие нейронные сети способны анализировать ЭКГ в 12 отведениях для раннего выявления амилоидоза сердца, при котором, как правило, патогномоничные изменения появляются только на поздних стадиях или не появляются вообще [2]. Для анализа этих последовательностей данных можно использовать два подтипа нейронных сетей: рекуррентные нейронные сети и нейронные сети с долгой краткосрочной памятью. Другие возможности применения этой технологии при анализе ЭКГ включают определение концентрации дофетилида в плазме крови [3], а также скрининг нарушений сократительной функции миокарда [4], пороков аортального и митрального клапанов [5] и определение давления заклинивания лёгочных капилляров. Возможность использования глубоких нейронных сетей для оценки фракции выброса левого желудочка на основе ЭКГ в 12 отведениях была подтверждена в крупномасштабном прагматическом рандомизированном клиническом исследовании, проведённом в условиях учреждений первичного звена [6]. В настоящий момент глубокие нейронные сети могут эффективно выявлять нарушения ритма, различая 12 видов ритма при анализе одноканальной ЭКГ, записанной амбулаторным устройством мониторинга [7]. Глубокие нейронные сети также способны спрогнозировать возникновение фибрилляции предсердий по данным ЭКГ в 12 отведениях у людей, не имевших в анамнезе этого нарушения ритма [8]. Помимо сердечно-сосудистых заболеваний, на основе ЭКГ также были выявлены анемия, предиабет, сахарный диабет 2-го типа, заболевания почек и щитовидной железы [9, 10].
Информацию о состоянии сердечно-сосудистой системы можно также получить при использовании глубоких нейронных сетей для анализа изображений, полученных в результате визуализирующих исследований. В частности, анализ изображений глазного дна может предоставить кардиологу существенную диагностическую информацию, необходимую для оценки факторов риска сердечнососудистых заболеваний, таких как возраст, пол, курение, систолическое артериальное давление [11], индекс коронарного кальция [12], масса миокарда левого желудочка и конечный диастолический объём, а также для прогнозирования риска инфаркта миокарда и острого нарушения мозгового кровообращения [13]. Гибкость глубоких нейронных сетей позволяет использовать их при проведении различных видов исследований, включая рентгенографию грудной клетки, для оценки функции сердца и наличия клапанных пороков [14], и эхокардиографию. Слепое рандомизированное исследование для проверки гипотезы о не меньшей эффективности показало, что работа с сопровождением ИИ может сэкономить время как врачам функциональной диагностики, так и кардиологам при оценке фракции выброса левого желудочка [15]. Хотя одномодальные глубокие нейронные сети обладают большой мощностью, они ограничены одним типом данных для каждой модели и поэтому требуют большого набора размеченных входных данных, которые используются на этапе обучения, чтобы модель научилась выполнять конкретную клиническую задачу, такую как обнаружение или прогнозирование определённого состояния. Ограниченная доступность этих данных, получение которых требует времени опытных клиницистов, тщательно отслеживающих процесс обучения, является главным препятствием для разработки и тестирования одномодальных глубоких нейронных сетей перед их внедрением в клиническую практику [16].
МУЛЬТИМОДАЛЬНЫЕ МОДЕЛИ
Включение более одного типа данных в анализ создаёт новые трудности, требующие внедрения новых моделей. Среди них — базисные модели, появление которых ознаменовало смену парадигмы одномодальных глубоких нейронных сетей, широко использовавшихся до этого в медицине. Несмотря на то что этим моделям также требуется большой набор данных для первоначального обучения, они могут обрабатывать не полностью размеченные или вообще не размеченные данные, используя методы неконтролируемого обучения или самообучения, и после первоначального обучения их можно применять к большому кругу задач. Как указано в препринте, базисные модели построены с использованием архитектуры трансформера и основаны на механизме внимания, позволяющем модели фокусироваться на различных частях входной последовательности при прогнозировании каждой части выходной последовательности [17], в отличие от рекуррентных нейронных сетей и сетей с долгой краткосрочной памятью, способных обрабатывать только один элемент единовременно. Таким образом, трансформеры определяют структуру анализируемых типов данных и адаптируют их для конкретной диагностической или прогностической задачи после этапа обучения, требующего меньше размеченных данных (предположительно, их сотую часть) по сравнению с другими моделями для достижения сопоставимой точности. Ввиду этого такие модели также могут применяться для диагностики редких заболеваний, когда имеется только несколько подтверждённых случаев, которые могут быть использованы для обучения алгоритма, но доступны большие наборы данных, не относящиеся к конкретному заболеванию. Базисные модели могут принимать различные комбинации типов данных (т. е. мультимодальные данные), имеющих отношение к разным медицинским специальностям [18], и расшифровывать результаты применения алгоритма с использованием точной медицинской терминологии (см. таблицу) [19, 20].
Базисная самообучающаяся модель, основанная на анализе 1 миллиона изображений глазного дна, превзошла небазисные модели, используемые в настоящее время для диагностики и прогнозирования заболеваний, угрожающих потерей зрения, но её возможности этим не ограничиваются. Механизм самообучения позволяет извлекать больше информации из изображений глазного дна и может применяться для прогнозирования тяжёлых системных заболеваний, обычно не диагностируемых на основе этих изображений (например, сердечная недостаточность, инфаркт миокарда, болезнь Паркинсона и болезнь Альцгеймера) [21]. Кроме того, базисные модели способны обрабатывать мультимодальные клинические данные и в сочетании с чат-ботом на основе большой языковой модели (Large Language Model — LLM) отвечать на диагностические вопросы и предлагать лечение [22]. LLM — это особый тип базисной модели, которая способна понимать и генерировать текст на большом количестве языков. Примерами такой модели являются: основанная на двунаправленной транс-формерной архитектуре языковая модель Google, известная как BERT; генеративный предобученный трансформер OpenAI и его разговорный вариант ChatGPT; большая языковая модель Meta AI*, известная как LLaMA. После появления LLM было предложено и протестировано несколько потенциальных вариантов их применения в медицине [23] и, в частности, в кардиологии [24]. Например, LLM может помочь кардиологу в трудоёмком ручном вводе данных и выполнении административных задач, обеспечивая автоматизацию составления медицинской документации или ответов на вопросы пациентов (c последующей проверкой врачом), потенциально экономя время, которое можно посвятить работе с пациентами [25]. Необходима дополнительная оптимизация LLM для этого типа задач, поскольку было показано, что используемые в настоящее время LLM не сокращают время, которое врачи первичного звена тратят на чтение сообщений от пациентов и ответы на них [26].
Потенциал LLM очень велик, поскольку большие языковые модели могут помогать кардиологам в анализе и составлении краткого резюме электронной медицинской карты пациента. Применение LLM в других специальностях, таких как лучевая диагностика, уже продемонстрировало результаты, сопоставимые или превосходящие медицинских экспертов по ёмкости, полноте и корректности формируемых заключений [27], что ещё раз подчёркивает перспективность применения ИИ для экономии времени клиницистов. Как указано в препринте, при предъявлении LLM и 20 опытным врачам первичного звена 149 клинических сценариев в части точности диагностики, навыков коммуникации с пациентами и составления плана лечения ИИ превзошёл врачей по 24 из 26 показателей [28].
После тщательной валидации в клинических условиях LLM сможет прогнозировать сердечнососудистый риск пациента, интегрируя мультимодальные данные, включая данные электронных медицинских карт, показатели шкал для оценки риска, данные биосенсоров, социальные детер-
Таблица
Архитектура искусственного интеллекта для использования в кардиологии
Одномодальные модели искусственного интеллекта |
Мультимодальные модели искусственного интеллекта |
Большие языковые модели |
|
Определение и входные данные |
Система искусственного интеллекта, предназначенная для использования только одного типа данных с целью обнаружения или прогнозирования |
Система искусственного интеллекта, которая может обрабатывать несколько типов данных (например, данные биосенсоров, изображения, текст и генетические данные), эффективно используя информацию каждой модальности |
Системы искусственного интеллекта, предназначенные для понимания человеческого языка на основе текста и генерации нового текста в ответ на запросы |
Архитектура |
Архитектура глубокой нейронной сети, включая свёрточные нейронные сети, рекуррентные нейронные сети и сети с долгой краткосрочной памятью |
Архитектура глубоких нейронных сетей может сочетать мультимодальные данные на входе (раннее слияние) или может объединять выходные данные при использовании различных вариантов архитектуры (позднее слияние); архитектура трансформера может обрабатывать различные типы входных данных |
Архитектура трансформера |
Практическое применение для кардиолога |
Анализ данных одного типа (например, обнаружение фибрилляции предсердий на ЭКГ в 12 отведениях); врач интерпретирует данные в соответствии с клинической картиной |
Задачи выявления и прогнозирования (например, прогнозирование возникновения фибрилляции предсердий), которые используют множество источников (например, данные электронной медицинской карты и ЭКГ в 12 отведениях) и могут обеспечить более точный индивидуальный прогноз риска |
Помощь кардиологу в проведении анализа данных электронной медицинской карты, постановке диагноза, коммуникации с пациентом и составлении плана лечения |
Практическое применение для пациента |
Самодиагностика в домашних условиях с помощью биосенсоров; результаты должны быть интерпретированы кардиологом |
Биосенсоры и визуализация с использованием смартфона; результаты должны быть интерпретированы кардиологом |
Интерактивное взаимодействие, трактовка данных пациента из различных источников и интерпретация медицинской терминологии |
минанты здоровья и данные о состоянии окружающей среды, такие как уровни загрязнения воздуха и пластикового загрязнения [29]. Например, в случае с аритмией LLM может выявлять людей, которым показана установка имплантируемого кардиовертера-дефибриллятора (ИКД) для предотвращения внезапной сердечной смерти — дорогостоящая процедура, которая в настоящее время приносит пользу только 5–10% пациентов и увеличивает риск осложнений у остальных 90–95% [30]. Кроме того, установка ИКД принесла бы пользу существенному количеству других людей с высоким риском внезапной сердечной смерти, которые ещё не идентифицированы (см. рисунок).
НА ПУТИ К СОЗДАНИЮ РАЗГОВОРНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ПАЦИЕНТОВ С СЕРДЕЧНО-СОСУДИСТЫМИ ЗАБОЛЕВАНИЯМИ
Первый доступный для пользователей алгоритм глубокого обучения, одобренный Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA), оказывает помощь пациентам в выявлении фибрилляции предсердий, используя DNN-интерпретацию данных смарт-часов или одноканальную ЭКГ с датчика на кончике пальца [31]. Возможности новых одномодальных глубоких нейронных сетей ещё больше: они включают оценку риска развития

Рисунок. Одномодальный и мультимодальный ИИ
( А ) Прогноз риска внезапной сердечной смерти при помощи одномодального ИИ на основе ЭКГ в 12 отведениях, приводящий к установке ИКД (ИКД приносят пользу только 5–10% пациентов, которым имплантировано это устройство). ( Б ) Потенциал мультимодального искусственного интеллекта с использованием данных ЭКГ в 12 отведениях, данных электронной медицинской карты и МРТ-изо-бражений для прогноза индивидуального риска внезапной сердечной смерти, что может привести к установке ИКД меньшему числу пациентов (из групп наиболее высокого риска) и увеличению доли пациентов, получающих пользу от ИКД. Оригинальный рисунок, созданный с помощью BioRender.com.
фибрилляции предсердий путём анализа ЭКГ без фибрилляции предсердий (сложная задача даже для опытного кардиолога), записанной во время холтеровского мониторирования [32] или при помощи одноканальных устройств для многосуточного амбулаторного мониторинга [33].
Значительный интерес к использованию ИИ и биосенсоров в области аритмологии (например, для выявления и прогнозирования фибрилляции предсердий) в настоящее время распространяется и на визуализацию. С помощью ИИ люди, не обученные выполнению эхокардиографии, могут провести её со смартфона с функцией автоматического считывания, и эта технология уже используется в клинических исследованиях для самостоятельного мониторинга сердечной недостаточности. ИИ может давать соответствующие инструкции с помощью LLM, которая транслирует их в режиме реального времени в диалоге с человеком, выполняющим эхокардиографию. Это также заслуживает особого внимания как пример возможного сокращения социального неравенства при использовании ИИ, поскольку визуализация на смартфоне людьми без медицинского образования всё чаще используется в странах с низким и средним уровнем дохода [34].
Пациенты ежедневно в интерактивном режиме используют чат-боты на базе LLM, чтобы задавать интересующие их вопросы в области медицины или интерпретировать свои данные. Хотя применение LLM расширяет возможности пациентов, для персонализированного подхода необходимо использование инженерии запросов (т.е. внедрения набора запрограммированных инструкций в LLM, которые могут устанавливать контекст и стиль обсуждения, в то же время ограничивая ответы LLM, чтобы избежать предоставления потенциально неверной и вредной для пациента информации). Персонализация также может способствовать развитию эмпатии в диалоге с пациентами [35]. Однако необходима проспективная систематическая оценка преимуществ использования LLM с этой целью.
ПРЕДОСТЕРЕЖЕНИЯ И ОПАСЕНИЯ
LLM обучаются на большом количестве неконтролируемых данных, доступных в интернете, и точ- ность ответов во многом зависит от этих данных. В LLM потенциально могут закрепиться связанные с социальными факторами систематические ошибки, способные навредить пациентам [36], и это основное ограничение, которое необходимо тщательно оценить и устранить. Рассмотрение этих проблем подразумевает строгую оценку систематических ошибок, а будущие стратегии уменьшения рисков потребуют большей прозрачности в обучении и функционировании LLM. Помимо этого, важными проблемами являются недостаточная прозрачность архитектуры LLM, несоблюдение конфиденциальности и безопасности данных пациентов, недостаточная объяснимость алгоритмов и усиление социального неравенства в отношении здоровья. Недостаточная прозрачность может быть устранена путём интеграции в LLM архитектуры генерации ответа, дополненной результатами поиска, которая извлекает информацию из соответствующих отобранных документов, предоставляет контекст для LLM и может корректно указывать источник информации [37]. Учитывая большой объём информации, используемой в обучении LLM для медицинского применения, включая данные пациентов, деидентификации часто бывает недостаточно для обеспечения конфиденциальности данных, поскольку обезличенные паттерны могут быть идентифицированы повторно [38]. Хотя обучение алгоритмов ИИ без перемещения данных из системы здравоохранения возможно при использовании федеративного обучения, а риск повторной идентификации можно снизить, добавив к данным искусственный шум, эти методы не могут полностью гарантировать конфиденциальность и безопасность. Таким образом, вышеописанные серьёзные проблемы могут ограничивать использование всего потенциала LLM. Кроме того, большинство доступных клинических данных, применяемых для обучения моделей искусственного интеллекта, относятся к ограниченной группе населения, зачастую не включающей представителей меньшинств [39]. Эти сообщества воспринимают медицинские инновации с недоверием, что ещё больше ограничивает внедрение моделей ИИ. Чтобы преодолеть данную проблему, необходимо лучше понимать препятствия на пути принятия моделей ИИ в таких сообществах, а также включить в будущем их данные в программы обучения LLM. Во всём мире LLM могут стать важным инструментом преодоления барьеров в коммуникации, предоставляя клиническую информацию на таком языке и уровне, который подходит для конкретного человека.
На сегодняшний день все одобренные FDA или получившие допуск 510(k) технологии искусственного интеллекта для кардиологии предназначены для одномодальных задач, и многие из этих положительных решений основаны на ретроспективных исследованиях с использованием переобученных моделей и, зачастую, без публикации данных [29, 40]. Число рандомизированных исследований ИИ в кардиологии невелико, поэтому для внедрения этих технологий требуется гораздо больше доказательств. Существенные опасения связаны с широко известной проблемой конфабуляций LLM (когда LLM генерирует ответы, являющиеся правдоподобными, но не соответствующими действительности или неточными), которые могут привести к серьёзным ошибкам в диагностике и лечении пациентов, что ещё больше подкрепляет абсолютное требование участия клинициста в принятии решений.
Определение стандартов и порядок утверждения использования LLM в здравоохранении сложны, поскольку эти модели имеют очень широкое применение и, будучи одобренными для решения конкретной задачи, могут быть потенциально использованы в нерегламентированных целях [41]. Возможно, потребуется новый способ регулирования, охватывающий использование этих моделей как по прямому назначению, так и для других целей.
Также недостаточно внимания, при внедрении LLM в систему здравоохранения, уделяется вопросам надзора, которые важны с учётом подверженности технологий искусственного интеллекта состязательным атакам и возможности ухудшения показателей их функционирования с течением времени. Современные LLM не имеют специализированной настройки в области кардиологии, которая должна включать доступ к самым современным источникам медицинской информации. В связи с этим требуется непрерывное совершенствование LLM для их использования в различных отраслях медицины в будущем.
ЗАКЛЮЧЕНИЕ
LLM и мультимодальный ИИ способны трансформировать кардиологию за счёт освобождения кардиологов от повторяющихся повседневных задач, таких как ручной ввод данных, возможности синтеза и объединения всей доступной информации о пациенте, повышения точности диагностики и формирования плана лечения на основе принципов доказательной медицины. Улучшение коммуникации и повышение уровня эмпатии при использовании консультационной помощи LLM — это ещё одна возможность применения ИИ в кардиологии. Кроме того, предоставляемая алгоритмами помощь в интерпретации данных и способность разговорного искусственного интеллекта отвечать на вопросы расширяют возможности пациентов. Однако, прежде чем внедрять эти технологии в клиническую практику, необходимо создать механизмы регулирования, учитывающие их потенциал, а также провести крупные проспективные исследования для получения убедительных доказательств того, что польза превышает потенциальные риски.
Это четвёртая статья в серии из четырёх статей об искусственном интеллекте и цифровых инновациях в лечении сердечно-сосудистых заболеваний. Все статьи этой серии доступны по адресу
Вклад авторов : ДК и ЭДТ внесли существенный вклад в разработку концепции и плана статьи, подготовили первый вариант рукописи, одобрили окончательную версию рукописи, несут ответственность за соответствие работы этическим принципам и приняли решение о её подаче для публикации.