Анализ сигналов электроэнцефалограмм с применением технологий машинного обучения для детектирования фокальных эпилептиформных разрядов

Автор: Карпов О.Э., Пензин О.В., Панин И.И., Утяшев Н.П.

Журнал: Вестник Национального медико-хирургического центра им. Н.И. Пирогова @vestnik-pirogov-center

Рубрика: Оригинальные статьи

Статья в выпуске: 4 т.15, 2020 года.

Бесплатный доступ

Рассмотрен алгоритм детектирования фокальных эпилепти формных разрядов, созданный при использовании свёрточных искусствен ных нейронных сетей. Показатель прогностической ценности отрицательного результата, ПЦОР, стремящийся к 100% (97,4-99,7% при распространенности 0,1-5%), обеспечивает высокую вероятность того, что участок, помеченный алгоритмом как нормальный, действительно не содержит эпилептиформных разрядов. Таким образом, алгоритм удовлетворяет исходному требованию о по иске областей интереса для детального анализа врачом-специалистом.

Эпилепсия, фокальные разряды, ээг, ма шинное обучение, свёрточные нейронные сети

Короткий адрес: https://sciup.org/140260063

IDR: 140260063   |   DOI: 10.25881/BPNMSC.2020.35.43.014

Текст научной статьи Анализ сигналов электроэнцефалограмм с применением технологий машинного обучения для детектирования фокальных эпилептиформных разрядов

Актуальность и цель исследования

Эпилепсия является распространенным и социально значимым хроническим заболеванием ЦНС. Регистрация электрической активности головного мозга в виде записи и последующего анализа электроэнцефалограммы (ЭЭГ) играет ключевую роль в подтверждении диагноза эпилепсия и дальнейшей ее классификации в соответствии с современными рекомендациями Международной противоэпилеп-тической лиги (International League Against Epilepsy, ILAE) [1]. Классификация приступов (по их началу) на фокальные и генерализованные является важным этапом для определения типа эпилепсии (фокальная; генерализованная; комбинированная генерализованная и фокальная эпилепсия) и дальнейшему уточнению эпилептического синдрома [2] важны для оптимального выбора противоэпилептических препаратов или рассмотрения вопроса об альтернативных, в том числе нейрохирургических методах лечения.

Длительный ЭЭГ-мониторинг (в сочетании с видеозаписью) может продолжаться несколько суток и предоставляет важную информацию для проведения оценки межприступной электрической активности, ре- гистрации ЭЭГ-картины приступа с целью определения его типа и источника эпилептогенной зоны, анализа семиологии приступа и других важных диагностических сведений [4].

К сожалению, анализ многочасовых записей длительного ЭЭГ-мониторинга занимает продолжительное время высококвалифицированных специалистов (вплоть до нескольких часов) — использование современных технологий искусственного интеллекта и машинного обучения для частичной автоматизации этого процесса позволит оптимизировать нагрузку на нейрофизиологов, осуществляющих расшифровку записей ЭЭГ.

Целью данного исследования является создание алгоритма детектирования фокальных эпилептиформных разрядов с помощью методов машинного обучения. В будущем комплекс из подобных алгоритмов для других паттернов ЭЭГ-сигналов может проводить предварительную оценку и разметку записи ЭЭГ для предоставления врачу-специалисту материалов исследования с выделенными «областями интереса» как продемонстрировано на блок-схеме, представленной на Рисунке 1.

Карпов О.Э., Пензин О.В., Панин И.И., Утяшев Н.П.

АНАЛИЗ СИГНАЛОВ ЭЛЕКТРОЭНЦЕФАЛОГРАММ С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДЕТЕКТИРОВАНИЯ ФОКАЛЬНЫХ ЭПИЛЕПТИФОРМНЫХ РАЗРЯДОВ

Рис. 1. Существующий порядок проведения исследования [сверху] и предлагаемый подход с автоматизацией и применением интеллектуального анализа [снизу].

Материалы и методы

Для создания алгоритма поиска фокальных разрядов в Пироговском Центре была собрана выборка из 74 обезличенных (деперсонифицированных) фрагментов записей ЭЭГ в формате EDF / EDF+C [4], полученных от различных взрослых пациентов, страдающих эпилепсией. Записи имели частоту дискретизации 128 Гц и включали стандартный набор электродов по системе 10–20% [5]: Fp1, Fp2, F7, F3, Fz, F4, F8, T3, C3, Cz, C4, T4, T5, P3, Pz, P4, T6, O1, O2. Суммарная длина всех записей составила 46,5 часов.

На всех ЭЭГ записях были размечены участки шириной в 2 секунды, содержащие фокальные разряды. Общее число таких участков составило 3500 штук или 4% от общей длины записей. Разметка записей ЭЭГ была произведена экспертом-неврологом Пироговского Центра.

В качестве предсказательной модели, лежащей в основе разработанного алгоритма, была использована сверточная нейронная сеть (Convolutional neural networks — CNN) [6]. В соответствии со стандартной методологией машинного обучения, исходная размеченная выборка ЭЭГ была разделена на обучающую для настройки параметров алгоритма и тестовую для контроля его качества; соотношение размеров этих выборок составило приблизительно 2 к 1, соответственно. Параметры предсказательной модели подбирались автоматически на обучающей выборке путем минимизации кросс-энтропии (логистической функции ошибки, Log Loss, демонстрирующее расхождение между двумя распределениями — предсказанием модели и интерпретацией участка ЭЭГ, предложенной экспертом).

Для полученных моделей также оценивались характеристики точности их прогноза: чувствительность и специфичность. Их определения с учетом контекста данной работы приведены ниже [7]:

  • •    Чувствительность (Se) — доля положительных результатов, которые правильно идентифицированы алгоритмом как таковые. В контексте данной работы: доля участков ЭЭГ с верно предсказанным наличием фокального эпилептиформного разряда среди всех

участков записи ЭЭГ с фокальными эпилептиформными разрядами, подтвержденными врачами-экспертами.

  • •    Специфичность (Sp) — доля отрицательных результатов, которые правильно идентифицированы алгоритмом как таковые. В контексте данной работы: доля участков ЭЭГ с верно предсказанным отсутствие фокального эпилептиформного разряда среди всех участков ЭЭГ, на которых отсутствие фокальных эпилептиформных разрядов подтверждено врачами-экспертами.

Для полученного алгоритма оценивались еще несколько характеристик классификации, являющихся дополнительными к чувствительности и специфичности и сильно зависящих от показателя распространенности (Р) фокальных эпилептиформных разрядов, представляющего собой долю всех участков ЭЭГ с фокальными эпилептиформными разрядами, подтвержденными врачами-экспертами, от общего количества проанализированных участков ЭЭГ [8; 9]:

  • •    Прогностическая ценность положительного результата (ПЦПР, она же точность, precision) — доля положительных результатов, которые правильно идентифицированы алгоритмом как таковые, от всех положительных результатов оценки алгоритмом. В контексте данной работы: доля участков ЭЭГ с верно предсказанным наличием фокального эпилептиформного разряда среди всех участков ЭЭГ, для которых алгоритмом было оценено наличие фокального разряда.

С распространённостью (Р), чувствительностью (Se) и специфичностью (Sp), данный показатель связан следующим образом:

ПЦПР = (Se*Р) / ( Se*Р + (1-Sp)*(1-Р) ).

  • •    Прогностическая ценность отрицательного результата (ПЦОР) — доля отрицательных результатов, которые правильно идентифицированы алгоритмом как таковые, от всех отрицательных результатов оценки алгоритмом. В контексте данной работы: доля участков ЭЭГ с верно предсказанным отсутствием фокального эпилептиформного разряда среди всех участков ЭЭГ, для которых алгоритмом было предсказано отсутствие фокального разряда.

С распространённостью (Р), чувствительностью (Se) и специфичностью (Sp), данный показатель связан следующим образом:

ПЦОР = ( Sp*(1-Р) ) / ( ( 1-Se)*Р + Sp*(1-Р) ).

В отличие от чувствительности и специфичности показатели ПЦОР и ПЦПР сильно зависят от распространенности (Р) фокальных эпилептиформных разрядов в выборке. Для возможности произвести сравнение с оценками ПЦОР и ПЦПР из других исследований

Карпов О.Э., Пензин О.В., Панин И.И., Утяшев Н.П.

АНАЛИЗ СИГНАЛОВ ЭЛЕКТРОЭНЦЕФАЛОГРАММ С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДЕТЕКТИРОВАНИЯ ФОКАЛЬНЫХ ЭПИЛЕПТИФОРМНЫХ РАЗРЯДОВ

Рис. 2. Представление найденных алгоритмом «кандидатов» в фокальные эпилептиформные разряды.

ряд авторов предлагает производить их коррекцию на другой уровень распространенности, известный по исследовательским работам или предлагаемый в качестве референтного [8–10].

Для всех вычисленных характеристик качества прогноза были рассчитаны 95-процентные биноминальные доверительные интервалы (ДИ) по методу Клоппера-Пирсона [9]. Расчет доверительных интервалов для скорректированных на распространенность фокальных эпилептиформных разрядов показателей прогностической ценности (ПЦПР и ПЦОР) осуществлялся по методу Вильсона [11].

Результаты и их обсуждение

Для поданного на вход двухсекундного участка ЭЭГ созданный в рамках данного исследования алгоритм выдает оценку вероятности того, что внутри него присутствует хотя бы один фокальный разряд. Выбирая пороговое значение для этой вероятности (так называемый порог классификации) и отсекая таким образом более вероятные события, можно получить список отрезков ЭЭГ, содержащих «кандидатов» в разряды. Этот список должен просмотреть врач-специалист и подтвердить или опровергнуть наличие фокальных эпилептиформных разрядов. Пользовательский интерфейс для просмотра и оценки записи сигнала ЭЭГ представлен на Рисунке 2.

На Рисунке 3 представлены нормализованные матрицы ошибок алгоритма на тестовой выборке для

Рис. 3. Матрицы ошибок алгоритма на тестовой выборке для двух значений порога классификации: (а) 0,1 [слева]; (б) 0,05 [справа].

Valid

двух значений порога классификации. Они позволяют провести оценку чувствительности и специфичности алгоритма выделения фокальных эпилептиформных разрядов в записи ЭЭГ-сигнала.

В строках матрицы ошибок содержатся истинные (« true ») значения, установленные врачом-неврологом, в столбцах — определенные алгоритмом (« predicted »). Меткой « norm » отмечены двухсекундные интервалы с нормальной электрической активностью, меткой « ED » — фокальные эпилептиформные разряды. Таким образом, на пересечении строки и колонки с одинаковыми метками находятся верные результаты работы алгоритма (истинно положительные и истинно отрицательные); если же метки отличаются — это ошибочные результаты

Карпов О.Э., Пензин О.В., Панин И.И., Утяшев Н.П.

АНАЛИЗ СИГНАЛОВ ЭЛЕКТРОЭНЦЕФАЛОГРАММ С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДЕТЕКТИРОВАНИЯ ФОКАЛЬНЫХ ЭПИЛЕПТИФОРМНЫХ РАЗРЯДОВ

Табл. 1. Показатели качества классификации алгоритма при разных порогах классификации [НГ-ДИ95% — нижняя граница 95%-го доверительного интервала, ВГ-ДИ95% — верхняя граница 95%-го доверительного интервала]

Показатели качества классификатора Порог классификации = 0,1 Порог классификации = 0,05 Значение НГ-ДИ95% ВГ-ДИ95% Значение НГ-ДИ95% ВГ-ДИ95% Общая доля верных результатов алгоритма 97,9% 97,9% 98,0% 95,6% 95,6% 95,7% Чувствительность 51,4% 48,8% 54,0% 65,3% 62,6% 68,0% Специфичность 98,6% 98,6% 98,7% 96,1% 96,1% 96,2% Распространенность 1,6% 1,5% 1,7% 1,6% 1,5% 1,7% ПЦПР 38,1% 36,1% 40,0% 21,5% 20,6% 22,4% ПЦОР 99,2% 99,2% 99,2% 99,4% 99,4% 99,5% ПЦПР при 5% распространенности 66,6% 64,1% 68,9% 47,1% 45,4% 48,7% ПЦОР при 5% распространенности 97,5% 97,4% 97,6% 98,1% 98,0% 98,2% ПЦПР при 0,1% распространенности 3,6% 2,8% 4,7% 21,5% 20,6% 22,4% ПЦОР при 0,1% распространенности 100,0% 99,9% 100,0% 99,4% 99,4% 99,5% алгоритма (ложноположительные или ложноотрицательные). Цвет ячейки выражает долю группы от общего количества проанализированных разрядов может быть интерпретирован по шкале, представленной справа от матрицы.

Можно отметить тот факт, что уменьшение численного значения для порога классификации увеличивает чувствительность метода, но при этом растет и число ложноположительных срабатываний. Учитывая, что чувствительность и специфичность для конкретной записи может отличаться от представленных в выборке усредненных данных, есть гипотеза, что задавать подходящее значение порога должен сам пользователь-врач.

Для лучшего отражения можно привести аналогию с регулировкой громкости аудиосистемы: чем больше усиление (ниже порог классификации), тем лучше слышны нюансы записи (алгоритм выделяет больше истинных фокальных разрядов), но и больше посторонних шумов и артефактов (ложноположительных срабатываний алгоритма).

Рассчитанные по матрицам ошибок показатели качества работы алгоритма-классификатора при обработке двухсекундных отрезков записей сигналов ЭЭГ из тестовой выборки с разными порогами классификации представлены в Таблице 1.

Заключение

Как видно из представленных результатов, точность алгоритма пока недостаточна для оценки точного количества фокальных эпилептиформных разрядов в записи ЭЭГ (или верного распознавания моделью каждого разряда, присутствующего в записи), но уже позволяет установить факт их наличия в этой записи.

Показатель прогностической ценности положительного результата, ПЦПР, составляющий 20–40% указывает на то, что алгоритм будет работать со значительной «гипердиагностикой», верно срабатывая лишь на каждый 3 или 5 фокальный эпилептиформный разряд (т.е. допуская при этом от 2 до 4 «ложноположительных срабатываний»).

Данная проблема является достаточно типичной и встречается при использовании алгоритмов машинного обучения и в других областях медицины, при необходимости выявлять редкие события с низкой распространенностью как в специально собранных для исследования выборках, так и в данных, накопленных в ходе рутинной клинической практики [12].

В тоже время показатель прогностической ценности отрицательного результата, ПЦОР, стремящийся к 100% (99,2–99,4%), обеспечивает высокую вероятность того, что участок, помеченный алгоритмом как нормальный, действительно не содержит эпилептиформных разрядов.

Таким образом, алгоритм удовлетворяет исходному требованию о поиске областей интереса для детального анализа врачом-специалистом, позволяя провести качественную (обнаружены/не обнаружены) оценку записи ЭЭГ на наличие фокальных эпилептиформных разрядов.

В дальнейшем данное исследование планируется продолжить с расширением размеченной выборки ЭЭГ, что должно позволить точнее оценить количество и распределение эпилептиформных разрядов (как фокальных, так и генерализованных) для вычисления индекса эпилептиформной активности.

Авторы заявляют об отсутствии конфликта интересов (The authors declare no conflict of interest).

9(1): 6–25. [Avakyan GN, Blinov DV, Lebedeva AV, et al. ILAE classification

АНАЛИЗ СИГНАЛОВ ЭЛЕКТРОЭНЦЕФАЛОГРАММ С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДЕТЕКТИРОВАНИЯ ФОКАЛЬНЫХ ЭПИЛЕПТИФОРМНЫХ РАЗРЯДОВ of the epilepsies: the 2017 revision and update. Epilepsia and paroxyzmal conditions. 2017; 9(1): 6–25. (In Russ).] doi:10.17749/2077-8333.

SPSS: iskusstvo obrabotki informatsii. Analiz statisticheskikh dannykh i vosstanovlenie skrytykh zakonomernostei: Per. s nem. Spb: DiaSoftYuP, 2005. (In Russ).]

Список литературы Анализ сигналов электроэнцефалограмм с применением технологий машинного обучения для детектирования фокальных эпилептиформных разрядов

  • Fisher R, Cross J, French J, et al. Operational classification of seizure types by the International League Against Epilepsy: Position Paper of the ILAE Commission for Classification and Terminology. Epilepsia. 2017; 58(4): 522-530. doi:10.1111/epi.13670.
  • Авакян Г.Н., Блинов Д.В., Лебедева А.В., и др. Классификация эпилепсии Международной Противоэпилептической Лиги: пересмотр и обновление 2017 года. Эпилепсия и пароксизмальные состояния. 2017; 9(1): 6-25. [Avakyan GN, Blinov DV, Lebedeva AV, et al. ILAE classification of the epilepsies: the 2017 revision and update. Epilepsia and paroxyzmal conditions. 2017; 9(1): 6-25. (In Russ).] doi:10.17749/2077-8333. 2017.9.1.006-025.
  • American Clinical Neurophysiology Society. Guideline twelve: guidelines for long-term monitoring for epilepsy. J Clin Neurophysiol. 2008; 25(3): 170-80. doi: 10.1097/WNP.0b013e318175d472.
  • Kemp B, Varri A, Rosa AC, Nielsen KD, Gade J. A simple format for exchange of digitized polygraphic recordings. Electroencephalogr Clin Neurophysiol. 1992; 82(5): 391-393. doi: 10.1016/0013-4694(92)90009-7.
  • American Electroencephalograph^ Society guidelines for standard electrode position nomenclature. J Clin Neurophysiol. 1991; 8(2): 200-2.
  • LeCun Y, Boser B, Denker JS, et al. Backpropagation Applied to Handwritten Zip Code Recognition, Neural Computation. 1989; 1(4): 541-551.
  • Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей: Пер. с нем. — Спб: ДиаСофтЮП, 2005. — 608 с. [Buyul, A. SPSS: iskusstvo obrabotki informatsii. Analiz statisticheskikh dannykh i vosstanovlenie skrytykh zakonomernostei: Per. s nem. Spb: DiaSoftYuP, 2005. (In Russ).]
  • Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. — Москва: МедиаС-фера, 2002. — 312 с. [Rebrova OYu. Statisticheskii analiz meditsinskikh dannykh. Primenenie paketa prikladnykh programm STATISTICA. Moscow: MediaSfera, 2002. (In Russ).]
  • Fleiss JL, Levin B, Paik MC. Statistical Methods for Rates and Proportions, 3d ed. New Jersey: John Wiley & Sons, 2003.
  • Heston TF. Standardized predictive values. J Magn Reson Imaging. 2014; 39(5): 1338. doi: 10.1002/jmri.24564.
  • Altman DG, Machin D, Bryant TN, et al. Statistics with Confidence, 2nd ed. UK: British Medical Journal Books; 2000.
  • Пензин О.В., Швырёв С.Л., Зарубина Т.В. Результаты внедрения в клиническую практику прогностической модели для оценки риска развития миелотоксических осложнений химиотерапии // Вестник новых медицинских технологий. — 2019. — №1. — С. 112-118. [Penzin OV, Shvyrev SL, Zarubina TV. Results of implementation in the clinical practice the prognostic model for assessing the risk development of mielotoxic complications of chemotherapy. Vestnik novykh medicinskikh tekhnologij. 2019; 1: 112-118. (In Russ).] doi: 10.24411/1609-2163-2019-16061.
Еще
Статья научная