Оценка эффективности алгоритма поддержки принятия решения врачом при дистрофии сетчатки с использованием методов машинного обучения
Автор: Жданов Алексей Евгеньевич, Долганов Антон Юрьевич, Занка Дарио, Борисов Василий Ильич, Лучиан Евдочим, Доросинский Леонид Григорьевич
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений, распознавание образов
Статья в выпуске: 2 т.47, 2023 года.
Бесплатный доступ
Электроретинография является перспективным методом электрофизиологического тестирования, позволяющего диагностировать заболевания, связанные с нарушениями сосудистых структур сетчатки зрительного анализатора. Классический анализ электроретинограммы строится на оценке 4 параметров в амплитудно-временном представлении и часто нуждается в конкретизации с использованием альтернативных методов диагностики. В настоящем исследовании предлагается использование оригинального алгоритма поддержки принятия решения врачом для диагностирования дистрофии сетчатки. Алгоритм построен на базе методов машинного обучения и использует параметры, извлеченные из вейвлет-скалограммы педиатрических и взрослых сигналов электроретинограмм. Также в исследовании используется размеченная база данных педиатрических и взрослых сигналов электроретинограмм, записанная с помощью компьютеризированной электрофизиологической рабочей станции EP-1000 (Tomey GmbH) в Екатеринбургском центре МНТК «Микрохирургия глаза». Научная новизна настоящего исследования заключается в разработке специального алгоритмического обеспечения для анализа процедуры извлечения параметров из вейвлет-скалограммы сигнала электроретинограммы с использованием функции cwt библиотеки PyWT, где в качестве базисной функции был выбран вейвлет Гаусса 8-го порядка. Также научная новизна заключается в разработке алгоритма анализа сигналов электроретинограмм, который в сравнении с классическим анализом реализует классификацию взрослых сигналов электроретинограммы на 19 % точнее, а педиатрических сигналов на 20 % точнее, чем классический анализ.
Электроретинография, электроретинограмма, эрг, электрофизиологическое исследование, эфи, дистрофия сетчатки, вейвлет-анализ, вейвлет-скалограмма, деревья решений, алгоритм поддержки принятия решения
Короткий адрес: https://sciup.org/140297691
IDR: 140297691 | DOI: 10.18287/2412-6179-CO-1124
Текст научной статьи Оценка эффективности алгоритма поддержки принятия решения врачом при дистрофии сетчатки с использованием методов машинного обучения
Проблема сохранения зрительных функций является чрезвычайно актуальной во всем мире. Например, по оценкам Всемирной организации здравоохранения, в мире около 1,3 миллиарда человек живут с той или иной формой нарушения рефракции [1]. В связи с ростом численности и популяционным старением населения неминуемо будет возрастать риск того, что нарушения зрительных функций будут развиваться у все большего числа людей [2]. Медицинская статистика за последние 10 лет показала, что заболевания, сопровождающиеся нарушениями сосудистых структур сетчатки зрительного анализатора, входят в первую тройку болезней, ответственных за снижение зрения и слепоту у пациентов, чей возраст превышает 50–55 лет.
Одним из информативных методов диагностики гетерогенных заболеваний, связанных с нарушениями сосудистых структур сетчатки, является электрорети-нография. Электроретинография представляет собой метод электрофизиологического тестирования, при котором регистрируется электрический отклик сетчатки при её стимуляции коротким стимулом света или изменением пространственной организации яркости (паттернами) [3]. В отличие от хорошо изученных сигналов электрокардиограммы, представляющих собой продолжающуюся активность миокарда, для снятия электроретинограммы необходимо стимулировать сетчатку светом, чтобы вызвать синхронизированную активность ретинальных клеток, ведущую, таким образом, к генерации ответа электроре-тинограммы [4].
Известно большое число работ, авторы которых предпринимали попытки реализации алгоритмов анализа сигналов электроретинограмм с использованием:
-
1) дискретного вейвлет-преобразования для извлечения компонент электроретинограммы, что расширяет стандартизованный анализ функции сетчатки во временной области [5];
-
2) функций эксцентриситета для интерпретации данных конкретных нейронных функций, способствующих электрогенерации клеточных структур [6];
-
3) биоэлектрической модели потенциалов элек-троретинограммы для картирования активности сетчатки [7].
Следует отметить работу Ш. Варадхараджан [8], в которой описана возможность диагностирования мышечной дистрофии Дюшенна с помощью дискретного вейвлет-преобразования сигналов электроретинограмм с материнским вейвлетом Добеши четвертого порядка. Также следует отметить работу Мэтью Говена [9], в которой был применен вейвлет-анализ сигналов электроретинограммы для диагностики глаукомы. Материнским вейвлетом был выбран вейвлет Морле. У группы больных диагностирована хроническая открытоугольная глаукома, а в качестве контрольной группы рассмотрены здоровые пациенты. Глаукоматозные участки выявлялись с высокой чувствительностью (0,894). Значение специфичности (0,844) подтвердило точность обнаружения здоровых областей на сигнале электроретинограммы.
Научная новизна настоящего исследования заключается в разработке специального алгоритмического обеспечения для анализа процедуры извлечения параметров из вейвлет-скалограммы сигнала элек-троретинограммы с использованием функции cwt библиотеки PyWT, где в качестве базисной функции был выбран вейвлет Гаусса 8-го порядка. Также научная новизна заключается в разработке алгоритма анализа сигналов электроретинограмм, который в сравнении с классическим анализом реализует классификацию взрослых сигналов электроретинограммы на 19 % точнее, а педиатрических сигналов на 20 % точнее, чем классический анализ.
1. Материалы и методы
В исследовании была использована база данных сигналов электроретинограмм, включающая в себя пять протоколов взрослых и педиатрических сигналов электроретинограмм [10]: Scotopic 2.0 ERG Response (53 педиатрических сигнала, 23 взрослых сигнала), Maximum 2.0 ERG Response (80 педиатрических сигналов, 42 взрослых сигнала), Photopic 2.0
ERG Response (74 педиатрических сигнала, 32 взрослых сигнала), Photopic 2.0 EGR Flicker Response (63 педиатрических сигнала, 38 взрослых сигналов), а также Scotopic 2.0 ERG Oscillatory Potentials (20 сигналов). Электрофизиологические исследования проводились в Екатеринбургском центре МНТК «Микрохирургия глаза». Регистрация сигналов электроре-тинограмм производилась с помощью компьютеризированной электрофизиологической рабочей станции EP-1000 производства Tomey GmbH.
Классический анализ сигнала электроретинограм-мы строится на оценке амплитуды a , b и латентности l a , l b а- и b-волны (верхняя часть рис. 1). Для формирования алгоритма были определены дополнительные параметры, извлекаемые из каждого сегмента вейвлет-скалограммы сигнала (нижняя часть рис. 1), обозначенного цифрами от 1 до 6. Вейвлет-скалограмма получена с использованием функции cwt библиотеки PyWT, где в качестве базисной функции был выбран вейвлет Гаусса 8-го порядка.

t, мс
Рис. 1. Амплитудно-временное и частотно-временное представление сигнала электроретинограммы
В табл. 1 приведено описание параметров, извлеченных из вейвлет-скалограммы с использованием функции connectedComponents из библиотеки OpenCV. Для получения связанных компонент сигнала была выполнена следующая обработка вейвлет-скалограммы:
-
1) перевод значений скалограммы в формат 8битной кодировки (диапазон значений от 0 до 255);
-
2) бинаризация изображения c помощью метода Оцу [11];
-
3) эрозия изображения с ядром 3 на 3 пикселя для удаления локальных артефактов, связанных с цифровой обработкой сигналов, что позволяет удалить пиксели на границах сегментов;
-
4) определение связанных компонент вейвлет-скалограммы с использованием функции connectedComponents из библиотеки OpenCV [12].
Математический смысл связанных компонент – это набор чисел Markers, который имеет размер изображения и несет информацию о принадлежности каждой точки вейвлет-скалограммы конкретному сегменту.
Табл. 1. Описание параметров, извлеченных из вейвлет-скалограммы сигнала электроретинограммы
Наименование |
Описание |
Максимальная яркость сегмента B max |
Оценка амплитуды сегмента S n сигнала в выделенной частотной и временной областях (рис. 2 б ). |
Частота и время максимальной области сегмента f max , t max |
Оценка частотно-временных координат максимальной области сегмента S n (рис. 2 в ), где амплитуда составляет 90– 100 % от максимального значения амплитуды. |
Медианное и среднее значение яркости сегмента A median , A mean |
Оценка распределения яркости и равномерности распределения яркости по всей площади сегмента S n (рис. 2 д ). |
Крайние значения частоты и времени сегмента t 1 , t 2 , f 1 , f 2 |
Оценка пространственного расположения сегмента S n (рис. 2 г ). |

Рис. 2. Схема извлечения параметров из вейвлет-скалограммы сигнала электроретинограммы: (а) схематичное изображение вейвлет-скалограммы, состоящее из 6 сегментов; (б) максимальная яркость сегмента; (в) частота и время максимальной области сегмента; (г) медианное и среднее значение яркости сегмента; (д) крайние значения частоты и времени сегмента
В этом исследовании в качестве метода машинного обучения выбраны деревья решений (ДР) для классификации. Отличительной особенностью данного метода является возможность построения нелинейных границ принятия решений и поиск информативных параметров [15]. В работе все используемые признаки – численные, при этом решалась задача бинарной классификации (здоровые и пациенты с патологией). Основные элементы ДР решений – узлы принятия решений и листья. На каждом узле ДР происходит поиск среди всех имеющихся параметров такого, который разделяет имеющую выборку по классам исходя из выбранной метрики. При этом для каждого параметра также подбирается свой порог. Отбор происходит последовательно до тех пор, пока все данные не будут разделены или дальнейшее разделение не обеспечивает экстремум выбранного функционала качества, чем то, что получено на предыдущем этапе. Также ДР имеют возможность оценить полезность или значимость отдельных признаков (feature importance) в итоговое решение по классификации.
В проведенных исследованиях в качестве реализации методов ДР использовалась библиотека scikit-learn [16]. Визуализация ДР была выполнена с использованием библиотеки dtreeviz. В качестве метрики разделения классов использовалась метрика Джини (Gini Impurity). Гиперпараметры ДР (глубина деревьев, количество субъектов на узле) определялись исходя из результатов k -fold кросс-валидации. Отметим, что при использовании энтропии результаты разбиения подобны результатам с использованием коэффициента Джини, что является корректным ввиду относительно небольшого размера выборки.
Для определения метрик алгоритмов была реализована k -fold кросс-валидация. k -fold кроссвалидация – это разновидность процедуры эмпирического оценивания обобщающей способности алгоритмов. k -fold кросс-валидация была выполнена следующим образом:
-
1. Обучающая выборка разбивается на k непересе-кающихся одинаковых по объему частей.
-
2. Производится k итераций. На каждой итерации происходит следующее:
- модель обучается на k – 1 части обучающей выборки;
- модель тестируется на части обучающей выборки, которая не участвовала в обучении.
2. Результаты
Каждая из k частей единожды используется для тестирования. В данном случае k =5. Для реализации k-fold кросс-валидации была использована функция StratifiedKFold, чтобы гарантировать, что каждая часть обучающей выборки сохраняла равные доли для каждого класса. Количество сплитов было установлено на 5.
Разработанный алгоритм поддержки принятия решения врачом для диагностирования дистрофии сетчатки предназначен для анализа сигналов электро-ретинограмм с использованием методов машинного обучения. Необходимо оценить эффективность алгоритма, использующего данные, извлеченные из вейвлет-скалограммы, и классический анализ сигналов электроретинограмм. В качестве метода машинного обучения был выбран метод деревья решений. Причиной выбора метода является возможность определения значимых признаков для решения задачи классификации сигналов по набору параметров.
На рис. 3, 4, 5 представлены обученные деревья решений на соответствующих наборах данных (классический, расширенный, комбинированный). Представлены все узлы принятий решений, гистограммы параметров, с цветовым кодированием классов, пороги принятия решений для каждых параметров и статистика о распределении классов на листах.

Рис. 3. Алгоритм классического анализа взрослых сигналов электроретинограмм
На рис. 3 приведен алгоритм классического анализа взрослых сигналов электроретинограмм, оценивающий сигнал по параметрам амплитуды и латентности а- и b-волн. Алгоритм реализует классификацию сигналов на «здоровые» и «больные» в 5 этапов. Рассчитанные метрики для оценки эффективности алгоритма находятся в диапазоне от 0,52 до 0,66 и приведены в табл. 2, где «в» – взрослый сигнал, а «п» – педиатрический сигнал.
Табл. 2. Метрики эффективности алгоритмов анализа сигналов электроретинограмм
Метрика |
„ 5 8 ft s 2 =■ 2 1 |
* ft 11 |
1 5 ’ s = 1 |
|
Accuracy |
в |
0,52 |
0,71 |
0,71 |
п |
0,40 |
0,60 |
0,60 |
|
F1 |
в |
0,59 |
0,80 |
0,80 |
п |
0,46 |
0,65 |
0,61 |
|
Precision |
в |
0,56 |
0,79 |
0,79 |
п |
0,50 |
0,69 |
0,72 |
|
Recall |
в |
0,66 |
0,81 |
0,81 |
п |
0,43 |
0,61 |
0,58 |
На рис. 4 приведен разработанный алгоритм анализа взрослых сигналов электроретинограмм, оценивающий сигнал по параметрам, извлеченным из сегментов № 1– 4 вейвлет-скалограммы, где номер сегмента указывается после обозначения параметра в скобках. Алгоритм реализует классификацию сигналов на «здоровые» и «больные» в 4 этапа. Рассчитанные метрики для оценки эффективности алгоритма приведены в табл. 2 и находятся в диапазоне от 0,71 до 0,81.
Комбинируя классический анализ и анализ, оценивающий сигнал по параметрам, извлеченным из сегментов № 1–4 вейвлет-скалограммы сигнала электрорети-нограммы, дерево решений показывает, что диагностическая польза от использования классических параметров отсутствует. Таким образом, комбинированный алгоритм идентичен алгоритму на рис . 4.

Рис. 4. Алгоритм анализа взрослых сигналов электроретинограмм, оценивающий сигнал по параметрам, извлеченным из сегментов № 1 – 4 вейвлет- скалограммы

Рис. 5. Комбинированный алгоритм анализа педиатрических сигналов электроретинограмм
В случае с анализом педиатрических сигналов электроретинограмм комбинированный алгоритм включает в себя 3 из 4 классических параметров и реализует классификацию сигналов на «здоровые» и «с патологиями» в 5 этапов, что показано на рис. 5. Рассчитанные метрики для оценки эффективности алгоритма также приведены в табл. 2.
Представленные в табл. 2 метрики алгоритмов анализа взрослых (педиатрических) сигналов элек-троретинограмм демонстрируют превосходство алгоритмов расширенного анализа над классическим анализом на 24,5 (7,75)% для расширенного и на 26 (9,75)% для комбинированного алгоритма. Таким образом, предлагаемый алгоритм анализа взрослых (педиатрических) сигналов электроретинограмм реализует классификацию сигналов, представленных в используемой базе данных, на 26 (9,75) % эффективнее, чем классический анализ сигналов электроретинограмм.
В алгоритмах, представленных на рис. 4 и рис. 5, для каждого набора данных оценивалась отдельно полезность каждого параметра для классификации. Для эффективной классификации сигналов использовались только сегменты вейвлет-скалограммы № 1 – 4, так как параметры данных сегментов подходят лучше, чем прочие.
Заключение
Современное состояние исследований по проблеме диагностики заболеваний, сопровождающихся нарушениями сосудистых структур сетчатки, в частности, дистрофии сетчатки, заключается в отсутствии методик расширенного анализа электрофизиологических сигналов. Существующая научно-техническая база позволяет решить данную проблему за счет разработки новых высокотехнологичных методов расширенного (комплексного) анализа офтальмологических электрофизиологических сигналов и эффективного использования существующих мировых наработок в этой области с использованием методов машинного обучения.
В настоящем исследовании произведена оценка эффективности алгоритмов поддержки принятия решения врачом для диагностирования дистрофии сетчатки. Предложенный алгоритм реализует классификацию взрослых сигналов электроретинограмм на 19% точнее и педиатрических сигналов на 20 % точнее, чем классический анализ.
Следует отметить, что метрики эффективности классического алгоритма ожидаемо невысоки, так как в амбулаторной практике электроретинография выполнятся в совокупности с другими методами диагностики и позволяет оценить функциональное состояние сетчатки.
Исследование выполнено при финансовой поддержке Министерства науки и высшего образования
Российской Федерации в рамках Программы развития Уральского федерального университета имени первого Президента России Б.Н. Ельцина в соответствии с программой стратегического академического лидерства «Приоритет-2030».
Список литературы Оценка эффективности алгоритма поддержки принятия решения врачом при дистрофии сетчатки с использованием методов машинного обучения
- Gonzales-Turin JM, et al. Relationship between self-reported visual impairment and worsening frailty transition states in older people: a longitudinal study. Aging Clin Exp Res 2021; 33(9): 2491-2498. DOI: 10.1007/s40520-020-01768-w.
- Iodice F, Cassano V, Rossini PM. Direct and indirect neurological, cognitive, and behavioral effects of COVID-19 on the healthy elderly, mild-cognitive-impairment, and Alzheimer's disease populations. Neurol Sci 2021; 42(2): 455-465. DOI: 10.1007/s10072-020-04902-8.
- Van Schijndel NH, et al. The inverse problem in electro-retinography: a study based on skin potentials and a realistic geometry model. IEEE. Trans Biomed Eng 1997; 44(2): 209-211. DOI: 10.1109/TBME.2021.3075617.
- Jonnal RS. Toward a clinical optoretinogram: a review of noninvasive, optical tests of retinal neural function. Ann Transl Med 2021; 9(15): 1270. DOI: 10.21037/atm-20-6440.
- Gauvin M, Little JM, Lina JM, Lachapelle P. Functional decomposition of the human ERG based on the discrete wavelet transform. Journal of vision 2015; 15(16): 14-14. DOI: 10.1167/15.16.14.
- Gauvin M, et al. Functional decomposition of the human ERG based on the discrete wavelet transform. J Vis 2015; 15(16): 14. DOI: 10.1167/15.16.14.
- Schroder P, et al. A minimal-model approach to analyze neuronal circuit dynamics from multifocal ERG (mERG). 2019 41st Annual Int Conf of the IEEE Engineering in Medicine and Biology Society (EMBC) 2019: 2955-2958. DOI: 10.1109/EMBC.2019.8856840.
- Varadharajan S, Fitzgerald K, Lakshminarayanan V. Wavelet analysis of ERG of patients with Duchenne Muscular Dystrophy. Vision Science and its Application, OSA Technical Digest 2000: 65-68.
- Gauvin M, Lina JM, Lachapelle P. Advance in ERG analysis: from peak time and amplitude to frequency, power, and energy. BioMed Res Int 2014; 2014: 246096. DOI: 10.1155/2014/246096.
- Zhdanov AE, et al. OculusGraphy: Norms for electro-retinogram signals. 2021 IEEE 22nd Int Conf of Young Professionals in Electron Devices and Materials (EDM) 2021: 399-402. DOI: 10.1109/EDM52169.2021.9507597.
- Otsu N. A threshold selection method from gray-level histograms. IEEE Trans Syst Man Cybern 1979; 9(1): 62-66. DOI: 10.1109/TSMC.1979.4310076.
- Abbasi H, et al. 2D wavelet scalogram training of deep convolutional neural network for automatic identification of micro-scale sharp wave biomarkers in the hypoxic-ischemic EEG of preterm sheep. 2019 41st Annual Int Conf of the IEEE Engineering in Medicine and Biology Society (EMBC) 2019: 1825-1828. DOI: 10.1109/EMBC.2019.8857665.
- Shamshinova AM, Volkov VV. Functional methods of research in ophthalmology. Publishing House Medicine; 2004.
- McCulloch DL, et al. ISCEV Standard for full-field clinical electroretinography (2015 update). Doc Ophthalmol 2015; 130(1): 1-12. DOI: 10.1007/s10633-014-9473-7.
- Lior R. Data mining with decision trees: theory and applications. World Scientific; 2014.
- Pedregosa F, et al. Scikit-learn: Machine learning in Python. J Mach Learn Res 2011; 12: 2825-2830.