Использование семантического индексирования и тезаурусов при обработке дермоскопических изображений
Автор: Г. А. Гулмирзаева
Журнал: Современные инновации, системы и технологии.
Рубрика: Управление, вычислительная техника и информатика
Статья в выпуске: 5(2), 2025 года.
Бесплатный доступ
В данной статье представлен инновационный алгоритм автоматического семантического индексирования дерматоскопических изображений на основе клинических метаданных (возраст, пол, анатомическое расположение). Предложенный подход сочетает современные методы обработки естественного языка (NLP) и использование медицинских тезаурусов и онтологий для повышения эффективности анализа и структурирования медицинских данных. Для генерации описаний изображений применялась нейронная языковая модель BioBERT, позволяющая преобразовать текстовые выражения в векторное пространство. Далее эти векторные представления сравнивались с концепциями, отобранными из медицинских тезаурусов (например, SNOMED CT), с помощью метрики косинусного сходства. В экспериментальной части исследования проведена автоматическая семантическая маркировка 100 изображений из набора данных ISIC 2020 GroundTruth. Были выбраны ключевые концепции, отражающие визуальные признаки опухолей кожи. Результаты показали высокий уровень согласованности между автоматически присвоенными тегами и реальными диагнозами. Такой подход позволяет значительно ускорить и стандартизировать процесс маркировки медицинских изображений, снизить субъективность и повысить воспроизводимость результатов. Разработанный алгоритм может быть интегрирован в информационные системы дерматологии для автоматизации диагностики, интеллектуальной сортировки данных и построения рекомендательных систем.
Дермоскопические изображения, семантическое индексирование, NLP, моделирование на основе онтологий, BioBERT, математическое моделирование
Короткий адрес: https://sciup.org/14133029
IDR: 14133029 | DOI: 10.47813/2782-2818-2025-5-2-3071-3076