Анализ причин ошибочной классификации изображений немеланоцитарных опухолей кожи программами на основе технологий искусственного интеллекта
Автор: Корабельников Д.И., Ламоткин А.И.
Журнал: Сибирский журнал клинической и экспериментальной медицины @cardiotomsk
Рубрика: Цифровые технологии в медицине и здравоохранении
Статья в выпуске: 1 т.41, 2026 года.
Бесплатный доступ
Дифференциальная диагностика немеланоцитарных опухолей кожи остается ключевой задачей дерматоонкологии, поскольку своевременное выявление злокачественных форм повышает шансы на успешное лечение. Субъективность традиционных методов стимулирует использование искусственного интеллекта (ИИ), при этом ошибки программ компьютерного зрения требуют анализа их причин. Цель исследования: анализ причин ошибочной классификации изображений немеланоцитарных опухолей кожи программами на основе технологий ИИ. Материал и методы. Для ретроспективного анализа фотоизображений опухолей использованы датасеты, обработанные в программах «Derma Onko Check» и «Melanoma Check». В контексте исследования злокачественные опухоли мы считали положительным результатом, доброкачественные – отрицательным. Для визуализации метрик качества изображений (яркость, контраст, энтропия, размытие, RGB-метрики) использованы боксплоты, парные диаграммы рассеяния, карты различий пиксельных значений. Для визуализации областей, наиболее важных для классификационных решений глубокой нейронной сети, применены два метода объяснимого ИИ: взвешенного картирования активации классов (Score-CAM) и определения чувствительности к окклюзии (Occlusion Sensitivity). Для проверки статистических гипотез использованы t-критерий Уэлча и однофакторный дисперсионный анализ; для оценки связи характеристик – корреляционный анализ по Спирмену. Результаты. Истинно положительные (ИП) результаты характеризовались следующими особенностями: меньшая яркость (медиана – 0,6914 в нормализованной шкале 0–1), что означает естественное равномерное освещение без сильных бликов. Энтропия оказалась высокой (медиана – 4,8584), что указывает на сложную текстуру с многими клинически значимыми деталями: изъязвлением, неровными границами и вариациями пигментации. Размытие было умеренным, обеспечивая приемлемую резкость изображения без сильного смазывания краев и текстуры опухоли. Средние значения красного и зеленого каналов были сбалансированными. Ложноположительные (ЛП) результаты имели повышенную яркость (медиана – 0,7994 – переэкспонированное, слишком светлое фото с бликами), низкую энтропию (медиана – 4,6414 – однородная текстура без сложных паттернов). Значимые различия между ИП и ЛП классами подтверждены для яркости (F = 5,1848; p < 0,05), энтропии (F = 5,2509; p < 0,05), размытия по FFT (F = 3,1136; p < 0,05), среднего значения зеленого канала (F = 5,3315; p < 0,05) и среднего значения красного канала (F = 3,3812; p < 0,05). Методы объяснимого ИИ и анализ качества фотоизображений показали, что ошибки классификации происходили также из-за артефактов фотосъемки (фон, волосы, тени). Заключение. Разработчикам для обучения программ «компьютерного зрения» рекомендуется проводить предобработку изображений (автоматический баланс белого, гамма-коррекция, фильтры Sobel для усиления текстуры и Wiener для подавления размытости, онлайн-аугментация яркости и контраста), нормализовать цветовые каналы, мониторить ключевые метрики качества после каждой эпохи обучения, использовать аугментацию, компенсирующую отрицательную корреляцию яркость – энтропия и вариабельность освещения. Пользователям рекомендуется соблюдать стандартные условия съемки: равномерное рассеянное освещение без теней и бликов, яркость < 0,75 в нормализованной шкале, отсутствие артефактов в кадре; выполнять съемку в режиме макро с расстояния 8–15 см, центрируя опухоль и обеспечивая энтропию - 4,8 и разрешение 2000–3000 пикселей по большей стороне; стабилизировать камеру и активировать функцию автоматического баланса белого на устройстве съемки.
Объяснимый искусственный интеллект, новообразования кожи, немеланоцитарные опухоли, ошибки классификации, предобработка изображений, параметры изображений, качество изображений
Короткий адрес: https://sciup.org/149150654
IDR: 149150654 | УДК: 616.5-006-047.44:004.8 | DOI: 10.29001/2073-8552-2026-2881
Analysis of the reasons of misclassification of non-melanocytic skin tumors by artificial intelligence based programs
Introduction. Differential diagnosis of non-melanocytic skin tumors remains a key challenge in dermato-oncology, as timely detection of malignant forms increases the chances of successful treatment. The subjectivity of traditional methods encourages the use of artificial intelligence (AI), but errors in computer vision programs require analysis. Aim: To analyze the reasons of misclassification of non-melanocytic skin tumor images by AI-based programs. This was accomplished by identifying systematic differences in data characteristics and visualizing regions of interest during image recognition. The results are aimed at improving the efficiency of training and using computer vision programs. Material and Methods. Datasets processed in the Derma Onko Check and Melanoma Check programs were used for a retrospective analysis of tumor images. For this study, malignant tumors were considered positive, while benign tumors were considered negative. Considering two types of AI decisions (true and false), four standard result classes were considered: true positive (TP), false positive (FP), true negative (TN), and false negative (FN). To visualize image quality metrics (brightness, contrast, entropy, blur, and RGB metrics), boxplots, paired scatterplots, and pixel difference maps were used. To visualize areas that significantly influence image classification, two explainable AI methods were applied: weighted class activation mapping (Score-CAM) and occlusion sensitivity. These methods allow us to understand which image regions are most important for the classification decisions of the deep neural network. To test statistical hypotheses, Welch's t-test and one-way analysis of variance were used; to assess the relationship between characteristics, Spearman's correlation analysis was used. Results. Significant differences in image characteristics were identified. The IP results were characterized by the following features. Brightness was lower (median 0.6914 on a normalized scale of 0-1), indicating natural, uniform illumination without strong glare. Entropy was high (median 4.8584), indicating a complex texture with many clinically significant details: ulceration, irregular borders, and pigmentation variations. Blurring was moderate, providing acceptable image sharpness without severe blurring of the tumor edges and texture. The mean values of the red and green channels were balanced. The LP results had increased brightness (median 0.7994, indicating an overexposed, overly bright photo with glare, where fine textural details are lost) and low entropy (median 4.6414, indicating a uniform texture without complex patterns). Significant differences between classes were confirmed for brightness (F = 5.1848; p < 0.05), entropy (F = 5.2509; p < 0.05), FFT blur (F = 3.1136; p < 0.05), green channel mean (F = 5.3315; p < 0.05), and red channel mean (F = 3.3812; p < 0.05). The Score-CAM and Occlusion Sensitivity explainable AI methods and image quality analysis showed that non-melanocytic tumor classification errors by the Derma Onko Check and Melanoma Check AI programs occurred due to overexposure, low entropy, and photography artifacts; false positives occurred on bright, low-texture images, and false negatives occurred on dark/blurred images. AI models are distracted by the background, hair, shadows. Conclusion. When training computer vision programs, developers are advised to perform image preprocessing (automatic white balance, gamma correction, Sobel filters for texture enhancement and Wiener filters for blur suppression, online brightness and contrast augmentation), normalize color channels, monitor key quality metrics after each training epoch, and use augmentation that compensates for the negative brightness-entropy correlation and illumination variability. Users of the programs are advised to adhere to standard shooting conditions: uniform diffuse lighting without shadows and glare, luminance < 0.75 on the normalized scale, and the absence of artifacts in the frame; shoot in macro mode from a distance of 8-15 cm, centering the tumor and ensuring entropy - 4.8 and a resolution of 2000-3000 pixels on the longest side; stabilize the camera and activate the automatic white balance function on the shooting device.