Метод повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных
Автор: Тихонов Д.В., Аршинов Н.П.
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
В статье рассматриваются вопросы повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных. Авторами обосновывается актуальность и значимость темы исследования, отмечается, что использование различных видов аугментации позволяет искусственно увеличить разнообразие обучающей выборки, снизить эффект переобучения и повысить обобщающую способность моделей. В рамках статьи проанализировано влияние геометрических и фотометрических преобразований, а также их комбинированного применения на качество классификации. Результаты подтверждают, что использование аугментации может значительно повысить обобщающую способность моделей и снизить риск переобучения без увеличения объема исходных данных. Более того, полученные результаты подтверждают целесообразность использования как индивидуальных, так и комбинированных методов аугментации в задачах глубокого обучения нейронных сетей с ограниченными ресурсами данных. В будущем перспективной областью исследований является разработка адаптивных и обучаемых стратегий расширения знаний, а также их интеграция с методами передачи знаний и самообучения.
Нейронная сеть, глубокое обучение, сегментация, аугментация данных, геометрические преобразования, фотометрические преобразования, машинное обучение
Короткий адрес: https://sciup.org/148333232
IDR: 148333232 | УДК: 004 | DOI: 10.18137/RNU.V9187.26.01.P.189
Method for improving the effectiveness of training deep neural networks on small samples using data augmentation techniques
The article focuses on a method for improving the effectiveness of training deep neural networks on small samples using data augmentation techniques. The authors substantiate the relevance and significance of the research topic, noting that the use of various types of augmentation allows to artificially increase the diversity of the training sample, reduce the effect of retraining and improve the generalizing ability of models. Within the framework of the article, the authors analyze the influence of geometric and photometric transformations, as well as their combined use, on the quality of classification. The results confirm that the use of augmentation can significantly increase the generalizing ability of models and reduce the risk of overfitting without increasing the volume of source data. Moreover, the results obtained confirm the expediency of using both individual and combined augmentation methods in deep learning tasks of neural networks with limited data resources. In the future, a promising area of research is the development of adaptive and learnable knowledge expansion strategies, as well as their integration with knowledge transfer and self-learning methods.
Текст научной статьи Метод повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных
Модели глубокого обучения произвели революцию в области машинного обучения, которое до сих пор оказывает влияние практически на все сферы применения, поскольку отрасль инвестирует миллиарды долларов в технологии искусственного интеллекта. Глубокие нейронные сети (Deep Neural Networks, DNN) в настоящее время являются одним из самых популярных подходов при решении различных практических задач: распознавание изображений и речи, обработка естественного языка, компьютерное зрение, медицинская информатика и др.
Для достижения хорошего результата обычно требуется большой набор данных с тысячами примеров для каждой выходной категории. Современные архитектуры глубоких нейронных сетей характеризуются большим числом настраиваемых параметров, прежде всего синаптических весов. Например, сверточная нейронная сеть AlexNet, предложенная в 2012 году группой учёных (А. Крижевским, И. Сатскевером и Дж. Хинтоном) из Университета Торонто, содержит около 60 млн обучаемых параметров. Более поздние ар-
Метод повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных хитектуры, такие как VGG-16, включают порядка 138 млн параметров. Наличие столь большого числа настраиваемых параметров требует значительного объёма обучающих данных для корректной настройки модели и предотвращения переобучения.
Практика применения глубоких нейронных сетей подтверждает необходимость использования больших обучающих выборок. Так, при обучении модели AlexNet использовался набор данных ImageNet, содержащий более 1,2 млн размеченных изображений, распределённых по 1000 классам. Большой объём данных позволяет модели выявлять устойчивые закономерности и формировать обобщённые признаки объектов.
При обучении нейронной сети на ограниченной обучающей выборке возникает риск переобучения, когда модель запоминает отдельные примеры вместо выявления общих закономерностей. Например, если для задачи классификации изображений доступно лишь несколько десятков или сотен примеров для каждого класса, модель может демонстрировать высокую точность на обучающих данных, но значительно худшие результаты на независимой тестовой выборке.
В связи с этим в задачах машинного обучения, где объем доступных данных ограничен, активно применяются методы искусственного увеличения обучающей выборки. Одним из наиболее распространенных подходов является аугментация данных , позволяющая генерировать дополнительные обучающие примеры путем применения различных преобразований исходных данных, таких как повороты, масштабирование, отражения и изменение яркости изображений. Использование аугментации позволяет повысить разнообразие обучающих данных и улучшить обобщающую способность модели без необходимости сбора новых реальных данных.
Безусловно, глубокие нейронные сети демонстрируют высокую эффективность при решении задач компьютерного зрения, обработки естественного языка и анализа временных рядов [1]. Однако их успешное применение, как правило, требует наличия больших объемов размеченных данных. В реальных прикладных задачах, особенно в медицине, промышленной диагностике и научных исследованиях, доступные обучающие выборки часто являются малыми, что приводит к переобучению моделей и снижению их обобщающей способности. Одним из наиболее перспективных подходов к решению данной проблемы является применение техник аугментации данных, направленных на искусственное увеличение объема и разнообразия обучающей выборки без привлечения дополнительных данных. Аугментации данных представляют собой методологические техники, направленные на генерацию новых обучающих примеров посредством трансформаций исходных данных, при этом обеспечивая сохранение их семантической целостности 1 .
Методы и материалы исследования
Целью данного исследования является изучение методов повышения эффективности обучения глубоких нейронных сетей на малых выборках с использованием различных техник аугментации данных, а также анализ их влияния на качество и устойчивость моделей.
Для оценки эффективности этих методов использовались различные показатели. Кроме того, в исследовании рассматривалась задача обучения сверточной нейронной
Вестник Российского нового университета
Серия «Сложные системы: модели, анализ и управление». 2026. № 1
сети для классификации данных с ограниченным размером обучающей выборки. В качестве базовой архитектуры использовалась стандартная сверточная нейронная сеть с несколькими сверточными и полностью связанными слоями. Обучение проводилось при помощи метода обратного распространения ошибок с использованием оптимизатора Adam [2].
Для повышения эффективности обучения применялись разные методы увеличения объема данных, в том числе геометрические преобразования, случайное обрезание и искажение входных данных, а также комбинированные методы увеличения, включающие последовательное применение нескольких преобразований. Увеличение выполнялось в режиме онлайн, то есть новые варианты данных генерировались непосредственно в процессе обучения модели. Результаты сравнивались с базовой моделью, подготовленной без использования дополнений.
Результаты и их обсуждение
Как известно, аугментация данных зарекомендовала себя как мощный инструмент повышения качества моделей машинного обучения в задачах компьютерного зрения. Главное преимущество аугментации – возможность увеличения эффективного размера обучающей выборки без необходимости собирать и размечать новые данные. Так, для оценки эффективности применения аугментации данных было проведено экспериментальное исследование на задаче классификации изображений при ограниченном объёме обучающей выборки [3–8].
В качестве исходных данных использовался поднабор изображений, сформированный из открытого датасета общего назначения. Обучающая выборка была искусственно ограничена и содержала фиксированное малое число примеров для каждого класса, что моделировало условия дефицита данных. При этом тестовая выборка оставалась неизменной и использовалась исключительно для оценки обобщающей способности моделей.
Как показано на Рисунке, процедуры аугментации данных применяются исключительно к обучающей выборке, что позволяет увеличить ее разнообразие без искажения распределения тестовых данных.
В исследовании применялась сверточная нейронная сеть, включающая:
-
• несколько сверточных слоёв с функцией активации ReLU;
-
• слои подвыборки для уменьшения размерности признаков;
-
• полносвязный классификационный слой на выходе.
В качестве функции потерь использовалась категориальная кросс-энтропия. Все модели обучались при одинаковых гиперпараметрах, что обеспечило корректность сравнительного анализа.
Непосредственно для оценки качества обучения использовались следующие показатели: точность классификации, полнота и F-мера. Результаты фиксировались на тестовой выборке после завершения обучения каждой модели. Исследование показало, что применение техник аугментации данных приводит к значительному улучшению качества обучения глубоких нейронных сетей на малых выборках. Базовая модель, обученная без аугментации, демонстрировала выраженное переобучение, что проявлялось в высоких значениях метрик на обучающей выборке и их существенном снижении на тестовых данных.
Метод повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных
Рисунок. Схема использования обучающей и тестовой выборок с применением аугментации данных Источник: рисунок выполнен авторами
Таким образом, использование геометрической аугментации позволило заметно повысить точность классификации и уменьшить разрыв между обучающей и тестовой выборкой. Это свидетельствует о формировании более устойчивых и инвариантных признаков, что особенно важно в задачах обработки изображений.
Фотометрическая аугментация также оказала положительное влияние на качество модели, однако её вклад оказался менее значительным по сравнению с геометрическими преобразованиями. Вместе с тем данный тип аугментации повысил устойчивость модели к изменениям условий освещения и наличию шумов во входных данных.
Наилучшие показатели были получены при использовании комбинированной аугментации данных. В этом режиме модель продемонстрировала максимальные значения метрик качества и наименьшую степень переобучения. Однако было выявлено, что чрезмерное усиление аугментации может негативно сказаться на результатах обучения, поскольку приводит к искажению семантики данных и усложняет процесс оптимизации.
Отметим, что при использовании комбинированной аугментации данных точность классификации на тестовой выборке увеличилась с 78,4 % для базовой модели (без применения аугментации) до 87,3 %, что соответствует улучшению на 8,9 процентных пунктов. При этом разрыв между точностью на обучающей и тестовой выборке снизился с 12,6 до 4,8 %, что свидетельствует о снижении степени переобучения модели.
Под геометрической аугментацией в работе понимаются преобразования, изменяющие пространственное положение объектов на изображении (повороты до +/–20 градусов, горизонтальное отражение, масштабирование в диапазоне 0,9…1,1 и случайные сдвиги до 10 % размера изображения).
Фотометрическая аугментация включает преобразования, изменяющие характеристики яркости и контрастности изображения без изменения его геометрической структуры (изменение яркости до ±20 %, изменение контрастности до ±15 % и добавление га-уссового шума).
Вестник Российского нового университета
Серия «Сложные системы: модели, анализ и управление». 2026. № 1
Дополнительные эксперименты показали, что чрезмерное усиление аугментации может приводить к ухудшению результатов обучения. В данной работе чрезмерной аугментацией считается применение преобразований с параметрами, существенно искажающими исходные изображения (например, повороты более +/–60 градусов, масштабирование 0,5…1,5 или изменение яркости более 40 %). В этих условиях точность классификации на тестовой выборке снижалась до 82,1 %, что на 5,2 процентных пункта ниже результата, полученного при оптимальных параметрах аугментации. Эффект чрезмерной аугментации оценивался по трем критериям: снижение точности классификации на тестовой выборке, увеличение значения функции потерь и рост разрыва между результатами на обучающей и тестовой выборках.
Результаты сравнительного анализа представлены в Таблице.
Таблица
Сравнение качества модели при различных стратегиях аугментации данных
|
Метод обучения |
Accuracy, % |
Precision |
Recall |
F1-score |
Разрыв train – test, % |
|
Без аугментации |
78,4 |
0,77 |
0,75 |
0,76 |
12,6 |
|
Фотометрическая аугментация |
81,2 |
0,80 |
0,79 |
0,79 |
9,4 |
|
Геометрическая аугментация |
84,7 |
0,84 |
0,83 |
0,83 |
6,3 |
|
Комбинированная аугментация |
87,3 |
0,87 |
0,86 |
0,86 |
4,8 |
Источник: таблица составлена авторами на основе сравнительного анализа.
Кроме того, экспериментальное исследование подтвердило, что применение продуманных стратегий аугментации данных является эффективным способом повышения обобщающей способности глубоких нейронных сетей в условиях дефицита обучающих данных.
Выводы
Вышеизложенное позволяет сделать общий вывод, что использование аугментации данных способствует повышению обобщающей способности моделей и снижению риска переобучения, особенно в задачах с ограниченным объемом обучающих данных. Кроме того, полученные результаты подтверждают эффективность как отдельных, так и комбинированных методов аугментации. При этом следует учитывать, что при значительном увеличении числа параметров сети эффект переобучения может сохраняться, и аугментация данных лишь частично компенсирует этот риск.
Таким образом, продуманное применение стратегий аугментации данных демонстрирует улучшение обобщающей способности нейронных сетей на ограниченных выборках и снижает риск переобучения для моделей среднего размера. Однако для очень больших моделей с огромным числом параметров аугментация остается полезной, но не является единственным средством борьбы с переобучением.
В дальнейшем целесообразно исследовать адаптивные стратегии аугментации, комбинируемые с методами передачи знаний и самообучения.
Метод повышения эффективности обучения глубоких нейронных сетей на малых выборках с применением техник аугментации данных