Распознавание микроскопических изображений пыльцевых зерен с помощью сверточной нейронной сети VGG-16
Автор: Камалова Юлия Борисовна, Андриянов Никита Андреевич
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 3 т.22, 2022 года.
Бесплатный доступ
В статье приводится результат эксперимента по применению трансферного обучения с помощью сверточной нейронной сети Visual Geometry Group with 16 layers (VGG-16) применительно к задаче распознавания пыльцевых зерен на изображениях. Анализ информационно-теоретической базы по применению алгоритмов машинного обучения к задаче классификации пыльцевых зерен за последние несколько лет показал необходимость разработки (применения) нового метода к распознаванию изображений пыльцевых зерен, полученных с помощью оптического микроскопа. В настоящее время автоматическая классификация для идентификации пыльцы становится очень активной областью исследований. В статье обоснована задача автоматизации классификации пыльцевых зерен. Целью исследования является анализ эффективности и точности классификации микроскопических изображений пыльцевых зерен с помощью трансферного обучения сверточной нейронной сети VGG-16. Трансферное обучение было выполнено с помощью нейронной сети VGG-16, имеющей 13 сверточных слоев, группируемых в 5 блоков с пулингом и 3 сглаживающих слоя на выходе. Поскольку применяется трансферное обучение, то количество эпох обучения можно выбрать небольшим. У данной сети меняются только сглаживающие выходные слои, а извлечение признаков осуществляется с весами классической модели. Поэтому было выбрано использовать 10 эпох обучения. Другие гиперпараметры - регуляризация Drop Out с вероятностью 50 %, метод оптимизации - ADAM, функция активации - sigmoid, функция потерь - кросс-энтропия, размер батча - 32 изображения. В результате за счет настройки гиперпараметров модели и использования аугментаций удалось достичь доли верных распознаваний порядка 80 %. При этом в связи с разным количеством обучающих примеров частные характеристики по классам несколько отличаются. Так, максимальные точность и полнота достигают 94 и 83 % соответственно для типа Одуванчик. В будущем планируются исследования для применения аугментации в качестве предобработки для создания сбалансированной выборки. За счет применения сверточной нейронной сети VGG-16 к задаче распознаваний изображений пыльцевых зерен были достигнуты высокие показатели точности и эффективности метода.
Машинное обучение, сверточные нейронные сети, задачи распознавания пыльцевых зерен, пыльцевые зерна, классификация, vgg16
Короткий адрес: https://sciup.org/147238575
IDR: 147238575 | DOI: 10.14529/ctcr220304
Текст научной статьи Распознавание микроскопических изображений пыльцевых зерен с помощью сверточной нейронной сети VGG-16
Yu.B. Kamalova, , N.A. Andriyanov, , Financial University under the Government of the Russian Federation, Moscow, Russia
Применение методов машинного обучения на основе глубоких нейронных сетей показало высокую эффективность и точность в решении различных задач, таких как распознавание изображений на фотографиях, полученных с помощью оптического микроскопа.
В настоящее время методы машинного обучения легли в основу приложений для классификации объектов, обеспечивая высокоточные результаты для крупномасштабных наборов данных с несколькими классами [1].
Технологии машинного обучения применяются для решения задач распознавания микроскопических изображений различных биологических объектов, в том числе пыльцевых зерен.
Классификация видов и типов пыльцы является важной задачей во многих областях, таких как судебная палинология, археологическая палинология и мелиссопалинология [2].
Автоматизация классификации пыльцевых зерен окажет большое влияние на разработку недорогих инструментов для аэробиологов.
Пчеловодство – это искусство выращивания пчел с целью добиться от этой отрасли максимальной производительности при минимальных затратах. К продуктам пчеловодства относят воск, пыльцу, мед, прополис и маточное молочко.
Развитие и автоматизация технологий пчеловодства способствует развитию животноводства и защите окружающей среды (апимониторинг).
В наше время задача распознавания пыльцевых зерен актуальна из-за отсутствия всеобщей международной базы данных пыльцевых зерен, которая могла бы пополняться.
Пыльцевой анализ меда используется для дифференциации цветочного источника, который используют пчелы, периода сбора урожая и геоклиматических условий различных регионов, палеоклиматической реконструкции [3].
Необходимость автоматизации классификации изображений зерен пыльцы обусловлена тем, что пыльцевой анализ меда должен производиться по ГОСТ 31769–2012 «Мед. Метод определения частоты встречаемости пыльцевых зерен» [4], согласно которому количество пыльцевых зерен в различных видах медов регламентировано.
Количество пыльцевых зерен определяется в палинологической лаборатории оператором вручную, что допускает вероятность совершения различного рода ошибок и медленность процесса. Для экономии времени и энергии, для большей эффективности процесса классификации необходима его автоматизация.
Цель работы – анализ эффективности и точности классификации микроскопических изображений пыльцевых зерен с помощью трансферного обучения сверточной нейронной сети VGG-16.
Цель машинного обучения состоит в том, чтобы обучить алгоритм с переменными параметрами для принятия правильного решения по заданной задаче.
Глубокое обучение является такой областью машинного обучения, которая направлена на получение определенных знаний на основе примеров. Обучение с учителем, распространенное в задаче классификации, происходит таким образом, что разработчик не задает правила для решения задачи, а предоставляет модель, с помощью которой компьютер сравнивает примеры, и, помимо этого, задаются определенные инструкции для модификации на случай ошибки. С каждым обучением модель должна улучшиться так, чтобы как можно более точно решать поставленные задачи.
На основе анализа просмотренных работ можно сделать вывод: среди применяемых систем наибольшую актуальность имеют многослойные сверточные нейронные сети. Однако модификация, цели и способы применения или, говоря другими словами, приложения данного инструмента различаются от эксперимента к эксперименту.
Целью рассмотренных работ [5–14] по распознаванию пыльцы является повышение точности классификации пыльцевых зерен.
Автоматизация анализа пыльцевых зерен зависит от создания выборок изображений, содержащих множество экземпляров разных видов, классифицированных экспертами. Эта задача требует больших усилий и должна выполняться в подходящих условиях с использованием специального оборудования, такого как оптический микроскоп и предметные стекла.
В 2020 году состоялось соревнование Pollen Grain Classification Challenge [15, 16], для которого была разработана база данных пыльцевых зерен Pollen 13K примерно с 13 тысячами изображений пыльцевых зерен в пяти различных категориях из аэробиологических образцов [17]. Pollen13K содержит более 12 тысяч изображений пыльцевых зерен, включая примеры «помех», таких как пыль, пузырьки воздуха на подложках и другие.
Самой перспективной для использования в целях обучения и тестирования нейронных сетей является Pollen13K.
Методика проведения эксперимента
На основе предоставленных Лабораторией цитогенетики и генетических ресурсов растений кафедры ботаники и генетики растений Пермского государственного университета микроскопических снимков пыльцевых зерен (в частности, профессором Л.В. Новоселовой) были сформированы обучающая и проверочная выборки из образцов трех типов.
Структура выборки представлена в табл. 1.
На рис. 1 представлены примеры изображений каждого класса.
Таблица 1

a)

b)

c)
Распределение выборок
Table 1
Sample distribution
Класс |
Тип выборки |
||
Обучающая |
Тестовая |
Всего |
|
1 – тип Липа |
160 |
40 |
200 |
2 – тип Подсолнечник |
286 |
18 |
304 |
3 – тип Одуванчик |
1143 |
286 |
1429 |
Рис. 1. Примеры изображений: a – пыльцевое зерно Липы, b – пыльцевое зерно Подсолнечника, c – пыльцевое зерно Одуванчика
Fig. 1. Sample images: a – Linden pollen, b – Sunflower pollen, c – Dandelion pollen
Будем выполнять трансферное обучение с помощью нейронной сети VGG-16 [18]. Данная сеть имеет 13 сверточных слоев, группируемых в 5 блоков с пулингом и 3 сглаживающих слоя на выходе. Поскольку применяется трансферное обучение, то количество эпох обучения можно выбрать небольшим. По сути, у сети меняются только сглаживающие выходные слои, а извлечение признаков остается, как в классической модели. Поэтому используется всего 10 эпох обучения. Другие гиперпараметры – регуляризация Drop Out [19] с вероятностью 50 %, метод оптимизации – ADAM, функция активации – sigmoid, функция потерь – кросс-энтропия, размер батча – 32 изображения. Результаты обучения (в смысле метрики достоверности accuracy и целевой функции кросс-энтропии) представлены на рис. 2. Здесь красным показаны характеристики для обучающей выборки, а зеленым – для тестовой.


Рис. 2. Процесс обучения модели без аугментации
Fig. 2. The process of training the model without augmentation
Анализ представленного рис. 2 показывает, что, несмотря на достаточно быструю сходимость модели, результаты получаются неудовлетворительными. Это связано с тем, что в качестве функции активации используется сигмоида. Кроме того, сильное различие показателей на тесте и обучении (больше 50 %) может свидетельствовать о переобученности модели.
Чтобы бороться с данным эффектом, будем использовать технологии аугментирования [20]. Вкратце данная технология позволяет на основе обучающей выборки искусственно сгенерировать дополнительные изображения для каждого класса, что потенциально обеспечивает уход модели от переобучения. Аугментация будет применяться на уровне батча. Наконец, изменим функцию активации на softmax. Процесс обучения такой модели показан на рис. 3.

Рис. 3. Процесс обучения модели с аугментацией
Fig. 3. The process of training a model with augmentation
Как видно из рис. 3, удалось значительно повысить метрику accuracy на тестовой выборке. Она составила порядка 80 %. В связи с несбалансированностью датасета (см. табл. 1) дополнительно рассмотрим другие метрики данной модели. Результаты оценки точности (precision) и полноты (recall) представлены в табл. 2.
Метрики эффективности
Performance Metrics
Таблица 2
Table 2
Истинные значения |
П |
рогнозные значения |
Точность |
Полнота |
|
Липа |
Подсолнечник |
Одуванчик |
|||
Липа |
28 |
3 |
9 |
0,4 |
0,7 |
Подсолнечник |
3 |
9 |
6 |
0,3913 |
0,5 |
Одуванчик |
39 |
11 |
236 |
0,94024 |
0,82517 |
Таким образом, видим, что наиболее хорошо модель научилась работать с одуванчиками. Это связано с тем, что таких примеров было гораздо больше в обучающей выборке.
Заключение
В проведенном исследовании было выполнено трансферное обучение модели сверточной сети VGG-16 для решения задачи распознавания пыльцы. За счет настройки гиперпараметров модели и использования аугментаций удалось достичь доли верных распознаваний порядка 80 %. При этом в связи с разным количеством обучающих примеров частные характеристики по классам несколько отличаются. Так, максимальные точность и полнота достигают 94 и 83 % соответственно для типа Одуванчик. В будущем планируются исследования для применения аугментации в качестве предобработки для создания сбалансированной выборки.
Список литературы Распознавание микроскопических изображений пыльцевых зерен с помощью сверточной нейронной сети VGG-16
- Detection and classification of pollen grain microscope images / S. Battiato, A. Ortis, F. Trenta et al. // Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2020. P. 980-981. DOI: 10.1109/CVPRW50498.2020.00498
- Шелехова Т.С., Слуковский З.И., Лаврова Н.Б. Методы исследования донных отложений озер Карелии: моногр. / Институт геологии КарНЦ РАН. Петрозаводск: КарНЦ РАН, 2020. 112 с.
- Чекрыга Г.П., Нициевская К.Н., Юдина О.Б. Определение ботанического происхождения меда и бонитета медоносной растительности методом пыльцевого анализа // Известия высших учебных заведений. Пищевая технология. 2021. № 1 (379). С. 94-97.
- ГОСТ 31769-2012. Мед. Метод определения частоты встречаемости пыльцевых зерен // Электронный фонд правовой и нормативно-технической документации [Электронный ресурс]. URL: https://docs.cntd.ru/document/1200100244.
- Automatic pollen recognition with the Rapid-Eparticle counter: the first-level procedure, experience and next steps / Ingrida Saulien, LauraSukien, Gintautas Daunys et al. // Atmos. Meas. Tech. 2019. 12. P. 3435-3452. DOI: 10.5194/amt-2018-432
- Logistic Model Tree and Expectation-Maximization for Pollen Recognition and Grouping / Endrick Barnacin, Jean-Luc Henry, Jack Molinié et al. // World Academy of Science, Engineering and Technology International Journal of Computer and Information Engineering. 2020. Vol. 14, no. 2. P. 46-49. DOI: 10.5281/zenodo.3669283
- JERI 2019. The National Study Day on Research on Computer Sciences. 3rd edition of the National Study Day on Research on Computer Sciences (JERI 2019). Saida, Algeria, April 27. 2019. P. 31-41.
- Ororbia A.G., Mali, A. Biologically Motivated Algorithms for Propagating Local Target Representations // Proceedings of the AAAI Conference on Artificial Intelligence. 2019. 33(01). P. 4651-4658. DOI: 10.1609/aaai.v33i01.33014651
- Reducing and Stretching Deep Convolutional Activation Features for Accurate Image Classification / Guoqiang Zhong, Shoujun Yan, Kaizhu Huang et al. // Cognitive Computation. 2018. Vol. 10. P. 179-186. DOI: 10.1007/s12559-017-9515-z
- Sevillano V., Aznarte J.L. Improving classification of pollen grain images of the POLEN23E dataset through three different applications of deep learning convolutional neural networks // PLoS ONE. 2018. Vol. 13 (9), e0201807. DOI: 10.1371/journal.pone.0201807
- POLLEN73S: An image dataset for pollen grains classification / Gilberto Astolfi, Ariadne Barbosa Gonçalves, Geazy Vilharva Menezes et al. // Ecological Informatics. 2020. Vol. 60. P. 1574-9541. DOI: 10.1016/j .ecoinf.2020.101165
- Pollen 73S. URL: https://figshare.com/articles/dataset/POLLEN73S/12536573 (дата обращения: 12.05.2021).
- Pollen Grain Recognition Using Convolutional Neural Network / N. Khanzhina, E. Putin, A. Filchenkov, E. Zamyatina // ESANN 2018 proceedings, European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. Bruges (Belgium), 25-27 April 2018, i6doc.com publ., ISBN 978-287587047-6. P. 409-414.
- Pollen classification challenge. URL: https://iplab.dmi.unict.it/pollenclassificationchallenge/ (дата обращения: 23.05.2021).
- Pollen Grain Classification Challenge 2020 (Challenge Report) / Sebastiano Battiato, Francesco Guarnera, Alessandro Ortis et al. // Springer Nature Switzerland AG 2021. A. Del Bimbo et al. (Eds.): ICPR 2020 Workshops, LNCS 12668. 2021. P. 469-479. DOI: 10.1007/978-3-030-68793-9_34
- Pollen classification challenge. URL: https://iplab.dmi.unict.it/pollenclassificationchallenge/ (дата обращения: 23.05.2021).
- Pollen13k: a large scale microscope pollen grain image dataset / S. Battiato, A. Ortis, F. Trenta et al. // 2020 IEEE International Conference on Image Processing (ICIP). 2020. P. 2456-2460. DOI: 10.1109/ICIP40778.2020.9190776
- Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition // Proceedings of ICLR-2015. 2015. P. 1-14. DOI: 10.48550/arXiv.1409.1556
- Dropout: A Simple Way to Prevent Neural Networks from Overfitting / N. Srivastava, G. Hinton, A. Krizhevsky et al. // JMLR. 2014. 15(56). P. 1929-1958.
- Dementyiev V.E., Andriyanov N.A., Vasilyiev K.K. Use of Images Augmentation and Implementation of Doubly Stochastic Models for Improving Accuracy of Recognition Algorithms Based on Convolutional Neural Networks // 2020 Systems of Signal Synchronization, Generating and Processing in Telecommunications (SYNCHROINFO). 2020. P. 1-4. DOI: 10.1109/SYNCHROINFO49631.2020.9166000