Мониторинг реинтродуцированных редких растений на основе нейронной сети YOLO
Автор: Городецкая Л.А., Денисова А.Ю., Кавеленова Л.М., Федосеев В.А.
Журнал: Компьютерная оптика @computer-optics
Рубрика: Обработка изображений, распознавание образов
Статья в выпуске: 3 т.48, 2024 года.
Бесплатный доступ
Восстановление популяций редких видов растений (реинтродукция) – одна из важнейших мер сохранения биоразнообразия на планете. Реинтродуцированные растения нуждаются в постоянном мониторинге с целью изучения особенностей их развития и контроля за состоянием популяции. Для сокращения влияния человека на естественную среду обитания растений и упрощения процесса мониторинга мы предлагаем использовать беспилотные летательные аппараты и осуществлять автоматический анализ результатов их съёмки при помощи свёрточной нейронной сети. В рамках данной статьи описаны результаты, полученные при помощи сети YOLOv3. Рассматриваются вопросы настройки нейронной сети для обнаружения посадок пиона тонколистного, реинтродуцированного в Самарской области силами кафедры экологии, ботаники и охраны природы Самарского университета. Основным вопросом исследования являлось изучение возможности обучения нейронной сети по изображениям пиона в искусственной среде обитания с последующим применением на изображениях в естественной среде обитания. Проведенные исследования подтверждают возможность успешного обучения нейронной сети на изображениях пионов в искусственной среде обитания.
Реинтродукция, биоразнообразие, данные БПЛА, нейронные сети, YOLOv3
Короткий адрес: https://sciup.org/140308608
IDR: 140308608 | DOI: 10.18287/2412-6179-co-1405
Текст научной статьи Мониторинг реинтродуцированных редких растений на основе нейронной сети YOLO
Из-за антропогенного воздействия количество видов растений, которым грозит исчезновение, постоянно растет. Чтобы защитить редкие растения и сохранить биоразнообразие, экологи всего мира занимаются реинтродукцией исчезающих видов. Этот процесс включает в себя перемещение искусственно выращенных растений в их естественную среду обитания [1].
В Самарской области Ботанический сад и кафедра экологии, ботаники и охраны природы Самарского национального исследовательского университета (далее – Самарский университет) более 10 лет ведут работы по реинтродукции исчезающих видов растений. Одним из растений, восстанавливаемых их усилиями, является пион тонколистный (Paeonia Tenuifolia), занесенный в Красную книгу Российской Федерации [2] и классифицируемый как растение с сокращающейся популяцией в Красном списке международного объединения охраны природы (IUCN – International Union for Conservation of Nature) [3]. Специалисты-экологи вырастили ряд экземпляров этих растений в искусственных условиях Ботанического сада и переселили их в особо охраняемую природную территорию возле села Чубовка в Самарской области.
Процесс реинтродукции требует постоянного наблюдения за здоровьем и численностью популяции переселенных растений. Для этого экологи проводят полевые обследования, чтобы получить актуальную информацию об особенностях развития популяции растений. Традиционно эти обследования включают ручной подсчет растений посредством наземных обследований. Однако проведение наземных съемок на больших территориях со сложным рельефом требует значительного человеческого труда и времени. Чтобы свести к минимуму усилия человека при обследовании и уменьшить антропогенное воздействие на среду обитания растений, можно осуществлять подобный мониторинг с использованием средств дистанционного зондирования Земли (ДЗЗ).
Существующие исследования по мониторингу видов растений с использованием данных ДЗЗ в основном используют данные беспилотных летательных аппаратов (БПЛА) из-за их высокого разрешения [4]. Методы мониторинга включают сбор данных с различных датчиков, установленных на платформе БПЛА, ручное картирование интересующих видов и применение алгоритмов машинного обучения.
В статье [5] авторы классифицировали виды мангровых зарослей с использованием гиперспектраль- ных данных и данных лазерной локации (LiDAR), полученных с БПЛА. Классификация осуществлялась алгоритмом Rotation Forest (RoF) [6]. Авторы статьи [7] использовали для обнаружения различных видов деревьев мультиспектральные и мультивременные данные БПЛА совместно с алгоритмом случайного леса (Random Forest) [8]. Alvarez-Taboada с соавторами применили алгоритм ближайшего соседа для распознавания Hakea sericea на снимках с БПЛА и спутника World View-2 [9]. Оба исследования, [8] и [9], рассматривали сложные наборы признаков, включая вегетационные индексы, различные спектральные каналы и текстурные признаки. В работе [10] применяется метод опорных векторов для классификации растительности заболоченной местности по гиперспектральным изображениям с БПЛА и цифровой модели рельефа. Как можно видеть, существующие методы в основном опираются на классические алгоритмы машинного обучения и совмещение данных БПЛА, полученных датчиками различного типа: гиперспектральные, мультиспектральные, лазерные дальномеры и так далее.
В последнее время успех нейронных сетей привел к их широкому использованию и для задач мониторинга растительности. В статье [11] глубокие нейронные сети используются для классификации табачных плантаций с использованием данных БПЛА. В обзоре [12] упоминаются алгоритмы, основанные на сверточной нейронной сети Mask R для картирования картофеля и салата, а также алгоритм на основе сети ResNet50 с архитектурой семантической сегментации SegNet для картирования сообществ верховой болотной растительности. В обоих случаях методы, основанные на глубоком обучении, превзошли классические методы машинного обучения. В [13] авторы разработали метод детального картографирования видов и сообществ растительности с использованием сети U-net. Данный метод достигает 84% точности в семантической сегментации. Однако текущие исследования сосредоточены в первую очередь на проблеме сегментации, пренебрегая обнаружением и подсчетом отдельных растений на изображении.
Целью нашего исследования является оценка возможностей применения нейронных сетей для мониторинга количества растений пиона тонколистного по данным БПЛА. Задача обнаружения объектов была выбрана как более соответствующая основной цели мониторинга, чем задачи классификации и семантической сегментации. В качестве основной сети обнаружения объектов в работе применялась сеть YOLOv3 [14], являющаяся одной из наиболее хорошо изученных сетей и имеющая доступную стабильную реализацию.
В настоящей статье мы рассматриваем вопросы выбора некоторых параметров обучения сети YOLOv3, а также пытаемся получить ответ на вопрос: можно ли на практике для обучения нейронной сети использовать изображения посадок пионов, выполненные в искусственно созданной среде обитания (Ботанический сад).
Предлагаемый нами подход мониторинга численности растений пиона тонколистного на основе данных БПЛА и нейронной сети Yolov3 позволит упростить сбор статистики численности растений, а также снизить антропогенное воздействие на территорию при мониторинге.
1. Общее описание предлагаемого метода
Предлагаемый метод мониторинга пиона тонколистного включает четыре этапа:
-
1. Получение изображений Paeonia Tenuifolia с БПЛА в искусственной среде обитания в Ботаническом саду в период цветения.
-
2. Сбор данных БПЛА в естественной среде в период цветения.
-
3. Обучение нейронной сети YOLOv3 на изображениях, полученных в Ботаническом саду, с использованием переноса обучения.
-
4. Обнаружение цветущих экземпляров пиона тонколистного в естественной среде за счёт применения нейронной сети и вычисление количества растений.
Первый этап включает в себя сбор обучающих данных. Мы предлагаем использовать снимки искусственно выращенных растений в качестве эталонных образцов для обучения нейронной сети. Ботанический сад, расположенный в центре города Самары, представляет собой более доступную территорию сбора данных по сравнению с естественной средой обитания растений, что делает процесс сбора данных более простым, экономичным и удобным. Данные можно собрать один раз и использовать в течение нескольких лет. Важным аспектом процесса сбора данных является время съемки. Крайне важно собирать данные в период цветения, когда растения наиболее ярко выделяются на фоне окружающей среды.
Второй этап включает в себя сбор тестовых данных в естественной среде обитания. В идеале полевое обследование должно проводиться исключительно с применением БПЛА без каких-либо дополнительных перемещений персонала и оборудования. Этого подхода достаточно, поскольку естественная среда обитания реинтродуцированных растений является охраняемой территорией, а мониторинг с помощью БПЛА обеспечивает максимально безопасный процесс сбора данных. Еще одним преимуществом сбора данных с БПЛА является сокращение человеческого труда, поскольку естественная среда обитания Paeonia Tenuifolia отличается сложным рельефом, что делает ручной мониторинг более сложным по сравнению с автоматизированными методами.
В процессе сбора данных важно настроить параметры камеры и полета как можно ближе к процессу сбора обучающих данных. Поэтому сбор тестовых данных производится также во время сезона цветения, на одинаковой высоте над землей и примерно в одно и то же время суток. Однако следует отметить, что эти рекомендации не гарантируют высокой степени сходства между тестовыми и обучающими данными по следующим причинам: 1) различия в видовом составе между естественной средой обитания и искусственной, 2) различия в погоде и условиях освещения и 3) различия характеристик почвы и рельефа местности. Следовательно, процесс обнаружения растений с использованием для обучения только изображений, снятых в Ботаническом саду, усложняется.
На третьем этапе мы предлагаем использовать метод переноса обучения нейронной сети, поскольку набор обучающих данных слишком мал для качественного обучения модели. Метод переноса обучения заключается в использовании для инициализации нейронной сети весов, полученных на других, более крупных наборах данных, с последующим дообучением сети на имеющейся обучающей выборке. Таким образом, метод переноса обучения упрощает процесс обучения, поскольку для дообучения сети требуется меньшее количество эпох. В качестве нейронной сети была выбрана хорошо изученная сеть обнаружения объектов YOLOv3, имеющая доступную стабильную реализацию и веса [15]. Исследование других архитектур остается за рамками настоящей статьи и представляет собой одно из направлений будущих исследований.
Процесс обучения включает специальную подготовку обучающих данных и выбор соответствующих гиперпараметров. В настоящей статье мы рассматриваем различные методы аугментации данных и экспериментально оцениваем необходимое количество эпох обучения. Аугментация данных позволяет искусственно расширить обучающую выборку и улучшить обобщающую способность сети. С другой стороны, выбор подходящего количества эпох определяет оптимальную продолжительность процесса обучения.
На последнем, четвертом, этапе изображения, полученные в естественной среде, обрабатываются с целью обнаружения экземпляров цветущих растений посредством выбранной нейронной сети. Кроме того, вычисляется количество растений на каждом изображении БПЛА. Чтобы оценить качество работы нейронной сети, мы вручную разметили изображения и рассчитали долю верно обнаруженных цветов (True Positive Rate – TPR) и ложно обнаруженных цветов (False Positive Rate – FPR) на каждом тестовом изображении.
N,
TPR = N 1 , FPR = N 2 , NN
где N 1 – количество корректно обнаруженных пионов, N 2 – количество некорректно обнаруженных пионов, N – истинное число пионов на изображении.
2. Территория объекта исследований
Источником обучающих данных служил Ботанический сад (53°12′52,25″ с.ш., 50°10′18,6″ в.д.), расположенный рядом с Самарским университетом на территории г. Самары, Россия. Сад был основан в 1932 году, а с 1995 года ему присвоен статус природоохранной зоны. Он служит как научным, так и общественным целям, на его территории выращивают более 4500 видов растений, в том числе пион тонколистный.
Естественный ареал реинтродукции пионов находится недалеко от села Чубовка Кинельского района Самарской области России. В 1983 году эта территория была определена как особо охраняемая природная территория регионального значения под названием «Чубовская степь». Территория состоит из травянистой луговой степи, где произрастают редкие и исчезающие виды степной флоры. Место высадки пионов охватывает участок водораздельного склона с перепадом высот до 10– 15 метров.
3. Сбор данных
Сбор данных для исследований проводился в течение 2022 и 2023 года. В 2022 году сбор данных производился с использованием аппарата БПЛА, тогда как в 2023 году в связи с запретом на запуск БПЛА на территории Самарской области сбор данных производился с использованием цифрового фотоаппарата с последующим моделированием данных БПЛА на основе полученных фотографий. Во всех случаях съемка осуществлялась в солнечную и безветренную погоду на площади около 8000 и 6200 квадратных метров в естественной среде обитания и Ботаническом саду соответственно. Опишем процесс получения данных более подробно.
В 2022 году было произведено две летных кампании: одна на территории Ботанического сада и одна на территории естественной среды произрастания пионов. Для этих кампаний мы использовали беспилотный летательный аппарат DJI Phantom 4 PRO v2 [16], оснащенный RGB-камерой. Первая летная кампания состоялась 18 мая 2022 года в Ботаническом саду. Высота полета была установлена на уровне 10 метров над землей. Соседние кадры были захвачены с 80-процентным пересечением как в продольном, так и в поперечном направлениях относительно траектории полета, что дало эквивалентное пространственное разрешение 0,01 метра. Вторая летная кампания была проведена 23 мая 2022 года и охватила четыре разных участка естественной среды обитания площадью от 2000 до 8000 квадратных метров. В ходе этой кампании БПЛА запускался на высоте 10 метров над высшей точкой склона. Пространственное разрешение в высшей точке склона составило 0,01 метра. Фрагменты изображений, полученных для естественной и искусственной среды обитания пионов, приведены на рис. 1 и 2 соответственно.

Рис. 1. Изображение пионов с БПЛА, полученное в 2022
году в естественной среде обитания

Рис. 2. Изображение пионов с БПЛА, полученное в 2022 году в Ботаническом саду
В 2023 году ввиду временного запрета на использование БПЛА на территории региона было принято решение заменить её наземной съёмкой в условиях, максимально напоминающих съёмку с борта БПЛА. Для наземной съемки использовалась камера Canon EOS 70 D. Съемка велась с приоритетом диафрагмы F 4.0 / ISO 100. Использовался объектив Canon EF-S c фокусным расстоянием 18–55 мм в режиме автофокуса. Высота съемки варьировалась от 1,5 до 3 метров в зависимости от рельефа экспозиции. Для приведения полученных фотографий к пространственному разрешению, сопоставимому с разрешением снимков БПЛА, был рассчитан средний максимальный размер цветка пиона в пикселях на изображениях БПЛА, полученных в 2022 году. После чего все фотографии 2023 года были откалиброваны таким образом, чтобы размер в пикселях наибольшего цветка на изображении соответствовал среднему максимальному размеру цветка, полученному по изображениям БПЛА 2022 года. Калибровка заключалась в ручном определении максимального размера цветка на изображении и автоматическом прореживании изображения нужное число раз. В среднем пространственное разрешение снимков с фотоаппарата было изменено в 22,5 раза. Примеры результирующих фотографических изображений для Ботанического сада и естественной среды обитания приведены на рис. 3 и 4.

Рис. 3. Изображение пионов с фотоаппарата после калибровки, полученное в 2023 году в естественной среде обитания

Рис. 4. Изображение пионов с фотоаппарата после калибровки, полученное в 2023 году в Ботаническом саду
Следует отметить, что естественный ареал обитания растений и искусственная среда обитания не содержат других похожих на детектируемый пион растений с таким же интервалом цветения. Поэтому в рамках нашего исследования не было необходимости решения задачи отделения класса пионов от других похожих цветов.
4. Наборы данных
Для обучения и тестирования нейронной сети было сформировано два набора данных для 2022 года и 2023 года соответственно, включающие в себя изображения для двух территорий, – Ботанический сад и естественная среда обитания в окрестностях села Чу-бовка. При этом изображения, полученные для Ботанического сада, использовались в качестве обучающей выборки, а изображения для естественной среды обитания – как тестовые данные.
При формировании набора данных для 2022 года снимки с БПЛА были использованы для подготовки ортофотопланов с использованием программного обеспечения Drone Deploy . За- тем полученные ортофотопланы нарезались на фрагменты малого размера, которые можно было использовать для обучения и тестирования нейронной сети. Из обучающей выборки были удалены фрагменты изображений, не содержащие пионов. В тестовой выборке были сохранены все фрагменты изображений и с пионами, и без них.
Данные 2023 года после проведения калибровки, описанной в параграфе 3, не подвергались более никаким изменениям и использовались как есть без дополнительной фрагментации. Все изображения 2023 года содержали пионы.
Характеристики обучающей и тестовой выборок 2022 и 2023 года приведены в табл. 1.
Табл. 1. Характеристики набора данных 2022 года
Набор |
Выборка |
Количество фрагментов изображений |
Количество пионов |
2022 |
Обучающая |
128 |
2213 |
2022 |
Тестовая |
280 |
198 |
2023 |
Обучающая |
29 |
214 |
2023 |
Тестовая |
141 |
844 |
Для проведения эксперимента по настройке параметров нейронной сети были использованы данные 2022 года, как будет описано далее в параграфе экспериментальных исследований. При этом тестирование производилось независимо по четырем участкам съемки естественной среды, соответствующей четырем полученным ортофотопланам. Более подробные характеристики тестовой выборки для каждого из участков съемки в естественной среде за 2022 год приведены в табл. 2.
Табл. 2. Характеристики тестовой выборки для набора данных 2022 года
Номер участка |
Количество фрагментов изображений |
Количество пионов |
1 |
50 |
42 |
2 |
84 |
46 |
3 |
110 |
13 |
4 |
36 |
97 |
Обучающие и тестовые выборки были размечены вручную с помощью программного обеспечения LabelImg . Каждый пион на изображении был заключен в ограничивающую рамку. Поэтому целевым объектом для обнаружения был отдельный цветок пиона. Пример разметки изображения приведен на рис. 5.
5. План экспериментальных исследований
Выполнение экспериментальных исследований производилось по следующему плану. Вначале на наборе данных 2022 года были определены достаточное количество эпох обучения и используемый тип аугментации данных. Затем на тестовом наборе 2023 года было проведено исследование различных способов формирования обучающей выборки.
Во всех экспериментах, описанных в настоящей статье, использовалась реализация нейронной сети
YOLOv3 [15] с весами, полученными при обучении сети на наборе данных MSCOCO 2017. Конфигурация сети определялась аналогично базовому файлу конфигурации YOLOv3 в репозитории [15] с очевидными изменениями, обеспечивающими соответствие одному классу обнаруживаемых объектов. Размер входного изображения перед подачей в нейронную сеть составлял 416×416, что является одним из допустимых входных размеров для сети. Прочие параметры нейронной сети были оставлены без изменений.

Рис. 5. Пример разметки изображения пионов
На выходе нейронная сеть YOLOv3 дает координаты обрамляющих прямоугольников для обнаруженных объектов с указанием меры уверенности (confidence score) обнаружения. Для детектирования пионов был экспериментально подобран порог уверенности (confidence threshold), равный 0,3. Объекты с меньшим значением порога уверенности отбрасывались.
Обучение нейронной сети производилось в среде Google Colab с использованием графического процессора NVidia Tesla K80.
Во всех экспериментах качество детектирования пионов оценивалось при помощи показателей TPR и FPR, рассчитываемых по формулам (1)
Пример результатов обнаружения приведен на рис. 6.
В первом эксперименте мы оценили достаточное количество эпох обучения. Оценка производилась по набору данных 2022 года без использования аугментации. Было проверено количество эпох обучения в диапазоне от 1000 до 5000 с шагом 1000. Результирующая доля верного обнаружения пионов для каждого из четырех тестовых участков представлена в табл. 3. Значение доли ложно обнаруженных пионов во всех экспериментах было равно 0.
Табл. 3 показывает, что самые высокие значения TPR для большинства тестовых изображений были достигнуты при количестве эпох обучения 3000. При этом среднее значение TPR составило 0,87. Второе лучшее число эпох с точки зрения среднего значения TPR было 4000 со средним значением TPR 0,83. В наших последующих экспериментах мы использовали оба из определенных значений.

Рис. 6. Пример обнаружения пионов
Табл. 3. Значения TPR для разного количества эпох обучения
Количество эпох |
Номер тестового участка |
Средняя TPR |
|||
1 |
2 |
3 |
4 |
||
1000 |
0,64 |
0,76 |
0,77 |
0,68 |
0,71 |
2000 |
0,76 |
0,96 |
0,85 |
0,72 |
0,82 |
3000 |
0,81 |
0,87 |
1 |
0,8 |
0,87 |
4000 |
0,67 |
0,91 |
1 |
0,74 |
0,83 |
5000 |
0,67 |
0,98 |
0,85 |
0,74 |
0,81 |
Из-за ограниченного количества обучающих изображений для увеличения качества работы нейронной сети необходимо было использовать аугментацию данных. В настоящем исследовании было рассмотрено три типа аугментации данных. Первый, «простой», тип аугментации включал только преобразования изображений, которые можно провести без интерполяции данных. Второй тип аугментации, «геометрия», включал геометрические преобразования, такие как масштабирование и случайные повороты, применяемые к пространственной области исходного изображения. Данный тип аугментации характеризуется тем, что для выполнения преобразований может потребоваться дополнительная интерполяция данных. Третий тип рассматриваемой аугментации – «геометрия+яркость» – включал случайные изменения яркости исходного изображения с помощью преобразований контраста, насыщенности и размытия. Аугментация данных производилась с использованием программного обеспечения Roboflow .
Эксперимент по выбору типа аугментации производился на наборе данных 2022 года. Параметры всех трех типов аугментации представлены в табл. 4. Общее количество изображений в обучающей выборке после аугментации составило 228 изображений для «простой» аугментации, 434 изображения для «геометрической» аугментации, 1019 изображений для аугментации типа «геометрия+яркость». Результаты эксперимента по выбору типа аугментации приведены в табл. 5.
Табл.4. Параметры аугментации
Аугментация |
Применяемые преобразования |
Простая |
Отражение: относительно горизонтальной и вертикальной оси Поворот на углы кратные 90º: по часовой стрелке, против часовой стрелки |
Геометрическая |
Все преобразования «Простой» аугментации Масштабирование: со случайным увеличением размера до 30% Поворот на угол: от –20º до 20º |
Геометрия + Яркость |
Все преобразования «Геометрической» аугментации Изменение насыщенности: от –28% до 28% Изменение яркости: от –30% до 30% Изменение экспозиции: от – 14% до 14% Размытие с радиусом: до 1 пикселя |
Табл. 5. Качество обнаружения пионов при различных типах аугментации данных
Тип аугментации |
Количество эпох 3000 |
Количество эпох 4000 |
||
TPR |
FPR |
TPR |
FPR |
|
Простая |
0,84 |
0 |
0,87 |
0 |
Геометрическая |
0,86 |
0 |
1 |
0,34 |
Геометрия+ Яркость |
0,92 |
0,01 |
0,93 |
0,005 |
Из табл. 5 видно, что наибольшее значение доли верно обнаруженных пионов TPR 0,93 было достигнуто при использовании типа аугментации «геомет-рия+яркость» при 4000 эпох обучения. В среднем для данного типа аугментации прирост TPR составил 10,75 %, в то время как значение FPR осталось ниже 1 %. При 3000 эпох показатели качества имеют схожие значения, но чуть ниже, чем при 4000 эпох обучения. «Геометрическая» аугментация без преобразований яркости показала противоречивые результаты: в одном случае был низкий прирост TPR, в другом – сильный рост ложного обнаружения. При «простой» аугментации показатели качества работы сети были также ниже, чем при аугментации типа «геомет-рия+яркость». В связи с этим было принято решение использовать только аугментацию типа «геомет-рия+яркость».
Приведенные в табл. 3 и 5 результаты экспериментов частично отвечают на вопрос, возможно ли обучение нейронной сети исключительно по данным, полученным в искусственной среде обитания растений. Как можно видеть из табл. 3 и 5, такое обучение возможно и при наличии подходящей аугментации данных позволяет достичь доли верно обнаруженных цветков 0,92 – 0,93 на наборе данных 2022 года.
Дополнительно для формирования полной картины был проведен эксперимент на тестовом наборе данных 2023. В данном эксперименте мы рассматривали следующие возможности формирования обучающей выборки:
– сценарий «Б22» – при наличии данных за несколько лет в качестве обучающей выборки используются только данные за предыдущие годы, полученные в искусственной среде, т.е. в нашем случае данные из Ботанического сада за 2022 год;
– сценарий «Б22 + Ч22» – используются данные и естественной, и искусственной среды обитания за предыдущие года, т.е. обучающая выборка включает данные Ботанического сада и естественной среды
Табл. 6. Качество обнаружения пионов при различных типах формирования обучающей выборки
Вариант обучающей выборки |
Истинное количество цветов |
3000 эпох |
4000 эпох |
|||
TPR |
FPR |
TPR |
FPR |
|||
Б22 |
844 |
0,8696 |
0,0710 |
0,8922 |
0,0435 |
|
Б22+ Ч22 |
844 |
0,8838 |
0,0342 |
0,8874 |
0,0669 |
|
Б22+ Б23 |
844 |
0,9087 |
0,0379 |
0,9537 |
0,0199 |
|
Б22+ Ч22+ Б23 |
844 |
0,917 |
0,0391 |
0,9289 |
0,0319 |
|
Из табл. 6 видно, что добавление в обучающую |
Полагаем, что это является причиной того, что точ- |
выборку данных 2023 года, сделанных в искусственной среде, повышает качество классификации по сравнению с аналогичными выборками, основанными только на архивных данных 2022 года. Из этого можно сделать вывод, что при проведении мониторинга целесообразно за каждый год проводить дополнительный сбор данных в искусственной среде обитания.
Добавление же данных естественной среды обитания за архивный 2022 год влияет на качество классификации неоднозначно: при 3000 эпох обучения качество классификации увеличивается, а при 4000 эпох уменьшается по сравнению с аналогичными обучающими выборками без данных естественной природной среды. Напомним, что в данных 2022 года изображения в естественной среде снимались для участка склона с перепадом высот 10– 15 метров. При этом высота полета БПЛА в верхней точке склона была 10 метров, а в нижней точке соответственно на 10 – 15 метров больше. При этом в данных тестовой выборки 2023 года вариации высоты съемки отсутствуют из-за съемки камерой со штатива. Таким образом, набор данных Ч22 является нетипичным в силу особенностей съёмки 2023 года.
обитания за 2022;
– сценарий «Б22 + Б23» – используются данные искусственной среды обитания за прошедшие и текущий год, т.е. объединение обучающих выборок набора 2022 и 2023 года, полученных в Ботаническом саду;
– сценарий «Б22 + Ч22 + Б23» – используются данные естественной и искусственной среды обитания за 2022 год и данные искусственной среды обитания за 2023 год.
Результаты данного эксперимента приведены в табл. 6.
ность классификации проседает при обучении с использованием этого набора данных. Однако если обстоятельства съёмки 2023 года были бы другими, вполне вероятно, что набор Ч22 оказался бы полезным для классификации Ч23 в силу того, что снят в той же местности.
Таким образом, наилучшим вариантом анализа набора данных Ч23 с точки зрения скорости обучения сети и качества обучения является использование 4000 эпох обучения и данных в искусственной среде обитания за архивный и за текущий годы ( Б22 + Б23 ).
Следует отметить, что тестовая выборка 2023 года в отличие от тестовой выборки 2022 года содержала большое количество нераскрытых бутонов пионов и облетевших пионов, для которых лепестки отсутствовали вовсе или присутствовали в малом количестве. В связи с такой особенностью данной выборки мы провели дополнительное исследование по качеству обнаружения пионов, разделив их на три класса: облетевшие пионы, нормальные пионы и нераскрывшиеся пионы. Количество пионов каждого типа в тестовой выборке 2023 года составило 156, 637 и 51 соответственно. Доля верно обнаруженных пионов каждого типа приведена в табл. 7.
Табл. 7. Качество обнаружения пионов по различным подклассам пионов
Вариант обучающей выборки |
3000 эпох |
4000 эпох |
||||
облетевшие |
нормальные |
нераскрывшиеся |
облетевшие |
нормальные |
нераскрывшиеся |
|
Б22 |
0,2600 |
0,8501 |
0,7843 |
0,2800 |
0,8917 |
0,9412 |
Б22+ Ч22 |
0,3012 |
0,8461 |
0,9607 |
0,3076 |
0,8398 |
0,8235 |
Б22+ Б23 |
0,1858 |
0,9309 |
0,4313 |
0,3333 |
0,9733 |
0,8823 |
Б22+ Ч22+ Б23 |
0,2307 |
0,9183 |
0,8039 |
0,2115 |
0,9638 |
0,7058 |
Как и ожидалось, наиболее высокое качество обнаружения характерно для нормальных пионов, венчик которых сохранился полностью, поскольку при обучении использовались только такие экзем- пляры. Два других класса уступают по качеству классификации, при этом облетевшие пионы детектируются хуже, чем нераскрывшиеся. Данный эксперимент проливает свет на природу ошибок в
предыдущем эксперименте, демонстрируя, что в основном пропуск объектов происходит для пионов с облетевшим венчиком.
С учётом этого наблюдения можно сделать два вывода по дальнейшему использованию на практике рассмотренной технологии мониторинга. Если опираться на текущие наборы данных и текущую разметку, впредь предпочтительнее проводить съёмку в начале периода цветения, когда облетевших пионов меньше всего. С другой стороны, недостаточно высокое качество классификации облетевших бутонов вызвано также тем, что таких бутонов не было в обучающем наборе данных. Таким образом, впредь представляется уместным проводить обучение нейронной сети на разметке, включающей все три выделенных состояния бутона. Также представляется целесообразным в будущем сезоне осуществлять серийную съёмку полигона в течение периода цветения для формирования более объёмного, а также разнообразного по состоянию бутона набора данных.
Заключение
В настоящей статье рассматривается метод мониторинга редких растений с использованием данных БПЛА на основе нейронной сети YOLOv3. Предлагаемый метод позволяет автоматически детектировать реинтродуцированные цветы пиона на снимках в их естественной среде обитания и оценивать численность популяции. Использование данных БПЛА делает данный метод мониторинга менее трудозатратным и более экологичным в сравнении с традиционными наземными обследованиями.
В статье рассматриваются вопросы выбора оптимального количества эпох обучения и типа аугментации данных для обучения сети. В ходе экспериментов было показано, что для рассматриваемой задачи достаточно 3000-4000 тысяч эпох обучения. Предпочтительный тип аугментации включает и геометрические, и яркостные преобразования изображений и позволяет повысить точность классификации более чем на 10 % по сравнению со случаем без использования аугментации. При обучении за 2022 год на данных БПЛА, снятых в искусственной среде обитания, удалось достичь доли верного обнаружения пионов 0,93 при доле ложного обнаружения 0,005, что подтверждает возможность успешного обучения нейронной сети с использованием только данных из искусственной среды обитания.
Дополнительный эксперимент с тестовой выборкой 2023 года показал, что обучающие данные нужно подбирать адаптивно, ориентируясь на особенности съёмки тестового полигона. В частности, для съёмки со штатива в 2023 году наилучший результат получен при обучении сети на данных искусственной среды обитания за архивный 2022 и текущий 2023 год совместно. В этом случае при 4000 эпох обучения удалось достичь вероятности верной классификации пи- онов 0,9537 при сохранении невысокой вероятности ложного обнаружения 0,0199. Подробное изучение результатов классификации тестовой выборки 2023 года также показало, что ошибки пропуска цели в основном связаны с невысокой вероятностью верной детекции облетевших пионов, представленных в большом количестве в тестовой выборке 2023 года.
Работа выполнена при поддержке гранта РНФ №2311-20013.
Список литературы Мониторинг реинтродуцированных редких растений на основе нейронной сети YOLO
- Malone EW, Perkin JS, Leckie BM, Kulp MA, Hurt CR, Walker DM. Which species, how many, and from where: Integrating habitat suitability, population genomics, and abundance estimates into species reintroduction planning. Global Change Biology 2018; 24(8): 3729-3748. DOI: 10.1111/gcb.14126.
- Paeonia Tenuifolia. Russian red book. Source: https://redbookrf.ru/pion-tonkolistnyy-paeonia-tenuifolia.
- Paeonia tenuifolia (Europe assessment). The IUCN red list of threatened species. Source: https://www.iucnredlist.org/species/165143/5981869.
- Randin CF, Ashcroft MB, Bolliger J, Cavender-Bares J, Coops NC, Dullinger S, Dirnböck T, Eckert S, Fernández N, Giuliani G, Guisan A, Jetz W, Joost S, Karger D, Lembrechts J, Lenoir J, Luoto M, Morin X, Price B, Rocchini D, Schaepman M, Schmid B, Verburg P, Wilson A, Woodcock P, Yoccoz N, Payne D. Monitoring biodiversity in the Anthropocene using remote sensing in species distribution models. Remote Sens Environ 2020; 239: 111626. DOI: 10.1016/j.rse.2019.111626.
- Cao J, Liu K, Zhuo L, Liu L, Zhu Y, Peng L. Combining UAV-based hyperspectral and LiDAR data for mangrove species classification using the rotation forest algorithm. Int J Appl Earth Obs Geoinf 2021; 102: 102414. DOI: 10.1016/j.jag.2021.102414.
- Rodriguez JJ, Kuncheva LI, Alonso CJ. Rotation forest: A new classifier ensemble method. IEEE Trans Pattern Anal Mach Intell 2006; 28(10): 1619-1630. DOI: 10.1109/TPAMI.2006.211.
- Belcore E, Pittarello M, Lingua AM, Lonati M. Mapping riparian habitats of Natura 2000 network (91E0*, 3240) at individual tree level using UAV multi-temporal and multi-spectral data. Remote Sens 2021; 13(9): 1756. DOI: 10.3390/rs13091756.
- Rigatti SJ. Random forest. J Insur Med 2017; 47(1): 31-39. DOI: 10.17849/insm-47-01-31-39.1.
- Alvarez-Taboada F, Paredes C, Julián-Pelaz J. Mapping of the invasive species Hakea sericea using unmanned aerial vehicle (UAV) and WorldView-2 imagery and an object-oriented approach. Remote Sens 2017; 9(9): 913. DOI: 10.3390/rs9090913.
- Li QS, Wong FKK, Fung T. Assessing the utility of UAV-borne hyperspectral image and photogrammetry derived 3D data for wetland species distribution quick mapping. Int Arch Photogramm Remote Sens Spat Inf Sci 2017; 42: 209. DOI: 10.5194/isprs-archives-XLII-2-W6-209-2017.
- Fan Z, Lu J, Gong M, Xie H, Goodman ED. Automatic tobacco plant detection in UAV images via deep neural networks. IEEE J Sel Top Appl Earth Obs Remote Sens 2018; 11(3): 876-887. DOI: 10.1109/JSTARS.2018.2793849.
- de Castro AI, Shi Y, Maja JM, Peña JM. UAVs for vegetation monitoring: overview and recent scientific contributions. Remote Sens 2021; 13: 2139. DOI: 10.3390/rs13112139.
- Kattenborn T, Eichel J, Fassnacht FE. Convolutional neural networks enable efficient, accurate and fine-grained segmentation of plant species and communities from high-resolution UAV imagery. Sci Rep 2019; 9(1): 17656. DOI: 10.1038/s41598-019-53797-9.
- What’s new in YOLO v3? Towards data science. Source: https://towardsdatascience.com/yolo-v3-object-detection-53fb7d3bfe6b.
- Yolo v4, v3 and v2 for Windows and Linux. Source: https://github.com/AlexeyAB/darknet.
- Bârliba FC, Bârliba LL, Bârliba C. Methods of acquisition and data processing carried out with DJI Phantom 4 Pro v2.0 UAV equipment. Res J Agric Sci 2020, 52(1): 14-23.