Сопровождение оператора при управлении полетом квадрокоптера в задачах сельского хозяйства
Автор: Шушков Р.А., Рапаков Г.Г.
Журнал: АгроЗооТехника @azt-journal
Рубрика: Общее земледелие и растениеводство
Статья в выпуске: 4 т.8, 2025 года.
Бесплатный доступ
Повышение эффективности агропроизводства требует внедрения цифровых технологий в современное растениеводство. Одной из ключевых задач агропромышленного комплекса является оперативный мониторинг полей и сельскохозяйственной техники. В этом контексте автономные беспилотные летательные аппараты с функцией слежения за оператором представляют особый интерес, так как помогают автоматизировать сопровождение агронома при объезде угодий; контролировать работу полевой техники в реальном времени; оптимизировать маршруты перемещения по полям. Целью исследования является разработка системы сопровождения оператора беспилотного летательного аппарата, которая позволяет решить научно-технические проблемы обеспечения стабильного трекинга при ограниченных вычислительных ресурсах, предлагая использование доступных платформ для решения задач автоматического следования за оператором; учет типичных скоростей перемещения агронома (5–7 км/ч); снижение требований к квалификации оператора; управление в условиях, когда объект сопровождения занят своими задачами; программирование через Python SDK; использование нейросетевых алгоритмов и методов компьютерного зрения, что обусловливает научную новизну исследования. В результате разработана надежная система сопровождения оператора БПЛА на основе нейросетевого подхода с учетом аппаратных ограничений и оптимизации параметров слежения за объектом в реальных условиях. Получено свидетельство о государственной регистрации программы для ЭВМ «Сопровождение оператора в задаче управления полетом квадрокоптера» с № RU 2025615266. Внедрение системы сопровождения оператора при масштабировании проекта определяет области применения полученных результатов в агропромышленном комплексе региона и позволит снизить трудозатраты агронома на мониторинг посевов, увеличить скорость обследования полей, уменьшить потери урожая за счет раннего выявления проблем, повысить точность агрохимических операций. Результаты работы могут быть использованы в учебном процессе образовательных организаций. Дальнейшие перспективы научно-исследовательской работы связаны с интеграцией технологии в агротехнологические процессы растениеводства с учетом специфики сельскохозяйственных предприятий – партнеров региона.
Искусственный интеллект, цифровая трансформация, агропромышленный комплекс, беспилотные летательные аппараты, компьютерное зрение
Короткий адрес: https://sciup.org/147252065
IDR: 147252065 | УДК: 633/635:004.8 | DOI: 10.15838/alt.2025.8.4.4
Operator support in flight control of a quadcopter in crop production tasks
Increasing the efficiency of agricultural production requires the introduction of digital technologies in modern crop production. One of the key tasks of the agro-industrial complex is the operational monitoring of fields and agricultural machinery. In this context, autonomous unmanned air vehicles with the function of tracking the operator are of particular interest, as they help automate the accompaniment of an agronomist when bypassing land; monitor the work of field equipment in real time; optimize routes across fields. The aim of the research is to develop an unmanned air vehicle operator tracking system that allows solving scientific and technical problems of stable tracking with limited computing resources, offering the use of available platforms to solve the problems of automatically following the operator; accounting for typical speeds of movement of an agronomist (5–7 km/h); reducing operator qualification requirements; management in conditions where when the support object is busy with their tasks; programming via the Python SDK; the use of neural network algorithms and computer vision methods, which determines the scientific novelty of the research. As a result, a reliable UAV operator tracking system has been developed based on a neural network approach, taking into account hardware limitations and optimizing object tracking parameters in real conditions. We received a certificate of state registration of the computer program “Operator support in the task of flight control of a quadcopter” RU 2025615266. The implementation of the operator's support system during project scaling determines the areas of application of the results obtained in the agro-industrial complex of the region and will reduce the labor costs of the agronomist for crop monitoring, increase the speed of field inspection, reduce crop losses due to early detection of problems, and improve the accuracy of agrochemical operations. The results of the work can be used in the educational process of educational organizations. Further prospects for research work are related to the integration of technology into agrotechnological processes of crop production, taking into account the specifics of agricultural partner enterprises in the region.
Текст научной статьи Сопровождение оператора при управлении полетом квадрокоптера в задачах сельского хозяйства
Беспилотные летательные аппараты (БПЛА) нашли широкое применение в различных сферах человеческой деятельности: от видеосъемки и мониторинга до поисково-спасательных операций и сельского хозяйства (Романец, Мудриченко, 2024; Свинарев, Евтушкова, 2024; Бояринов, 2023). Повышение эффективности агропроизводства требует внедрения цифровых технологий в современное растениеводство (Волотина и др., 2024; Маркова и др., 2020). Одной из ключевых задач агропромышленного комплекса (АПК) является оперативный мониторинг полей и сельскохозяйственной техники (Рапаков, Шушков, 2024). В этом контексте автономные БПЛА с функцией слежения за оператором представляют особый интерес, так как позволяют автоматизировать сопровождение агронома при объезде угодий; контролировать работу полевой техники в реальном времени; оптимизировать маршруты перемещения по полям (Пчелинцева, Андреев, 2019; Кладко, 2018).
Управление дроном с использованием слежения за лицом оператора – это перспективная технология, позволяющая контролировать полет БПЛА; автоматически отслеживать и сопровождать человека квадрокоптером, определяя его местоположение по лицу (или другим визуальным признакам). Однако на практике разработчик сталкивается с множеством проблем, начиная от подключения к дро- ну и вывода изображения с его камеры; включая трудности эксплуатации библиотек для распознавания лиц; ложное детектирование; удержание лица в кадре при передвижении за ним квадрокоптера; подбор библиотеки и методов, дающих возможность с требуемой точностью обнаружить конкретное лицо при минимальных вычислительных затратах (Ка-тернюк и др., 2024).
Трекинг за движением оператора по лицу (Face Tracking) при помощи камеры позволяет дрону автоматически сопровождать человека, определяя его местоположение. Для обнаружения лица квадрокоптер использует бортовую камеру и алгоритмы компьютерного зрения (КЗ) на основе OpenCV, нейронных сетей (НС) YOLO и MediaPipe или SSD-MobileNet для мобильных устройств. Отслеживание движения оператора начинается после фиксации положения лица в кадре. Дрон корректирует свой полет так, чтобы удерживать оператора в центре изображения. Для управления дроном система отправляет команды полетному контролеру (вперед/назад, влево/ вправо, вверх/вниз) для сохранения оптимальной дистанции (с помощью PID-регулятора) и угла обзора.
Основными ограничениями являются зависимость от освещения, угла обзора и частичных перекрытий; риск потери трека при резких движениях; необходимость достаточно мощного процессора для обработки видео в реальном времени.
Для стабилизации и прогнозирования движения используют:
– фильтрацию дрожания при помощи рекурсивного алгоритма фильтра Калма-на (Kalman Filter), который оценивает вектор состояния динамической системы, используя последовательность зашумленных и неполных сигналов;
– предсказание траектории оператора для плавного сопровождения.
Опционально предлагается система избегания препятствий на основе интеграции ультразвуковых датчиков, лидара или стереокамер.
Варианты технологических стеков
-
1. Для трекинга:
– совместно применяют библиотеки для задач КЗ – OpenCV и Dlib, которые содержат инструменты для обработки изображений, распознавания лиц и обнаружения объектов с помощью алгоритмов машинного обучения (МО); OpenCV поддерживает обработку изображений (чтение и запись, анализ видео, стереоскопические изображения, поиск объектов); Dlib специализируется на распознавании лиц, обнаружении ориентиров лица и его выравнивании на основе предварительно обученных моделей;
– масштабируемая модель обнаружения объектов YOLO-NAS от компании Deci AI с технологией автоматического поиска нейронной архитектуры (AutoNAC), генерирующей структуру модели, с высокой точностью и низкой задержкой;
– кроссплатформенная модель MediaPipe Face Detection как часть библиотеки MediaPipe (Google) для обнаружения лиц и отслеживания их особенностей на изображениях и видео за несколько миллисекунд. Малый размер модели (565 КБ) делает ее пригодной для использования на мобильных устройствах. Модель обеспечивает высокую точность при различных условиях освещения.
-
2. Для управления: набор модулей Python SDK при взаимодействии с дро-
- ном DJI Tello, предоставляет команды для движения, вращения, флипов и управления камерой в ходе натурного моделирования по проекту.
Управление при помощи PID-регулятора применяют для плавного движения дрона за объектом. Интеграция с дроном выполняется по протоколу связи, который поддерживает передачу данных через интерфейс UART (универсальный асинхронный прием/передатчик) и беспроводную сеть Wi-Fi – WiFi/UART и Python SDK.
В целях оптимизации используют C++ вместо Python для критичных участков кода в целях уменьшения задержек; применяют адаптацию к перемене освещения за счет совместного использования цветового пространства HSV (Hue, Saturation, Value) и метода гистограммной коррекции.
Цель исследования: разработка системы автоматического трекинга лица для автономного сопровождения оператора беспилотным летательным аппаратом. Поставленная цель послужила основой для постановки и решения следующих задач:
-
– изучить алгоритмы компьютерного зрения и нейросетевые методы в задаче управления движением квадрокоптера; обеспечить: обнаружение лица при помощи бортовой камеры дрона с использованием алгоритмов компьютерного зрения; отслеживание движения после обнаружения (дрон фиксирует положение лица в кадре и корректирует полет, чтобы удержать оператора в центре изображения); управление квадрокоптером (программа отправляет управляющие полетные команды – вперед/назад, влево/вправо, вверх/вниз для сохранения заданной дистанции и угла обзора); автономная работа без использования GPS, ручного управления (кроме экстренной посадки) в реальном масштабе времени;
– разработать программное обеспечение на языке программирования Python для автономного слежения БПЛА за оператором на основе компьютерного зрения с использованием трекинга лица, обеспечивающего стабильное сопровождение без необходимости ручного управления с точностью не менее 80% при скорости движения оператора до 1 м/с и задержкой не более 0,5 сек.
Объектом исследования является система автономного слежения беспилотным летательным аппаратом за движущимся оператором на основе компьютерного зрения. Предмет исследования: алгоритмы и методы, обеспечивающие автономное слежение БПЛА за оператором на основе трекинга лица в части алгоритмов компьютерного зрения, системы управления полетом, эффективных вычислений для задач реального времени.
Материалы и методы
Проблема автономного слежения дронов за оператором активно исследуется в последние годы. Сравнительный анализ существующих решений представлен в табл. 1.
На этапе анализа существующих решений традиционным является сравнение методов трекинга: каскады Хаара (КХ; Haar Cascades — HC) vs нейросетевые модели (НС). КХ используют заданные признаки идентификации объектов и обычно обеспечивают меньшую точность, чем НС. Нейросети сами извлекают признаки изображений и лучше адаптируются к конкретным условиям. Преимуществом КХ является более высокая скорость при обработке большого потока людей. НС используют, когда требуется отсутствие ложноположительных срабатываний и корректная идентификация при переменном освещении или нестационарных фонах. Сверточные нейронные сети (CNN), например YOLO, также обеспе-
Таблица 1. Сравнительный анализ современных подходов
Комбинация методов HOG (гистограммы направленных градиентов) и SVM (метода опорных векторов) представляет лица в виде набора градиентов и контуров, а затем при помощи МО находит такую границу, которая максимально разделяет классы по признаку: лицо челове-
Таблица 2. Сравнительный анализ алгоритмов детекции
Ограничения существующих разработок: большинство решений созданы для контролируемых условий; работа в полевых условиях требует учета освещенности и запыленности; необходима оптимизация точность vs энергопотребление. Актуальными являются следующие ключевые научно-технические проблемы, определяющие степень разработанности темы: обеспечение стабильности трекинга при переменной освещенности и смене фона; учет ветровой нагрузки; увеличение времени работы; эффективное использование ограниченного по вычислительной мощности CPU. Перспективные направления исследований: гибридные алгоритмы (комбинация MediaPipe и оптического потока, использование IMU-датчиков дрона); энергоэффективные архитектуры (динамическое управление частотой кадров и оптимизированные нейросетевые модели); специализированные доработки (антипылевые фильтры для камеры и дополнительные датчики освещенности).
Применение в сфере растениеводства систем управления на основе следования за оператором для БПЛА остается ограниченным. Основными нерешенными проблемами являются высокие требования к вычислительным ресурсам при работе в полевых условиях; низкая устойчивость к условиям эксплуатации (пыль и переменное освещение); требуют дополнительного изучения: влияние растительного фона на трекинг; оптимальные полетные режимы для разных условий наблюдения. Таким образом, несмотря на наличие множества решений, проблема создания надежной ССО остается недостаточно изученной, что открывает возможности для научно-практических исследований в ча- сти адаптации существующих алгоритмов с учетом аппаратных ограничений и оптимизации параметров слежения за объектом в реальных условиях.
Для постановки задачи исследования выявлены основные проблемы существующих систем. На основании анализа современного состояния исследований определены ключевые недостатки применяемых технологий управления при помощи ССО БПЛА в растениеводстве:
– низкая надежность в полевых условиях: точность распознавания снижается при ярком солнечном свете, наличии пыли/ аэрозолей химикатов в воздухе;
– технические ограничения: высокое энергопотребление алгоритмов, несовместимость с распространенными сель-хоздронами.
Tello представляет собой перспективную платформу для проведения исследований. Ключевой задачей становится разработка с использованием специализированных алгоритмов, учитывающих аппаратные ограничения и условия сель-хозприменения при масштабировании проекта с переходом на более мощные полетные решения. Наибольший потенциал в этом случае показывает комбинация MediaPipe для детекции и адаптированного оптического потока для трекинга.
Результаты и обсуждение
Анализ и использование инструментальных средств ССО в ходе проектирования программной технологии сопровождения оператора для платформы Tello позволили остановиться на основном стеке инструментов разработки (табл. 3) .
Библиотеки компьютерного зрения Python:
– обработка видео в реальном времени opencv-python 4.11.0.86;
– детекция лица оператора mediapipe 0.10.21 (mediapipe blazeface 2.0);
– управление Tello djitellopy 2.5.0;
Таблица 3. Инструменты разработки
|
Категория |
Инструмент |
Версия |
Назначение |
|
Язык программирования |
Python |
3.6–3.13 |
Основной язык разработки |
|
IDE |
VS Code |
1.75–1.100 |
Среда разработки с поддержкой Python/ C++, Python-расширений. Интеграция с DJI Tello Python SDK |
|
IDE |
PyCharm (опционально) |
2025.1.1.1 |
Среда разработки с поддержкой Python. Отладка сложных алгоритмов, визуализация данных, профилирование кода |
|
Создание изолированных сред |
Docker |
3.9 |
Тестирование на разных версиях Python |
|
Источник: составлено авторами. |
|||
К альтернативным вариантам относятся: – для квантованных моделей (опционально) tensorflow-lite 2.17.0;
– для квантованных моделей на RPi (опционально) tflite-runtime 2.10.0;
– для Jetson Nano – torch 1.13.0 и torchvision (если требуется YOLO);
– для ускорения OpenCV – opencv-contrib-python-headless.
Инструменты отладки и профилирования в части набора утилит представлены в табл. 4.
Таблица 4. Инструменты отладки и профилирования
|
Инструмент |
Команда/ Использование |
Назначение |
|
cProfile |
python -m cProfile main.py |
Профилирование производительности |
|
Pyflakes |
pyflakes gesture_ controller.py |
Статический анализ кода |
|
OpenCV Video Capture |
cv2.VideoCapture(0). get(cv2.CAP_PROP_FPS) |
Проверка FPS видеопотока |
|
Источник: составлено авторами. |
||
Рис. Блок-схема решения
Источник: составлено авторами.
В случае необходимости построения графиков (точности/ производительности) используется Python-библиотека визуализации данных средствами 2D– 3D графики Matplotlib или функционал OpenCV. Tello SDK Logging обеспечивает встроенное логирование команд.
Максимальную производительность при работе в контролируемых условиях обеспечивает ноутбук i5-1135G7 с видеокартой не ниже GeForce GTX 1660 Super. При этом производительность фреймворка MediaPipe для обработки лица человека составит не менее 18 FPS. Для работы в полевых условиях рекомендуется использовать: одноплатный микрокомпьютер Raspberry Pi 5, 8 GB или платформу от компании NVIDIA, которая предназначена для создания приложений на базе искусственного интеллекта – Jetson Nano. Аппаратные перспективы улучшения определяются использованием Jetson Nano при работе в полевых условиях и добавлением ИК-камеры для эксплуатации в сумерках. Алгоритмически улучшения возможны за счет предсказание перемещения лица оператора за несколько кадров. Блок-схема решения представлена на рис.
Исходный текст разработанной программы и пояснения к тексту программы представлены в заявке № 2025613414 и датой регистрации 25.02.2025 по резуль- татам, которой получено свидетельство о государственной регистрации программы для ЭВМ «Сопровождение оператора в задаче управления полетом квадрокоптера» с № RU 2025615266 и датой публикации 03.03.2025 г. Краткая характеристика программы: тип ЭВМ: IBM РС-совмест. ПК; язык: Python; ОС: Windows 7/10; объем программы: 7,07 Кб1.
Программа «Сопровождение оператора в задаче управления полетом квадрокоптера» написана на языке программирования Python. Программное обеспечение управляет движением БПЛА на основе автоматического распознавания лица оператора и выполняет следование за человеком при помощи системы технического зрения с использованием нейронной сети для обработки видеопотока с камеры дрона на персональном компьютере.
Функциональные особенности ПО:
– подключение к дрону и вывод изображения с камеры на экран ПК;
– ПО распознает лицо оператора в видеопотоке;
– программа обеспечивает слежение дрона за лицом человека, переводя координаты смещения центральной точки лица относительно центральной точки экрана в команды управления дроном.
Библиотека алгоритмов компьютерного зрения и обработки изображений с открытым кодом OpenCV используется для того, чтобы вывести изображение с квадрокоптера на экран компьютера и отобразить интерфейс. Для идентификации лица человека в кадре применяется функционал библиотеки Mediapipe – мультиплат-форменный фреймворк от Google, состоящий из множества моделей машинного обучения, который широко применяется для обнаружения и распознавания объектов в задачах компьютерного зрения. Для подключения дрона, отправки команд и получения видеопотока с камеры дрона используется библиотека djitellopy. С помощью библиотеки djitellopy происходит подключение к дрону и передача видеопотока на компьютер. Видеоданные обрабатываются при помощи библиотек Mediapipe и OpenCV. Функции OpenCV отвечают за интерфейс ПО, который содержит данные с камеры дрона. Использование Mediapipe позволяет обработать видеопоток и распознать лицо. Координаты смещения передаются для управления дроном и OpenCV для наглядного отображения.
Анализ результатов в ходе тестирования и отладки приложения показал, что при работе над проектом недостаточно базовых возможностей библиотеки OpenCV. Для подключения к дрону и вывода изображения с его камеры требуется аппаратно-ориентированная библиотека djitellopy. Анализ эксплуатационных издержек вынудил разработчиков отказаться от библиотеки face-recognition, где уже представлена функция распознавания лица. В ходе практической реализации алгоритма обнаружения лиц с помощью каскадов Хаара было выявлено, что, несмотря на высокое быстродействие, точностные характеристики сопровождения являются неудовлетворительными. В результате анализа первоисточников и сопоставления альтернативных вариантов выбор был остановлен на библиотеке Mediaрipe с широким спектром возможно- стей. Данный инструмент позволяет помимо простого детектирования человека выполнить поиск полной маски человеческого лица, расположения рук и пальцев, позы. При использовании в проекте библиотека с точностью не менее 80% позволила обнаружить лицо, затратив минимальные ресурсы компьютера. Для реализации алгоритма, отвечающего за слежение дроном при перемещении лица, были использованы методы библиотеки djitellopy. Нагрузка на систему составила: MediaPipe – 55%; Tello SDK – 15%. Для реального тестирования в контролируемых условиях (в помещении и на открытом пространстве) применялись разные сценарии движения оператора: по прямой и зигзагом, с изменением скорости. Работа выполнялась при различном освещении и наличии естественных помех. Общие показатели эффективности сведены в таблицу результатов (табл. 5).
Таблица 5. Сводная таблица результатов
|
Параметр |
Целевое значение |
Фактический результат |
Отклонение |
|
Точность распознавания |
≥ 80% |
85% |
+5% |
|
Средняя задержка |
≤ 300–500 мс |
270 мс |
-30 мс |
|
Устойчивость FPS |
≥ 18 |
18 |
– |
|
Время обучения оператора |
≤ 10 мин. |
8 мин. |
-2 мин. |
|
Источник: составлено авторами. |
|||
Выводы
Результаты проведенных исследований демонстрируют следующее:
– сопровождение оператора в задаче управления полетом квадрокоптера – это перспективное направление для интеграции с сельхозработами за счет сочетания возможностей машинного обучения, компьютерного зрения и робототехники;
– результат разработки (программный продукт) обеспечивает отслеживание лица человека в реальном масштабе вре- мени и естественных условиях наблюдения при помощи совместного использования камеры квадрокоптера и системы технического зрения на основе методов машинного обучения;
– система автоматического слежения в состоянии обеспечить снижение затрат на обследование посевов и свою окупаемость.
Научная новизна исследования состоит в решении ключевых проблем системы сопровождения оператора БПЛА и обусловлена использованием нейросетевых алгоритмов и методов компьютерного зрения.
Практическая значимость работы определяется возможностями применения разработанного программного обеспечения с перспективами дальнейшего масштабирования проекта в задаче управления дроном без использования штатной радиоаппаратуры. Например, в области растениеводства – при мониторинге состояния полей агрономом, который одновременно решает задачи взятия проб почвы и анализа растительности с видеофиксацией состояния посевов.