Применение фильтра Калмана для отслеживания ключевых точек множества объектов

Бесплатный доступ

В данной статье рассматривается задача онлайн-трекинга ключевых точек нескольких объектов (скелетов). Решение этой задачи основывается на интеграции современных методов глубокого обучения и классических алгоритмов фильтрации. Предлагаемый подход включает детекцию людей и их ключевых точек с использованием нейронной сети YOLO. Для установления соответствия между детекциями на последовательных кадрах применяется комбинация фильтра Калмана и Венгерского алгоритма, реализованная в алгоритме SORT. В качестве вектора состояния фильтра используются параметры ограничивающих прямоугольников (bounding boxes), включая координаты центра, площадь, соотношение сторон. Вектор наблюдения содержит текущие координаты обнаруженного ограничивающего прямоугольника. Для количественной оценки эффективности системы используются стандартные метрики мультиобъектного трекинга: НОТА, МОТА и IDF1. Экспериментальные результаты демонстрируют, что предложенная система обладает высокой скоростью обработки и простотой реализации, что обеспечивает её практическую применимость для задач трекинга ключевых точек в условиях ограниченных вычислительных ресурсов.

Еще

Видеонаблюдение, трекинг, мульти-объектный трекинг, фильтр калмана

Короткий адрес: https://sciup.org/142247875

IDR: 142247875   |   УДК: 004.932.2

Using the Kalman filter to track key points of multiple objects

This paper addresses the problem of online tracking of multiple object keypoints (skeletons). The proposed solution integrates state-of-the-art deep learning techniques with classical filtering algorithms. The approach employs a YOLO neural network for human and keypoint detection, while temporal associations between detections across consecutive frames are established using a combination of the Kalman filter and the Hungarian algorithm, as implemented in the SORT framework. The state vector of the filter comprises bounding box parameters--center coordinates, area, aspect ratio as well velocities. The observation vector consists of the current coordinates of the detected bounding box. To quantitatively evaluate system performance, standard multi-object tracking metrics are employed, including НОТА, MOTA, and IDF1. Experimental results demonstrate that the proposed system achieves high processing speed and maintains implementation simplicity, thereby ensuring its practical applicability to keypoint tracking tasks under limited computational resources.

Еще