Инкрементное обучение алгоритма обнаружения нехарактерного поведения на основе главных компонент
Автор: Шаталин Роман Андреевич, Фидельман Владимир Романович, Овчинников Павел Евгеньевич
Журнал: Компьютерная оптика @computer-optics
Рубрика: Численные методы и анализ данных
Статья в выпуске: 3 т.44, 2020 года.
Бесплатный доступ
Предложена схема инкрементного обучения алгоритма обнаружения нехарактерного поведения на основе главных компонент. Результаты экспериментов на наборе данных лаборатории университета Калифорнии в Сан-Диего и экспериментально полученных видео при разном количестве обучающих примеров свидетельствуют о достижении результатов, схожих с процедурой обычного обучения. При этом предложенная схема позволяет в несколько раз сократить время инкрементного обучения в сравнении с подходом на основе спектрального разложения.
Инкрементное обучение, обработка видеоизображений, обнаружение нештатных ситуаций, метод главных компонент
Короткий адрес: https://sciup.org/140250013
IDR: 140250013 | DOI: 10.18287/2412-6179-CO-624
Текст научной статьи Инкрементное обучение алгоритма обнаружения нехарактерного поведения на основе главных компонент
За последние годы для задач видеонаблюдения предложено и реализовано множество алгоритмов обнаружения конкретных нештатных ситуаций на основе строгих правил [1, 2]. Хотя данный подход позволяет с высокой надёжностью распознавать заранее известные типы нештатных ситуаций, модификация алгоритмов для выявления иного типа аномалий нетривиальна. Для устранения данного недостатка было предложено множество подходов к обнаружению аномалий в сцене [3]. Одним из них является поиск отклонений от модели, составленной на основе примеров нормального поведения. Для решения данной задачи часто используют оценки на основе метода главных компонент [4]. Ранее был предложен алгоритм обнаружения нештатных ситуаций на основе метода главных компонент [5]. Данный алгоритм обучается путём вычисления набора главных компонент для векторов характеристик нормального поведения. При поступлении нового примера нормального поведения требуется повторное вычисление главных компонент по старым и новым данным, но вычислительная сложность данной процедуры не позволяет применить её в реальном времени. Одним из способов устранения данного недостатка является инкрементное обучение [6], которое заключается в адаптации модели по новым данным.
В данной работе предложена схема инкрементного обучения алгоритма на новом векторе характеристик нормального поведения с существенно меньшей вычислительной сложностью и уровнем ошибок, сравнимым с обычным обучением алгоритма.
-
1. Метод
Предлагаемая схема инкрементного обучения была протестирована путём модификации алгоритма обнаружения нештатных ситуаций по последовательностям длин векторов смещения [5]. Полученный алгоритм состоит из следующих этапов.
Выделение фона
Для выделения фона использовалась самоорганизующаяся искусственная нейронная сеть, предложенная в работе [7]. Параметры сети подбирались на основе экспериментальных данных. Хотя предложенный ранее критерий качества выделения фона на основе морфологических операторов [8] позволяет получить некие оценки параметров самоорганизующейся сети, он не учитывает особенностей остальных этапов алгоритма. Например, ложные объекты мало влияют на оценку движения в сцене, но отнесение объекта к фону вносит существенное искажение в характеристики поведения.
Оценка движения
Для оценки движения пикселей объектов между двумя последовательными кадрами был использован пирамидальный метод Лукаса–Канаде [9]. Для компенсации влияния перспективной проекции методом плоской гомографии [10] рассчитывались векторы смещения – проекции векторов оптического потока на плоскость пола. Затем вычислялись значения длин векторов смещения, к которым применялся медианный фильтр.
Извлечение признаков поведения
Вектор признаков поведения был выбран как последовательность отфильтрованных длин векторов смещения для всех пикселей на изображении. Пусть изображение имеет размеры W × H , а d ( x , y ) – вектор смещения для пикселя с координатами ( x , у ). Тогда вектор признаков поведения f можно записать в следующем виде:
f ={| <^(0,0)|,| d (1,0)|,...| d(w ,0)|,
I J(0,1)|,^| d(W ,1)|,™| d(W , H )| } .
Обнаружение нештатных ситуаций
Для оценки аномальности поведения в сцене по векторам признаков применялся метод на основе главных компонент [5], суть которого заключается в следующем. На стадии обучения для всех примеров «нормального» поведения извлекаются вектора признаков, и для получившегося набора векторов находятся главные компоненты. Во время работы текущий вектор признаков поведения проецируется на набор векторов главных компонент и обратно. В общем случае набор векторов главных компонент не является базисом и некоторая составляющая вектора теряется при проецировании. Далее эта составляющая называется вектором невязки, и её можно вычислить из следующих выражений:
r = f - f = f - F - Z>V , р. =(f - F, v),
где r - вектор невязки, f - текущий вектор характеристик поведения, f r - результат прямого и обратного проецирования вектора f , F – среднее значение вектора характеристик поведения по обучающей выборке, v - вектор i -й главной компоненты, р , -проекция вектора f на вектор v , ( f - F , v i ) - скалярное произведение векторов v и f - F , q - общее количество главных компонент.
В качестве оценки аномальности использовалась максимальная невязка, которая представляет собой максимальное значение среди модулей компонент вектора невязки.
Инкрементное обучение данного метода сводится к задаче обновления главных компонент по новому значению вектора характеристик нормального поведения. Пусть n – размерность вектора характеристик поведения, а m – количество примеров в исходной обучающей выборке. Если пренебречь изменением среднего значения вектора характеристик F , то ковариационную матрицу C' размером n × n для дополненной обучающей выборки можно записать в следующем виде:
1 m+1
C '= — 7 Z ( f k - F )( f k - F ) m + 1 к
T
m
---7Z( fk - F )( fk - F ) T + m + 1 k
+ -^( f m +1 - F )( f +1 - F ) T = m + 1
m m +1
C +
----; ( f m +1 m +1
- F )( f m +1 - F ) T ,
где C’ - ковариационная матрица для дополненной обучающей выборки, f m + 1 - новое значение вектора характеристик нормального поведения, а C – ковариационная матрица для исходной обучающей выборки.
Если количество главных компонент q для исходной обучающей выборки совпадает с размерностью вектора характеристик n , то вектора главных компонент образуют базис и вектор невязки равен нулю. Рассмотрим случай, когда q < n . Составим ортонор-мированный базис из векторов главных компонент, нормализованного вектора невязки r m + 1 /1 r m + 11 для нового примера нормального поведения и произвольных векторов { vq + 2 ... vn }. С учётом выражения (2) новое значение вектора характеристик нормального поведения f m + 1 после вычитания среднего значения вектора характеристик F можно записать в данном базисе следующим образом:
v v q q fm+1 - F = rm+1 + Z Pivi = Z PiV,■+ Irm+1 I Tm^ .
I I I rm +1|
Определим ортогональную матрицу V размером n × n вида:
V = [V0 _ Vq rm+1/rm+11 Vq+2 ^ V„ J.(5)
Тогда спектральное разложение ковариационной матрицы C для исходной обучающей выборки можно представить в следующем виде:
Аналогично спектральное разложение ковариационной матрицы C ' для дополненной обучающей выборки можно представить в виде:
C ' = V 'A'V' T = -m- V Л V T + m + 1
+ ^Т( f m +1 - F )( f m +1 - F ) T .
m + 1
Из выражения (7) следует связь между главными компонентами исходной и дополненной обучающей выборки:
V 'л,V' T = my л VT + m +1
+ VV T ( f m +1 - F ) ( f m + 1 - F ) T VV T = (8)
m + 1
= -1- V [ m л + V T ( f m +1 - F ) ( f m +1 - F ) T V J V T .
m + 1
Определим матрицу M размером n × n следующим образом:
M = m Л + V T ( f m +1 - F )( f m +1 - F ) T V , (9)
тогда задачу обновления главных компонент можно свести к поиску спектрального разложения матрицы M следующим образом:
V 'Л'V' T = J- VV m Л M V MT V T , m + 1
V '= VVm , Л = Л M , m +1
где Vm - матрица из собственных векторов M , Л M -матрица из собственных чисел M .
Для анализа структуры матрицы M необходимо рассмотреть часть второго слагаемого с учётом выражений (4) и (5):
m % о + p 2 • |
p 0 p q |
p 0 F m +1 |
0 |
■ 0" |
|
p q p 0 |
• m % q + p q |
p q V m +1 |
0 |
0 |
|
F m +1 p 0 • |
■ r m +1 p q |
V m +12 |
0 |
0 |
• (13) |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
• 0 _ |
Из (13) видно, что все столбцы и строки матрицы M с индексами больше q +1 равны нулю, что позволяет произвести спектральное разложение лишь для верхнего левого блока. Тем не менее, средняя вычислительная сложность данной операции составляет O ( q 3) [12], что при большом количестве главных компонент не позволяет применить её в реальном времени.
Предлагаемая схема инкрементного обучения заключается в следующем. Если пренебречь взаимоза-висимостями между проекциями вектора характеристик fm + 1 на составленный базис, то обновление главных компонент можно производить по набору векторов следующего вида:
{ F + ( f m +1 , 1 ) V o , _ , F + ( f m +1 , V q ) V q , F + ^ +1 } • (14)
При проецировании таких векторов только одна из компонент вектора (12) отлична от нуля, и матрица M принимает диагональный вид. Введя шаг инкрементального обучения c , получаем следующую схему обновления собственных значений:
(1 - c ) % i + c • p , 2, i < q, c • r m +1|2 , i = q + 1.
V T ( f m +1
- F) =
vq rm+1/ m+1|
V q +2
V n
(^L Piv'i + r m +1| r m )• (11) i | rm +11
Поскольку вектора { Vq + 2 ... Vn } вместе с векторами главных компонент v i и нормализованным вектором невязки rm + 1 /1 rm + 11 образуют ортонормирован-ный базис, то выражение (11) сводится к следующему:
p 0
V T ( f m +1 - F ) =
p q
| Fm +1|
Тогда матрица M запишется в виде:
Таким образом, инкрементное обучение метода сводится к добавлению главной компоненты с вектором rm + 1 /1 rm + 11 и обновлением собственных значений по формуле (15). Данный подход использует неточный способ определения главных компонент для дополненной обучающей выборки, но его вычислительная сложность составляет O ( q ).
2. Результаты экспериментов
Предлагаемая схема инкрементного обучения алгоритма обнаружения нехарактерного поведения на основе главных компонент была реализована в качестве алгоритма обработки видеоизображений. Работа алгоритма была протестирована на наборе данных лаборатории университета Калифорнии в Сан-Диего (UCSD) [11] и экспериментально полученных видео. Видеозапись «Работа и ремонт» была сделана в компьютерном классе ННГУ. На ней в качестве нормального поведения была взята работа за компьютером, а в качестве нештатного – манипуляции с задней панелью системного блока. Видеозапись лаборатории UCSD содержит пешеходную улицу, обычная ходьба
по которой была взята за нормальное поведение, а проезд транспортных средств – за нештатное.
Из каждого видео бралось ограниченное число примеров нормального поведения. Часть примеров использовалась для обычного обучения алгоритма, а остальная часть – для инкрементного обучения. Затем вычислялись значения максимальной невязки для остальных кадров с нормальным и аномальным поведением из выбранного видео. На основе полученных значений рассчитывались равные уровни ошибок, которые представляют собой уровень ошибок при равной частоте ложных тревог и пропуска события [11]. При этом для уменьшения влияния шума и вычислительных погрешностей отбрасывались главные компоненты, которые описывали менее 0,1 % вариации характеристик нормального поведения. Для сравнения также рассматривался случай, когда все примеры нормального поведения использовались для обычного обучения алгоритма.
Параметры самоорганизующейся сети для извлечения фона [7] и размер медианного фильтра для длин векторов смещения подбирались из условия минимума равного уровня ошибок алгоритма на видеозаписях и приведены в табл. 1. Шаг инкрементного обучения c был задан равным 0,00001.
Табл. 1. Параметры извлечения характеристик поведения из видео «Работа и ремонт» и видео лаборатории UCSD
Параметр |
Работа и ремонт |
UCSD |
Начальный порог сети для извлечения фона |
1 |
1 |
Рабочий порог сети для извлечения фона |
0,001 |
0,05 |
Начальная скорость обучения сети для извлечения фона |
1 |
1 |
Рабочая скорость обучения сети для извлечения фона |
0,001 |
0,001 |
Размер медианного фильтра, пиксели |
3 |
5 |
В табл. 2 приведены равные уровни ошибок алгоритма при разном количестве примеров нормального поведения для обычного и инкрементного обучения. Из табл. 2 видно, что предложенная схема инкрементного обучения позволяет достичь результатов, аналогичных обычному обучению. При этом расхождение в равных уровнях ошибок объясняется неточностью определения главных компонент при инкрементном обучении. Для видео лаборатории UCSD полученные результаты близки к равному уровню ошибок в 23 %, который является минимальным среди всех методов, рассмотренных в работе [11].
Тестирование предлагаемого алгоритма было проведено на компьютере с четырёхъядерным CPU Intel Core i7 4,2 ГГц и 16 GB RAM. В табл. 3 приведено среднее время инкрементного обучения на одном примере нормального поведения на основе спектрального разложения матрицы M и по предложенной схеме при разном количестве главных компонент. Из табл. 3 видно существенное сокращение времени инкрементного обучения при использовании предложенной схемы вместо подхода на основе спектрального разложения.
Табл. 2. Равный уровень ошибок максимальной невязки для видео «Работа и ремонт» и видео лаборатории UCSD при разном количестве примеров нормального поведения для обычного и инкрементного обучения. Знак «+» обозначает инкрементное обучение и разделяет количество примеров для обычного и инкрементного обучения
Название видео |
Количество примеров |
Максимальная невязка |
Работа и ремонт |
3+2 |
5,72 % |
Работа и ремонт |
3+4 |
7,02 % |
Работа и ремонт |
3+6 |
1,47 % |
Работа и ремонт |
5 |
5,72 % |
Работа и ремонт |
7 |
1,58 % |
Работа и ремонт |
9 |
1,47 % |
UCSD |
5+5 |
28,56% |
UCSD |
5+10 |
26,20% |
UCSD |
5+15 |
27,95 % |
UCSD |
5+20 |
26,57% |
UCSD |
10 |
28,85 % |
UCSD |
15 |
26,63 % |
UCSD |
20 |
28,60% |
UCSD |
25 |
27,41 % |
Табл. 3. Среднее время инкрементного обучения на одном примере нормального поведения для кадров из видео «Работа и ремонт» и видео лаборатории UCSD на основе спектрального разложения и предложенной схемы при разном количестве главных компонент
Название видео |
Количество главных компонент |
Обучение на основе спектрального разложения, мс |
Предложенная схема, мс |
Работа и ремонт |
205 |
199,68 |
14,74 |
UCSD |
624 |
5438,52 |
68,58 |
В табл. 4 приведено среднее время извлечения вектора характеристик и расчёта значений невязок для него. Видно, что инкрементное обучение не приводит к увеличению количества главных компонент и времени вычисления невязок.
Заключение
В данной работе предложена схема инкрементного обучения алгоритма обнаружения нехарактерного поведения на основе метода главных компонент. Для тестирования схемы был реализован алгоритм оценки аномальности поведения в сцене. Результаты экспериментов на наборе данных лаборатории университета Калифорнии в Сан-Диего (UCSD) и экспериментально полученных видео при разном количестве обучающих примеров свидетельствуют о достижении результатов, схожих с процедурой обычного обучения. При этом предложенная схема позволяет в не- сколько раз сократить время инкрементного обучения в сравнении с подходом на основе спектрального разложения.
Табл. 4. Среднее время извлечения вектора характеристик и расчета невязок для кадров из видео «Работа и ремонт» и видео лаборатории UCSD при разном количестве примеров нормального поведения для обычного и инкрементного обучения. Знак «+» обозначает инкрементное обучение и разделяет количество примеров для обычного и инкрементного обучения
Название видео |
Количество примеров |
Количество главных компонент |
Извлечение харак-тери-стик, мс |
Вычисление невязок, мс |
Работа и ремонт |
3 |
205 |
98,9 |
13,9 |
Работа и ремонт |
5 |
227 |
99,2 |
15,2 |
Работа и ремонт |
7 |
257 |
98,5 |
17,2 |
Работа и ремонт |
9 |
265 |
99,4 |
17,7 |
Работа и ремонт |
3+2 |
220 |
99,2 |
14,8 |
Работа и ремонт |
3+4 |
202 |
99,7 |
13,7 |
Работа и ремонт |
3+6 |
265 |
98,9 |
17,8 |
UCSD |
5 |
624 |
13,3 |
32,7 |
UCSD |
10 |
1353 |
13,3 |
69,4 |
UCSD |
15 |
1161 |
13,7 |
59,9 |
UCSD |
20 |
1614 |
13,7 |
83,8 |
UCSD |
25 |
1815 |
13,6 |
93,7 |
UCSD |
5+5 |
703 |
13,7 |
36,8 |
UCSD |
5+10 |
366 |
13,4 |
19,3 |
UCSD |
5+15 |
456 |
13,6 |
24,0 |
UCSD |
5+20 |
593 |
13,2 |
30,5 |
Список литературы Инкрементное обучение алгоритма обнаружения нехарактерного поведения на основе главных компонент
- Popoola, O. Video-based abnormal human behavior recognition - A review / O. Popoola, K. Wang. // IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews. - 2012. - Vol. 42, Issue 6. - P. 865-878.
- Епифанцев, Б.Н. Мультисенсорные системы мониторинга территорий ограниченного доступа: возможности видеоаналитического канала обнаружения вторжений / Б.Н. Епифанцев, А.А. Пятков, С.А. Копейкин // Компьютерная оптика. - 2016. - Т. 40, № 1. - С. 121-129. - DOI: 10.18287/2412-6179-2016-40-1-121-129
- Sodemann, A. A Review of Anomaly Detection in Automated Surveillance / A. Sodemann, M. Ross, B. Borghetti // IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews. - 2012. - Vol. 42, Issue 6. - P. 1257-1272.
- Jolliffe, I.T. Principal component analysis / I.T. Jolliffe. - 2nd ed. - New York: Springer, 2002. - 488 p.
- Шаталин, Р.А. Обнаружение нехарактерного поведения в задачах видеонаблюдения / Р.А. Шаталин, В.Р. Фидельман, П.Е. Овчинников // Компьютерная оптика. - 2017. - Т. 41, № 1. - С. 37-45. - DOI: 10.18287/2412-6179-2017-41-1-37-45
- Losing, V. Incremental on-line learning: A review and comparison of state of the art algorithms / V. Losing, B. Hammer, H. Wersing // Neurocomputing. - 2018. - Vol. 275. - P. 1261-1274.
- Maddalena, L. A self-organizing approach to background subtraction for visual surveillance application / L. Maddalena, A. Petrosino // IEEE Transactions on Image Processing. - 2008. - Vol. 17, Issue 7. - P. 1168-1177.
- Шаталин, Р.A. Критерий качества выделения фона с использованием морфологических операторов для задач обнаружения нештатных ситуаций / Р.А. Шаталин, П.Е. Овчинников // Системы управления и информационные технологии. - 2014. - Т. 56(2). - С. 190-194.
- Bouguet, J. Pyramidal implementation of the Lucas Kanade feature tracker / J. Bouguet // Intel Corporation, Microprocessor Research Labs. - 2000. - 9 p.
- Antonakaki P. Detecting abnormal human behavior using multiple cameras / P. Antonakaki, D. Kosmopoulos, S. Perantonis // Signal Proccesing. - 2009. - Vol. 89, Issue 9. - P. 1723-1738.
- Mahadevan, V. Anomaly detection and localization in crowded scenes / V. Mahadevan, W. Li, V. Bhalodia, N. Vasconcelos // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2014. - Vol. 36, Issue 1 - P. 18-31.
- Press, W.H. Numerical recipes: The art of scientific computing / W.H. Press, S.A. Teukolsky, W.T. Vetterling, B.P. Flannery. - 3rd ed. - New York: Cambridge University Press, 2007. - 1256 p.