Формирование пространства признаков для обнаружения живых объектов в здании на основе экологических факторов
Автор: Куликовских Илона Марковна
Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc
Рубрика: Информатика, вычислительная техника и управление
Статья в выпуске: 4-4 т.18, 2016 года.
Бесплатный доступ
В работе рассматривается задача формирования признакового описания для обнаружения живых объектов на основе экологических факторов. Для решения поставленной задачи была реализована модель логистической регрессии и предложен функционал, учитывающий взаимную корреляцию признаков. Серия вычислительных экспериментов подтвердила адекватность и непротиворечивость полученных результатов, а также эффективность предложенной модели для обнаружения объектов в здании.
Машинное обучение, формирование пространства признаков, логистическая регрессия, бинарная классификация, обнаружение объектов, экологические факторы
Короткий адрес: https://sciup.org/148204764
IDR: 148204764
Текст научной статьи Формирование пространства признаков для обнаружения живых объектов в здании на основе экологических факторов
Работа выполнена при государственной поддержке Министерства образования и науки РФ (грант № 074-U01).
ПОСТАНОВКА ЗАДАЧИ
Проблема обнаружения живых объектов в здании является актуальной для энергосбережения и обеспечения безопасности в помещениях. Как показывают результаты предыдущих исследований [1-7], более точное решение данной проблемы связано с анализом экологических факторов, что позволило повысить энергосбережение с 30% до 42% [1-3]. С другой стороны такие системы точного обнаружения позволяют определить поведение и перемещение живых объектов без использования камеры, что представляет значительный интерес из-за необходимости соблюдения конфиденциальности информации.
работе результаты показали наибольшую точность для метода LDA по сравнению с результатами аналогичных исследований.
В свою очередь, логистическая регрессия имеет ряд достоинств по сравнению с LDA [8-14], в частности, даёт лучшие результаты, поскольку основана на менее жёстких гипотезах. Кроме того, логистическая регрессия предпочтительнее, так как не вводит избыточную сущность как LDA, который сводит задачу классификации к более сложной задаче восстановления плотностей вероятностей [8].
Однако в работе[4]отмечается, что реализация модели логистической регрессии на используемом наборе данных невозможно, так как алгоритм расходится для линейно разделимых классов. Следовательно, было бы интересно оценить возможности логистической регрессии в контексте задачи, описанной в [4], более детально, проанализироватьуказанное ограничение и попытаться реализовать модель логистической регрессии при решении задачи обнаружения живых объектов в здании.
ОПИСАНИЕ НАБОРА ДАННЫХ
Исходные наборы данных для решения поставленной задачи доступны в UCI Machine Learning Repository по ссылке datasets/Occupancy+Detection+. Данные наборы могут быть использованы как для обучения, так и для тестирования моделей. Для сбора данных было использовано помещение 5,85 х 3,50 х 3,53 м, в котором были измерены следующие экологические факторы: уровни температуры, влажности, света и CO2, с помощью датчиков, установленных в помещении. Кроме того, для формирования меток – отсутствия или присутствия живого объекта в помещении – была установлена цифровая камера, которая снимала изображения с заданным интервалом времени. Таким образом, представленны-евыше признаки, дополнены отсчетами времени и влагоемкостью. Результирующий показатель в наборах соответствует статусу – обнаружен, не обнаружен – и определяет метки классов. Более подробное описание процедуры сбора данных представлено в работе [4].
Обучающая выборка содержит 8143 реализации, которые были получены, когда дверь в помещение была закрыта. Два тестовых набора по 1998 реализаций каждая были сформированы для двух случаев: открытой и закрытой двери. На рисунке ниже представлены исходные наборы в зависимости от имеющихся признаков, исключая отсчеты времени. Метки классов размечены в виде черных крестиков в случае отсутствия объекта и красных точек в случае его присутствия в помещении (см. рис. 1).
Исходя из описания данных, представим задачу обнаружения объектов в здании как задачу бинарной классификации исходного набора данных с формированием пространства признаков. В качестве метода классификации определим нереализованный в проведенных ранее исследованиях [4] метод логистической регрессии и проанализируем его эффективность.
ФОРМИРОВАНИЕПРОСТРАНСТВА ПРИЗНАКОВ
Приведем основные понятия и определения, необходимые для решения поставленной задачи обнаружения объектов с помощью модели логистической регрессии.
Определение 1. Пусть X – множество объектов, Y – множество допустимых ответов. Объекты описываются числовыми признаками ,
, где n – количество признаков. Тогда в русле работы [8] вектор , где
, называется пространством признаков объекта x.
Определение 2. Пусть X – множество объектов, Y – множество допустимых ответов, а Θ – множество допустимых значений пространства параметров θ . Тогда в русле работы [10] параметрическим семейство , где
– фиксированная функция, называется моделью алгоритмов.
Задача 1. Пусть в качестве модели алгоритмов выбрана модель логистической регрессии 1
9^Х’^ - 1 + exp (-9тх)"
Тогда задача определения пространства параметров по выборке прецедентов , где , сводится к минимизации логарифмической функции потерь [8]
i lnL(0,Xz) =
^ln(l + ехр(-ОтХ1уОУ
i=l
При этом в постановке Задачи 1 значение yi=0 соответствует случаю отсутствия объекта, а yi=1 – случаю присутствия объекта.
а)

б)


Рис. 1. Исходные данные:
а - обучающая выборка; б - тестовая выборка (закрытая дверь); в - тестовая выборка (открытая дверь)
Сформируем пространство признаков с учетом взаимной корреляции признаков. С этой целью построим таблицу корреляций признаков для обучающей выборки X l=(x.,у)=1 и тестовых выборок X ki=(x ,yi)ki=1 и X k2=(xt ,yi)k2=1. Согласно структуре исходных данных 1=6107, k1=1998, k2=1998; n=5, xj = {Температура, Влажность, Свет, СО2, Влагоём-кость}. Заметим, что часть данных из обучающей выборки было использовано для проведения кросс-валидации.
Зададим функционал для формирования пространства признаков x j = f(x) для пары { x p , x q }, где
Таблица 1. Коэффициенты корреляции между признаками xj для выборок X l , X k 1 и X k 2
xj с X1 |
xj с Xkl |
xj с Xk2 |
|||||||||||||
j |
1 |
2 |
3 |
4 |
5 |
1 |
2 |
3 |
4 |
5 |
1 |
2 |
3 |
4 |
5 |
1 |
1,00 |
- |
- |
- |
- |
1,00 |
- |
- |
- |
- |
1,00 |
- |
- |
- |
- |
2 |
-0,15 |
1,00 |
- |
- |
- |
0,71 |
1,00 |
- |
- |
- |
-0,48 |
1,00 |
- |
- |
- |
3 |
0,65 |
0,04 |
1,00 |
- |
- |
0,77 |
0,56 |
1,00 |
- |
- |
0,70 |
-0,2 |
1,00 |
- |
- |
4 |
0,56 |
0,44 |
0,66 |
1,00 |
- |
0,87 |
0,91 |
0,77 |
1,00 |
- |
0,22 |
-0,1 |
0,23 |
1,00 |
- |
5 |
0,15 |
0,96 |
0,23 |
0,63 |
1,00 |
0,89 |
0,95 |
0,70 |
0,96 |
1,00 |
-0,03 |
0,88 |
0,15 |
0,05 |
1,00 |
, , в следующем виде d m f^.x^d) = П Пор)™-71^9)11, m=l n=0
где . При этом в данном исследо вании выбиралась пара {p,q} , соответствующая признакам с наибольшей корреляцией на обучающей выборке (см. табл. 1).Исключени- ем являлась пара {2,5}, которая линейно зависима по определению [4].
Рассмотрим различные комбинации признаков в виде наборов:
-
1.;
-
2.;
-
4.;
-
5.;
-
6.
РЕЗУЛЬТАТЫ РАСПОЗНАВАНИЯ
Проанализируем приведенные выше комбинации и исследуем возможность минимизации набора признаков. В таблице 2 приведены значения точности распознавания для наборов { Gr } 6 r=1 при различных значениях величины d = {2,4,6} на обучающей выборке и двух тестовых выборках. Следует отметить, что при формировании наборов была проведена нормировка значений для повышения качества и скорости сходимости выбранной модели классификации [8]. Нормировка пространства признаков также необходима из-за выбора степенного функционала f ( xp, xq, d ) – возведение в степень слишком больших или слишком маленьких значений может привести к неадекватным результатам. Модель логистической регрессии была реализована в системе GNU Octave 3.8.2
и апробирована при проведении экспериментальных исследований на MacBookAir 11 OS X EI Captain с процессором 1.3 GHzIntelCore i5 и памятью 4 GB 1600 MHz DDR3.
Как видно из таблицы, повышение сложности пространства признаков не приводит к существенному повышению качества распознавания: точность классификации как среднее лучших показателей (выделено жирным) при d = 2 на 0,85% хуже, чем при d = 4, и на 0,25% хуже, чем при d = 6. Более того, обращает на себя внимание тот факт, что при d = {2,4} наилучшая точность получена для результатов, где при формировании признаков использовался функционал f ( x1,x3,d ) с парой признаков {1,3} .
Согласно результатам исследований, приведенных в [4], хорошее качество классификации-было получены приполном наборе G0 : xj – 97,90% для тестового набора Xk 1 и 98,76% для тестового набора Xk 2 .Данные результаты были получены с помощью LDA.Тем не менее, отмечается, что наилучший результат для набора Xk 1 – 97,9% был также получен на паре признаков {1,3}, а для набора Xk 2 – 99,33% на полном наборе, но дополненном парой вновь сформированных признаков, учитывающих временную компоненту. Представленные результаты были тоже получены с использованием LDA.
Анализируя таблицу 1, можно заметить, что пара признаков {1,3} является единственной, которая имеет высокую корреляцию как всех выборках: X l , X k 1 и X k 2 . Следовательно, использование корреляции при формировании пространства признаков является целесообразным. Проведем серию дополнительных вычислительных экспериментов при d = 1, включив в рассмотрение полный набор признаков xj без дополнительного преобразования. Кроме того, для сравнения
Таблица 2. Точность распознавания при формировании наборов { Gr } 6 r=1 при d = {2,4,6}
d = 2 |
d = 4 |
d = 6 |
|||||||
X1 |
Xk i |
Xk 2 |
X1 |
Xk i |
Xk 2 |
X1 |
Xk i |
Xk 2 |
|
G |
98,4608 |
92,8929 |
85,8359 |
99,1158 |
94,5445 |
89,0891 |
98,9520 |
90,8408 |
90,9910 |
G |
98,4117 |
91,1411 |
89,0891 |
98,8701 |
94,4444 |
82,8829 |
98,6900 |
91,8919 |
97,9980 |
g 4 |
98,7392 |
93,2933 |
93,8438 |
99,1158 |
93,1932 |
91,0410 |
99,1813 |
89,8899 |
92,5926 |
G3 |
93,6794 |
73,7738 |
69,8699 |
95,2186 |
74,0240 |
54,8549 |
94,9894 |
75,7758 |
65,5656 |
G2 |
98,5754 |
91,7918 |
96,1962 |
98,8374 |
94,4444 |
92,2422 |
98,6573 |
92,9429 |
94,9450 |
G |
98,6573 |
75,5756 |
97,1471 |
99,0175 |
76,4764 |
97,5976 |
98,9029 |
76,3763 |
94,8949 |
Таблица 3. Точность распознавания при формировании наборов { Gr }6r=0 при d = 1
Из представленной таблицы следует, что точность распознавания без нормировки пространства признаков значительно выше. Результаты, полученные в данном исследовании с помощью логистической регрессии – 98% для набора Xk 1 и 99,35% для набора Xk 2 ,– аналогичны представленным в [4] для LDA, но реализуют более простую и легко интерпретируемую модель.
ВЫВОДЫ
В данной работе:
-
1. реализована модель логистической регрессии, являющаяся более простой и интерпретируемой по сравнению с рассмотренными ранее;
-
2. предложен метод обучения классификатора на основе формирования признаков с учетом взаимной корреляции и выявлена пара наиболее информативных признаков.
Автор выражает благодарность д.т.н., профессору С.А. Прохорову и к.ф.-м.н., профессору Л.П. Усольцеву за ценные замечания и рекомендации, способствующие повышению качества представления результатов исследований.
Список литературы Формирование пространства признаков для обнаружения живых объектов в здании на основе экологических факторов
- Erickson V.L., Carreira-Perpiñán M.Á., Cerpa A.E. OBSERVE: Occupancy-based system for efficientreduction of HVAC energy//Information Processing in Sensor Networks (IPSN): Proc. 10thIEEE International Conference on, Stockholm, Sweden, 2011. Pp. 258-269.
- Occupancy modeling and prediction for building energy management/V.L. Erickson, M.Á. Carreira-Perpiñán, A.E. Cerpa//ACM Transactions on Sensor Networks (TOSN). 2014. 10(3). 42.
- Dong B., Andrews B. Sensor-based occupancy behavioral pattern recognition for energy and comfortmanagement in intelligent buildings. URL: www.ibpsa.org/proceedings/BS2009/BS09_1444_1451.pdf (дата обращения 8.11.2016).
- Candanedo L.M., Feldheim V. Accurate occupancydetection of an office room from light, temperature, humidity and CO2measurements using statistical learning models//Energy and Buildings. 2015. URL: http://dx.doi.o (дата обращения 8.11.2016) DOI: rg/10.1016/j.enbuild.2015.11.071
- Occupancy detection through an extensive environmental sensor network in an open-plan office building/K.P. Lam, M. Höynck, B. Dong, B. Andrews, Y.-S. Chiou, R. Zhang, D. Benitez, J. Choi//IBPSA Building Simulation. 2009. 145. pp. 1452-1459.
- Real-time occupancy detection using decision trees with multiple sensor types/E. Hailemariam, R. Goldstein, R. Attar, A. Khan//Simulation for Architecture and Urban Design: Proc. 2011 Symposium on, Boston, MA, USA, 2011. pp. 141-148.
- A multi-sensor based occupancy estimation model forsupporting demand driven HVAC operations // Z. Yang, N. Li, B. Becerik-Gerber, M. Orosz // Simulation for Architecture and Urban Design: Proc. 2012 Symposium on, San Diego, CA, USA, 2012. pp. 49-56.
- Воронцов К.В. Лекции по линейным алгоритмам классификации. URL: http://www.machinelearning.ru/wiki/images/6/68/voron-ML-Lin.pdf Дата обращения 08.11.16.
- Воронцов К.В. Лекции по алгоритмам восстановления регрессии. URL: http://www.ccas.ru/voron/download/Regression.pdf. Дата обращения 08.11.16.
- Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин). URL: http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf Дата обращения08.11.16.
- Rodriguez G. Lecture notes on generalized linear models. Appendix B. Generalized linear model theory. URL: http://data.princeton.edu/wws509/notes/a2.pdf. Accessed 08.11.2016.
- Rodriguez G. Lecture notes on generalized linear models. Chapter 3. Logit models for binary data. URL: http://data.princeton.edu/wws509/notes/c3.pdf. Accessed 08.11.2016.
- Hastie T., Tibshirani R., Friedman J. The elements of statistical learning: Data mining, inference, and prediction (2nd ed.)/T. Hastie, Springer Series in Statistics, 2013. 745 p.
- Czepiel S.A. Maximum likelihood estimation of logistic regression models: Theory and implementation. URL: http://czep.net/stat/mlelr.pdf. Accessed 08.11.2016.