О прогнозировании временного ряда с помощью нейронных сетей
Автор: Василькин Н.В., Мамедова Т.Ф.
Журнал: Огарёв-online @ogarev-online
Статья в выпуске: 23 т.3, 2015 года.
Бесплатный доступ
В статье решается задача о прогнозировании временного ряда. Рассматривается пример энергопотребления. Для примера проводится анализ модели экстраполяции временных рядов по выборке максимального подобия с помощью применения нейронных сетей.
Временной ряд, математическая модель, нейронная сеть
Короткий адрес: https://sciup.org/147249001
IDR: 147249001
Текст научной статьи О прогнозировании временного ряда с помощью нейронных сетей
В настоящее время задача анализа временных является актуальной темой для большого количества практических исследователей. От выбора метода анализа временных данных существенно зависит скорость расчётов и точность полученных прогнозов. На текущий момент разработано множество моделей прогнозирования временных рядов [1- 9]. С целью повышения точности результатов прогнозирования и увеличение скорости обработки данных временного ряда, наиболее перспективным является создание комбинированных моделей, в которых первоначально выполняется кластеризация, а затем производиться прогнозирование временного ряда для нужного кластера.
Рассмотрим временной ряд вида: Z ( t ) = Z (1), Z (2),... , Z ( t ).
Предположим, что последовательность значений, Z M = Z(t ), Z(t + 1),... Z(t + M + 1), представляет собой выборку длины M с момента начала отсчета t; M е { 1,2,..., T } , t е { 1,2,..., T — M + 1 } . Тогда выборкой будет является фрагмент временного ряда, имеющий точку начала отсчета и длину. Обозначим через временную задержку k Z M = Z(t),...Z ( t + M — 1)и Z M = Z ( t — k),...Z ( t — k + M — 1),где k e { 1,2,..., t — 1 } - две выборки одинаковой длины, принадлежащие одному временному ряду.
Тогда справедлива формула
ZM = aZM + a0 IM + EM. (1)
или
Z м = a 1 Z Mk + а Iм .
где а и a0 - некоторые коэффициенты.
Для зависимости (1) функция ошибки аппроксимации SM для выборок ZМ и ZМ с задержкой k будет имеет вид
M - (3)
SM (a ,a) = E( z (t+i)—a z (t - k+i) - a) • t=0
Необходимо подобрать такие значения а и а 0, чтобы при подстановке в (3) было получено минимально возможное значение SM ( a , a ) • Решение находится методом наименьших квадратов.
Рассмотрим временной ряд Z(t) и некоторую выборку ZМ , принадлежащую данному временному ряду. Определим все значения SM ( a , a ) для k е { 1,2,—, t - 1 } , M=const. Затем найдем минимальное
S M. = min( S M , S M .-S M )- (4)
Определим множество значений модуля линейной корреляции при k е { 1,2,.„, t - 1 } ,
M=const по формуле:
M
P k
=| р ( Z M , Z M )| =
M
£ ( Z ( t + i ) - z )( z (t + i ) - z )
t = 1
MM
£ ( Z ( t + i ) - z )2 £ ( z ( t + i ) - z )2
V t = 1 t = 1
e [ 0,1J
Тогда справедливо:
M MM M
P k max = max( p 1 . p 2 .••• , P t - 1)-
Очевидно, что задержка kmjh (4) и задержка kmaxиз (6) будут совпадать между собой, т.е. k = k . Полученную задержку, соответствующую минимуму ошибки регрессии S^^и максимуму модуля корреляции pMnaхобозначим kmax. Назовем выборку ZM выборкой максимального подобия. Выборка максимального подобия ZM является выборкой, которая при подстановке в уравнение (2) дает в результате значения выборки ZM, которая максимально точно описывает исходную выборку ZM.
Чтобы определить значения прогнозной выборки ZP+ u учитывая влияние внешних факторов, представленных в виде временных рядов X1 (t),
I ...
, Xs ( t ), был разработан алгоритм,
ˆ P P P P P
Z T + 1 = a s + 1 Z T + a sX ( S ) T + 1 + ... + а 1 X (1) T + 1 + а 0 I .
Алгоритм.
-
1. Определяется выборка максимального подобия для выборки новой истории.
-
2. . Вычисляется выборка Z P .
-
3. Вычислим выборку Zр+ х. Экстраполяция значения выборки Zр+ определяем по
формуле
/.’и = а+ZP . м + аX?+1 +...+aXPT+1 + aip .=emmspx(M) (8)
T + 1 S + 1 k max + m S ( S ) T + 1 1 (1) T + 10
Средняя абсолютная ошибка дает точность аппроксимации и экстраполяции временных рядов
1 t + M - 1 Z ( i ) - Z ( i ) MAPE = — У J------^00%.
M ^ Z ( i )
На текущий момент явно определена проблема быстрого и точного нахождения коэффициентов линейной корреляции, близкого единице. Данную проблему можно решать, основываясь на комбинированной модели с помощью многослойной нейронной сети с алгоритмом обучения, основанным на принципе обратного распространения ошибки
Найдем коэффициенты линейной корреляции при помощи модели нейронной сети.
Пусть каждый нейрон сети имеет нелинейную функцию активации:
= 1 (10)
У i 1 + exp(-vy), где v j - индуцированное локальное поле; у, - выход нейрона.
Пусть сеть содержит несколько слоев скрытых нейронов, не являющихся частью входа или выхода сети, которые позволяют сети обучаться решению сложных задач.
Алгоритм обратного распространения ошибки заключается в следующем:
eMMEMSPX ( M
1. Сигнал ошибки выходного нейрона j на итерации n (соответствующей n-му примеру обучения) определяется выражением
e j ( п ) = d j ( п) — у} ( п ).
2. Энергия среднеквадратичной ошибки вычисляется как нормализованная по N сумма
всех значений энергии ошибки E(n)
N
E (п ) = v X E ( п ).
N п = 1
3. Индуцированное локальное поле ^ ( п) , равно
m
v ( п ) = X w j ( п ) у ( п ), i = 0
где m-общее число входов.
4. Функциональный сигнал у} ( п) на выходе нейрона j на итерации n:
У; ( п ) = P j V j ( п )).
Алгоритм обратного распространения состоит в применении к синаптическому весу
Wj(п ) коррекции A w ^( п) , пропорциональной частной производной д Е ( п)/ d wt X п ).
Градиент можно представить следующим образом:
д Е ( п ) _ д Е ( п ) д e j ( п ) д y j ( п ) dV j ( п ) (15)
dwJt ( п ) " де} ( п ) ду} ( п ) ду} ( п ) 0w} ( п )’
Построив по описанному методу модель нейронной сети, появляется возможность быстрого нахождения выборки максимального подобия и нахождения значения линейной корреляции Пирсона.
Таблица 1
Прогнозные значения энергопотребления на территории населенного пункта по состоянию на 24 апреля 2013 года
№ |
Дата (24.03.2014), ч. |
Значения ряда, МВт/ч. |
Прогнозные значения ряда МВт ⋅ ч. |
MAE (MAPE) МВт ⋅ ч., (%) |
1 |
1:00 |
1,013 |
1,023 |
(0,94) |
2 |
2:00 |
1,075 |
1,086 |
(1,03) |
3 |
3:00 |
1,192 |
1,203 |
(0,98) |
4 |
4:00 |
1,308 |
1,325 |
(1,32) |
5 |
5:00 |
1,416 |
1,436 |
(1,45) |
6 |
6:00 |
1,478 |
1,494 |
(1,14) |
7 |
7:00 |
1,489 |
1,512 |
(1,57) |
8 |
8:00 |
1,512 |
1,539 |
(1,83) |
9 |
9:00 |
1,460 |
1,484 |
(1,67) |
10 |
10:00 |
1,473 |
1,486 |
(0,95) |
11 |
11:00 |
1,436 |
1,459 |
(1,66) |
12 |
12:00 |
1,437 |
1,456 |
(1,37) |
13 |
13:00 |
1,417 |
1,429 |
(0,91) |
14 |
14:00 |
1,389 |
1,410 |
(1,55) |
15 |
15:00 |
1,382 |
1,398 |
(1,22) |
16 |
16:00 |
1,307 |
1,324 |
(1,34) |
17 |
17:00 |
1,338 |
1,358 |
(1,56) |
18 |
18:00 |
1,472 |
1,498 |
(1,77) |
19 |
19:00 |
1,391 |
1,405 |
(1,05) |
20 |
20:00 |
1,241 |
1,258 |
(1,43) |
21 |
21:00 |
1,093 |
1,108 |
(1,45) |
22 |
22:00 |
1,024 |
1,036 |
(1,22) |
23 |
23:00 |
1,000 |
1,012 |
(1,27) |
24 |
0:00 |
1,013 |
1,031 |
(1,83) |
С помощью созданного СПО на основе заданной комбинированной модели получены результаты прогноза для временного ряда энергопотребления. Полученные результаты внесены в таблицу 1.
Список литературы О прогнозировании временного ряда с помощью нейронных сетей
- Draper N. Applied regression analysis. - New York: Wiley, In press, 1981. - 693 p.
- Gheyas I. A. A Neural Network Approach to Time Series Forecasting // Proceedings of the World Congress on Engineering. - London, 2009. - pp. 1292-1296.
- Mazengia D. H. Forecasting Spot Electricity Market Prices Using Time Series Models: Thesis for the Degree of Master of Science in Electric Power Engineering. - Gothenburg: Chalmers University of Technology, 2008. - 89 p.
- Morariu N., Iancu E., Vlad S. A. A neural network model for time series forecasting // Romanian Journal of Economic Forecasting. - 2009. - No. 4. - pp. 213-223.
- Norizan M. Short Term Load Forecasting Using Double Seasonal ARIMA Model // Regional Conference on Statistical Sciences. - Malaysia, Kelantan, 2010. - pp. 57-73.
- Prajakta S. K. Time series Forecasting using Holt-Winters Exponential Smoothing // Kanwal Rekhi School of Information Technology Journal. - Boston, 2004. - pp. 1-13.
- Бокс Дж., Дженкинс Г. М. Анализ временных рядов, прогноз и управление. - М.: Мир, 1974. - 406 с.
- Хайкин С. Нейронные сети: полный курс. - М.: Вильямс, 2006. - 1104 с.
- Чучуева И. А. Модель прогнозирования временных рядов по выборке максимального подобия: автореф. дис.. канд. техн. наук. - Москва, 2012. - 16 с. EDN: QHZDPD