О прогнозировании временного ряда с помощью нейронных сетей

Автор: Василькин Н.В., Мамедова Т.Ф.

Журнал: Огарёв-online @ogarev-online

Статья в выпуске: 23 т.3, 2015 года.

Бесплатный доступ

В статье решается задача о прогнозировании временного ряда. Рассматривается пример энергопотребления. Для примера проводится анализ модели экстраполяции временных рядов по выборке максимального подобия с помощью применения нейронных сетей.

Временной ряд, математическая модель, нейронная сеть

Короткий адрес: https://sciup.org/147249001

IDR: 147249001

Текст научной статьи О прогнозировании временного ряда с помощью нейронных сетей

В настоящее время задача анализа временных является актуальной темой для большого количества практических исследователей. От выбора метода анализа временных данных существенно зависит скорость расчётов и точность полученных прогнозов. На текущий момент разработано множество моделей прогнозирования временных рядов [1- 9]. С целью повышения точности результатов прогнозирования и увеличение скорости обработки данных временного ряда, наиболее перспективным является создание комбинированных моделей, в которых первоначально выполняется кластеризация, а затем производиться прогнозирование временного ряда для нужного кластера.

Рассмотрим временной ряд вида: Z ( t ) = Z (1), Z (2),... , Z ( t ).

Предположим, что последовательность значений, Z M = Z(t ), Z(t + 1),... Z(t + M + 1), представляет собой выборку длины M с момента начала отсчета t; M е { 1,2,..., T } , t е { 1,2,..., T M + 1 } . Тогда выборкой будет является фрагмент временного ряда, имеющий точку начала отсчета и длину. Обозначим через временную задержку k Z M = Z(t),...Z ( t + M 1)и Z M = Z ( t k),...Z ( t k + M 1),где k e { 1,2,..., t 1 } - две выборки одинаковой длины, принадлежащие одному временному ряду.

Тогда справедлива формула

ZM = aZM + a0 IM + EM.                   (1)

или

Z м = a 1 Z Mk + а Iм .

где а и a0 - некоторые коэффициенты.

Для зависимости (1) функция ошибки аппроксимации SM для выборок ZМ и ZМ с задержкой k будет имеет вид

M - (3)

SM (a ,a) = E( z (t+i)—a z (t - k+i) - a) • t=0

Необходимо подобрать такие значения а и а 0, чтобы при подстановке в (3) было получено минимально возможное значение SM ( a , a ) • Решение находится методом наименьших квадратов.

Рассмотрим временной ряд Z(t) и некоторую выборку ZМ , принадлежащую данному временному ряду. Определим все значения SM ( a , a ) для k е { 1,2,—, t - 1 } , M=const. Затем найдем минимальное

S M. = min( S M , S M .-S M )- (4)

Определим множество значений модуля линейной корреляции при k е { 1,2,.„, t - 1 } ,

M=const по формуле:

M

P k

=| р ( Z M , Z M )| =

M

£ ( Z ( t + i ) - z )( z (t + i ) - z )

t = 1

MM

£ ( Z ( t + i ) - z )2 £ ( z ( t + i ) - z )2

V t = 1                            t = 1

e [ 0,1J

Тогда справедливо:

M     MM  M

P k max = max( p 1 . p 2 .••• , P t - 1)-

Очевидно, что задержка kmjh (4) и задержка kmaxиз (6) будут совпадать между собой, т.е. k = k . Полученную задержку, соответствующую минимуму ошибки регрессии S^^и максимуму модуля корреляции pMnaхобозначим kmax. Назовем выборку ZM выборкой максимального подобия. Выборка максимального подобия ZM является выборкой, которая при подстановке в уравнение (2) дает в результате значения выборки ZM, которая максимально точно описывает исходную выборку ZM.

Чтобы определить значения прогнозной выборки ZP+ u учитывая влияние внешних факторов, представленных в виде временных рядов X1 (t),

I ...

, Xs ( t ), был разработан алгоритм,

ˆ P          P       P              P         P

Z T + 1 = a s + 1 Z T + a sX ( S ) T + 1 + ... + а 1 X (1) T + 1 + а 0 I .

Алгоритм.

  • 1.    Определяется выборка максимального подобия для выборки новой истории.

  • 2. . Вычисляется выборка Z P .

  • 3.    Вычислим выборку + х. Экстраполяция значения выборки + определяем по

формуле

/.’и = а+ZP . м + аX?+1 +...+aXPT+1 + aip .=emmspx(M) (8)

T + 1      S + 1 k max + m     S  ( S ) T + 1          1  (1) T + 10

Средняя абсолютная ошибка дает точность аппроксимации и экстраполяции временных рядов

1 t + M - 1 Z ( i ) - Z ( i ) MAPE = — У J------^00%.

M ^    Z ( i )

На текущий момент явно определена проблема быстрого и точного нахождения коэффициентов линейной корреляции, близкого единице. Данную проблему можно решать, основываясь на комбинированной модели с помощью многослойной нейронной сети с алгоритмом обучения, основанным на принципе обратного распространения ошибки

Найдем коэффициенты линейной корреляции при помощи модели нейронной сети.

Пусть каждый нейрон сети имеет нелинейную функцию активации:

=        1                                       (10)

У i   1 + exp(-vy), где v j - индуцированное локальное поле; у, - выход нейрона.

Пусть сеть содержит несколько слоев скрытых нейронов, не являющихся частью входа или выхода сети, которые позволяют сети обучаться решению сложных задач.

Алгоритм обратного распространения ошибки заключается в следующем:

eMMEMSPX ( M

1. Сигнал ошибки выходного нейрона j на итерации n (соответствующей n-му примеру обучения) определяется выражением

e j ( п ) = d j ( п) у} ( п ).

2. Энергия среднеквадратичной ошибки вычисляется как нормализованная по N сумма

всех значений энергии ошибки E(n)

N

E (п ) = v X E ( п ).

N п = 1

3. Индуцированное локальное поле ^ ( п) , равно

m

v ( п ) = X w j ( п ) у ( п ), i = 0

где m-общее число входов.

4. Функциональный сигнал у} ( п) на выходе нейрона j на итерации n:

У; ( п ) = P j V j ( п )).

Алгоритм обратного распространения состоит в применении к синаптическому весу

Wj(п ) коррекции A w ^( п) , пропорциональной частной производной д Е ( п)/ d wt X п ).

Градиент можно представить следующим образом:

д Е ( п ) _ д Е ( п ) д e j ( п ) д y j ( п ) dV j ( п )                    (15)

dwJt ( п ) "  де} ( п ) ду} ( п ) ду} ( п ) 0w} ( п )’

Построив по описанному методу модель нейронной сети, появляется возможность быстрого нахождения выборки максимального подобия и нахождения значения линейной корреляции Пирсона.

Таблица 1

Прогнозные значения энергопотребления на территории населенного пункта по состоянию на 24 апреля 2013 года

Дата (24.03.2014), ч.

Значения ряда, МВт/ч.

Прогнозные значения ряда МВт ч.

MAE (MAPE) МВт ч., (%)

1

1:00

1,013

1,023

(0,94)

2

2:00

1,075

1,086

(1,03)

3

3:00

1,192

1,203

(0,98)

4

4:00

1,308

1,325

(1,32)

5

5:00

1,416

1,436

(1,45)

6

6:00

1,478

1,494

(1,14)

7

7:00

1,489

1,512

(1,57)

8

8:00

1,512

1,539

(1,83)

9

9:00

1,460

1,484

(1,67)

10

10:00

1,473

1,486

(0,95)

11

11:00

1,436

1,459

(1,66)

12

12:00

1,437

1,456

(1,37)

13

13:00

1,417

1,429

(0,91)

14

14:00

1,389

1,410

(1,55)

15

15:00

1,382

1,398

(1,22)

16

16:00

1,307

1,324

(1,34)

17

17:00

1,338

1,358

(1,56)

18

18:00

1,472

1,498

(1,77)

19

19:00

1,391

1,405

(1,05)

20

20:00

1,241

1,258

(1,43)

21

21:00

1,093

1,108

(1,45)

22

22:00

1,024

1,036

(1,22)

23

23:00

1,000

1,012

(1,27)

24

0:00

1,013

1,031

(1,83)

С помощью созданного СПО на основе заданной комбинированной модели получены результаты прогноза для временного ряда энергопотребления. Полученные результаты внесены в таблицу 1.

Список литературы О прогнозировании временного ряда с помощью нейронных сетей

  • Draper N. Applied regression analysis. - New York: Wiley, In press, 1981. - 693 p.
  • Gheyas I. A. A Neural Network Approach to Time Series Forecasting // Proceedings of the World Congress on Engineering. - London, 2009. - pp. 1292-1296.
  • Mazengia D. H. Forecasting Spot Electricity Market Prices Using Time Series Models: Thesis for the Degree of Master of Science in Electric Power Engineering. - Gothenburg: Chalmers University of Technology, 2008. - 89 p.
  • Morariu N., Iancu E., Vlad S. A. A neural network model for time series forecasting // Romanian Journal of Economic Forecasting. - 2009. - No. 4. - pp. 213-223.
  • Norizan M. Short Term Load Forecasting Using Double Seasonal ARIMA Model // Regional Conference on Statistical Sciences. - Malaysia, Kelantan, 2010. - pp. 57-73.
  • Prajakta S. K. Time series Forecasting using Holt-Winters Exponential Smoothing // Kanwal Rekhi School of Information Technology Journal. - Boston, 2004. - pp. 1-13.
  • Бокс Дж., Дженкинс Г. М. Анализ временных рядов, прогноз и управление. - М.: Мир, 1974. - 406 с.
  • Хайкин С. Нейронные сети: полный курс. - М.: Вильямс, 2006. - 1104 с.
  • Чучуева И. А. Модель прогнозирования временных рядов по выборке максимального подобия: автореф. дис.. канд. техн. наук. - Москва, 2012. - 16 с. EDN: QHZDPD
Еще
Статья научная