Интеграция нечетких моделей для анализа временных рядов

Автор: Ярушкина Н.Г., Перфильева И.Г., Афанасьева Т.В.

Журнал: Известия Самарского научного центра Российской академии наук @izvestiya-ssc

Рубрика: Информатика

Статья в выпуске: 4-2 т.12, 2010 года.

Бесплатный доступ

Работа посвящена актуальной задаче извлечения новых знаний о поведении временных рядов.

Нечеткие модели, временные ряды

Короткий адрес: https://sciup.org/148199419

IDR: 148199419   |   УДК: 004.8

Fuzzy models integration in time series analysis

In this article we described the fuzzy models for Time Series Data Mining.

Текст научной статьи Интеграция нечетких моделей для анализа временных рядов

ний о тенденциях во временных рядах трудоемка и дорогостояща.

Поэтому при создании нечетких моделей ВР перспективным является применение интеллектуальных методов направления Times-Series Data Mining , в котором нечеткое моделирование ВР позволяет извлекать дополнительные знания в виде легко интерпретируемых продукционных правил. Нечеткое моделирование и представление ВР в виде нечеткого временного ряда (НВР) активно развивается в трудах иностранных ученых, таких как Х. Танака, Келминс и Диамонд, К.Сонг, К. Хирота, Я. Капржик, В. Педрич, В. Новак, И.Перфильева, И. Батыршин, а также в работах отечественных ученых – Н. Ярушкиной, С. Ковалева, К.Дегтярева. Несмотря на перечисленные работы, ряд научных проблем нечеткого моделирования ВР в новом направлении Times-Series Data Mining остаются нерешенными, в частности проблемы моделирования, анализа и прогноза развития такого объекта временного ряда, как нечеткая тенденция.

Здесь для постановки задачи исследований выбран временной ряд в виде последовательности упорядоченных в моменты времени пар Y= { t i ,xi }, таких что x i В , t i Вt, i [1,n] . Требуется построить нечеткую модель временного ряда, позволяющую извлекать знания о тенденциях и правилах их следования, образующую базу знаний Rule={R k p }, где k – количество нечетких продукционных правил в базе знаний, p – количество переменных (нечетких высказываний) в каждом правиле:

R ip : Если x , есть ~ , и x есть xj и ... xp есть ~p то y есть ~ i .

Метод нечеткого моделирования заключается в построении для исследуемого ВР контекстно-зависимой параметрической ACL-шкалы [1], генерации базы знаний нечеткой модели ВР, со- держащей отношения между нечеткими элементарными тенденциями [2] временного ряда, и поиск такого параметра р базы правил Rule={R kp }, для которого ошибка прогноза минимальна.

В основу моделирования поведения ВР в терминах нечетких тенденций положим предположение о развитии поведения ВР как результата зависимости нечеткой тенденции от значений нечетких тенденций в предыдущие моменты времени.

Предлагаются три нечеткие модели временного ряда, выражающие эту зависимость через компоненты модели элементарной нечеткой тенденции. Результатами прогноза ВР являются параметры нечеткой элементарной тенденции τ , выражающие тип v ~ , интенсивность a ~ , степень принадлежности μ будущих изменений и числовая оценки уровней ВР, полученные по наилучшей модели.

В основе нечеткой модели временного ряда F2S лежит нечеткая модель элементарной тенденции τ =(μ, v ~ , a ~ ) , Тогда нечеткая модель ВР порядка р , выраженная через компоненты модели элементарной тенденции представима следующим образом:

ν ~( t - р ) o R ν ~ ( t , t - р ) ν ~ ( t ) ,

α ~( t - р ) o R α ~ ( t , t - р ) α ~ ( t ) .

Результатом моделирования ВР является база правил {R(t,t-р)} нечеткой системы логического вывода, выявляющая нечеткую зависимость следования отдельных компонент модели элементарной тенденции, извлеченная из нечеткого ВР, пример которой с частотной характеристикой каждого правила для р=1 представлен в табл. 1.

Данная модель временного ряда F1N основана на представлении временного ряда в виде числового ВР дефазифицированных интенсивностей нечеткой элементарной тенденции:

τ =(μ,н, α ) , н= DeFuzzy( v ~ ), α =DeFuzzy( a ~ ).

Для прогнозирования значений этого ряда удобно использовать трехслойную нейросетевую модель, с количеством входов, равным порядку модели р и одним выходом:

р α′=F(∑wiαi), i =1

где (α1,α2,...,αр)T – вектор входных интенсивностей, (w1,w2,...,wр) – вектор весовых коэффи- циентов, F – оператор нелинейного преобразования, неявно выражающий зависимость выхода от входа.

Модель F3N1S использует представление нечеткой элементарной тенденции в виде         τ

=( a ~ 1, μ23), где μ1, μ2, μ3 – числовые временные ряды степеней принадлежностей (функции принадлежностей) типов элементарных тенденций:

α ~( t - р ) o R α ~ ( t , t - р ) α ~ ( t )

р р

µ 1 ′ = F 1 ( wi µ 1 i ) , µ 2 ′ = F 2 ( wi µ 2 i ) , i = 1                                                  i = 1

р

µ 3 ′ = F 3 ( w i µ 3 i ) , r = arg(max( µ 1 , µ 2 , µ 3), i = 1

где r – номер типа тенденции.

Далее проводится вычислительный эксперимент, целью которого является исследование продуктивности метода нечеткого моделирования ВР для генерации авторских моделей временных рядов, позволяющих извлекать знания о нечетких тенденциях в форме продукционных правил “IF-THEN” и использовать их для прогнозирования ВР.

Для выбора наилучшей из трех предлагаемых нечетких моделей ВР в терминах нечетких тенденций используются следующие критерии качества:

N

МАРЕ =

N t = 1

yt

100%

,

MSE = 1 n ( y i - y t 0 ) 2 , n i = 1

TTend = (ErrorCount / TotalCount) * 100% .

МАРЕ – средняя абсолютная процентная ошибка. Данный критерий удобно использовать для сравнения продуктивности метода при его применении на множестве временных рядов.

MSE – средняя квадратичная ошибка, традиционно используется для выбора наилучшей модели временных рядов из множества конкурирующих. Иногда применяют корень квадратный из MSE. Такой показатель качества обозначают RMSE.

TTend – коэффициент ошибок в обнаружении типов нечетких элементарных тенденций вре-

Таблица 1. Таблица извлеченных правил для типов тенденций

Правило Частота if ((Input0 is Падение)) then (Output is Рост) 3 if ((Input0 is Рост)) then (Output is Рост) 1 if ((Input0 is Рост)) then (Output is Падение) 2 if ((Input0 is Падение)) then (Output is Падение) 2 менного ряда в процентах, где ErrorCount – количество ошибок в моделировании типов нечетких элементарных тенденций, TotalCount – общее количество нечетких элементарных тенденции временного ряда.

Вычислительный эксперимент на нестационарных временных рядах показал, что авторские нечеткие модели ВР в терминах нечетких тенденций имеют недостаточно хорошие показатели качества для среднесрочного и долгосрочного прогноза за счет обработки “сырых данных” без выделения тренда. В то же время для краткосрочного прогноза авторские модели показали неплохие результаты, как по критериям качества моделирования и оценки прогноза нечетких тенденций, так и для оценки числовых уровней ВР.

В эксперименте были использованы авторские нечеткие модели тенденций F2S(Х,Y,Z), F1N(Х,Y,Z), F3N1S(Х,Y,Z) и для сравнения нечеткие модели S(Х,Y,Z) [3], D(Х,Y,Z) [4]. В этих моделях Х обозначает мощность генерируемой ACL-шкалы, Y – порядок модели, Z – глубина прогноза (количество интервалов для прогноза). В некоторых моделях будет использоваться авторский алгоритм отбора нечетких правил, где к модели добавляется текст “+ отбор”.

Метод нечеткого моделирования и анализа тенденций временных рядов применяется для моделирования и прогнозирования временного ряда статьи 211 по данным бухгалтерской отчетности “Доходы и расходы” бюджетной организации. Данные, образующий ВР, характеризуют месячные расходы на заработную плату за четыре с половиной года (рис. 1). Для этого нестационарного ВР проводился прогноз на один интервал сначала (а) для усеченного ВР на 3 точки, (б) затем – на две точки, (в) затем на одну точку, в заключении (с) исследован весь временной ряд. Целью такого исследования одного и того же временного ряда – проанализировать устойчивость краткосрочного прогноза авторских нечетких моделей по сравнению с известными S- и D-моделями. Результаты лучших моделей приведены в табл. 2.

Рис. 1. Временной ряд статьи 211

Таблица 2. Показатели внешних мер качества. Прогноз на один интервал

Название модели

МАРЕ

TTend

MSE

(а)

F2S(10,1,1)

5,4

0

0,69*10^12

S(10,1,1)

0,6

50

0,8*10^10

D(10,3,1)

9,4

0

0,2*10^13

(б)

F2S(10,1,1)

8,2

0

0,43*10^13

S(10,3,1)

22

0

0,3*10^14

D(10,1,1)

42

50

0,1*10^15

(в)

F1N(10,1,1)

5,9

0

0,1*10^13

S(10,4,1)

17

0

0,28*10^13

D(10,1,1)

52

0

0,24*10^15

(с)

F1N(10,2,1)

4

0

0,1*10^13

S(10,4,1)

30

0

0,78*10^14

D(10,1,1)

29

0

0,7*10^14

Таблица 3. Показатели внешних мер качества. Прогноз на три интервала

Название модели

MAPE

RMSE

TTend

F1N(3,3,3)+отбор

28

70*10^5

16,6

F3N1S(3,3,3) + отбор

36

122*10^5

16,6

F2S(3,4,3) + отбор

42

80*10^5

16,6

SARIMA(1,1,1)x(1,0,0)

49

88*10^5

50

F3N1S(3,4,3) + отбор

49

101*10^5

0

F2S(3,1,3) + отбор

55

88*10^5

0

Анализ внешних мер качества показывает, что авторские модели при прогнозе на один интервал характеризируются стабильными показателями качества (МАРЕ < 10%, TTend=0), что нельзя сказать о нечетких S- и D- моделях.

Проведенное статистическое моделирование и прогнозирование данного ВР на три интервала в пакете “Статистика” показало, что наименьшее MSE соответствует модели SARIMA(1,1,1)x(1,0,0), для которой MAPE=49%, RMSE=88*10^5. При нечетком моделировании предлагаемым методом были получены следующие результаты, приведенные в табл. 3.

Таким образом, исследование предлагаемого метода нечеткого моделирования и анализа тенденций временных рядов позволяет сделать вывод о его полезности при решении задач извлечения знаний о правилах следования нечетких тенденций и краткосрочного прогноза временных рядов.

Список литературы Интеграция нечетких моделей для анализа временных рядов

  • Афанасьева Т.В. Модель ACL-шкалы для генерации лингвистических оценок в принятии решений//Вопросы современной науки и практики. Университет им. В.И.Вернадского. Т.2. Серия "Технические науки". 2008. № 4 (14). С. 91-97.
  • Интегральный метод принятия решений и анализа нечетких временных рядов/Новак В., Перфильева И.Г.,Ярушкина Н.Г., Афанасьева Т.В.//Программные продукты и системы. 2008. № 4. С. 65-68.
  • Song Q. Fuzzy time series and its models/Song, Q. Chissom B.//Fuzzy Sets and Systems, 54 (1993). Р. 269-277.
  • Дегтярев К.Ю. Применение специализированных компьютерных программ и методов, основанных на нечетких временных рядах для краткосрочного прогнозирования USB/RUB котировок [Электронный ресурс] URL: http://Exponenta.ru (дата обращения 16.02.2010)