Сравнительный анализ методов прогнозирования временных рядов на основе нейронных сетей и регрессионного анализа

Автор: Аверкин Алексей Николаевич, Ярушев Сергей Александрович

Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse

Статья в выпуске: 2, 2015 года.

Бесплатный доступ

В статье рассматриваются два основных направления в прогнозировании временных рядов, а именно, нейросетевые методы прогнозирования и методы на основе регрессионного анализа. Производится сравнение результатов прогноза на примере отдельных показателей, произведенных на основе двух методов. Анализируются основные проблемы, возникающие при использовании данных методов, а так же методы их решения, в частности гибридизация данных методов. Проводится широкий обзор исследований по сравнению прогностической производительности методов на основе искусственных нейронных сетей и других методов прогнозирования. Особое внимание уделяется сравнению методов ИНС и методов множественной регрессии.

Еще

Гибридные модели, временной ряд, нейронные сети, нечеткие методы моделирования, регрессионный анализ, эконометрические методы

Короткий адрес: https://sciup.org/14123256

IDR: 14123256

Текст научной статьи Сравнительный анализ методов прогнозирования временных рядов на основе нейронных сетей и регрессионного анализа

Недавний всплеск в исследованиях искусственных нейронных сетей (ИНС) показал, что нейронные сети имеют мощный потенциал в прогнозировании и в задачах классификации. ИНС успешно используются для различных задач во многих областях бизнеса, индустрии и науки [1].

Столь высокий интерес к нейронным сетям виден из бурного роста числа статей, опубликованных в научных журналах по различным научным дисциплинам. Достаточно рассмотреть несколько крупных баз данных, чтобы понять, какое огромное количество статей публикуется за год на тему исследования нейронных сетей, это тысячи статей.

Нейронные сети способны работать параллельно с входными переменными и, следовательно, способны достаточно просто обрабатывать большие объемы данных. Главное достоинство нейронных сетей – это способность находить закономерности [2]. ИНС являются перспективной альтернативой в инструментарии специалистов, занимающихся прогнозированием. По сути, не линейная структура нейронных сетей частично полезна для выявления сложных взаимосвязей в большинстве реальных проблем.

Нейронные сети, возможно, являются наиболее универсальными методами прогнозирования в связи с те, что они не только могут находить нелинейные структуры в задачах, они также могут моделировать линейные процессы процессов. Например, возможности нейронных сетей в моделировании линейных временных рядов линейной были изучены и подтверждены рядом исследователей [3], [4], [5].

Одна из основных областей применения ИСН это прогнозирование. В последнее время был замечен возрастающий интерес к прогнозированию с помощью нейронных сетей. Прогнозирование насчитывает длинную историю, и его важность отражается в применении в разнообразных дисциплинах от бизнеса до инженерии.

Способность точно предсказывать будущее имеет фундаментальное значение для многих процессов принятия решений в планировании, разработке стратегий, построении политики, а также в управлении поставками и ценах акций. Как таковое, прогнозирование является областью, в которую было вложено немало усилий в прошлом. Так же, оно остается важной и активной областью человеческой деятельности в настоящем и продолжит развиваться в будущем. Обзор исследовательских потребностей в прогнозировании был представлен работе Армстронга [6].

В течение нескольких десятилетий в прогнозировании доминировали линейные методы. Линейные методы просты в разработке и применении, и они так же просты для понимания и интерпретации. Тем не менее, линейные модели имеют серьезные ограничения, вследствие которых они не способны распознавать любые не линейные связи в данных. Аппроксимация линейных моделей на сложные не линейные взаимосвязи не всегда дают положительный результат. Ранее в 1980х, было проведено крупномасштабное соревнование по прогнозированию, в котором большинство широко используемых линейных методов тестировались на более чем 1000 реальных временных рядов [7]. Смешанный результат показал, что ни одна из линейных моделей не показала глобально лучшего результата, что можно интерпретировать как отказ в работе линейных моделей в сфере учета с той или иной степенью нелинейности, что является обычным для реального мира.

Прогнозирование финансовых рынков одно из самых актуальных направлений в исследованиях в силу их коммерческой привлекательности [8]. К сожалению, финансовые рынки являются динамическими, не линейными, сложными, непараметрическими и хаотическими по своей натуре [9]. Временные ряды мульти-стационарны, зашумлены, случайны и имеют частые структурные разрывы [10]. Кроме того, на финансовые рынки так же оказывает влияние большое количество макроэкономических факторов [11,12], таких как политические события, глобальные экономические события, банков- ский рейтинг, политика крупных корпораций, обменные курсы, инвестиционные ожидания и события на других фондовых рынках, и даже психологические факторы.

Искусственные нейронные сети являются одной из технологий, получивших заметный прогресс в сфере исследования фондовых рынков. В общем случае, стоимость акций представляет собой случайную последовательность с некоторым шумом, в свою очередь искусственные нейронные сети, являются мощными параллельными обработчиками нелинейных систем, зависящих от собственных внутренних связей. Разработка способов и методов, способных аппроксимировать любую нелинейную непрерывную функцию, без априорного представления о природе самого процесса рассматривается в работе Р. Пино [13]. Очевидно, что ряд факторов демонстрируют достаточную эффективность в прогнозе цен, а главное слабое место в этом то, что все они содержат несколько ограничений в прогнозе цен акций и используют линейные методы, относительного этого факта, хотя предыдущие исследования выявили проблему в некоторой степени, ни один из них не обеспечивает комплексную модель для оценки стоимости акций. Если оценивать стоимость и обеспечить модель для того, чтобы убрать неопределенность, то это в значительной степени может помочь повысить инвестиционную привлекательность фондовых бирж. Проведение научных исследований для получения наилучшего метода прогнозирования финансовых временных рядов на данный момент является наиболее востребованной и перспективной задачей.

  • 1.    Прогнозирование временных рядов на основе методов множественной регрессии

Классификация эконометрических моделей

Существует множество публикаций, отражающих фрагментарные исследования локальных экономических процессов и показателей [14]. Среди публикаций, посвященных разработке и применению эконометрических методов, моделей и программно-технологических средств, выделим только те, которые применимы для полномасштабного описания динамики прогноза показателей страны и сравним их. Разумно провести предварительную классификацию используемых средств прогноза в страновых моделях, потому что имеет смысл сравнивать только сопоставимые продукты. В качестве основных характеристик страновых систем моделей прогноза выделим несколько очевидных:

  • 1.    мощность системы прогноза;

  • 2.    наличие и развитость средств отладки регрессионных уравнений;

  • 3.    наличие и гибкость систем управления расчетом;

  • 4.    контроль балансовых значений прогнозных показателей;

  • 5.    контроль допустимых значений прогнозных показателей;

  • 6.    наличие и развитость табличных и графических средств для анализа прогнозных показателей.

Мощность системы прогноза. Такая характеристика определяет возможность системы в однопроходном режиме решать предельно допустимое количество взаимосвязанных регрессионных уравнений. Будем различать системы, решающие до 10 уравнений - малой мощности («М»), до 100 уравнений – средней мощности («С»), до 1000 уравнений - большой мощности («Б»), свыше 1000 уравнений - сверхбольшой мощности («Х»),

Наличие и развитость средств отладки регрессионных уравнений. Составление регрессионных уравнений – творческий процесс. Процесс отладки и отбора регрессионных уравнений - рутинный, кропотливый и трудоемкий. Без автоматизации основных элементов этого процесса можно построить только системы класса «М». Начиная с систем класса «С» и выше, необходим язык записи уравнений на уровне идентификаторов и программы автоматической расшифровки записи уравнений на внешнем языке в таблицы параметров и поля исходных данных для перехода к стандартным процедурам отыскания коэффициентов регрессионных уравнений. Одновременно необходимы процедуры авто- матического контроля правильности записи регрессионных уравнений на уровне формального языка. Будем различать три уровня средств отладки регрессионных уравнений:

  • 1.    отсутствие автоматизированного контроля записи уравнений (эти функции выполняет эксперт -исследователь) – («НЕТ»):

  • 2.  наличие языка записи уравнений и контроля правильности записи – («ЯЗКП»):

  • 3.  наличие контроля полноты информации для решения уравнений – («КПИР»).

Следует отметить, что поиск регрессионного уравнения для исследуемой функции – творческий процесс, который не должен ограничиваться одной версией. Для одной исследуемой функции можно предложить несколько вариантов записи регрессионных уравнений и выбрать уравнение с наилучшими показателями качества и точности. Для этих целей подключают средства визуального контроля и сравнения параметров регрессионных уравнений и показателей качества - «ВК».

Таким образом, для ПТК с развитыми средствами отладки регрессионных уравнений должны быть средства отладки с цепочкой: «ЯЗКП + КПИР + ВК».

Наличие и гибкость систем управления расчетом . Развитые страновые модели прогноза и программно-технологические средства, реализующие эти модели, начиная с систем класса « С» и выше, должны иметь и воспроизводить, как минимум, три режима работы: подготовительный, эксплуатационный, заключительный .

  • -    Подготовительный режим включает: формирование и обновление базы исходных отчетных данных, необходимых для расчета прогноза; установку значений сценарных показателей варианта прогноза; запись и отладку регрессионных уравнений, установку параметров расчета; установку идентификаторов версии варианта прогноза;

  • -    Эксплуатационный режим включает: установку параметров и значений сценарных показателей варианта прогноза, выполнение варианта прогнозного расчета, анализ полей контроля информации;

  • -    Заключительный режим включает: полномасштабный вывод всех значений рассчитанных прогнозных показателей; распечатки таблиц оценок качества прогноза каждого показателя; возможность вывода таблиц и графиков прогнозных и отчетных значений любого отдельно взятого прогнозного показателя; возможность вывода совмещенных графиков прогнозных и отчетных значений любого набора отдельно взятых прогнозных показателей; сохранение результатов версии прогноза.

Особое место в страновых эконометрических моделях занимаю системы контроля балансовых значений прогнозных показателей и системы контроля допустимых значений прогнозных показателей.

Контроль балансовых значений прогнозных показателей. В СНС валовой внутренний продукт вычисляется тремя способами. Каждый из способов вычисления имеет свой набор составляющих показателей, сумма которых в относительных единицах не должна превосходить 1,0 (с установленным допуском отклонений). Любые балансовые показатели, рассчитываемые в системе (например, показатели баланса денежных доходов и расходов населения, баланса трудовых ресурсов и др.), могут быть включены в систему контроля балансовых значений. Наличие выявленных отклонений, превышающих в сумме допустимую величину, не останавливает вычисления, но обращает внимание эксперта-исследователя на имеющееся расхождение.

Контроль допустимых значений прогнозных показателей . Для большинства показателей известны диапазоны допустимых значений. Значения этих ограничений устанавливаются (или переустанавливаются) в подготовительном режиме перед выполнением расчетов. Наличие превышений допустимых значений, выявленных системой контроля, не останавливает вычислений, а служит предупреждением о возможных несоответствиях в выделенных прогнозных значениях.

Наличие и развитость табличных и графических средств для анализа прогнозных показателей. После завершения основного этапа расчетов возникает целый ряд работ по подготовке материалов для аналитического исследования варианта прогноза. Необходимо иметь таблицы и графики с 4

оценкой качества прогноза каждого показателя, возможность визуального сравнения любых показателей в любом количестве, полную картину прогноза показателей исследуемого варианта, результаты контроля балансовых соотношений, результаты контроля допустимых диапазонов изменения индивидуальных значений каждого показателя.

Описываемая система моделей проверена на 300 уравнениях, но может объединять и решать гораздо больше уравнений (до 1500-2000). Известны зарубежные аналоги, реально функционирующие и включающие более 1500 уравнений.

Классификация показателей

Среди исследуемых показателей и факторов следует различать номинальные и аномальные. Например, все показатели СНС – номинальные. К аномальным следует отнести показатели не характерные для стабильной экономики, но используемые в отечественной статистике в настоящее время. Например, задолженность по заработной плате, кредиторская задолженность предприятиям, скрытая оплата труда, численность незарегистрированных мигрантов, занятых в экономике, и другие подобные показатели, Для прогноза номинальных показателей рекомендуется не использовать в качестве факторов аномальные показатели. Или применять аномальные факторы в исключительных случаях, там, где они наилучшим образом (временно) объясняют количественные и качественные явления и процессы. Кроме того, следует иметь в виду, что сами номинальные показатели могут иметь как номинальные значения, так и аномальные.

Предельные возможности эконометрических моделей ограничиваются возможностями информационной базы и состоянием методологического инструментария. Ограничения в применении методов эконометрического прогнозирования наступают при возникновении следующих ситуаций:

  • 1.    Появление новых показателей с короткими рядами отчетных данных.

  • 2.    Несопоставимость отчетных данных показателя из-за радикальных методологических изменений на исследуемом отрезке отчетности.

  • 3.    Зависимость значений показателя от постановлений законодательной или исполнительной власти или от решений руководства финансовыми органами («Директивные» показатели).

  • 4.    Использование показателей со скрытыми (ненаблюдаемыми) наборами факторов влияния.

  • 5.    Административно-зависимые показатели.

  • 2.    Прогнозирование временных рядов на основе нейронных сетей

  • 2.1.    Обзор работ, работ по выявлению эффективности применения нейронных сетей в задачах прогнозирования в сравнении с традиционными методами.

Последняя ситуация была обнаружена на самой ранней стадии использования эконометрических моделей автором этих моделей лауреатом нобелевской премии 1980 года Клейном Л.Р. Администраторы сами определяли будущие значения управляющих воздействий на основе умозрительных заключений о поведении факторов влияния. И, исходя из опыта собственных оценок поведения прогнозных рыночных показателей, выработанных доктрин и целей, выдавали собственные управляющие воздействия, которые и определяли поведение эндогенных показателей.

Искусственные нейронные сети (ИНС) – вычислительные структуры, моделирующие свободные биологические процессы. ИНС изучают множество конкурирующих гипотез одновременно, используя массивно параллельные сети состоящие из нелинейных относительно вычислений элементов, соединённых связями с различными весами. Этот соединённый набор весов, который содержит знание, генерируется ИНС. ИНС и были удачно использованы для низкоуровневых задач распознавания, таких как распознавание речи или символов. В настоящее время они изучаются для задач принятия решений и индукции [15].

В общем, модели ИНС описываются топологией сети, характеристиками узлов и правилами тренировки или обучения. ИНС состоят из большого числа простых обрабатывающих элементов, каждый из которых взаимодействует с другими посредством возбуждающих или тормозящих соединений. Распределённое представление поверх большого числа элементов вместе с взаимосвязью

Электронный журнал «Системный анализ в науке и образовании» Выпуск №2, 2015 год обрабатывающих элементов обеспечивает допустимую ошибку. Обучение достигается посредством правил, которые адаптируют веса связей в ответ на входные шаблоны. Изменения весов, ассоциированных со связями, позволяют приспосабливаться к новым ситуациям. Липманн [16] в своей работе открыл широкий спектр топологий, которые используются для реализации ИНС.

За последние 10 лет всё более активные усилия исследований были направлены на применение ИНС в бизнесе. Несмотря на это мнения о ценности этих подходов оказались неоднозначными. Одни считают их эффективными для задач неструктурированного принятия решений, другие исследователи выразили сомнения в их потенциале, предполагая, что требуются более сильные эмпирические доказательства. Для того чтобы оценить эффективность нейронных сетей, необходимо провести тщательный обзор исследований в области оценки эффективности прогностических возможностей ИНС.

Далее мы проведем исследование эффективности применения нейронных сетей в задачах прогнозирования, проведя обширный обзор существующих исследований и работ по данной тематике.

Уилсон и Шарда [17] разработали НС для классификации банкротств. Уилсон и Шарда (1994) пришли к выводу, что, хотя НС работали лучше, чем дискриминантный анализ, различия были не всегда значительными. Авторы обучили и протестировали сеть, используя 3 набора образцов: 50% всех обанкротившихся и не обанкротившихся фирм, 80% обанкротившихся и 20% не обанкротившихся фирм и 90% обанкротившихся и 10% не обанкротившихся фирм. Каждый такой образец был протестирован на 50/50, 80/20 и 90/10 обучающего набора, что дало всего 9 сравнений. НС превзошли дискриминантный анализ на всех образцах кроме одного, для обработки которых методы статистически не отличались.

Там и Кианг [18] сравнили производительность НС со множеством альтернатив: регрессией, дискриминантным анализом, логистикой, методом K ближайших соседей, и ID 3. Они сообщают, что НС обогнали все методы из сравнения, когда для тренировки использовались данные в течение одного года до банкротства. В случаях, когда для тренировки использовались данные за два года до банкротства, дискриминантный анализ превзошёл НС. В обоих случаях НС с одним скрытым слоем превзошли линейную сеть без скрытых слоёв.

В похожей области, Зальценберг, Цинар и Лэш [19] использовали НС для классификации финансовых институтов как провальные или нет. Зальценберг и соавторы сравнили работу НС с логическими моделями. Сети работали лучше, чем логические модели в большинстве случаев, когда обучающая и тестовая выборки имели равное количество провальных и непровальных институтов. НС превзошли логические модели в разбавленном образце, в котором было около 18% данных провальных институтов. Коатс и Фант [20] использовали алгоритм каскадной корреляции для прогнозирования финансовых затруднений. Сравнительные оценки были выполнены с методом дискриминантного анализа. НС превзошли метод дискриминантного анализа на образцах с большим процентом проблемных фирм, но не смогли сделать это на тех, где были равные количества проблемных и непроблемных фирм.

Рефенс, Азема-Барак и Запранис [21] протестировали НС в области оценки акций. Сравнение с множественной регрессией показало что предложенная сеть даёт лучший результат на тестовых данных, чем множественная регрессия, примерно на порядок. Сеть превзошла регрессию на проверочной выборке примерно на 36%.

  • 3    из 11 эффективных исследований сравнили работу с альтернативными моделями предсказания временных рядов. Их них 1 показало смешанные результаты в сравнении НС с альтернативными методиками. Хо, Хсу и Йонг [22] протестировали предложенный алгоритм, алгоритм адаптивного обучения, в области краткосрочного прогнозирования нагрузки. ААО автоматически адаптирует момент процесса обучения в зависимости от ошибки. Работа сети сравнивалась с системой правил и

  • экспертных оценок оператора. Хотя НС несколько лучше, чем основанные на правилах системы и оператор, средняя абсолютная ошибка не сильно отличалась для трёх случаев и не были проведены тесты для определения того, что результаты НС были значительно лучше.

Фостер, Коллопи и Ангер [23] сравнили производительность линейной регрессии и комбинацией НС с ней в прогнозировании 181 годовых и 203 квартальных временных рядов конкурса M (Мадриа-кис, 1982). Они использовали одну сеть для прямых прогнозов (комбинация сетей). Авторы отмечают, что в то время пока прямая сеть работала значительно хуже, чем сравниваемые методы, комбинация сетей опередила и регрессию, и простую комбинацию. Интересно, что сети становились более консервативны по мере увеличения горизонта или с ростом зашумлённости данных. Это отражает подход, который может применять эксперт в этом случае.

Коннор, Мартин и Атлас [24] сравнили работу различных НС в прогнозировании временных рядов. Они сравнили работу рекуррентных и упреждающих сетей для прогнозирования нагрузки. Рекуррентная сеть превзошла традиционную упреждающую сеть удачно моделируя область с большей бережливостью чем конкурирующая архитектура.

Эффективно проверенные положительные результаты, несмотря на проблемы реализации:

  • 11    дополнительных исследований, которые были фактически подтверждены, показывают что НС работают лучше, чем сравниваемые модели. Датта [25] использовала искусственные данные, рейтинг корпоративных облигаций и частоту покупки продукции как тестовые выборки для реализации НС. НС работали лучше, чем множественная регрессия на искусственных данных, несмотря на подготовленное преимущество для регрессии. В предсказании рейтинга облигаций, НС последовательно превзошли регрессии, в то время как только одна конфигурация сетей превзошла регрессии в области частоты покупки продукции. Ли и Джи [26] использовали НС для идентификации модели ARMA с расширенной автокорреляционной функцией образца. НС продемонстрировали превосходную точность классификации на искусственных данных. Затем НС были протестированы на данных из трёх предыдущих исследований, где модели были определены с использованием традиционных подходов. Авторы отмечают, что НС правильно определили модель ВНП США, индекс потребительских цен и кофеин.

Другие исследования в области прогнозирования включают исследования Флетчера и Госса [27], Десилтса [28] и Кимото [29]. Флетчер и Госс в 1993 году разработали НС для классификации банкротств и сравнили свою НС с логическими моделями. НС превзошли логические модели, имея более низкую ошибку предсказания и меньшую дисперсию. Десилетс сравнил работу моделей регрессии с НС в прогнозировании солёности в заливе Чесапик. Результаты показывают, что НС работали эффективно по сравнению с регрессионными моделями. Кимото с соавторами прогнозировал время покупки и продажи акций на Токийской бирже. Их система, состоящая из многих НС, была сравнена с множественной регрессией. Коэффициенты корреляции с реальными движениями акций показали более высокое значение для НС, чем для регрессии. В этой же области Юн [30] сравнивал работу НС с дискриминантным анализом для прогнозирования стоимости акций. Хотя исследование не проводило поперечных проверок, результаты показали, что НС работали значительно лучше, чем дискриминантный анализ в классификации показателей акций.

В области прогнозирования временных рядов, Чен, Ю и Моджадамжо [31] использовали НС для прогнозирования электрической нагрузки. НС обеспечили лучший прогноз чем модели ARIMA. Они также лучше адаптированы к изменениям, показывая надёжность. Парк и др. [32] также разработали НС прогнозирования в области электрической нагрузки и сравнили её работу с подходом, использующемся в электроцехах. Их НС значительно превзошла традиционные подходы. Танг, де Альмеида и Фишвик в 1991 году [33] протестировали работу НС в прогнозировании продаж отечественных и зарубежных автомобилей, а также на данных авиапассажиров. Они сообщили, что НС работали лучше, чем Бокс+Дженкинс для долгосрочных (12 и 24 месяцев) прогнозов, и также как Бокс+Дженкинс для краткосрочных (1 и 6 месяцев) прогнозов.

Дальнейшая оценка реализаций алгоритма обратного распространения ошибки

Из 48 исследований [34], 44 (88%) использовали алгоритм обратного распространения ошибки как алгоритм обучения. В литературе хорошо освещено, что этот подход может страдать от трёх 7

потенциальных проблем. Во-первых, нет ни одной конфигурации, которая является достаточной для всех областей или даже в пределах одной области. А, следовательно, топология должна быть определена методом проб и ошибок. Во-вторых, такие НС восприимчивы к проблемам с локальными мини-мумами[35]. Наконец, они склонны к переобучению. Рефенс [36] предлагает 5 параметров управления, которые можно использовать, чтобы направлять эффективный дизайн НС. Мы рассмотрели 27 исследований, которые соответствовали нашим критериям эффективности проверки в отношении их подходов к этим управляющим критериям:

Структура сети: Некоторые проблемы, такие как количество скрытых слоёв и узлов, вес соединений, дизайн снизу-вверх или сверху-вниз, можно определить как проблему наиболее эффективной структуры НС. Мы учитывали сделали ли в исследовании анализ чувствительности НС к количеству слоёв и узлов. Оценка других особенностей сети представляется сложной, учитывая уровень раскрытия информации, характерной для этих исследований.

Градиентный спуск: манипуляции с коэффициентом обучения во время тренировки показали тенденцию к более эффективному снижению градиента на поверхности ошибок.

Перекрёстная проверка: для предотвращения переобучения, Рефенс рекомендует проводить перекрёстную проверку во время обучения. Это облегчает завершение обучения и предотвращает переобучение.

Перекрёстная функция: пока мы определили передаточные функции, мы не пытались оценить их относительные достоинства, а литература по этому вопросу остаётся неубедительной.

Функция трансформации: все исследования, которые сообщили о них, использовали сигмоидальные функции.

Из 27 исследований, которые были фактически подтверждены, 18 (67%) сделали анализ чувствительности, для определения более подходящей структуры сети. В общем, большинство решили, что одного скрытого слоя достаточно для решаемой задачи. Однако, не было согласия относительно количества узлов, которое требуется включить в скрытый слой, что свидетельствует о необходимости дальнейших эмпирических исследований по этому вопросу. 11 (41%) исследований пытались контролировать градиентный спуск путём реализации динамического управления коэффициентом обучения. И вновь, необходимы дальнейшие эмпирические исследования, прежде чем предложить соответствующий диапазон скорости обучения. Интересно, что 27 исследований пытались контролировать потенциальные проблемы переобучения, которые могли возникнуть во время обучения с помощью перекрёстной проверки. Это разочаровывающий вывод, особенно в свете того, что алгоритм обратного распространения ошибки в НС, как известно, серьёзно склонен к переобучению. 18 (67%) из 26 исследований сообщили об использовании сигмоидальной функции активации. Остальные 9 не сообщали о конкретной функции преобразования.

2. 2. Сравнение методов прогнозирования на основе искусственных нейронных сетей и множественной регрессии на примере прогноза стоимости жилой недвижимости

В своей работе Криппс и Энджин [37] провели сравнение эффективности прогнозов множественной регрессии и искусственной нейронной сети, используя метод обратного распространения ошибки. Сравнение производили на примере прогнозирования стоимости жилой недвижимости. При сравнении обеих моделей использовались различные наборы данных, различные функциональные спецификации и сравнительные критерии. Одинаковые спецификации обоих методов и реальная, правдоподобная информация объясняют то, почему другие исследования по сравнению ИНС и множественной регрессии давали различные результаты.

Для объективного сравнения моделей, необходимо выявить возможные проблемы каждой модели, которые могли бы исказить производительность метода. Исследования показывают, что множественная регрессия и ИНС определены. К тому же, некоторые исследования, посвященные изучению моделей на основе множественной регрессии, так же однозначно определены и применены к набору данных, используемых в данном исследовании.

Так же, стандартная нейронная сеть прямого распространения с обучением на основе метода обратного распространения ошибки, используемая в сравнении, так же были проведены эксперименты с множеством вариаций методов обучения нейронных сетей. Различные архитектуры нейросетей, такие как ARTMAP (адаптивная резонансная теория), GAUSSIAN , нейрорегрессии, так же были изучены. После сотен экспериментов и изменений архитектуры, стандартный метод обратного распространения показал лучшую производительность, чем другие архитектуры нейронных сетей. Несколько других исследований, проводивших сравнение между нейронными сетями и множественной регрессией, получали различные результаты. Таим образом, основным вопросом и целью данного исследования ставится выяснение причин, по которым одни исследователи получили результат, в котором множественная регрессия получает лучшие результаты, а другие пришли к выводу, что лучше нейронная сеть.

Вопросы реализации

Некоторые исследования демонстрируют превосходство ИНН над множественной регрессией в задаче прогнозирования рынка недвижимости [38, 39]. Другие исследования [40] однако, показали, что ИНН не всегда превосходят регрессии. Из-за способности ИНС к обучению и распознаванию сложных образов, не будучи запрограммированными под определенные правила, они могут легко использоваться в небольшим наборе статистических данных. В отличие от регрессионного анализа, нейронная сеть не нуждается в предварительно определенной функциональной форме, основанной на детерминантах. Эта функция ИНС имеет большое значение, так как несколько исследований [41, 42] обнаружили, что возраст недвижимости имеет нелинейную зависимость с её стоимостью (для набора данных, используемых в их исследовании). Другие исследования показали, что в дополнение к возрасту, жилая площадь так же имеет нелинейную зависимость со стоимостью[43]. Исходя из результатов предыдущих исследований и теоретической мощности ИНС, можно было бы ожидать, что ИНС имеет большую производительность, чем множественная регрессия.

При использовании множественной регрессии, необходимо решать методологические проблемы функциональной формы из-за не правильной спецификации, нелинейность, мультиколлинеарность и гетероскедатичности. Сталкиваясь с возможной нелинейностью функциональной формы, в большинстве случаев можно перевести нелинейную зависимость в линейную до того, как мы приступим к использованию регрессионного анализа [44]. Как было отмечено ранее, некоторые исследования обнаружили, что возраст и жилая площадь имеют нелинейную зависимость со стоимостью недвижимости. Мультиколлинеарность не влияет на прогностические возможности множественной регрессии как и у ИНС [45] потому что сделаны выводы в совместно определенной области наблюдений. Мультиколлинеарность, тем не менее, делает невозможным отделение эффектов якобы независимых переменных. Гетероскедатичность обычно возникает, когда используется поперечное пересечение данных. В дополнение к модели методологических проблем, отсутствующая соответствующая объясняющая переменная является еще одним источником ошибок при использовании множественной регрессии и ИНС. Это часто связано с отсутствием данных.

При использовании нейронной сети прямого распространения с обучением на основе метода обратного распространения ошибок, необходимо решить следующие методологические проблемы, такие как количество скрытых слоев, число нейронов в каждом скрытом слое, выборка обучающих данных, размер этой выборки, выборка проверочных данных и соответствующий размер данной выборки, а также перетренировка. Как правило, уровень обучения и число скрытых нейронов влияет на запоминание и обобщенность предсказываемой модели. Чем более широкое обучение и большее количество скрытых нейронов используется, тем лучше модель способна производить верные прогнозы на обучающей выборке. С другой стороны, ИНС с меньшей вероятностью предсказывают новые данные (обобщение), т.е. способность ИНС к обобщению слабеет, когда происходит перетре-нированность, которая может возникнуть при слишком большой размерности скрытого слоя. Чтобы избежать перетренированности, целесообразно использовать эвристический метод, описанный в статье Гекта-Нилсона [46]. Несмотря на ограничения, есть некоторые теоретические основы, чтобы облегчить определение количества скрытых слоев и нейронов в использовании. В большинстве слу- чаев, нет никакого способа для определения наилучшего количества скрытых нейронов без тренировки нескольких сетей и оценки ошибки обобщения каждой из них. Если ИНС имеет только несколько скрытых нейронов, тогда ошибка тренировки и ошибка обобщения будут высокими из-за высокой статистической погрешности. Если нейронная сеть имеет слишком много скрытых нейронов, тогда тренировочная ошибка будет маленькой, но ошибка обобщения будет высокой из-за переобучения и высокой дисперсии[47]. Если обучающая выборка не репрезентативна набору данных (статистических), тогда нет основы для обучения ИНС. Как правило, репрезентативный набор обучения формируется с помощью случайной выборки набора данных. Если обучающий набор данных слишком мал, тогда ИНС будет иметь тенденцию к запоминанию обучающих моделей слишком конкретно и экстремальные точки (шумы) будут иметь экстраординарное влияние на качество модели. Это можно исправить, однако, с помощью K-кратной перекрестной проверки метода обуче-ния[48].

Предыдущие используемые исследования

Ду и Груднитски [39] использовали множественную регрессию и нейронные сети для прогнозирования стоимости жилой недвижимости по восьми входам: возраст в годах, число спален, число ванных комнат, жилая площадь, количество мест для автомобилей в гараже, количество каминов, количество объявлений и размер лота. Разработанная ими модель множественной регрессии SP i = fS y ), где SP i - недвижимость, i - цена, S y - это набор независимых переменных цен на жилье на имущество i. Модель нейронной сети содержит входной слой из восьми нейронов (соответствующим восьми переменным в множественной регрессии), скрытый слой состоит из трёх нейронов и выходной слой содержит один нейрон, представляющий собой оценочную стоимость недвижимости. Результаты их работы продемонстрировали, что ИНС примерно в два раза по точности превосходит множественную регрессию в оценке стоимости жилой недвижимости (ИНС содержит абсолютную ошибку 6,9%, а нейронная множественная регрессия получила ошибку 11,26%). Относительно нейронной сети, результаты, полученные исследователями, показывают достоверный результат, но только при использовании специальных методов обучения. Размер их выборки довольно мал (всего 58 и только по одному городу) в то время, как ИНС (полно связная) использует только 27 весов. Без специализированного обучения, основная прогностическая пригодность модели существенно ограничена и сомнительна [49]. Специальные методы обучения, такие как К-кратная перекрестная проверка обучения, которая часто используется для маленького набора данных[48].

Тэй и Хо [50] использовали выборку по стоимости жилой недвижимости в Сингапуре, чтобы протестировать прогностическую производительность ИНС и множественной регрессии. Они обнаружили, что модель ИНС имеет среднюю абсолютную ошибку 3,9%, а модель множественной регрессии имеет ошибку 7,5%. Однако, в своем исследовании они не использовали специализированных методов обучения, необходимость в котором, как правило, возникает при малом размере выборки.

Вышеупомянутые исследования в целом подтверждают превосходство нейронных сетей над множественной регрессией в качестве получаемых прогнозов.

Данные

Для исследования были выбраны 3906 наблюдений по продаже одной единицы жилой недвижимости, собранные за 18 месяцев. Следующие параметры недвижимости использовались для исследования: жилая площадь ( sqrft ), количество спален ( bed #), количество санузлов ( bath #), количество лет, прошедших с момента постройки здания ( age ), квартал, в котором недвижимость продается ( quarter#-) и имеет ли объект гараж или навес для автомобиля ( garage cp ).

Из 3906 наблюдений, выбраны следующие 306, 506, 706, 906, 1,106, 1,306, 1,506, 1,706, 1,906, 2,106, 2,306, 2,506, 2,706, 2,906, 3,106, 3,306, 3,506 и 3,706. Эти наборы называются обучающей выборкой, от одного до 18 ( T1, T 2, T3, T 4, T 5, T 6, T 7, T 8, T 9, T 10, T 11, T 12, T 13, T 14, T 15, T 16, T 17, T 18) соответственно. Каждый набор включает расширение предыдущего, то есть T 1 : - T2 T3 % .% T 18.

Дополнением каждого обучающего множества, по отношению к набору данных из 3906 наблюдений, дает набор проверочных данных, V 1- V 18, соответственно. Таблица 1 отражает некоторый базовый набор статистической информации для набора данных. Каждый тренировочный набор от Т 1 до Т 18 содержит равномерное распределение по кварталам по 18 месяцам. Наборы проверочных данных используются для уменьшения любых ошибок, связанных с каждой моделью, связанных с размером выборки. Для обеих моделей, используются идентичные обучающие выборки, так же, как и проверочные данные. Например, проверка набора V 1 использует обучающую выборку T 1, и т.д.

Описание моделей ИНС и множественной регрессии

Чтобы противопоставить прогностическую эффективность множественной регрессии и ИНС, были проведены 108 сравнений с различными размерами обучающей выборки, функциональными спецификациями и периодами прогноза. Модели множественной регрессии и ИНС (используемые в данном исследовании) включают в себя вопросы, описанные ранее, это функциональная форма неправильной спецификации, нелинейность и гетероскедастичность для моделей множественной регрессии. Для нейросетевых моделей, это число скрытых слоев, количество нейронов в каждом скрытом слое, выбранная обучающая выборка, ее размер, проверочный набор данных и его размер, а так же перетренированность.

Как было отмечено, в предыдущих исследованиях были представлены некоторые улучшения модели данных множественной регрессии для прогноза цены продажи. Улучшения ИНС использовались для прогнозирования так же прогнозов цены продаж. Из этого следует, что шесть функциональных спецификаций множественной регрессии (базирующихся на предыдущих исследованиях) используются для разработки моделей ИНС. Этот процесс используется, чтобы продемонстрировать улучшения множественной регрессии и так же улучшить модель ИНС. Получены модели данных, сравниваемые с использованием 18 обучающих выборок и соответствующие восемнадцать комплектов проверки. Функциональные формы множественной регрессии, используемые в данном исследовании, являются линейными, полулогарифмическими и полностью логарифмическими.

Полученные результаты

В сравнении множественной регрессии и ИНС, была предпринята попытка провести достоверное сравнение прогностической способностей обеих моделей. Множественные сравнительные эксперименты проводились при различных наборах обучающих данных, функциональных спецификациях и на различных периодах прогноза. Было проведено 108 испытаний. Для сравнения использовали два критерия – MAPE (средняя абсолютная относительная ошибка) и FE (ошибка прогнозирования). Основанные на результатах прогнозирования, эти оба критерия могут различаться на различных выборках данных модели. Таким образом, необходимо с осторожностью к каждому показателю, для которого используются данные критерии для оценки точности прогнозирования, а также к размеру используемой выборки. При использовании размера выборки от умеренной до большой, ИНС показывает лучшие результаты по обоим критериям, относительно множественной регрессии. Для этих целей, размер выборки данных от 506 до 1506 наблюдений (из общего числа 3906 наблюдений) для ANN превзошли множественную регрессию (с использованием обоих критериев). В общем случае, при усложнении функциональной спецификации ИНС, размер тренировочной выборки должен быть увеличен для того, чтобы ИНС работала лучше, чем множественная регрессия. Множественная регрессия показывает лучшие результаты (при использовании критерия средней абсолютной относительной ошибки) чем ИНС, при использовании малого размера данных для тренировки. Для каждой функциональной спецификации модели, производительность множественной регрессии в некоторой степени сохраняется постоянной при различных размерах выборок, в то время как производительность ИНС значительно улучшается при увеличении размера тренировочных данных.

Колебания в производительности модели ИНС связаны с большим числом возможных параметров и отсутствием методического подхода к выбору наилучших параметров. Например, эксперименты должны проводиться, чтобы определить наилучший способ представления данных, спецификацию 11

Электронный журнал «Системный анализ в науке и образовании» Выпуск №2, 2015 год модели, количество скрытых слоев, число нейронов на каждом скрытом слое, скорость обучения, и количество циклов обучения. Все эти действия направлены для того, чтобы определить наилучшую модель нейронной сети. Невозможность проведения подобных экспериментов может привести к плохо специфицированной модели ИНС.

Если другие входные переменные, такие как камин, этажность, отделочные материалы, размер лота, подключенные коммуникации и тип финансирования включены, то результаты могут различаться.

Результаты исследования дают объяснение, почему предыдущие исследования давали различные результаты при сравнении множественной регрессии и ИНС в прогнозировании. Прогностическая эффективность зависит от критериев оценки ( MAPE и FE ), используемых в сочетании с размером обучения и параметрами модели. Колебания производительности модели ИНС может быть связано с большим количеством параметров настройки, выбранных с помощью экспериментов, и в зависимости от размера обучающей выборки.

В заключение стоит отметить, если у нас имеется достаточный размер набора обучающих данных и соответствующие параметры ИНС, то она работает значительно лучше, чем множественная регрессия. В противном случае, результаты варьируются.

Заключение

В статье были подробно рассмотрены модели прогнозирования временных рядов на основе статистических методов, в частности методов множественной регрессии и на основе искусственных нейронных сетей. Был проведен тщательный анализ исследований, проводившихся по данному направлению, и рассмотрены результаты исследований по выявлению наиболее качественно дававшего прогнозы метода. Особое внимание уделено сравнению методов на основе множественной регрессии и искусственных нейронных сетей. Был подробно изложен пример исследования, в котором проводилось практическое сравнение прогностических возможностей ИНС и множественной регрессии на примере прогнозирования стоимости жилой недвижимости. В результате исследования, был получен результат, демонстрирующий превосходство нейронных сетей по качеству полученного прогноза по сравнению с множественной регрессией. Так же были выявлены некоторые сложности, возникающие при прогнозировании обоими методами. Так, исходя из результатов исследования, можно сделать вывод, что, для того, чтобы получить наибольшее превосходство в качестве прогноза с использованием ИНС над множественной регрессией, необходимо вводить как можно наиболее большой обучающих данных. Чем больше объем обучающей выборке, тем наиболее качественный прогноз делает нейронная сеть.

Рассматривая результаты всех рассмотренных исследований, в которых проводилось сравнение нейронных сетей с множеством других методов прогнозирования, можно сделать вывод, что в абсолютном большинстве случаев, искусственные нейронные сети дают более качественный прогноз по отношению к другим методам, в том числе и по отношению к множественной регрессии.

Список литературы Сравнительный анализ методов прогнозирования временных рядов на основе нейронных сетей и регрессионного анализа

  • Widrow, B., Rumelhart, D., & Lehr, M. A. Neural networks: Applications in industry, business and science.// Stanford University. Communications of the ACM, 1994 - Vol.37 - №3.
  • Chung et al., P.C. Chang, Y.W. Wang and C.H. Liu, The development of a weighted evolving fuzzy neural network for PCB sales forecasting, Expert Systems with Applications, 2007 - 32, pp. 86-96.
  • Hwang, H. B. Insights into neural-network forecasting of time series corresponding to ARMA (p, q) structures. Omega, 2001 - 29, 273-289.
  • Medeiros, M. C. & Pedreira, C. E. What are the effects of forecasting linear time series with neural networks? Engineering Intelligent Systems, 2001 - 237-424.
  • Zhang, G. P. An investigation of neural networks for linear time-series forecasting. Computers & Operations Research, 2001 - 28, 1183-1202.
Статья научная