Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей

Автор: Попова А.В., Ловчикова Е.И., Шестаков Р.Б.

Журнал: Научный журнал молодых ученых @young-scientists-journal

Рубрика: Экономические науки

Статья в выпуске: 1 (14), 2019 года.

Бесплатный доступ

В статье сделан прогноз сельскохозяйственного производства на основе мультимодельных ансамблей и его использование в форсайт процессе. Разработаны рекомендации по применению форсайта в бизнес-процессах.

Форсайт, сельскохозяйственное производство, бизнес процессы, мультимодельные ансамбли, стратегическое управление

Короткий адрес: https://sciup.org/147229009

IDR: 147229009

Текст научной статьи Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей

В современных условиях системе управления любого уровня необходима надежная и эффективная исследовательская система инструментов, позволяющая с определенной уверенностью спрогнозировать сценарии развития отдельных сфер деятельности. Форсайт-исследования используются как системный инструментарий формирования сценариев будущего, учитывающий возможные изменения внешней и внутренней среды.

В широком понимании метод ансамблей в науке о данных известен давно, и открыл второе дыхание с развитием технологий. Он представляет собой среднюю или средневзвешенную оценку результатов анализа, как искусственного интеллекта, так и экспертного сообщества. В сложном процессе это могут быть различные комбинации экспертных и машинных решений. Каждая из моделей или методов, входящих в ансамбль чувствительны к определённым статистическим моментам, и вместе призваны охватить широкий их диапазон (интегральные прогнозы).

Для отражения реального выпуска продукции в таблице 1 приведены данные с учетом корректировки на индекс цен производителей соответствующего периода (PPI).

Таблица 1 – Продукция сельского хозяйства в Российской Федерации и Орловской области за 1998-2018 гг.*

Ежегодный PPI

Накопленный PPI

Продукция в фактических ценах, млрд руб.

Продукция в сопоставимых ценах, млрд руб.

РФ

Орл. область

РФ

Орл. область

1

2

3

4

5

6

7

1998

141,9

141,9

298,4

3,2

210,3

2,2

1999

191,4

271,6

586

7,4

215,8

2,7

Продолжение табл. 1

1

2

3

4

5

6

7

2000

122,2

233,9

742,4

9,0

317,4

3,9

2001

117,5

143,6

918,2

10,6

639,5

7,4

2002

98,1

115,3

968,2

11,2

840,0

9,7

2003

124,7

122,3

1076,4

12,0

879,9

9,8

2004

117,7

146,8

1253,2

14,1

853,8

9,6

2005

103

121,2

1380,9

14,7

1139,1

12,2

2006

110,4

113,7

1570,6

14,7

1381,2

12,9

2007

130,2

143,7

1931,6

19,3

1343,8

13,4

2008

102,5

133,5

2461,4

25,0

1844,4

18,7

2009

98,2

100,7

2515,9

24,7

2499,5

24,5

2010

123,6

121,4

2587,8

27,3

2132,1

22,5

2011

94,9

117,3

3261,7

36,6

2780,7

31,2

2012

110,8

105,1

3339,2

39,1

3175,7

37,2

2013

102,7

113,8

3687,1

43,0

3240,2

37,7

2014

114,1

117,2

4319,1

52,3

3685,8

44,6

2015

108,5

123,8

5164,9

64,6

4172,0

52,2

2016

101,8

110,5

5505,7

70,9

4984,7

64,2

2017

92,2

93,9

5111,8

61,6

5446,2

65,6

2018

99,8

91,5

5070,9

65,6

5542,0

71,7

*Источник: рассчитано авторами по данным ФСГС РФ [1]

В таблице 2 приведены методы описательной статистики исследуемых данных и их наличие по коинтеграции между динамикой производства в Орловской области и в целом по России.

Таблица 2 – Разведочный анализ динамических рядов*

Методы статистики

Продукция в сопоставимых ценах, млрд руб.

Продукция в сопоставимых ценах, млрд руб.

Среднее хронологическое

2222,4

25,9

Максимум

5542,0

71,7

Минимум

210,3

2,2

Размах

5331,7

69,5

Среднегодовая волатильность

377,6

4,8

Гипотеза о коинтеграции рядов ( p> 0,05)

Принимается

*Источник: рассчитано автором по данным таблицы 1

Таким образом, можно сделать предварительный вывод, что результативность регионального агробизнеса идеально коррелируется с федеральными тенденциями, что может косвенно говорить об относительно «нормальном» (не лучше и не хуже, чем в других субъектах) структурно-институциональных условиях.

Из-за сравнительно небольшого размера выборки использование методов унимодельных ансамблей, основанных на ресемплировании, баггинге и бустинге (наример XGBoost или RandomForest), а также глубокого обучения с помощью нейронных сетей будет не целесообразно, так они не будут превышать возможности «классических» методов.

В качестве прогнозных методов мы использовали экспоненциальное сглаживание с учетом тренда и сезонности ETS, интегрированную модель авторегрессии и скользящего среднего ARIMA, а также линейную регрессионную модель общего тренда. Калибровочные модели (бенчмарк) представлены простыми методами. С помощью программной среды анализа данных «R» в автоматическом режиме подобраны следующие параметры для моделей по оптимальному инфорационному критерию Акаике (AIC), скорректированному для малых выборок. Модель разделена на обучаемую и тестовую выборку (тестовая выборка состоит из последних трех значений (2016-2018 годы). Сопоставление проводилось по MAPE (meanabsolutepercentageerror – средней абсолютной ошибки в процентах), которая позволяет сравнивать данные в различных единицах измерения или шкалах.

В таблице 3 некоторые основные модели показывают худшие результаты, чем модели бенчмарка, например, модель общего линейного тренда. Таким образом, мы можем в итоговом интегральным прогнозе заменить основные модели с худшим результатом на калибровочные модели. Кажется логичным замена линейного тренда на модель последнего значения с дрифтом. Сильно сокращать количество моделей даже с высокими метриками не рекомендуется, так как каждая призвана уловить определенные паттерны в данных, особенно это важно при ожидаемой нестабильности или неопределенности.

Таблица 3 – Сопоставление обучаемых моделей по метрике MAPE*

Модели

Ряд

Гиперпараметры

Параметры

Стат. знач.-ть модели /парт-ов (+), (-)

MAPE, %

«Бенчмарк» по наивным моделям

Последнее значение (naïve)

РФ

Y 2017-2018= Y 2015

Y=4172,0

+/+

17,3

Орл.

Y 2017-2018 = Y 2015

Y=52,2

+/+

17,1

Cлучайное блуждание (random walk)

РФ

Y 2017-2018 = Y 2015 + 2d

Y=4172,0+ 233,0T

+/+

19,9

Орл.

Y 2017-2018 = Y 2015 + 2d

Y=52,2 + 2,9T

+/+

20,5

Основные модели

Линейный тренд

РФ

Y t = Kt + const

Const = -433,11 K = 228,93

+/+

29,5

Орл.

Y t = Kt + const

Const = -6,14 K = 2,71

+/+

41,8

ARIMA

РФ

(0,1,0) + d

d = 218,3

+/+

18,8

Орл.

(0,2,2)

ma_1 = -1,21 ma_2 = 0,59

+/+

11,3

ETS

РФ

(A,A,N)

Alpha=0.23 Beta=0.23 Gamma = 0

+/+

15,2

Орл.

(M,A,N)

Alpha=0,84

Beta=0,001

Gamma = 0

+/+

14,8

*Источник: рассчитано автором

Группа опрошенных нами экспертов посчитала, что с учётом высокого уровня риска и неопределённости в экономике, в особенности, связанных с постоянно меняющимися институциональными условиями, необходимо ограничиться краткосрочным трёхлетним прогнозом. Эксперты сошлись во мнении, что необходимо доверительный интервал использовать 80% вместо часто используемого 95%, который даёт слишком широкий диапазон оценок. При анализе доверительной зоны можно ограничить количество альтернатив развития (сценариев) в планах организации, например, остановиться на негативном или стабильном.

Точечные прогнозы обобщены и доверительные интервалы (ДИ) в интегральном прогнозе (табл. 4), основанном на хронологическом среднем от результатов предсказаний вышеуказанных моделей.

Таблица 4 – Прогнозные данные в соответствии с выбранными моделями временных рядов на 2019-2021 гг.*

Модели

РФ

Орловская область

Точечное значение

Нижний 80% ДИ

Верхний 80% ДИ

Точечное значение

Нижний 80% ДИ

Верхний 80% ДИ

Naive

2019

5542,0

5044,7

6039,3

71,7

65,3

78,1

2020

5542,0

4838,8

6245,2

71,7

62,7

80,7

2021

5542,0

4680,7

6403,3

71,7

60,7

82,7

ARIMA

2019

5808,6

5437,9

6179,3

56,3

52,4

60,1

2020

6075,2

5550,9

6599,4

62,1

57,2

67,0

2021

6341,8

5699,7

6983,9

67,9

61,3

74,6

ETS

2019

6194,9

5840,7

6549,0

75,2

57,3

93,2

2020

6723,4

6340,4

7106,4

79,2

54,6

103,9

2021

7252,0

6811,0

7692,9

83,2

52,0

114,4

Ансамбльмоделей

2019

5848,5

5441,1

6255,9

67,7

58,3

77,1

2020

6113,5

5576,7

6650,3

71,0

58,2

83,9

2021

6378,6

5730,5

7026,7

74,3

58,0

90,6

Среднегодовой уровень

6113,5

5581,2

6645,8

71,0

58,2

83,9

*Источник: рассчитано автором с помощью программной среды R на основе полученных моделей

Графики динамических рядов, производство сельскохозяйственной продукции в Российской Федерации и Орловской области соответственно, несмотря на схожие тренды, региональный ряд имеет более широкий доверительный диапазон, что говорит о большей неопределённости в развитии регионального производства.

Однако, здесь лучше дифференцированы сигналы выбора негативного или стабильного сценария. Стабильный сценарий предполагается, если производство находится в границах между точным прогнозом и верхним доверительным интервалом, а негативный, соответственно, между точным прогнозом и нижним доверительным интервалом. Четкий сигнал уже будет виден в 2019 году. В общем, из достаточно «стройного» рисунка доверительных интервалов, модели можно определить как обладающие достаточными прогностическими возможностями.

В ходе исследования были получены следующие результаты и сделаны следующие выводы:

  • 1.    Процесс форсайтинга имеет важное значение в современном управлении, поскольку включает в себя не только вопросы прогнозирования, но также и оценку альтернатив развития планирования, в том числе стратегического, политику деловой активности в условиях неопределенности и риска.

  • 2.    Прогнозирование является фундаментом форсайт комплекса. Требованиям современного прогнозирования отвечают сложные интегральные модели, использование которых во многом облегчается использованием современной вычислительной техники и достижениями науки о данных.

  • 3.    Разработан алгоритм использования прогнозов форсайт процесса с помощью мультимодельных ансамблей.

Кроме того, нами использованы ансамбли в широком понимании форсайта, то есть с привлечением экспертных оценок на разных стадиях исследования.

В качестве положительных моментов можно отметить возможность использования существующей инфраструктуры и широкий выбор бесплатных и условно-бесплатных инструментов анализа, отрицательных – отсутствие специалистов в области анализа данных и разработки ПО.

В качестве основы для дальнейших исследований, предлагается использовать информацию одного форсайта для прогнозирования другого, а также привлечение дополнительных факторов (например, моделей, основанных на векторных, динамических и иерархических регрессиях, проприетарных алгоритмов и других методов, основанных на машинном обучении).

Необходимо расширять круг экспертного сообщества для более эффективного взаимодействия в области регулирования инновационного развития сельскохозяйственного производства.

Список литературы Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей

  • Официальный сайт Федеральной службы государственной статистики [Электронный ресурс]. URL:http://www.gks.ru (дата обращения: 01.12.2018).
  • Малюк В.И. Стратегический менеджмент. Организация стратегического развития: учебник и практикум для бакалавриата и магистратуры. М.: Издательство Юрайт, 2018. 361 с.
  • Пособие ЮНИДО по принципам и методам Форсайта: UNIDO Technology Foresight TrainingManual. [Электронный ресурc] (дата обращения: 01.12.2018 г.).
  • Формирование национальной системы технологического прогнозирования: проблемы и перспективы / А.В. Соколов, А.А. Чулок, В.Р. Месропян, С.А. Шашнов // Инновации. 2013. № 12. С. 34-43.
  • Поппер Рафаэль Мониторинг исследований будущего // Форсайт. 2012. №2. URL: https://cyberleninka.ru/article/n/monitoring-issledovaniy-buduschego (дата обращения: 5.02.2019).
  • Чулок А.А., Кузьминов И.Ф. АПК России: есть ли потенциал для глобального прорыва? // BRICS BusinessMagazine (Россия). 2018. № 1(19). С. 86-91.
  • Шестаков Р.Б., Ловчикова Е.И Анализ динамики аграрного производства в условиях общей экономической рестрикции // Экономика, труд, управление в сельском хозяйстве. 2017. № 4 (33). С. 65-73.
Еще
Статья научная